עזרה:הגהה של קבצים סרוקים

מתוך ויקיטקסט, מאגר הטקסטים החופשי

הקדמה[עריכה]

טעות לעולם חוזר ובכל טקסט שהוקלד, כמובן שיכולות להיות טעויות, גם לאחר הגהה.

לשם כך הדרך הכי טובה היא להציג את צילום הספר המקורי במקביל לטקסט המוקלד, וכך יכול כל עורך באתר לתקן בקלות את הטקסט גם אם הספר המקורי אינו בהישג יד.

כיצד? יש להעלות קובץ לאתר ויקישיתוף שמכיל את צילום כל הדפים (בתסדיר DJVU או PDF) וליצור דף "מפתח:" כגון זה, שמכיל קישורים לדפי "עמוד:".

את הטקסט שהוקלד בדפים אלו אפשר להכליל (בהכללה רגילה של דף שלם או של קטעים על ידי LST, לתוך דפים מסודרים כגון זה.

כדאי ליצור קישור עריכה מתוך הדף הסופי אל דפי ה"עמוד:".

זיהוי תווים אופטי – OCR[עריכה]

טכנולוגיית זיהוי תווים אופטי (OCR) מאפשרת את תרגום הצילום לאותיות. קיימת תוכנה חינמית בעברית אך אם משתמשים בקבצים מתוך אתר hebrewbooks פעולת זיהוי התווים כבר נעשתה. ניתן לבחור את כל הטקסט, ועל ידי העתקה והדבקה להעביר את כל הטקסט לתוך תיבת העריכה.

ניתן גם להעביר ספר שלם מתוך קובצי PDF ו־DJVU לתוך ויקיטקסט על ידי תוכנה. לבקשות נא לכתוב בדף השיחה של עמוד זה או לפנות לאוֹרי.

היברו בוקס[עריכה]

באתר היברו בוקס רובם הגדול של הספרים עבר המרה בתוכנה מקצועית (תלוי באיכות הספר), כדי להעתיק יש להוריד את הספר, לבחור קטע להעתקה או בחר הכל ע"י ctrl + a. אם בהדבקה יוצא רק תווים מוזרים או מבולבלים כדאי להדביק בוורד בהדבקה מיוחדת דהיינו במקום לבחור הדבק בוחרים הדבקה מיוחדת ואחרי זה ללא עיצוב.

באגים והצעות לשיפור[עריכה]

  • בוויקיטקסט באנגלית קיים כפתור OCR שאוטומטית עובר על התמונה ושם את הטקסט המופיע בה בתוך תיבת העריכה. הלוואי גם בעברית...

דוגמאות נוספות[עריכה]