ויקיטקסט:מזנון/ארכיון מאי 2019

מתוך ויקיטקסט, מאגר הטקסטים החופשי
קפיצה לניווט קפיצה לחיפוש

ocr בעברית[עריכה]

יש אחד נוח שיוכל לפענח לי ספרים שלמים? (כמובן אחרי זה תדרש הגהה). David7031 (שיחה) 12:14, 20 בפברואר 2019 (IST)

יש את ABBYY READER. מלפני כמה שנים העמותה של ויקימדיה שיש לה משרד בתל אביב רכשה את זה עבורנו והתקינה אותו במחשב מסוים במשרד שלהם. ההגיון הייתה אז לאפשר גישה אל המחשב ההוא לעורכים כאן כדי לבצע המרת טקסטים דרך המחשב ההוא על ידי שליטה מרחוק. נראה לי מאז כל העניין נשכח. אפשר ליצור איתם קשר ולבקש מהכוח הטכני שמה לחדש את הנוהל. או אפשר לקנות את התוכנה בעצמך. לחלופין, תלוי איזה ספר אתה רוצה להעלות, אבל כדאי לבדוק אצל SEFARIA קודם כי הם ממירים המון טקסטים באופן יותר מדויק מאשר תוכל לעשות בתוכנות OCR רגילות. עושים מיקור חוץ לחברה שמתמחה בזה.--Roxette5 (שיחה) 19:52, 20 בפברואר 2019 (IST)
אתה יכול לברר עם העמותה? נראה לי שהספר שאני רוצה פחות יעניין את ספריא. David7031 (שיחה) 21:25, 20 בפברואר 2019 (IST)
אני אנסה. אבל תבין, עדיין זה ידרוש ממך מיומנות טכני, להבין את ההוראות כדי לשלוט במחשב שלהם מרחוק. נראה לך שאתה יכול? לחלופין, אם אתה קרוב לת"א תוכל ללכת לשם פיזי אם תרצה.--Roxette5 (שיחה) 21:43, 20 בפברואר 2019 (IST)
עם שולחן עבודה מרוחק אני עובד כל הזמן (גם המילים האלה נכתבות ככה) אני רחוק מתל אביב, אבל אם תיצור איתם קשר והם יגידו שצריך להגיע לשם פיזית פעם אחת אז אני מקווה שאני אוכל. David7031 (שיחה) 21:49, 20 בפברואר 2019 (IST)
אל תשכח לכוון את שפת הטקסט לעברית בלבד.--נחום - שיחה 01:43, 21 בפברואר 2019 (IST)
נדמה לי שאיתן96 טיפל בנושא הזה בזמנו. הוא די נעלם מאז.--נחום - שיחה 01:53, 21 בפברואר 2019 (IST)
David7031, לתוכנה ABBYY READER גרסת ניסיון חינם, ההגבלה שחוויתי היא על ייצוא, הצלחתי לעשות העתק הדבק לטקסטים נרחבים. Uziel302 (שיחה) 22:04, 22 בפברואר 2019 (IST)
חזרו אליי ממשרד העמותה. כבר אין להם את התוכנה. כנראה שהם מחקו את זה או איבדו את המחשב בו היה מותקן. :(--Roxette5 (שיחה) 19:57, 25 בפברואר 2019 (IST)
תודה Roxette5 . אז נחזור לשאלה המקורית. האם מישהוא מכיר ocr טוב עד בסדר חינמי בעברית? David7031 (שיחה) 14:36, 26 בפברואר 2019 (IST)
אני לא מכיר כזו.--נחום - שיחה 14:03, 27 בפברואר 2019 (IST)
אם זה ספר בודד, תוכל לשלוח לי במייל כקובץ פי די אף ואמיר לך אותו לוורד. יש לי עותק חוקי של ABBYY FINEREADER שזו תוכנה טובה עד מעולה.--נחום - שיחה 14:05, 27 בפברואר 2019 (IST)
דרך אגב, יצא לי עכשיו להכנס לאתר של העמותה, והם עדיין מפרסמים את האופציה הזו. Roxette5, האם תוכל לעדכן אותם שכדאי להוריד את זה מהאתר, או לחלופין (אפשרות מועדפת) לקנות מחדש את התוכנה? David7031 (שיחה) 18:06, 19 במרץ 2019 (IST)
תוכל לספק קישור לדף הנזכר?--Roxette5 (שיחה) 21:02, 19 במרץ 2019 (IST)
בשמחה. כאן. David7031 (שיחה) 22:47, 19 במרץ 2019 (IST)

שלום. יש חדש בעניין הזה? כי חיפשתי הרבה זמן כאן איך אפשר להמיר סריקות לטקסט, והספר שאני מעוניין בו הוא טקסט ישן נושן שאפילו בהיברובוקס קשה לקרוא אותו (ספר בשם בני יעקב של רבי יעקב ששון http://hebrewbooks.org/home.aspx) ואין אותו בנמצא בשום מקום אחר. אז אשמח מאד לשמוע אם יש חדש בזה. תודה. נחום המדי (שיחה) 23:56, 28 באפריל 2019 (IDT)

סליחה ושוב סליחה, א' שמרתי לפני שבדקתי את השינוי, ב' לא תייגתי אף אחד קודם. אז כעת אם תוכלו לעזור לי. כמו כן רציתי לדעת אם למישהו יש מושג מה עם הספר 'שדי חמד' אם מותר להקליד. תודה רבה נחום המדי (שיחה) 14:08, 1 במאי 2019 (IDT)
את הסךפר שדי חמד מותר להקליד. הרב חיים מזקיהו מדיני נפטר לפני למעלה משבעים ואחת שנה ולכן יצירותיו הינן בנחלת הכלל. בברכה, נחום - שיחה 14:19, 1 במאי 2019 (IDT)
לעניות דעתי תוכנת ה-או.סי.אר תתקשה להתמודד עם הטקסט הקטן של הספר בני יעקב. אולי אפשר לנסות להגדיל אותו. לא יודע מה להגיד לך.--נחום - שיחה 14:27, 1 במאי 2019 (IDT)
David7031 אני מצטרף לדברי נחום. איכות מאוד גרועה וגם שני ספרים בדף אחד מהווים יתר קושי להשתמש ב-OCR בקלות. ניתן להקליד ידני או אולי לבקש מאנשים כמו סאפריה שכבר מתמחים בזה יותר.--Roxette5 (שיחה) 09:20, 2 במאי 2019 (IDT)
אין להאשים אותי בשום דבר. השואל הוא נחום המדי. ולעצם העניין, א. מה זאת אומרת שני ספרים בדף אחד? ב.אם אתה אומר שבספריא מתמחים בנושא של ocr, אז אכן כדאי לפנות אליהם ולנסות ליצור שיתוף פעולה (הם יסרקו ויצרו חומר גולמי, ואנחנו נערוך). david7031שיחה • כ"ז בניסן ה'תשע"ט • 14:25, 2 במאי 2019 (IDT)
גגל ABBYY, הורד את התוכנה מהאתר הרשמי, השתמש בניסיון חינם וגלה מה OCR נותן. לא ידוע לי על יכולות מיוחדות שיש לספריא. Uziel302 (שיחה) 20:16, 4 במאי 2019 (IDT)
תודה רבה לכל העוזרים והיועצים. עשיתי כעצתך. התחלתי (לנסות בכל אופן) להקליד, באמת הספר 'ני יעקב' יוצא גרוע מאד, אבל 'שדי חמד' סביר. טוב אז התחלתי באמצע שדי חמד חלק ד ואני מקווה להמשיך נחום המדי (שיחה) 19:54, 7 במאי 2019 (IDT)

תקלה בפואמות[עריכה]

בעת שיטוטיי בין כתבי רבי יהודה הלוי, נתקלתי בתקלה (הה-הה) בהצגת פואמות, לדוגמה כאן: https://he.wikisource.org/wiki/%D7%99%D7%A4%D7%94_%D7%A0%D7%95%D7%A3

צריך להזיז את ה- '/' בזהו של סוף הפואמה לתחילת המילה POEM. למשל תיקנתי כאן: https://he.wikisource.org/wiki/%D7%9C%D7%91%D7%99_%D7%91%D7%9E%D7%96%D7%A8%D7%97

אם מישהו יכול לעשות בוט שיסדר את זה.


חזקו ואמצו.

חיפוש מצא 8 מופעים, זה לא מצריך בוט. אם היו 200 מופעים הייתי ממליץ על AWB. אם היו 5000 זה עדיין אפשרי עם AWB ו-autoclicker. בוט אפשר לנצל לדברים כאלה אם כבר יש תשתית של בוט החלפות. Uziel302 (שיחה) 20:42, 11 במאי 2019 (IDT)
טופל. 21:34, 11 במאי 2019 (IDT)

העברת דפים לשמות בעלי משמעות[עריכה]

אני שוקל להעביר את הדפים של חבל נחלתו לשמות בעלי משמעות, לדוגמה: חבל נחלתו א א - לזיהוי התכלת בציצית - האם זה עדיף משמעותית או שזה לא שווה את המאמץ? כשאני מחפש בגוגל "לזיהוי התכלת בציצית" הוא כבר עכשיו מציג: "לזיהוי התכלת בציצית - חבל נחלתו א א – ויקיטקסט" למרות שהקישור לדף הישן. אני תוהה איזו השפעה תהיה לשינוי כזה על הדירוג בגוגל ועל חוויית המשתמש. Uziel302 (שיחה) 20:38, 11 במאי 2019 (IDT)

כנראה שזה מיותר מבחינת מדד גוגל. אולי יש בזה יתרון מצד שיקולים אחרים (זה נראה יותר טוב וכו'). david7031שיחה • ז' באייר ה'תשע"ט • 21:29, 11 במאי 2019 (IDT)
אתה מסיק שזה מיותר מהדוגמה שנתתי? אני חושב שגוגל כן נותנים משקל שונה למיקומים שונים במאמר וכותרת יכולה לעזור בקידום. Uziel302 (שיחה) 21:51, 11 במאי 2019 (IDT)
לא רק. עשיתי ניסוי גם עם עוד דף. david7031שיחה • ז' באייר ה'תשע"ט • 22:05, 11 במאי 2019 (IDT)

תיקון תקלדות בקליק[עריכה]

הי, לאחר שמיזם ויקיפדיה:תיקון תקלדות בקליק הביא לתיקון למעלה מ-4000 תקלדות, חשבתי לנסות להביא את המיזם גם לפה. אפשר להתחיל לתקן תקלדות בדף: משתמש:Uziel302/typos. אשמח למשוב ולעזרה בתיקוני תקלדות. אני מודע לעובדה שהעברית פה שונה וחלק מהמילים שהתוכנית שלי חושדת בהן הן מילים תקינות. אבל עדיין יש ברחבי ויקיטקסט תקלדות ודאיות שניתן לתקן בקלות בעזרת הכלי. מתייג את משתמש:Roxette5 שהתעניין בכלי דומה. Uziel302 (שיחה) 21:43, 11 במאי 2019 (IDT)

כלי מצוין. רק סתם מתוך סקרנות, למה הרשימה כל כך קצרה?
דרך אגב, צריך בסוף להוסיף כלי שיתן אפשרות להוריד דברים שהם לא טעות מהרשימה. david7031שיחה • ז' באייר ה'תשע"ט • 22:16, 11 במאי 2019 (IDT)
david7031, יש כפתור הסר כחלק מהסקריפט. הרשימה קצרה כי יש בוויקיטקסט הרבה מילים בכתיב חריג ודאגתי ידנית שיהיה אחוז גבוה של תקלדות אמיתיות. בלי סינון אני יכול להפיק אלפי מילים חשודות. Uziel302 (שיחה) 06:07, 12 במאי 2019 (IDT)
העליתי עוד 66 שגיאות. אשמח לעזרה. Uziel302 (שיחה) 11:54, 25 במאי 2019 (IDT)
איפה מתקינים את הסקריפט? (עשיתי את זה בויקיפדיה, אבל אני לא זוכר איך). david7031שיחה • כ"א באייר ה'תשע"ט • 21:17, 25 במאי 2019 (IDT)
david7031, פה זה שונה מוויקיפדיה, שם זה גאדג'ט שמופיע בהעדפות, פה צריך להכניס importScript('משתמש:Uziel302/typos.js'); לדף הסקריפטים שלך: משתמש:david7031/common.js. תודה Uziel302 (שיחה) 09:41, 26 במאי 2019 (IDT)
כתבתי את זה בדף, וזה לא עבד לי. תוכל להכנס לשם ולבדוק האם כתבתי את זה נכון? david7031שיחה • כ"א באייר ה'תשע"ט • 11:06, 26 במאי 2019 (IDT)
david7031, לא כתבת נכון, צריך להיות בדיוק כך:

importScript('משתמש:Uziel302/typos.js');

תודה. Uziel302 (שיחה) 16:29, 26 במאי 2019 (IDT)

עבד לי. מצוין.david7031שיחה • כ"ב באייר ה'תשע"ט • 19:36, 26 במאי 2019 (IDT)

קישורים לרמב"ם[עריכה]

האם ניתן ליצור קישורים לרמב"ם, כך שיתבססו על "נוסח הדפוסים"‏[1], כדי שיהיה נח יותר לקשר מויקיפדיה?
נח יותר לקשר ל"הלכות ביכורים", מאשר ל"הלכות ביכורים ושאר מתנות כהונה שבגבולין". (רשימה של נוסח הדפוסים ניתן למצוא בויקיטקסט:רמב"ם). תודה david7031שיחה • י"א באייר ה'תשע"ט • 18:20, 15 במאי 2019 (IDT)

תבנית:ממ רמב"ם, ו-תבנית:ממ רמב"ם/קיצור שם, לא מספיק טובים?--נחום - שיחה 16:24, 16 במאי 2019 (IDT)
והאם זה עובד גם בקישור מויקיפדיה? david7031שיחה • י"א באייר ה'תשע"ט • 16:25, 16 במאי 2019 (IDT)
כדי שזה יעבוד בוויקיפדיה, יצטרך מאן דהוא שיש לו ההרשאות המתאימות בוויקיפדיה לייבא את התבנית ותבנית-הבת מכאן, מן הסתם.--נחום - שיחה 16:59, 16 במאי 2019 (IDT)
איזה הרשאות צריך? david7031שיחה • י"א באייר ה'תשע"ט • 17:01, 16 במאי 2019 (IDT)
נראה לי שדי בהרשאת מפעיל מערכת.--נחום - שיחה 17:06, 16 במאי 2019 (IDT)
כמובן שאחד הוויקיפדים יצטרך לערוך אח"כ את התבנית כדי שהיא תקשר משם אלינו ולא לוויקיפדיה.--נחום - שיחה 17:09, 16 במאי 2019 (IDT)
בסדר, פניתי לאחד המפעילים.david7031שיחה • י"א באייר ה'תשע"ט • 17:17, 16 במאי 2019 (IDT)
יוער, שהתבנית אינו שלימה ויש בה עוד הרבה קיצורי שמות להוסיף. בזמנו בקשתי ליצור את זה עבור עבודה שלי בעין המשפט על גמרא והוספתי בו קיצורי שמות שבהם נתקלתי במהלך עבודתי. זאת אומרת שייתכן מאוד שישנם עוד הרבה שמות של הלכות ברמב"ם שלא נתוספו לתבנית. כדאי להוסיף אותם לפני שאנשים מוויקיפדיה מייבאים את התבנית בכדי למנוע כפל עבודה. אנסה כרגע להעיף אל זה מבט במה שאוכל.--Roxette5 (שיחה) 21:41, 16 במאי 2019 (IDT)
התבנית כבר יובאה, אבל עדיין אפשר להוסיף, ואני אוסיף בויקיפדיה. david7031שיחה • י"ב באייר ה'תשע"ט • 21:43, 16 במאי 2019 (IDT)

הערות[עריכה]

  1. ^ כן כן, זה הידוע לשמצה

איפה קבצי המשניות נמצאים פיזית[עריכה]

הדפים של כל משנה נשאבים מאיפשהוא. איפה זה? (שואל בעקבות דיווח על טעות). david7031שיחה • ט"ו באייר ה'תשע"ט • 13:16, 20 במאי 2019 (IDT)

בדפי משנה מסכת x דפוסים, למשל: משנה ברכות א דפוסים מכיל את המשניות לפרק א במסכת ברכות.--נחום - שיחה 16:58, 20 במאי 2019 (IDT)
ברוב המסכתות יש עותק מקביל במשנה המבוארת. לכן, אודה לך אם תעדכן אותי בתיקון כדי שאבדוק שהוא מתוקן גם שם. Ahituvrs (שיחה) 08:36, 21 במאי 2019 (IDT)
מסכת בבא בתרא ב ד תקלדה.david7031שיחה • ט"ז באייר ה'תשע"ט • 08:41, 21 במאי 2019 (IDT)