ויקיטקסט:מזנון/ארכיון מאי 2019

מתוך ויקיטקסט, מאגר הטקסטים החופשי

דף זה הוא ארכיון של הדיונים שהתקיימו במזנון. דיונים חדשים יש לקיים במזנון הנוכחי. אין לערוך דף זה.


ocr בעברית

יש אחד נוח שיוכל לפענח לי ספרים שלמים? (כמובן אחרי זה תדרש הגהה). David7031 (שיחה) 12:14, 20 בפברואר 2019 (IST)[תגובה]

יש את ABBYY READER. מלפני כמה שנים העמותה של ויקימדיה שיש לה משרד בתל אביב רכשה את זה עבורנו והתקינה אותו במחשב מסוים במשרד שלהם. ההגיון הייתה אז לאפשר גישה אל המחשב ההוא לעורכים כאן כדי לבצע המרת טקסטים דרך המחשב ההוא על ידי שליטה מרחוק. נראה לי מאז כל העניין נשכח. אפשר ליצור איתם קשר ולבקש מהכוח הטכני שמה לחדש את הנוהל. או אפשר לקנות את התוכנה בעצמך. לחלופין, תלוי איזה ספר אתה רוצה להעלות, אבל כדאי לבדוק אצל SEFARIA קודם כי הם ממירים המון טקסטים באופן יותר מדויק מאשר תוכל לעשות בתוכנות OCR רגילות. עושים מיקור חוץ לחברה שמתמחה בזה.--Roxette5 (שיחה) 19:52, 20 בפברואר 2019 (IST)[תגובה]
אתה יכול לברר עם העמותה? נראה לי שהספר שאני רוצה פחות יעניין את ספריא. David7031 (שיחה) 21:25, 20 בפברואר 2019 (IST)[תגובה]
אני אנסה. אבל תבין, עדיין זה ידרוש ממך מיומנות טכני, להבין את ההוראות כדי לשלוט במחשב שלהם מרחוק. נראה לך שאתה יכול? לחלופין, אם אתה קרוב לת"א תוכל ללכת לשם פיזי אם תרצה.--Roxette5 (שיחה) 21:43, 20 בפברואר 2019 (IST)[תגובה]
עם שולחן עבודה מרוחק אני עובד כל הזמן (גם המילים האלה נכתבות ככה) אני רחוק מתל אביב, אבל אם תיצור איתם קשר והם יגידו שצריך להגיע לשם פיזית פעם אחת אז אני מקווה שאני אוכל. David7031 (שיחה) 21:49, 20 בפברואר 2019 (IST)[תגובה]
אל תשכח לכוון את שפת הטקסט לעברית בלבד.--נחום - שיחה 01:43, 21 בפברואר 2019 (IST)[תגובה]
נדמה לי שאיתן96 טיפל בנושא הזה בזמנו. הוא די נעלם מאז.--נחום - שיחה 01:53, 21 בפברואר 2019 (IST)[תגובה]
David7031, לתוכנה ABBYY READER גרסת ניסיון חינם, ההגבלה שחוויתי היא על ייצוא, הצלחתי לעשות העתק הדבק לטקסטים נרחבים. Uziel302 (שיחה) 22:04, 22 בפברואר 2019 (IST)[תגובה]
חזרו אליי ממשרד העמותה. כבר אין להם את התוכנה. כנראה שהם מחקו את זה או איבדו את המחשב בו היה מותקן. :(--Roxette5 (שיחה) 19:57, 25 בפברואר 2019 (IST)[תגובה]
תודה Roxette5 . אז נחזור לשאלה המקורית. האם מישהוא מכיר ocr טוב עד בסדר חינמי בעברית? David7031 (שיחה) 14:36, 26 בפברואר 2019 (IST)[תגובה]
אני לא מכיר כזו.--נחום - שיחה 14:03, 27 בפברואר 2019 (IST)[תגובה]
אם זה ספר בודד, תוכל לשלוח לי במייל כקובץ פי די אף ואמיר לך אותו לוורד. יש לי עותק חוקי של ABBYY FINEREADER שזו תוכנה טובה עד מעולה.--נחום - שיחה 14:05, 27 בפברואר 2019 (IST)[תגובה]
דרך אגב, יצא לי עכשיו להכנס לאתר של העמותה, והם עדיין מפרסמים את האופציה הזו. Roxette5, האם תוכל לעדכן אותם שכדאי להוריד את זה מהאתר, או לחלופין (אפשרות מועדפת) לקנות מחדש את התוכנה? David7031 (שיחה) 18:06, 19 במרץ 2019 (IST)[תגובה]
תוכל לספק קישור לדף הנזכר?--Roxette5 (שיחה) 21:02, 19 במרץ 2019 (IST)[תגובה]
בשמחה. כאן. David7031 (שיחה) 22:47, 19 במרץ 2019 (IST)[תגובה]

שלום. יש חדש בעניין הזה? כי חיפשתי הרבה זמן כאן איך אפשר להמיר סריקות לטקסט, והספר שאני מעוניין בו הוא טקסט ישן נושן שאפילו בהיברובוקס קשה לקרוא אותו (ספר בשם בני יעקב של רבי יעקב ששון http://hebrewbooks.org/home.aspx) ואין אותו בנמצא בשום מקום אחר. אז אשמח מאד לשמוע אם יש חדש בזה. תודה. נחום המדי (שיחה) 23:56, 28 באפריל 2019 (IDT)[תגובה]

סליחה ושוב סליחה, א' שמרתי לפני שבדקתי את השינוי, ב' לא תייגתי אף אחד קודם. אז כעת אם תוכלו לעזור לי. כמו כן רציתי לדעת אם למישהו יש מושג מה עם הספר 'שדי חמד' אם מותר להקליד. תודה רבה נחום המדי (שיחה) 14:08, 1 במאי 2019 (IDT)[תגובה]
את הסךפר שדי חמד מותר להקליד. הרב חיים מזקיהו מדיני נפטר לפני למעלה משבעים ואחת שנה ולכן יצירותיו הינן בנחלת הכלל. בברכה, נחום - שיחה 14:19, 1 במאי 2019 (IDT)[תגובה]
לעניות דעתי תוכנת ה-או.סי.אר תתקשה להתמודד עם הטקסט הקטן של הספר בני יעקב. אולי אפשר לנסות להגדיל אותו. לא יודע מה להגיד לך.--נחום - שיחה 14:27, 1 במאי 2019 (IDT)[תגובה]
David7031 אני מצטרף לדברי נחום. איכות מאוד גרועה וגם שני ספרים בדף אחד מהווים יתר קושי להשתמש ב-OCR בקלות. ניתן להקליד ידני או אולי לבקש מאנשים כמו סאפריה שכבר מתמחים בזה יותר.--Roxette5 (שיחה) 09:20, 2 במאי 2019 (IDT)[תגובה]
אין להאשים אותי בשום דבר. השואל הוא נחום המדי. ולעצם העניין, א. מה זאת אומרת שני ספרים בדף אחד? ב.אם אתה אומר שבספריא מתמחים בנושא של ocr, אז אכן כדאי לפנות אליהם ולנסות ליצור שיתוף פעולה (הם יסרקו ויצרו חומר גולמי, ואנחנו נערוך). david7031שיחה • כ"ז בניסן ה'תשע"ט • 14:25, 2 במאי 2019 (IDT)[תגובה]
גגל ABBYY, הורד את התוכנה מהאתר הרשמי, השתמש בניסיון חינם וגלה מה OCR נותן. לא ידוע לי על יכולות מיוחדות שיש לספריא. Uziel302 (שיחה) 20:16, 4 במאי 2019 (IDT)[תגובה]
תודה רבה לכל העוזרים והיועצים. עשיתי כעצתך. התחלתי (לנסות בכל אופן) להקליד, באמת הספר 'ני יעקב' יוצא גרוע מאד, אבל 'שדי חמד' סביר. טוב אז התחלתי באמצע שדי חמד חלק ד ואני מקווה להמשיך נחום המדי (שיחה) 19:54, 7 במאי 2019 (IDT)[תגובה]

תקלה בפואמות

בעת שיטוטיי בין כתבי רבי יהודה הלוי, נתקלתי בתקלה (הה-הה) בהצגת פואמות, לדוגמה כאן: https://he.wikisource.org/wiki/%D7%99%D7%A4%D7%94_%D7%A0%D7%95%D7%A3

צריך להזיז את ה- '/' בזהו של סוף הפואמה לתחילת המילה POEM. למשל תיקנתי כאן: https://he.wikisource.org/wiki/%D7%9C%D7%91%D7%99_%D7%91%D7%9E%D7%96%D7%A8%D7%97

אם מישהו יכול לעשות בוט שיסדר את זה.


חזקו ואמצו.

חיפוש מצא 8 מופעים, זה לא מצריך בוט. אם היו 200 מופעים הייתי ממליץ על AWB. אם היו 5000 זה עדיין אפשרי עם AWB ו-autoclicker. בוט אפשר לנצל לדברים כאלה אם כבר יש תשתית של בוט החלפות. Uziel302 (שיחה) 20:42, 11 במאי 2019 (IDT)[תגובה]
טופל. 21:34, 11 במאי 2019 (IDT)

העברת דפים לשמות בעלי משמעות

אני שוקל להעביר את הדפים של חבל נחלתו לשמות בעלי משמעות, לדוגמה: חבל נחלתו א א - לזיהוי התכלת בציצית - האם זה עדיף משמעותית או שזה לא שווה את המאמץ? כשאני מחפש בגוגל "לזיהוי התכלת בציצית" הוא כבר עכשיו מציג: "לזיהוי התכלת בציצית - חבל נחלתו א א – ויקיטקסט" למרות שהקישור לדף הישן. אני תוהה איזו השפעה תהיה לשינוי כזה על הדירוג בגוגל ועל חוויית המשתמש. Uziel302 (שיחה) 20:38, 11 במאי 2019 (IDT)[תגובה]

כנראה שזה מיותר מבחינת מדד גוגל. אולי יש בזה יתרון מצד שיקולים אחרים (זה נראה יותר טוב וכו'). david7031שיחה • ז' באייר ה'תשע"ט • 21:29, 11 במאי 2019 (IDT)[תגובה]
אתה מסיק שזה מיותר מהדוגמה שנתתי? אני חושב שגוגל כן נותנים משקל שונה למיקומים שונים במאמר וכותרת יכולה לעזור בקידום. Uziel302 (שיחה) 21:51, 11 במאי 2019 (IDT)[תגובה]
לא רק. עשיתי ניסוי גם עם עוד דף. david7031שיחה • ז' באייר ה'תשע"ט • 22:05, 11 במאי 2019 (IDT)[תגובה]

תיקון תקלדות בקליק

הי, לאחר שמיזם ויקיפדיה:תיקון תקלדות בקליק הביא לתיקון למעלה מ-4000 תקלדות, חשבתי לנסות להביא את המיזם גם לפה. אפשר להתחיל לתקן תקלדות בדף: משתמש:Uziel302/typos. אשמח למשוב ולעזרה בתיקוני תקלדות. אני מודע לעובדה שהעברית פה שונה וחלק מהמילים שהתוכנית שלי חושדת בהן הן מילים תקינות. אבל עדיין יש ברחבי ויקיטקסט תקלדות ודאיות שניתן לתקן בקלות בעזרת הכלי. מתייג את משתמש:Roxette5 שהתעניין בכלי דומה. Uziel302 (שיחה) 21:43, 11 במאי 2019 (IDT)[תגובה]

כלי מצוין. רק סתם מתוך סקרנות, למה הרשימה כל כך קצרה?
דרך אגב, צריך בסוף להוסיף כלי שיתן אפשרות להוריד דברים שהם לא טעות מהרשימה. david7031שיחה • ז' באייר ה'תשע"ט • 22:16, 11 במאי 2019 (IDT)[תגובה]
david7031, יש כפתור הסר כחלק מהסקריפט. הרשימה קצרה כי יש בוויקיטקסט הרבה מילים בכתיב חריג ודאגתי ידנית שיהיה אחוז גבוה של תקלדות אמיתיות. בלי סינון אני יכול להפיק אלפי מילים חשודות. Uziel302 (שיחה) 06:07, 12 במאי 2019 (IDT)[תגובה]
העליתי עוד 66 שגיאות. אשמח לעזרה. Uziel302 (שיחה) 11:54, 25 במאי 2019 (IDT)[תגובה]
איפה מתקינים את הסקריפט? (עשיתי את זה בויקיפדיה, אבל אני לא זוכר איך). david7031שיחה • כ"א באייר ה'תשע"ט • 21:17, 25 במאי 2019 (IDT)[תגובה]
david7031, פה זה שונה מוויקיפדיה, שם זה גאדג'ט שמופיע בהעדפות, פה צריך להכניס importScript('משתמש:Uziel302/typos.js'); לדף הסקריפטים שלך: משתמש:david7031/common.js. תודה Uziel302 (שיחה) 09:41, 26 במאי 2019 (IDT)[תגובה]
כתבתי את זה בדף, וזה לא עבד לי. תוכל להכנס לשם ולבדוק האם כתבתי את זה נכון? david7031שיחה • כ"א באייר ה'תשע"ט • 11:06, 26 במאי 2019 (IDT)[תגובה]
david7031, לא כתבת נכון, צריך להיות בדיוק כך:

importScript('משתמש:Uziel302/typos.js');

תודה. Uziel302 (שיחה) 16:29, 26 במאי 2019 (IDT)[תגובה]

עבד לי. מצוין.david7031שיחה • כ"ב באייר ה'תשע"ט • 19:36, 26 במאי 2019 (IDT)[תגובה]

קישורים לרמב"ם

האם ניתן ליצור קישורים לרמב"ם, כך שיתבססו על "נוסח הדפוסים"[1], כדי שיהיה נח יותר לקשר מויקיפדיה?
נח יותר לקשר ל"הלכות ביכורים", מאשר ל"הלכות ביכורים ושאר מתנות כהונה שבגבולין". (רשימה של נוסח הדפוסים ניתן למצוא בויקיטקסט:רמב"ם). תודה david7031שיחה • י"א באייר ה'תשע"ט • 18:20, 15 במאי 2019 (IDT)[תגובה]

תבנית:ממ רמב"ם, ו-תבנית:ממ רמב"ם/קיצור שם, לא מספיק טובים?--נחום - שיחה 16:24, 16 במאי 2019 (IDT)[תגובה]
והאם זה עובד גם בקישור מויקיפדיה? david7031שיחה • י"א באייר ה'תשע"ט • 16:25, 16 במאי 2019 (IDT)[תגובה]
כדי שזה יעבוד בוויקיפדיה, יצטרך מאן דהוא שיש לו ההרשאות המתאימות בוויקיפדיה לייבא את התבנית ותבנית-הבת מכאן, מן הסתם.--נחום - שיחה 16:59, 16 במאי 2019 (IDT)[תגובה]
איזה הרשאות צריך? david7031שיחה • י"א באייר ה'תשע"ט • 17:01, 16 במאי 2019 (IDT)[תגובה]
נראה לי שדי בהרשאת מפעיל מערכת.--נחום - שיחה 17:06, 16 במאי 2019 (IDT)[תגובה]
כמובן שאחד הוויקיפדים יצטרך לערוך אח"כ את התבנית כדי שהיא תקשר משם אלינו ולא לוויקיפדיה.--נחום - שיחה 17:09, 16 במאי 2019 (IDT)[תגובה]
בסדר, פניתי לאחד המפעילים.david7031שיחה • י"א באייר ה'תשע"ט • 17:17, 16 במאי 2019 (IDT)[תגובה]
יוער, שהתבנית אינו שלימה ויש בה עוד הרבה קיצורי שמות להוסיף. בזמנו בקשתי ליצור את זה עבור עבודה שלי בעין המשפט על גמרא והוספתי בו קיצורי שמות שבהם נתקלתי במהלך עבודתי. זאת אומרת שייתכן מאוד שישנם עוד הרבה שמות של הלכות ברמב"ם שלא נתוספו לתבנית. כדאי להוסיף אותם לפני שאנשים מוויקיפדיה מייבאים את התבנית בכדי למנוע כפל עבודה. אנסה כרגע להעיף אל זה מבט במה שאוכל.--Roxette5 (שיחה) 21:41, 16 במאי 2019 (IDT)[תגובה]
התבנית כבר יובאה, אבל עדיין אפשר להוסיף, ואני אוסיף בויקיפדיה. david7031שיחה • י"ב באייר ה'תשע"ט • 21:43, 16 במאי 2019 (IDT)[תגובה]

הערות

  1. ^ כן כן, זה הידוע לשמצה

איפה קבצי המשניות נמצאים פיזית

הדפים של כל משנה נשאבים מאיפשהוא. איפה זה? (שואל בעקבות דיווח על טעות). david7031שיחה • ט"ו באייר ה'תשע"ט • 13:16, 20 במאי 2019 (IDT)[תגובה]

בדפי משנה מסכת x דפוסים, למשל: משנה ברכות א דפוסים מכיל את המשניות לפרק א במסכת ברכות.--נחום - שיחה 16:58, 20 במאי 2019 (IDT)[תגובה]
ברוב המסכתות יש עותק מקביל במשנה המבוארת. לכן, אודה לך אם תעדכן אותי בתיקון כדי שאבדוק שהוא מתוקן גם שם. Ahituvrs (שיחה) 08:36, 21 במאי 2019 (IDT)[תגובה]
מסכת בבא בתרא ב ד תקלדה.david7031שיחה • ט"ז באייר ה'תשע"ט • 08:41, 21 במאי 2019 (IDT)[תגובה]