שתף קטע נבחר

האלגוריתם שיפענח כתבי יד

פרויקט חדשני של אוניברסיטת בן גוריון ישלב בין היכולת המדעית והמחקרית של מדעי הרוח ומדעי המחשב, על מנת לאפשר קריאה ומחקר של מסמכים עבריים וערביים שעברו דגרדציה ונמחקו תוך שנכתבו עליהם מחדש טקסטים חדשים

באומנות מוכרת התופעה של יצירות שתחתן מופיעים ציורים ישנים שכוסו או נמחקו. אנו שואלים את עצמנו לא פעם: מה יש מתחת ליצירה שצוירה מחדש? מה האמן המקורי צייר בטרם צוירו גרסאות התיקון החדשות על הציור המקורי? גם חוקרי הספרות מכירים תופעה דומה, היא נקראת בשפה מקצועית - פאלימפססטים.

 

עוד בנושא:

 

פאלימפססטים הם כתבי יד מחוקים (המלה באה מהמלה היוונית Palimpsestos שפירושה "לגרד שוב"), שהטקסט המקורי שלהם קולף וגורד ואז נכתב עליו טקסט חדש. כתבי יד בימי הביניים נכתבו על קלפים, שהוכנו וקולפו במיוחד מעור חיות. מטעמי חיסכון, היה נהוג לקחת סכין ופשוט לגרד את הטקסט מהקלף ולכתוב על הקלף שוב פעם מחדש טקסט חדש.

 

פאלימפססט ידוע הוא הפאלימפססט של ארכימדס. על הקלף המקורי שעליו כתב ארכימדס, נכתב ספר תפילה שהושלם בשנת 1229 וכנראה נכתב בירושלים. הבעיה היא שבין כתבי ארכימדס ישנם עותקים יחידים ובודדים של רעיונותיו. עתה נשאלת השאלה כיצד נציל את כתביו של ארכימדס מתחת לספר התפילה הימי ביניימי? הארכיאולוגים וההיסטוריונים מאוד רוצים לדעת מה כתוב בטקסט המקורי שמופיע מתחת לטקסט החדש. עד היום היה מאוד קשה לחקור פאלימפססטים למסיבה זו נותרו טקסטים רבים בלתי מפוענחים.

 

לפני כמה ימים הגיעה הבשורה מאוניברסיטת בן גוריון בנגב. חוקרים בבן גוריון ישלבו את היכולת המדעית והמחקרית של מדעי הרוח ומדעי המחשב וכל זאת בפרויקט חדש שנועד לחקור מסמכים עבריים וערביים שהם במצב מאוד ירוד. יחקרו מסמכים עתיקים כמו למשל אוסף כתבי היד שקרוי גניזת קהיר ואוספי כתבי היד בספריה באל-אזאר בקהיר, ומסמכים עבריים שנמחקו תוך שנכתבו עליהם טקסטים אחרים.

 

המאמץ לפתח אלגוריתמי מחשב חדישים משלב את המומחים מאוניברסיטת בן גוריון מכמה תחומים: ראיה ממוחשבת, גרפיקה ממוחשבת, מומחי עיבוד תמונה וגיאומטריה חישובית, ואלה יחד עם המומחים להיסטוריוגרפיה וליטורגיה וכל זאת כדי לספק תשובות בעלות ערך בנוגע לטקסטים יהודיים ליטורגיים וטקסטים ערביים היסטוריים שיקדמו את המחקר האקדמי בתחומים אלה.

 

המטרה הטכנית של המחקר היא לפתח אלגוריתמים חדשים ביותר לבחינת הטקסטים ולשלבם בתוך מערכת כלים פתוחה שקל לתפעל אותה. מערכת שנועדה לסייע להיסטוריונים לסווג מסמכים בעולם כולו.

 

פרופ' אורי ארליך מהמחלקה למחשבת ישראל באוניברסיטת בן גוריון, שמתעניין בספרי תפילה קדומים מסביר: "היה פאלימפססט אחד, ספר שהשתמשו בו במקור כספר תפילות עברי החל מהמאה ה-12, אולם קלפו אותו, והשתמשו בקלף שלו כדי לכתוב עליו טקסט ערבי. המטרה היא לקרוא את הספר הראשון בטרם הוא נמחק ולא את הספר השני. כיצד יעשו זאת? צריך להפריד בין האותיות העבריות שנותרו ברקע לבין האותיות הערביות מקדימה. משימה זו היא מורכבת מכיוון שהדיו של הכתב העברי מתערבב בדיו של הכתב הערבי".

 

כדי לנסות ולפתור את הבעיות האלה יצרו החוקרים אלגוריתם שיוכל לכסות את הפאלימפססט בצבע אפור כהה. אחר כך הוא מאיר בפיקסלים בעלי צבע בהיר יותר כצבע רקע את מה שמאחור ומנסה לזהות את הפיקסלים הכהים יותר בקלף המחוק מאחור, את האותיות העבריות המקוריות. כך מתארת זאת פרופ' קלרה קדם מהמחלקה למדעי המחשב ואחת מיוצרות המערכת. המערכת תוכל להיות ישימה גם לשפות אחרות ולא רק לעברית ולערבית.

 

לבלוג של ד"ר גלי ויינשטיין

 

לפנייה לכתב/ת
 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
מגילות מדבר יהודה
צילום: AP
מומלצים