שתף קטע נבחר

מה עושים עם הדיסקטים? פרויקט אירופי משמר פורמטים ישנים

המועצה לשימור קבצים: נפחי האיחסון האינסופיים של האינטרנט יוצרים אשליה של כספת נצחית לקבצים, אבל לאיש לא ברור איך, והאם יידעו בעתיד לקרוא אותם. פרויקט מיוחד של הקהילה האירופית מנסה לייצר פתרונות: מהמרה אוטומטית עד שימור מחשבי DOS

זה אולי נראה כמו הסטוריה עתיקה, אבל עד לפני שנים ספורות לא מעט אנשים בישראל עבדו עדיין עם מעבדי תמלילים כמו Qtext, איינשטיין או Word Perfect. הקבצים נשמרו על דיסקט פלופי בגודל ‭5.25‬ אינץ‭,'‬ והמתקדמים יותר השתמשו כבר בדיסקט בגודל ‭3.5‬ אינץ‭.'‬ מי שלא דאג להמיר את הקבצים בזמן נמצא כיום בבעיה לא פשוטה - הוא צריך חומרה מתאימה, כלומר כונן דיסקטים שיוכל לקרוא את הדיסקט, ותוכנה, שתדע לפענח את המידע ששמור בו.

 

מלחמת הפורמטים

חושבים שבעיה כזאת כבר לא רלוונטית? ובכן, בשנים האחרונות אמנם נראה כאילו הכל כבר עובדים עם אותם פורמטים, למשל קובצי doc או ‭,rtf‬ אבל בטווח הארוך איש לא מוכן להתחייב עם אלו מערכות ותוכנות נעבוד בעתיד. ומה יקרה אם יום אחד תיפסק התמיכה בפורמטים הפופולריים כיום?

 

במהלך השנים צצים חידושים ומתנהלות גם "מלחמות פורמטים‭."‬ בחבילת Office‭,2007‬ למשל, הציגה מייקרוסופט פורמט חדש ‭,docx -‬ שאינו נתמך אוטומטית בגרסאות קודמות של התוכנה (אלא מצריכה הורדה של קובץ עדכון) וגם לא על-ידי החבילה המתחרה, Open Office החופשית.

 

Office 2007‬ מנגד, לא מציעה תמיכה בפורמט odf של Open Office. לבחירה בפורמט הקבצים אתו תעבדו, אם כן, יש השלכות ארוכות טווח: יתכן שכל התכנים שתיצרו ותשמרו פשוט לא יעבדו בעתיד. לא מדובר רק בקובצי טקסט - ייתכן שבעתיד יפותחו פורמטים מוצלחים יותר לשמירת תמונות, שירים או סרטים, ואז יהיה צורך להמיר את כל הספריות שיצרתם לפורמט החדש. פיספסתם קובץ? על הנייר, יתכן שלא תהיה דרך חזרה.

 

ומה על אמצעי הגיבוי? כונני הדיסקטים כבר לא בשימוש, ולאחרונה נכנסו גם כוננים אופטיים לרשימת אמצעי המדיה הנמצאים בסכנת הכחדה. באפל, שהייתה הראשונה לבשר על מות הדיסקט כשהציגה מחשב נטול כונן דיסקטים, כבר טוענים שאין צורך גם בכונן CD או DVD ואפילו לא מציעים כונן כזה ב-MacBook Air העולם הרי עובר לכרטיסי זיכרון דיגיטליים, שמציעים אותו נפח, אפילו גדול יותר, באמינות גבוהה יותר.

 

גם אם טרחתם לגבות את כל המידע החשוב שלכם ל‭CD-‬ או ל‭DVD-‬ אתם לא חסינים. יצרני הדיסקים מצהירים אומנם, כי אלה אמורים לשמור מידע לתקופה של עד 100 שנה, אבל בפועל חלקם הופכים בלתי שמישים כבר לאחר שנים ספורות - בגלל תנאי האחסון שלהם או אופן השימוש בהם. עניין הפורמטים תקף גם כאן: אם שמרתם מידע - סרטים, שירים, תמונות או מסמכי טקסט - בפורמט שאף תוכנה כבר לא תומכת בו, ייתכן שהלך לאיבוד. גם גיבוי באתרי אינטרנט לא מבטיח שהמידע יישמר: חלק מאתרי האחסון נסגרים או מוחקים מידע שנשמר בהם אם לא התבצעה פעילות כלשהי במשך תקופה מסוימת.

 

נאסא מודאגת

"שימור של מידע דיגיטלי הוא לא דבר שקורה מעצמו, צריך לתכנן את זה מראש‭,"‬ מסבירה ד"ר דלית נאור, מנהלת תחום טכנולוגיות האחסון במעבדת המחקר של IBM בחיפה. "ספר או מגילות ישנות יכולים להשתמר במקרה, במערה כלשהי למשל, ואחרי מאות שנים ימצאו אותם ויצליחו לפענח אותם. קובץ דיגיטלי שלא יעבור המרה לפורמט עדכני, או לא יכיל מראש מידע שיאפשר לתוכנות לעבוד איתו, יהיה חסר ערך‭."‬

 

חוקרים במעבדת המחקר של IBM בחיפה שותפים ב‭CASPAR-‬ (ראשי תיבות של "שימור, גישה ושליפה של ידע תרבותי, אמנותי ומדעי‭("‬ פרויקט כלל אירופי, אשר מטפל במידע הקשור לתכנים תרבותיים של מדינות הקהילה האירופית, מחקרים מדעיים ואמנות בת-זמננו. הפרויקט ממומן על-ידי של הקהילייה האירופית, ומיועד לפתח אמצעים ודרכים לשימור מורשת ומשאבים תרבותיים ומדעיים. שותפים בו גם גופים דוגמת אונסקו, סוכנות החלל האירופאית, אוניברסיטאות מאירופה, וגופים טכנולוגיים ועסקיים. פרויקט CASPAR צפוי להסתיים עד סוף ‭.2009 ‬

 

הפרויקט מתמקד ביישום מודל ‭,OAIS‬ המקובל כיום כתקן בינלאומי לשימור מידע דיגיטלי. CASPAR יפתח רכיבים ומסגרת כוללת להצגת מידע ולשימורו, במסגרת אחסון וירטואלי, תוך שימוש במערכות לניהול זכויות יוצרים בסביבה דיגיטלית ‭(DRM)‬ ושליטה מלאה בהצגת היידע המאוחסן.

 

"נאסא היו בין הראשונים שהבינו שהם עשויים להיות בבעיה‭,"‬ מסבירה נאור. "חלק גדול מהתקציב שלהם ושל גופים דומים מוקדש לשימור המידע הקיים. אם שולחים חללית בעלויות עצומות והיא אוספת ומשגרת מידע אבל המידע לא נשמר לאורך זמן, פשוט זרקו כסף לפח‭."‬

 

לא תהיה קופסת קסם לשמירת הקבצים

נאור ממהרת להבהיר: "אני לא מאמינה שיהיה פתרון פלא. לא תהיה 'קופסה' שמכניסים אליה סוג מסוים של מדיה - בטח לא קופסה שתקבל את כל סוגי המדיה הישנים - ומקבלים את המידע מעודכן או משוחזר. אנחנו מנסים למצוא פתרונות, ואני מניחה שהם ישתלבו בעתיד במוצרים חדשים וקיימים‭."‬

 

אחד הרעיונות הוא לפתח מערכת אחסון עם יכולת עדכון אוטומטי לקבצים: "אם שמרת, למשל, קובץ ‭,doc‬ והמערכת תקבל עדכון שמשהו משתנה בפורמט, היא תבצע המרה או פעולה כלשהי, כדי שהקובץ יהיה נגיש וקריא‭,"‬ מדגימה ד"ר נאור. "יהיו מאגרי מידע מרכזיים, שירכזו מידע לגבי הפורמטים השונים ואופן ההצגה שלהם, והמערכת תתעדכן מהם בשינויים שהיא צריכה לבצע. מוצר כזה יהיה רלוונטי יותר לארגונים ולגופים גדולים ולא לצרכן הביתי. יכול להיות שלצרכן לא יוצע מוצר, אלא שירות של אחסון קבצים באתר מרוחק, דרך האינטרנט, ושם יעדכנו את המידע‭."‬

 

לדברי נאור, סיכויי הישרדות גבוהים יותר יהיו לקובץ שיכיל כמה שיותר מידע הנוגע לאופן הפעולה שלו ולתוכנה שעובדת איתו. בקובץ כזה המידע ארוז יחד עם כמויות גדולות של "מטא- נתונים‭-"‬ נתוני-על אודות הנתונים המאוחסנים, כמו הקונטקסט שבו נוצר ואוחסן התוכן, פורמטים ואופני הצגה. קבצי PDF הם אחת הדוגמאות המוצלחות לכך: פורמט PDF מסוגל לשמור על העיצוב, הפונטים, העימוד והגרפיקה של המסמך המקורי, ללא תלות במערכת ההפעלה בה המסמך נוצר. המידע שנשמר בקובץ עצמו קובע איך הוא יוצג.

 

גם שמירה בכמה פורמטים שונים נותנת יותר אפשרויות וסיכויים לשימוש עתידי בקובץ. בשיטה הזאת יתבזבז יותר מקום, מאחר שכל קובץ יישמר בכמה גרסאות ועותקים. מצד שני, המרה לפורמט אחד פופולרי יכולה להגדיל את הנגישות אליו - אם שומרים, למשל, קובץ docx גם בפורמט ‭,rtf‬ אפשר לפתוח אותו בחבילת Office של מיקרוסופט, בחבילת Open Office, בשירות Google Docs,‬ תוכנת AbiWord ועוד. בצעד אחד פשוט הקטנו את התלות שלנו בתוכנה אחת מסוימת.

 

ד"ר נאור מציגה גישה נוספת לסוגיית העבודה עם פורמטים דיגיטליים ישנים - גישת המוזיאון: "לפי השיטה הזאת יהיו כמה מקומות מרכזיים שיציעו שירותי שחזור או המרה של פורמטים ישנים. הבעיה היא, שצריך לשמר את כל סביבת העבודה הישנה - אם זאת תוכנה שעובדת על בסיס דוס, צריך שיהיה מחשב שמריץ דוס וצריך גם לתחזק אותו. השיטה הזאת גם משמרת קבצים ישנים בפורמט הישן, ולא מציעה להתקדם עם הטכנולוגיה‭."‬

 

נאור לא רואה בגישה הזו פתרון אידיאלי: בגלל התקדמות הטכנולוגיה, אין הרבה טכנאים ואנשי מחשבים שיודעים לתפעל ולתחזק מערכות ישנות. אם כבר, היא מציעה, במקום לשמר מחשב וסביבת עבודה ישנים, אפשר גם לעבוד בסביבה וירטואלית, דוגמת VMWare או ‭,Microsoft Virtual PC‬ ולהריץ על מחשב חדש סימולציה של מערכת ישנה כמו דוס, Windows 98 או כל מערכת אחרת.

 

אז מה עושים בינתיים? הרי לא נתחיל לשמור במחשב הביתי כל קובץ בחמישה פורמטים שונים ובכמה צורות אחסון שונות - במחשב הביתי על ‭,DVD‬ באתר אינטרנט, בזכרון נייד וכולי.'‬ כדאי, פשוט, לעבוד עם הקבצים הפופולריים והסטנדרטיים. כל "סטייה" לכיוון פורמט פחות מוכר, גם אם הוא איכותי יותר, עשויה להביא לחוסר תאימות בעתיד ולאובדן מידע.

 

לפנייה לכתב/ת
 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
עוד יש לכם קבצים ישנים?
צילום: סי די בנק
מומלצים