שתף קטע נבחר

מבחנה אחת במקום חוות שרתים

17 טריליארד ג'יגה-בייט של מידע דיגיטלי מאוחסנים כיום ברחבי העולם באלפי חוות שרתים ענקיות. פריצת דרך שהושגה על ידי חוקר ישראלי תאפשר לאחסן ב-DNA בגודל מכולה את כל המידע שנוצר מעולם

גם לכם אזל לאחרונה מקום האחסון בטלפון או במחשב? אתם יכולים להתנחם שזו בעיה שמטרידה את האנושות כולה. כמות המידע והנתונים הדיגיטליים שנוצרים בכל רגע היא בלתי נתפסת ונמצאת במגמת גידול מתמיד: מטקסט ומסמכים ועד תמונות או וידיאו, מציוצי טוויטר ועד קוד של תוכנות מחשב ומסדי נתונים.

 

בשנתיים האחרונות יצר המין האנושי יותר נתונים מאשר בכל ההיסטוריה שקדמה להן. לפי חברת המחקר IDC, כמות המידע הדיגיטלי המאוחסן ברחבי העולם תגיע השנה לכ־17 טריליארד ג'יגה-בייט.

 

 (צילום: Shutterstock) (צילום: Shutterstock)
(צילום: Shutterstock)

 

לכל המידע הזה צריך מקום, והרבה. רובו נשמר באלפי חוות שרתים ובמרכזי מידע עצומים הפרוסים על פני הגלובוס כולו, וצורכים מקום, משאבים ואנרגיה. הבעיה רק תחמיר, שכן קצב השיפור של אמצעי האחסון הקיימים הולך ומואט.

 

אך טכנולוגיה חדשה שצוברת תאוצה בשנים האחרונות עשויה לאפשר יום אחד לשנות את המצב הזה באורח דרמטי. באמצעותה ניתן, תיאורטית, לאחסן את כל המידע הדיגיטלי שנוצר אי־פעם בתוך חדר אחד בלבד.

 

המפתח הוא ה-DNA. בשנים האחרונות הצליחו חוקרים להראות כי ניתן לאחסן מידע דיגיטלי כמו סרטונים, קבצי מוזיקה, טקסט, תמונות, מסמכים, תוכנות ועוד - בתוך DNA.

 

ה-DNA הוא "חוות השרתים" של הטבע. הוא מופקד על שמירת כמות אדירה של מידע חשוב ביותר, ללא שגיאות ותקלות ולאורך זמן רב: מולקולות ה־DNA מכילות את הגנים המהווים את הקוד, או את "ספר ההוראות", לבניית רכיבי תאי הגוף של כל היצורים החיים. לפיכך, ה־DNA מצטיין ב"נפח אחסון", באמינות ובאורך חיים גדולים לאין שיעור מכונני האחסון האלקטרוניים שפיתח האדם.

בתחילת החודש נרשמה פריצת דרך משמעותית בחקר התחום, וזו הגיעה מהחוקר הישראלי פרופ' יניב ארליך, איש מדעי המחשב מאוניברסיטת קולומביה וראש מעבדה במרכז הגנום בניו־יורק, שלאחרונה מונה למדען הראשי בחברת הסטארטאפ הישראלית MyHeritage; ומהחוקרת דינה זילנסקי ממרכז הגנום בניו-יורק. השניים הצליחו למצוא דרך חדשה וטובה מאי-פעם לקודד מידע דיגיטלי על גבי DNA, ופירסמו מאמר עם תוצאות המחקר בכתב העת המדעי Science.

 

השיטה החדשה מאפשרת לצופף 215 מיליון ג'יגה-בייט על גרם אחד של DNA. כלומר: באופן תיאורטי, אפשר יהיה לאחסן כל פריט מידע שנוצר אי־פעם על ידי בני אדם בתוך מכולה בגודל שני טנדרים.

 

מיקרוסופט בעניינים

הרעיון לאחסן מידע על DNA עלה כבר בשנות ה-60. המחקר הראשון שהוכיח כי אפשר לעשות זאת פורסם רק ב-2012, כאשר ג'ורג' צ'רץ' וסרי קוסורי, גנטיקאים מהרווארד, הצליחו לקודד ספר של 52 אלף מילים על גבי DNA. ב-2013 חוקרים במכון לביואינפורמטיקה בבריטניה הדגימו אף הם שיטה לעשות זאת. גם במיקרוסופט עובדים על הנושא: ב-2016 חוקרים מהחברה, בשיתוף חוקרים מאוניברסיטת וושינגטון, הצליחו לכתוב 200 מגה-בייט של מידע לתוך DNA.

 

במיקרוסופט הסבירו שהם רוצים ליצור מערכת אוטומטית מבוססת DNA, שמסוגלת לאחסן מידע ולשמש לצורכי אחסון ארגוני. היתרונות ברורים: "כמות DNA בגודל ובמשקל של קופסת נעליים תוכל לאחסן כמות מידע שהיא שוות ערך ל-100 מרכזי מידע", הסבירה קארין שטראוס, החוקרת הראשית של מיקרוסופט בפרויקט, למגזין MIT Technology Review.

 (צילום: Shutterstock) (צילום: Shutterstock)
(צילום: Shutterstock)

  

איך זה עובד? כל קובץ דיגיטלי מבוסס על קוד בינארי - רצפי המספרים 0 ו־1. הרעיון הוא לתרגם את הקוד הבינארי, באמצעות תוכנה, למחרוזות הבנויות מאותיות ה-DNA - ארבעה בסיסים כימיים (נוקליאוטידים) המסומנים כ-A, G, T, C. לאחר מכן, מסנתזים את ה-DNA בצורה מלאכותית (באמצעות חברות המתמחות בכך), ומקבלים מבחנה - ובתוכה DNA שעליו מאוחסנים הקבצים. ואיך קוראים את המידע שאוחסן? את קוד ה-DNA קוראים באמצעות תהליך שנקרא "ריצוף", ומזינים אותו למחשב, שמתרגם מהקוד הביולוגי חזרה לקוד הבינארי הרגיל.

 

סרט צרפתי אילם 

ארליך וזילנסקי ביצעו את התהליך על 6 קבצים בגודל כולל של 2.14 מגה־בייט - ביניהם מערכת הפעלה של מחשב, וירוס מחשב, עותק של הסרט הצרפתי האילם מ-1895 "רכבת נכנסת לתחנה", ומחקר מ-1948 של קלוד שאנון, אבי תורת האינפורמציה.

 

אלגוריתם חדש, המכונה DNA Fountain (מזרקת ה־DNA), ביצע את תהליך כתיבת וקריאת המידע בשיטה יעילה מאי־פעם: "המחקרים הקודמים לא סידרו את המידע בצורה אופטימלית ב־DNA, כך שנותר מקום לא מנוצל", מסביר ארליך ל"ידיעות אחרונות". "הם בעצם לא סחטו את הלימון עד הסוף. השיטה שלנו איפשרה לאחסן 1.6 ביט על גבי כל נוקליאוטיד, 60% יותר מהשיטות הקודמות".

 

ארליך מסביר כי הישג חשוב נוסף של השיטה החדשה הוא היכולת לשמור ולקרוא את המידע בצורה אופטימלית, עם הרבה פחות שגיאות ואובדן מידע. זאת בזכות העובדה שהאלגוריתם מסוגל לקרוא קובץ אפילו אם יש בו "חורים". "זה כמו שניקח פאזל סודוקו לילדים, ונמחק חלק מהתאים. עדיין יהיה אפשר לפתור אותו אם יהיו מספיק רמזים", אומר ארליך. המחקר הראה שניתן גם לשכפל את המידע מספר רב של פעמים מבלי לאבד אותו.

 

בקהילה המדעית מתייחסים למחקר כהוכחה ניצחת לכך שאכן ניתן לאחסן מידע בקנה מידה גדול ב-DNA.

 

המידע לא אובד

היתרונות של אחסון מידע ב-DNA ברורים. כאמור, ה-DNA מסוגל לאחסן מידע בצפיפות הרבה יותר גבוהה מאשר כונני אחסון אלקטרוניים. בנוסף, הוא מצטיין באורך חיים גדול במיוחד: בניגוד לתקליטורים ולכוננים קשיחים ה-DNA לא מתיישן. נסו היום לשחזר תמונות ששמרתם על שקופיות בשנות ה-70 או סרט וידיאו שצילמתם בשנות ה-90, וכנראה תתקשו למצוא מכשיר שיקרין אותם. לא כך עם ה-DNA: מפני שהוא נמצא בכל יצור חי, סביר להניח שבני אדם תמיד יידעו ויוכלו לפענח את המידע הצפון בו. והוא גם עמיד לאורך זמן: אם תחזיקו את ה־DNA בסביבה יבשה וקרירה הוא יחזיק גם אלפי שנים. הסרטים המגנטיים, המשמשים כיום לשמירת מידע לטווח ארוך, מחזיקים כמה עשורים בלבד.

 

כל זה הביא חוקרים לכנות את ה-DNA אמצעי אחסון "חסין אפוקליפסה". תיאורטית, גם אחרי אסון קטסטרופלי גלובלי, שימחק את התרבות וההתקדמויות הטכנולוגיות, הדורות העתידיים יוכלו להגיע לדרכים לפענח DNA ולהפיק את המידע הדיגיטלי שנשמר עליו בעבר.

 

אך היישום של הטכנולוגיה, כמובן, עדיין רחוק. המחסום העיקרי הוא כלכלי - תהליך סינתזת וריצוף ה-DNA עדיין יקר, כך שעלות קידוד של כ־2 מגה-בייט ב-DNA עומדת על 9,000 דולר. זה כמו לשלם על 12 אייפונים ולקבל בעצם תקליטון (דיסקט-פלופי) אחד.

 

רק בעתיד, כאשר העלויות יוזלו דרמטית, יהיה אפשר לדבר על פתרון ישים ותחרותי שייכנס לשוק הרחב. ארליך מאמין שזה יקרה מהר מהצפוי. מחירי ריצוף ה-DNA ירדו דרמטית בעשרים השנים האחרונות: ריצוף של גנום עלה לפני עשרים שנה כ-3 מיליארד דולר, וכיום עולה 1,500 דולר בלבד. "זה כמו שבעוד עשרים שנה אפשר יהיה לקנות מאות מכוניות פורשה באגורה אחת, ועוד יישאר עודף", הוא מסביר. בנוסף, מזכיר ארליך, המחיר הנוכחי משקף את היישומים הרגילים והמדעיים של סנתוז DNA. "לצורך אחסון מידע ב־DNA יהיה אפשר להשתמש בשיטות סנתוז מהירות ו'מלוכלכות' יותר, וכך לחתוך את המחיר".

 

בכל מקרה, אל תצפו שהסמארטפונים והמחשבים שלכם יצוידו בעתיד בכונני אחסון מבוססי DNA, בין השאר בגלל שתהליך הכתיבה והגישה למידע עדיין איטי וממושך יחסית לכוננים רגילים (כדי לשלוף את המידע השמור ב-DNA יהיה צורך בתהליך שייקח יום-יומיים). "לא נסתובב עם דיסק און קי של DNA", אומר ארליך. אבל לדבריו, ה-DNA יוכל לשמש לצורכי גיבוי, ארכוב ואחסון ארוך־טווח. "זה יתאים, למשל, לממשלה שרוצה לשמור מידע לאורך זמן נגד קטסטרופה. אני חושב שיישום אמיתי וראשון יגיע כבר בעוד עשור".

 

הכתבה פורסמה במוסף "ממון" ב"ידיעות אחרונות"

 

לפנייה לכתב/ת
 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
מומלצים