המחשב שאף פעם לא מפסיד בפוקר

הוא "שיחק" מיליארד כפול מיליארד משחקי טקסס הולדם ולמד מכל יד, הוא כמעט אף פעם לא פורש בסיבוב הראשון ובטווח הארוך הוא תמיד מנצח. הכירו את קפאוס

ynetפורסם: 12.01.15 , 12:59

בסיבוב הראשון תמיד כדאי להעלות את ההימור, מה שיכול להוביל לפרישה המיידית של היריב. בסיבובים הבאים, אם היריב מעלה בעצמו, העלה את ההימור אם אתה מחזיק לפחות בזוג של 3. אם אתה מתלבט - עדיף לטעות ולהמשיך לשחק, ולא לפרוש. אלו והחלטות רבות אחרות בגרסה הפופולרית של הפוקר - טקסס הולדם לשני אנשים - מובילות לאסטרטגיה קרובה לאופטימלית, שבטווח הארוך היא בלתי מנוצחת. זוהי לפחות המסקנה במחקר שתוצאותיו פורסמו בשבוע שעבר במגזין "Science".

עוד בחדשות בעולם

במינוס 3 מעלות: בני הערובה בחדר הקירור

זמין ונפוץ: הנשק של המחבלים מפריז

עומאן: הסולטן גוסס, קרב הירושה בדרך

תוכנת מחשב שמתבססת על האסטרטגיה הזו היא הראשונה מסוגה "לפתור" כל סוג של פוקר. מדען המחשב מייקל בולינג מאוניברסיטת אלברטה שבקנדה, שהוביל את המחקר, אמר כי התוכנה "קפאוס" משחקת באופן הקרוב ביותר לשלמות שאפשרי מבחינה מתמטית ומסיימת לכל היותר בתיקו - בטווח הארוך, כשבוחנים מספר רב של הימורים, "ידיים".

המדענים אמרו כי קפאוס טובה כל כך, עד שגם כוכב פוקר שישחק מולה כל חייו לא יוכל לנצח אותה. כדי ללמוד את המשחק, קפאוס שיחקה במשך חודשיים מספר המקביל למיליארד כפול מיליארד של משחקי טקסס הולדם, יותר משחקי פוקר ששוחקו בהיסטוריה האנושית. ב-4,000 מעבדי מחשב נעשה שימוש בדרך למטרה, בכל אחד מהם שוחקו 6 מיליארד ידיים מדי שנייה.

גם כוכב פוקר אף פעם לא יגבור על קפאוס(צילום: AP)

כל משחק של קפאוס שיפר את האסטרטגיה שלה - הוא נכנס למאגר הנתונים, ששמר את הקלפים שחולקו, ההחלטות שנעשו והתוצאות. בסופו של מרתון האימונים המטורף הזה הכיל מאגר הנתונים הממוחשב 11 טרהבייט של מידע על השוואות, העלאות והתקפלויות, על כל יד שיכולה להיות לשחקן. "קפאוס החלה עם אסטרטגיה די גרועה, אבל כל יד נוספת שיפרה אותה", הסביר לעיתון הבריטי "גרדיאן" ניל בורץ', אחד המפתחים.

התוכנה קפאוס היא הרבה יותר ממחשב שמשחק פוקר. המדען סם גנזפילד אמר לסוכנות הידיעות רויטרס כי התוכנה שסייע לפתח, וזכתה בתחרות הפוקר למחשבים ב-2014, עשויה להיות שימושית בעתיד גם לאבטחת סייבר, לרפואה ולמשא ומתן עסקי. "התוצאה היא התקדמות משמעותית בפוקר ממוחשב ובבינה מלאכותית", הוסיף.

ההיסטוריה של מחשבים ומשחקים ארוכה מאוד. תוכנות מחשב שניצחו את המובילים בעולם בדמקה, שחמט ו"ג'אופרדי" סייעו להתפתחות הבינה המלאכותית, וגם למטרות שונות לחלוטין. בולינג מזכיר למשל כי אסטרטגיות שאימצו מחשבים במשחקי שחמט הובילו לאופטימיזציה בניתוב תעלות ביוב.

יוהנסון ובולינג. האנשים מאחורי קפאוס(צילום: AP)

פוקר, עם זאת, מייצג אתגר ייחודי וקשה בהרבה למחשבים. בניגוד לשחמט ולדמקה, המחשב לא יודע מה מצבו של היריב - הוא לא יודע מהם קלפיו. מספר המצבים האפשריים מבחינה תיאורטית, שבהם יש לחשב את הסיכויים ולבחור אם להמר (bet), להשוות (call), להעלות את ההימור (raise) או לקפל את היד, או לפרוש (fold) הוא אסטרונומי – 319 טריליון ליתר דיוק. גודל הזיכרון המוגבל של המחשבים מקשה על חישוב שכזה.

קפאוס משחקת טקסס הולדם לשניים "מוגבל" (מספר ההימורים והעלאות ההימור תחום). המחלק מעניק לכל שחקן שני קלפים שפניהם למטה, ואחר כך חמישה קלפים משותפים – אחד בכל פעם, שפניהם כלפי מעלה. השחקנים מהמרים אחרי כל חלוקה, ומשתמשים בקלפים המשותפים כדי להרכיב את "היד" הטובה ביותר. התוכנה שפותחה מעלה כמעט תמיד את ההימור אחרי חלוקת שני הקלפים הראשונים, אבל מקפלת את היד כאשר היא מקבלת זוגות שצפויים להפסיד כמו 3 ו-7 או 2 ונסיך.

בלתי אפשרי לנצח בכל יד, כי היריב יכול לקבל בתחילה זוג אסים או יד מוצלחת אחרת. לכן, קפאוס משחקת בצורה הטובה ביותר האפשרית – גם אם היא לא תמיד מובילה לניצחון. היא בודקת את הקלפים שלה מול מאגר הנתונים וההסתברויות השונות, וכך מחליטה כיצד לנהוג. "אני בטוח שנקבל הרבה מיילים מאנשים שישחקו 20 או 30 ידיים מולנו, ינצחו לא מעט ויכריזו כי יש באג בקפאוס. אבל בזמן שאדם יכול להיות בר מזל ולנצח את קפאוס בטווח הקצר, אף אחד לא יכול לגבור עליה בטווח הארוך", הצהיר אחד ממפתחיה, מייקל יוהנסון.

מצאתם טעות בכתבה? כתבו לנו