הרומן הממושך שלנו עם רובוטים ומכונות חכמות מתקיים בעיקר בקולנוע ובספרות. במציאות, העניינים הרבה יותר יגעים. ההשוואה המתמדת ליכולות של המוח האנושי מלמדת כי מכונה תבונית הינה עדיין חלום רחוק.
ובכל זאת, בשנים האחרונות יש כמה סימנים שמשהו מתחיל לזוז. תוכנה חדשה שיודעת לתרגם מילים ומשפטים לתמונות היא בהחלט דוגמא מעניינת לכך.
———————————————–
והגיע הזמן לתת בהן תבונה
לא פעם כאשר אני נוסע לבד במכונית אני מוצא עצמי צוחק בקול רם. זה קורה כאשר אני נמצא בסוג של אינטראקציה קולית עם “סירי”, העוזרת הטלפונית החכמה של אפל. הניסיונות של סירי להקריא לי הודעות חדשות, לקשר אותי בטלפון, או לשלוח בשמי הודעת ווטסאפ, נגמרות פעמים רבות במה שאני קורא: תאונות קוליות משעשעות. אלה נגרמות בדרך כלל על רקע המפגש הלא מוצלח של סירי עם השפה העברית וגם עם המפעיל שלה בן האנוש. זה בא לידי ביטוי, בין היתר, בשבושים ועוותי שמות, תגובות שאינן במקום, ואפילו בשורה של התחכמויות מוזרות. סירי ושורה של אפליקציות דומות של חברות אחרות ממחישות יפה את מצבה של ה-AI ברבע הראשון של המאה ה-21.
ה-AI, ראשי תיבות באנגלית של “בינה מלאכותית” הוא בשנים האחרונות אחד המונחים היותר פופולאריים בתחומי המדע והטכנולוגיה. הוא הופיע לראשונה אי שם בשנות ה-50 של המאה הקודמת, כ-200 שנה אחרי תחילתה של המהפכה התעשייתית, אותה מהפכה שהציבה את ה-‘מכונה’ ככלי עזר וכמנוע העיקרי של התפתחות הציוויליזציה שלנו.
מאוחר יותר, כאשר הופיעו המחשבים, ואחריהם רשת האינטרנט בסוף המאה ה-20, הצעד הכמעט מתבקש היה מתן אינטליגנציה למכונות. הסופרת האנגליה מרי שלי עשתה את זה כבר במאה ה-19 כאשר הגבור הספרותי שלה פרנקנשטיין בנה יצור דומם וגדל מידות, הפיח בו חיים ויצק בו בינה. אבל התהליך הזה שנראה כמעט “טבעי”, וגם נפתר זה מכבר בספרים ובסרטי המדע הבדיוני התברר במציאות כספור מורכב וסבוך במיוחד שספק אם יפתר בעתיד הקרוב.
על פליאה והתרגשות, אין בכלל על מה לדבר
אין כל ספק שהמכונות של היום הן סופר משוכללות. הן יודעות לאסוף נתונים, לנתח, לעבד ולהציג תוצאות במהירויות פנטסטיות. העובדה היא שהן עולות על הבצועים האנושיים ביותר ויותר משימות. לפני כשנתיים, לדוגמא, הצליחה תוכנת מחשב של גוגל (אלפא-גו) לנצח את אלוף העולם במשחק גו, שזה משחק מסובך במיוחד. אם בשחמט יש 20-30 צעדים אפשריים בכל מצב נתון, ב-גו יש כ-250. אלא שאלפא-גו כמו תוכנות מחשב אחרות, לא יודעת הרבה יותר מאשר לנצח במשחק, למשל שהיא נצחה את אלוף העולם (לי סידול) ושהיא בעצם רק מכונה. המכונות או הרובוטים היותר מתקדמים שקיימים היום אינם יצירתיים, אין להם שכל ישר – במובן שאנחנו בני האדם משתמשים במונח הזה, והם לא מודעים לעצם קיומם. על נושאים הקשורים לחיי הרגש, הנאה, חוויה אסתטית, פליאה והתרגשות, אין בכלל על מה לדבר. רובוטים רגשנים, הנוטים למצבי רוח, ומודעים לעצמם נמצאים, כאמור, רק בסרטים.
נכון לעכשיו, בינה האנושית, זו המכונסת לה בתוך הגולגולת התפוחה של ההומו סאפיינס המודרני הינה הדגם המתקדם והמורכב ביותר של התבונה מקרב כל מיני חי והצומח המוכרים לנו בפלנטה. לא ממש מפתיע אם זוכרים שתהליך החיים בכללותו ארך כ-4 מיליארדי שנים, מאז שחומר דומם הפך למשהו חי. האם אפשר ליצור מכונה שתסגל יכולות ואופני חשיבה כמו שלנו, תחקה תהליכים קוגניטיביים ותבין מה היא? שאלה לא קלה. מעל מסכי הווידיאו נראים בשנים האחרונות רובוטים שמבצעים משימות פיזיות, ווירטואוזיות בסגנון בני אדם, משמיעים טקסטים מתוחכמים המלווים לפעמים גם בהבעות פנים הנראות אנושיות. זה מראה שאולי בכל זאת משהו זז. לא יותר מכך.
להחליף מילים (ותמונות) עם מכונה זרה
בימים האחרונים נחשפתי לתוכנת AI שפותחה על ידי חוקרים בחברת מיקרוסופט עם כמה קבוצות אחרות באוניברסיטאות בארה”ב. התוכנה המכונה AttnGAN הינה פרויקט אחד מתוך כמה שנעשה במסגרת התחום של “למידת מכונה” ומיועד, על פי החוקרים, ללמד מכונה שתבין אותנו בני האדם ואת העולם, בדרך שאנחנו מבינים. התוכנה הינה בעצם מעין מתורגמן ויזואלי מאחר והיא יודעת לייצר תמונות ממילים ומשפטים שאנחנו כותבים לה. חוקר בשם כריסטובל ולנזואלה (Valenzuela) העלה גרסה שלה לרשת, מה שמאפשר לכל אחת ואחד מאתנו להחליף מילים ותמונות עם מכונה זרה, ניסיון מעניין לכשעצמו. עוד כאן.
אתה מתחיל להקליד את המשפט, והתמונה מתחילה להתרקם. אתה מוסיף מילה למשפט והתמונה שוב משתנה. מה שמרתק במיוחד בתוכנה הזו הן שתי תכונות: א. התמונות הינן מקוריות לחלוטין ב. התמונות אמנם מופשטות אבל אפשר בדרך כלל לזהות קשר בינן למילים. ועוד משהו, ואין דרך אחרת לומר זאת – לעיתים התמונה המתקבלת נראית שלא מהעולם הזה, יש בה משהו נכרי כאילו שהאמן שיצר אותה איננו…אדם.
האם מכונות יודעות, או תדענה בעתיד, ליצור אמנות? מכיוון שכותב התוכנה העלה גרסה לרשת, תוכלו להתחבט עם השאלה הזו בעצמכם.
יש בה משהו נכרי כאילו שהאמן שיצר אותה איננו…אדם
העיסוק בתוכנה ממכר, אפילו מרגש. הפרוש הויזואלי שהיא מציעה למילה או למשפט מסוים אינו תמיד עִקְבִי, לא פעם הוא סתום ומופשט, לעיתים סוריאליסטי, אבל תמיד מפתיע. הנה למשל הורסיה של המכונה למשפט היפיפה של נתן יונתן: “חופים הם לפעמים געגועים לנחל (התרגום לאנגלית שלי):
והנה הדבר האמיתי. דיאלוג שניהלתי עם AttnGAN: טקסטים תמורת תמונות:
רוצים לנסות בעצמכם? הכנסו ל-כאן
—————————
——————————————————