חישוב אנושי

הקדמה – מה זה קפצ'ה ור-קפצ'ה

קפצ'ה היא מבחן המאפשר להבחין בין מחשב למכונה (סוג של מבחן טיורינג לעניים). כשמדברים על קפצ'ה באינטרנט, לרוב מדברים על האותיות המחורבשות שרואים כשצריך להכנס לאיזשהו אתר. אתרי אינטרנט משתמשים בתמונות הללו כיוון שבני אדם יכולים (לרוב) לקרוא אותם, בעוד שמחשבים לא. דוגמא לשימוש נפוץ הוא בהרשמה לחשבון אימייל חדש – החברה שמספקת את השירות דורשת מאיתנו הגולשים למלא ק'פצה (לפתור את הכתוב בתמונה), כדי לזהות שמי שמבקש את חשבון האימייל הוא אדם אמיתי, ולא תוכנת מחשב שמנסה לפתוח מאות אלפי חשבונות אי-מייל במכה אחת (ואז להשתמש בהם בשביל לשלוח דואר ספאם).

דוגמא נוספת לחשיבות הקפצ'ה תוכלו לקבל מקומיקס ה- XKCD המשובח הבא (לחצו על התמונה להגדלה וקריאה):

בחור מבריק אחד ששמו הוא לואיס וון האן, הקים בזמנו חברה בשם re-Captcha. הרעיון המבריק מאחורי המייזם שלו הוא לחבר בין שני צרכים משלימים:

אתרי אינטרנט צריכים מבחני קפצ'ה בשביל לזהות שגולש מסויים הוא אדם אמיתי ולא רובוט, ובמקביל –
מי שברשותו ספרים סרוקים היה רוצה שאנשים יקלידו לו אותם לתוך המחשב (כלומר – שאנשים יזהו מילים מקושקשת מתוך הספר הסרוק – היות ומחשבים לא יכולים לעשות זאת)

הפתרון: re-Captcha. מדובר בטכנולוגיה המאפשרת להשתיל באתר (המרשה לה), מערכת שנותנת לגולש מסויים מבחן לזיהוי מילה סרוקה. בעל האתר מקבל לגלות האם הגולש הוא אדם אמיתי או לא, והמערכת מקבלת לדעת על אותה המילה מהי הפרשנות שלה.

להל"ן סרטון של 12 דקות שמסביר את כל אשר כתבתי:

החדשות – גוגל רכשו את ר-קפצ'ה

היום גוגל פירסמו בבלוג שלהם הודעה על רכישת החברה ר-קפצ'ה (reCAPTCHA). טק-קרנצ' כתבו שגוגל עשו נסיונות בלפתח את הטכנולוגיה בעצמם, אך כנראה שגוגל הגיע למסקנה שיותר הגיוני לרכוש את החברה מאשר להמציא את הגלגל מחדש.

המשמעות המיידית וההשלכות לעתיד

השירות ר-קפצ'ה כבר משמש כ- 100,000 אתרי אינטרנט. ועכשיו לאחר שגוגל רכשו אותם, אפשר לצפות לעוד אינספור אתרים שיתחיל להשתמש בשירות. המשמעות המיידית של זה תהיה שגוגל מקבלת מאות אלפי גולשים שיעזרו לה (בחינם) להקליד את הספרים שהיא סרקה לתוך השירות שלה גוגל-ספרים. המשמעות של זה תהיה שבעתיד הנראה לעין, עוד ועוד ספרים יהיו זמינים לחיפוש דרך השירות של גוגל-ספרים. בעתיד הבינוני אפשר אף לצפות שגוגל יוציאו שירות עבור כבדי-ראיה שבו גוגל תקריא להם ספרים (אני ממתין לשיתוף הפעולה הזה שיהיה בין גוגל לאמאזון).
עידכון: ווינט מספרים על כך שגוגל עומדת לאפשר לאנשים להדפיס ולקנות ספרים ישנים מהמאגר שלה (בהנחה שכמה סוגייות משפטיות יפתרו). או במילים אחרות: גוגל לוקחת ספרים שלא קיימים בפורמט דיגטלי, סורקת אותם, מתרגמת את התמונות הסרוקות לאותיות (ועכשיו, באמצעות reCAPTCHA, היא תוכל לעשות זאת באופן כמעט מושלם, כזה שאף מערכת OCR בעולם תוכל לעשות), ואז למכור את הספרים הללו בהדפסה מחודשת. מבריק…

בטווח הרחוק יותר, מדובר בהשקעה אסטרטגית מבריקה. גוגל לא רק זוכה לקבל תירגום של הספרים הסרוקים לטקסט שהמחשב יודע לזהות, היא גם מקבלת מאגר עצום וחסר תקדים של תירגום בין פיקסלים לאותיות. המידע הזה יאפשר לגוגל ליצור אלגוריתמים סטטיסטיים ל- OCR (זיהוי של אותיות מתוך פיקסלים של תמונה) ברמת דיוק שלדעתי האישית (והלא מקצועית) תהיה חסרת תחרות לכל אלגוריתם אחר שיהיה (עד אשר ימציאו בינה מלאכותית אמיתית).
ולמה להסתפק באנגלית? הרי גוגל יוכלו לקדם את הפרוייקט הזה לרשת האינטרנט בכל השפות המדוברות, ובכך ליצור אלגוריתמים סטטיסטיים לזיהוי אותיות ומילים (OCR) בכל שפה אנושית שאנשים המדברים אותה נמצאים ברשת.

החשש: מונופול

אז האם הרכישה הזו טובה לנו או לא? סביר להניח שכן. הכוח של גוגל באינטרנט יאפשר להם להפיץ עוד יותר את השימוש בר-קפצ'ה, מה שאומר שבמקום שאנשים "יבזבזו" את התשובות שלהם על קפצ'ות (מה שקורה ברוב השירותים הקיימים), הרי שיהיה גוף שיאסוף את התשובות שלהם ויעשה בהם שימוש טוב.

ההסתייגות היחידה שלי היא החשש שזה יאפשר לגוגל להיות מונופול בתחום ה- OCR. אני מקווה לראות עוד שחקנים גדולים (מישהו אמר מייקרוסופט?) עולים לבמה ומתחילים לאסוף את המידע הזה. והכי הייתי מקווה אילו איזשהו אירגון (מייקרוסופט, היש סיכוי?) שיעשה שירות מתחרה אבל שהוא יהיה בנוי כך שיפתח את המידע לציבור לחלוטין. כלומר, שכל אחד מאיתנו יוכל להוריד קובץ גדול עם תמונות של מילים, ותירגומם לטקסט שמחשב "מבין" את המשמעות שלו.

לסיום – כיצד להשתמש באנשים כדי לזהות לא רק טקסט, אלא גם תמונות (הרצאה של 50 דקות על כיצד להשתמש באנשים במקום מחשבים)

את ההרצאה הבאה ראיתי לפני יותר משנה, ומדובר באחת מההרצאות היותר מרתקות ופותחות אופקים – למי שיש את הזמן, מומלץ בחום:
להמשיך לקרוא גוגל רוצה לקרוא ספרים סרוקים – וכולנו הולכים לעזור לה (או: על הרכישה של גוגל את ר-קפצ'ה)