יש הנאה עצומה בלראות סרטון כזה מבלי לדעת על מה הוא הולך להיות או מה יהיה בו. אך בשביל שתצפו בו נדרשתי לכותרת הפרובוקטיבית (ומדוייקת) אותה ציינתי. הנה הסרטון:
לבקשת הבמאית הסרטון הוסר עד לאחר התחרות. את הטיזר לסרטון ניתן לראות כאן:
ואת הסרטון עצמו אפשר לראות (בחינם), כאן: בקישור הזה – אם אהבתם את הסרטון, אנא הצביעו בעדו עבור תחרות פסטיבל הסרטים breast fest.
קפצ'ה היא מבחן המאפשר להבחין בין מחשב למכונה (סוג של מבחן טיורינג לעניים). כשמדברים על קפצ'ה באינטרנט, לרוב מדברים על האותיות המחורבשות שרואים כשצריך להכנס לאיזשהו אתר. אתרי אינטרנט משתמשים בתמונות הללו כיוון שבני אדם יכולים (לרוב) לקרוא אותם, בעוד שמחשבים לא. דוגמא לשימוש נפוץ הוא בהרשמה לחשבון אימייל חדש – החברה שמספקת את השירות דורשת מאיתנו הגולשים למלא ק'פצה (לפתור את הכתוב בתמונה), כדי לזהות שמי שמבקש את חשבון האימייל הוא אדם אמיתי, ולא תוכנת מחשב שמנסה לפתוח מאות אלפי חשבונות אי-מייל במכה אחת (ואז להשתמש בהם בשביל לשלוח דואר ספאם).
דוגמא נוספת לחשיבות הקפצ'ה תוכלו לקבל מקומיקס ה- XKCD המשובח הבא (לחצו על התמונה להגדלה וקריאה):
בחור מבריק אחד ששמו הוא לואיס וון האן, הקים בזמנו חברה בשם re-Captcha. הרעיון המבריק מאחורי המייזם שלו הוא לחבר בין שני צרכים משלימים:
אתרי אינטרנט צריכים מבחני קפצ'ה בשביל לזהות שגולש מסויים הוא אדם אמיתי ולא רובוט, ובמקביל –
מי שברשותו ספרים סרוקים היה רוצה שאנשים יקלידו לו אותם לתוך המחשב (כלומר – שאנשים יזהו מילים מקושקשת מתוך הספר הסרוק – היות ומחשבים לא יכולים לעשות זאת)
הפתרון: re-Captcha. מדובר בטכנולוגיה המאפשרת להשתיל באתר (המרשה לה), מערכת שנותנת לגולש מסויים מבחן לזיהוי מילה סרוקה. בעל האתר מקבל לגלות האם הגולש הוא אדם אמיתי או לא, והמערכת מקבלת לדעת על אותה המילה מהי הפרשנות שלה.
להל"ן סרטון של 12 דקות שמסביר את כל אשר כתבתי:
החדשות – גוגל רכשו את ר-קפצ'ה
היום גוגל פירסמו בבלוג שלהם הודעה על רכישת החברה ר-קפצ'ה (reCAPTCHA). טק-קרנצ' כתבו שגוגל עשו נסיונות בלפתח את הטכנולוגיה בעצמם, אך כנראה שגוגל הגיע למסקנה שיותר הגיוני לרכוש את החברה מאשר להמציא את הגלגל מחדש.
המשמעות המיידית וההשלכות לעתיד
השירות ר-קפצ'ה כבר משמש כ- 100,000 אתרי אינטרנט. ועכשיו לאחר שגוגל רכשו אותם, אפשר לצפות לעוד אינספור אתרים שיתחיל להשתמש בשירות. המשמעות המיידית של זה תהיה שגוגל מקבלת מאות אלפי גולשים שיעזרו לה (בחינם) להקליד את הספרים שהיא סרקה לתוך השירות שלה גוגל-ספרים. המשמעות של זה תהיה שבעתיד הנראה לעין, עוד ועוד ספרים יהיו זמינים לחיפוש דרך השירות של גוגל-ספרים. בעתיד הבינוני אפשר אף לצפות שגוגל יוציאו שירות עבור כבדי-ראיה שבו גוגל תקריא להם ספרים (אני ממתין לשיתוף הפעולה הזה שיהיה בין גוגל לאמאזון). עידכון: ווינט מספרים על כך שגוגל עומדת לאפשר לאנשים להדפיס ולקנות ספרים ישנים מהמאגר שלה (בהנחה שכמה סוגייות משפטיות יפתרו). או במילים אחרות: גוגל לוקחת ספרים שלא קיימים בפורמט דיגטלי, סורקת אותם, מתרגמת את התמונות הסרוקות לאותיות (ועכשיו, באמצעות reCAPTCHA, היא תוכל לעשות זאת באופן כמעט מושלם, כזה שאף מערכת OCR בעולם תוכל לעשות), ואז למכור את הספרים הללו בהדפסה מחודשת. מבריק…
בטווח הרחוק יותר, מדובר בהשקעה אסטרטגית מבריקה. גוגל לא רק זוכה לקבל תירגום של הספרים הסרוקים לטקסט שהמחשב יודע לזהות, היא גם מקבלת מאגר עצום וחסר תקדים של תירגום בין פיקסלים לאותיות. המידע הזה יאפשר לגוגל ליצור אלגוריתמים סטטיסטיים ל- OCR (זיהוי של אותיות מתוך פיקסלים של תמונה) ברמת דיוק שלדעתי האישית (והלא מקצועית) תהיה חסרת תחרות לכל אלגוריתם אחר שיהיה (עד אשר ימציאו בינה מלאכותית אמיתית).
ולמה להסתפק באנגלית? הרי גוגל יוכלו לקדם את הפרוייקט הזה לרשת האינטרנט בכל השפות המדוברות, ובכך ליצור אלגוריתמים סטטיסטיים לזיהוי אותיות ומילים (OCR) בכל שפה אנושית שאנשים המדברים אותה נמצאים ברשת.
החשש: מונופול
אז האם הרכישה הזו טובה לנו או לא? סביר להניח שכן. הכוח של גוגל באינטרנט יאפשר להם להפיץ עוד יותר את השימוש בר-קפצ'ה, מה שאומר שבמקום שאנשים "יבזבזו" את התשובות שלהם על קפצ'ות (מה שקורה ברוב השירותים הקיימים), הרי שיהיה גוף שיאסוף את התשובות שלהם ויעשה בהם שימוש טוב.
ההסתייגות היחידה שלי היא החשש שזה יאפשר לגוגל להיות מונופול בתחום ה- OCR. אני מקווה לראות עוד שחקנים גדולים (מישהו אמר מייקרוסופט?) עולים לבמה ומתחילים לאסוף את המידע הזה. והכי הייתי מקווה אילו איזשהו אירגון (מייקרוסופט, היש סיכוי?) שיעשה שירות מתחרה אבל שהוא יהיה בנוי כך שיפתח את המידע לציבור לחלוטין. כלומר, שכל אחד מאיתנו יוכל להוריד קובץ גדול עם תמונות של מילים, ותירגומם לטקסט שמחשב "מבין" את המשמעות שלו.
לסיום – כיצד להשתמש באנשים כדי לזהות לא רק טקסט, אלא גם תמונות (הרצאה של 50 דקות על כיצד להשתמש באנשים במקום מחשבים)
הרגע הצטרפתי לאיגוד האינטרנט הישראלי (70 ש"ח לשנה).
בפוסט שלפניכם אסביר מדוע עשיתי זאת (ובעצם, מדוע כדאי אולי שגם אתם תעשו זאת).
איגוד האינטרנט הישראלי (לקוח מוויקיפדיה) הוא עמותה הפועלת לקידום השימוש באינטרנט לצורכי מחקר, תקשורת ושיתוף פעולה בין גורמים שונים. למרות היותו גוף עצמאי ובלתי תלוי, נחשב האיגוד בעל השפעה רבה בתחום האינטרנט ומהווה סמכות עליונה בנושאים שונים.
החדשות הטובות: לאיגוד האינטרנט הישראלי יש לא מעט כסף וקשרים והוא בעל השפעה רבה בתחום האינטרנט בארץ. היה לי את הזכות לעבוד מול אנשים באיגוד במעורבותי באירגון וורדקמפ ישראל 2007, וגם ב- 2008. אנשים מקסימים כמו נהורא, מי-טל אייל סלע (וכנראה עוד כמה שכרגע פרח לי שמם, ואני מתנצל על כך) – שהראו רמה גבוהה מאד של מקצועיות, אדיבות ואיכפתיות בכל מגעי איתם. אך אנשים טובים אלו אינם האנשים היחידים באיגוד. החדשות הפחות טובות:
באיגוד האינטרנט הישראלי אין מספיק שקיפות ובקרה ציבורית חיצונית על ההתנהלות של האיגוד
החל מעוד שבועיים – כל מי שיירשם שלא נרשם לאיגוד לפני מועד זה לא יוכל להשפיע עליו "מבפנים" במשך שנה (בניגוד למצב היום שבו מי שנרשם אוטומאטית מקבל את הזכות להצביע בתהליכים קבלת החלטות של האירגון)
בגלל שהאיגוד הוא גורם כל כך חשוב באינטרנט הישראלי, ושהחלון עבורנו (בוני האתרים ומשתמשי האינטרנט באופן כללי) להשפיע על התנהלותו עלול בקרוב להסגר. החלטתי היום להירשם לאיגוד ולהבטיח את זכותי להשפיע על איך הוא (והאינטרנט של כולנו) יראה בעתיד.
בדקות אלו אני כבר רואה בטוויטוספירה עוד ועוד טוויטים של אנשים שכותבים שהם נרשמו לאיגוד. כדי להשאר במעקב, חפשו את תגיות ההש: #ISOC
כדי להצטרף לאיגוד, כל שעליכם לעשות הוא להכנס לעמוד ההרשמה שכאן (אשר אפשר להגיע אליו דרך העמוד הזה). ההרשמה לקחה לי פחות מ- 5 דקות, ו – 50 שקל (כי אני סטודנט. זה היה עולה 70 שקל אחרת). לחברות באיגוד יש גם כמה הטבות עליהם תוכלו לקרוא כאן, אבל לא לשם כך נרשמתי – אלא בשביל האפשרות להשפיע על האירגון החשוב ביותר בארץ לעתיד האינטרנט בישראלי.
* * * * *
מה הוביל אותי לנושא הזה?
הקריאה של רועי שלומי בבלוג שלו "איגוד האינטרנט הישראלי צריך להשתנות" (שנכתב כהרחבה למאמר שהוא פירסם היום בווינט "איגוד האינטרנט הישראלי: ככה עושים כסף ברשת"). שני המאמרים הללו נותנים הצצה לעולם הפנימי שמתנהל בתוך איגוד האינטרנט הישראלי. המאמרים מציגים כמה מפעילויות האיגוד, על חלקם אני יכול להסכים ועל חלקם להתמרמר. אני ממליץ לכם להכנס למאמרים ולעקוב אחר המידע שרועי מוסר בעצמכם. אך אם לתמצת חלק מהדברים שמפורטים שם, הנה כמה דוגמאות.
החיבור שבין סלולארי למציאות מולבשת איננו חדש וכבר הופיע בכמה התייחסויות. אבל זו הפעם הראשונה שנתקלתי בסרטון פירסומי המציג מוצר (פחות או יותר) מוגמר, שמציג את החיבור. בסרטון אפשר לראות אדם משתמש במצלמת הסלולרי שלו על פני איזור שמולו. המצלמה לוכדת את תמונת האיזור ומלבישה עליו שכבות מידע מסוגים שונים (איפה יש בתים, מה המרחק מהם, מה אפשר לקנות בחלקם וכן הלאה). וזה הרי חלק חשוב במהפכה הגיאו-מרחבית עליה כתבתי לפני חודש.
מכאן עד למוצר שמתפשט לכלל האוכלוסיה יש עוד דרך: יש פה אתגרים טכנולוגיים ואתגרים חברתיים. בצד הטכנולוגי, יש את השאלה כיצד לעמוד בעומס החישובי של יצירת המאשאפ (העירבוב) הזה של הווירטואלי עם המציאותי. אפשר לדמיין שלפני שנצטרך שהסלולארים שלנו יחזיקו מחשבים מאד חזקים, יפתרו את הבעיה הזו באמצעות טכנולוגיות ענן. מסיבה זו טכנולוגיות כמו זו של און-לייב (שבכלל מיועדת למשחקי מחשב על הענן) הן כל כך מעניינות. כך שהבעיה הזו מתחלקת לפתרון החומרה (האפשרות להעביר יותר מידע דרך השרת הסלולרית) ופתרון התוכנה (כיצד ליצור מיחשוב ענן יעיל להלבשת העולם הווירטואלי על העולם האמיתי). בצד החברתי, כנראה מצוי עיקר הקאטצ'. פה מועלית השאלה כיצד יוצרים ממשק שימוש שאנשים יוכלו להתמודד איתו בקלות ואינטואטיביות. ויותר מזה, כיצד יוצרים רשתות-חברתיות שיאפשרו איסוף של מידע גיאוגרפי במקביל לשאר סוגי המידע שהן אוספות.
תחושת הבטן שלי אומרת שלא נראה תפוצה רחבה של המוצר הזה השנה. אבל מצד שני שההפצה של הטכנולוגיה הזו תהיה מהירה יותר מכפי שאנו מצפים – ואז יום אחד נתעורר ונראה ששילבנו את הווירטואלי למציאותי ונהיה מאד מופתעים (כמו שהיום אנשים פתאום גילו שיש איזה דבר בשם טוויטר שהשפיע על איראן, איזה פלא…)