הפער בתחזית הפער: 3 או 12 (על סקרי בחירות ומיגבלותיהן)

המאמר שלפניכם הוא פרי מקלדתו של פרופסור יואב בנימיני מאוניברסיטת תל אביב. קריאה מהנה:

* * *

ביום רביעי שעבר פורסמו בשני ערוצי טלביזיה שני סקרי בחירות. לפי הסקר שפורסם בערוץ 10 היה לליכוד יתרון של 3 מנדטים על קדימה. לפי הסקר שפורסם בתוכניתו של נסים משעל בערוץ 2 היתרון היה 12 מנדטים. כיצד אפשר להגיע לפערים שכאלה? האם בכלל יש אמינות לסקרים בטרם בחירות, וכיצד למנוע את ההשפעות השליליות על ציבור הבוחרים?

סקר הבחירות שמפורסם במוצאי יום הבחירות הוא בגדר שעשוע תקשורתי ואינטלקטואלי – התוצאות האמיתיות כבר נקבעו, ויודעו בתוך יום. לעומת זאת לסקר בטרם בחירות השפעה רבה. הבוחרים יכולים ללמוד דרכו על התוצאה המסתמנת ומתוך כך לבחור לחזק או להחליש גוש מפלגות על ידי תמיכה במפלגה מסוימת, כמו גם לתמוך במפלגה שהיא בסביבת אחוז החסימה או להימנע מכך. המחוקקים בישראל הכירו בחשיבותם והשפעתם של סקרי בחירות בתקופה הסמוכה לבחירות, וקבעו כללים מיוחדים לפירסום תוצאותיהם.

כיצד יכולים להופיע פערים גדולים כל כך בתוצאות סקרים? נלך מהחשוב פחות אל החשוב יותר: למי שמממן את הסקר עלולה להיות השפעה אפשרית, על ידי הטיות קטנות במהלכו, כמו בחירת האוכלוסיה המיוצגת בסקר, סדר השאלות, או אפילו השפעה על נוסח השאלה שנשאלה. כך ניתן לצפות לשינוי ניכר בתשובה באם השאלה היא: "כידוע יש חשיבות בימים סוערים אלו לעמידה איתנה. מי לדעתך…" וזאת לעומת הפתיחה "כידוע גם בימים בוערים אלו יש לשמור על אופק של שלום. מי לדעתך…". לכן, כאשר דובר מפלגה מסוימת מדווח בשידור "לפי סקר בידינו", הזהירות צריכה להיות רבה. אם המממן ועורך הסקר הם גופים חסרי פניות אין לצפות להטיה מכוונת בהקשר זה.

חשוב מכך להבין מה גודל המדגם אליו פנו, איזה חלק ממנו סירב להשיב, ואיזה חלק מהמשיבים עדיין מתלבטים ומהווים קולות צפים. טעות הדגימה הניתנת בחלק מפרסומי הסקרים עונה על השאלה עד כמה יכולה להיות תוצאת הסקר שונה לו אנשים אחרים היו עולים במדגם. כך למשל, נתוני הסקר שפורסם בערוץ 10 פורסמו למחרת ב"הארץ" ומהם ניתן היה ללמוד שטעות הדגימה אינה מבוטלת: 3.2% שהם קרוב ל4 מנדטים. (עבור הפער בין שתי המפלגות הטעות גדלה לכ-6 מנדטים)

אולם לטעות זו מתווספות שתי בעיות שיכולות להיות חמורות יותר. המסרבים להשיב – שמעידים אולי על הטייה שיטתית שכיוונה אינה ידוע כלל, ואלו שטרם החליטו. כך למשל, המספר הגבוה של המסרבים להשיב הפיל כנראה בפח את סוקרי הפריימריז. הבלתי מחליטים מאתגרים תמיד את הסוקרים השונים כאשר לכל אחד שיטות שונות לפלח את דפוס הצבעתם העתידי, כמו גם לחזות באם ילכו לקלפי, על מנת לתת תחזית מנדטים. כמובן שהשיטה נשמרת בסודיות על ידי כל סוקר, אבל כל בוחר יכול לעמוד על גודל הטעות האפשרית מתוך אחוז הבלתי מחליטים. אם האחוז גדול, כמו בבחירות הנוכחיות בהן הוא עדיין קרוב ל30%, ההבדל שנובע משיטות הפילוח השונות יכול להיות גדול. במקרה זה צריך להתייחס בספקנות ראויה לכל התוצאות. כאשר אחוז זה יקטן, בטחוננו בתוצאות החיזוי יגדל.

לכן, בראותכם סקר בחירות שאלו מי מימן, מי ערך ומתי; מי נשאלו ומה; כמה סרבו להשיב, מהי טעות הדגימה וכמה עדיין מתלבטים; זאת על מנת להעריך את ערכו.
איך תדעו? לצערנו הדבר בלתי אפשרי. למרות שחוק תעמולת הבחירות מחייב לתת כמעט את כל המידע הזה עם פירסום או דיווח על תוצאות הסקר בעיתונות הכתובה והמשודרת, המציאות רחוקה מכך. במעקב חלקי של קבוצת מתנדבים מהאיגוד הישראלי לסטטיסטיקה התקבלה תמונה עגומה ביותר. לדוגמא, שני פרסומי הסקרים בטלביזיה שהזכרנו נתנו רק את המידע על עורכי הסקר ותחזית המנדטים ואפילו טעות הדגימה הושמטה, למרות שבאחד מהערוצים דנו בפער בין התחזיות. אפילו עיתון זה, שמתקרב ביותר לפירסום מלוא המידע הדרוש, לא נותן מידע על אחוז המסרבים להשיב.

על אמצעי התקשורת לשנות את דרך פירסום תוצאות הסקרים כבר במערכת בחירות זו. גם לוועדת הבחירות המרכזית תפקיד להבהיר את החובה במילוי החוק. עד אז, וגם לאחר מכן, התייחסו בזהירות הדרושה להשענות על תוצאות הסקרים בקביעת החלטתכם למי להצביע.

פרופ' יואב בנימיני
נשיא האיגוד הישראלי לסטטיסטיקה

סטטיסטיקות מלמדות ש… אמריקאים טיפשים

כשנתקלתי בסרטון "אמריקה הטיפשה", חשבתי לעצמי "למי איכפת, מה זה משנה עד כמה אמריקאים טיפשים". אבל היה כתוב שיציגו סטטיסטיקות, אז אמרתי לעצמי "נו טוב, נקשיב לרגע".
אתם מוזמנים לעשות את אותו הדבר:

מפחיד.
מבלי שהאמינו, אנשים נחמדים אחרים "יצאו לרחוב" כדי לראיין אמריקאים ולהמחיש את היקף הבורות שלהם (אני כמובן שואל את עצמי האם מדגם האנשים ברחוב מייצג את האוכלוסיה, והאם אין פה הטיות של אנשים שהסכימו להיות מצולמים – כך או אחרת, בשביל לקבל תחושה של המשמעות של הסטטיסטיקות מהסרטון הראשון, יש טעם לתת כמה דקות גם לסרטון השני):

(עוד קישורים בנושא אפשר למצוא כאן)

glTail.rb – כלי חינמי לויזואליזציה, בזמן אמת, של ביקורי גולשים לאתרים שלכם

הכלי מאפשר להציג וויזואליזציית זמן אמת של נתוני שימוש בשרת אינטרנט, לפי נתוני הלוג של השרת.
בקליפ שמיד אציג לכם, אפשר לראות שפריצים של בועות מימין ומשמאל. כל בועית משמאל, מייצגת כניסה לאתר. גודל הבועית מייצג כמה זמן לקח כדי להציג את הדף (לפי עומס השרת וגודל העמוד שהגולש ביקש לראות וכו'), צבע הבועית מציין לאיזה אתר נכנס הגולש.
בועיות מצד ימין מייצגות מי האתר שהפנה אלינו את הגולש.
את התוכנה ניתן להוריד מכאן.
את הקליפ שאציג מיד, ניתן להוריד באיכות גבוה מכאן.

ואם למישהו יש מושג איך אפשר להתקין דבר כזה על גו-דדי, בבקשה תספרו לי 🙂

שעונים סטטיסטיים בחצי מחיר (ולקינוח, תורת היחסות ב- 5 דקות)

בפוסט מוקדם יותר, עסקנו בממדי מרחב והיום נעבור לממד הזמן. למה – בזכות אתר איכותי שמוכר (בחינם) שעונים סטטיסטיים.

אתרו של פו-דווידל מייצר שעוני פלאש שניתן לשלב באתרי אינטרנט בחינם.
יש שם שעונים פשוטים ונעימים.

אבל אותי עניינו הרבה יותר השעונים הסטטיסטיים שבאתר. לדוגמא שעון שמריץ נתונים על ה"אקולוגיה" של לכדור הארץ. נתונים כגון: מספר האנשים החיים בעולם (6,619,894,652 איש, ברגע זה), כמה מהם סובלים מתת תזונה (37,155,757 איש ברגע זה), מהי הטמפרטורה הגלובלית, כמה נפט שואבים וכמה עוד נישאר, קצב יצור הזבל לעומת קצב המיחזור (תנחשו מי רץ יותר מהר…) ועוד.להנאתכם, אני מצרף כאן את השעון:

Poodwaddle.com
באתר ישנם שעונים נוספים, כמו שעון נתוני תמותה:
שעון סטטיסטי (אשר ניתן לצפות בו, ובשעונים נוספים, בשידור חי כאן)השעונים הסטטיסטיים הקסימו אותי, משום שהם מדגימים כיצד אנימציה של נתונים, מספקת יותר מאשר מידע על קצב הנתונים (מה שאפשר היה להציג פשוט עם עוד מספר שמייצג את הקצב). מה שאנימציית נתונים יכולה להציע, היא לתת לנו תחושה של קצב בנתונים.

לדוגמא, התחושה של הבדלי הקצב בין יצירת זבל למול קצב מחזור הזבל (בארה"ב), מועברות בצורה הרבה יותר חוויתית דרך השעון הסטטיסטי, מאשר היה קורא אילו היו מציעים שני מספרים שמייצגים קצב.

ובמעבר חד, קצת השכלה כללית: מאיינשטיין. בשנת 2005, פרס פירלי (אשר מקיים תחרויות להנגשת מושגים מדעיים להדיוטות כמונו), העלה את "אתגר היחסות" שבו הוא ביקש להסביר את תורת היחסות ב (סדר גודל של) 5 דקות. הזוכה היה:"ההרפתקה היחסית של איינשטיין" (ולמי שעוד לא ראה, אני ממליץ בחום. והלוואי ומישהו היה מתרגם את זה לעברית, עבור הילדים שעוד לא דוברי אנגלית מבינינו).
ההרפתקה היחסית של אל

(נ.ב: רוצים עוד נתונים ואנימציה – אז אתם תהנו לראות קליפים של אינפוגרפיקה)

ילדים שנולדו בקיץ- יש להם סיכוי יותר גדול בכ-25% לפתח קוצר ראייה

הכותב "אוניברסיטת תל אביב" העלה כתבה מעניינת לאתר הידען. אשר עוררה בי רצון להפעיל קריאה ביקורתית. ולזה מיועדת רשומה זו.

(אני מביא כאן את עיקר דברי הכתבה)
"ילדים שנולדו ביוני ויולי – יש להם סיכוי יותר גדול בכ-25% לפתח קוצר ראייה מעל ל-3 - מאשר לאלה שנולדו בדצמבר או ינואר כך עולה ממחקר משותף לצה"ל ולשלוש אוניברסיטאות.
...
המחקר נעשה על מעל רבע מליון אנשים בצה"ל כשהחוקר המוביל הוא דר' יוסי מנדל ממפקדת קצין רפואה ראשי.
התופעה שנמצאה אינה תלויה בהורוסקופ – הקשר הוא בין מספר שעות האור שהתינוק חשוף אליהן לפי עונת השנה לבין התארכות העין. במחקרי חיות נמצאה עדות למנגנון שקשור בחומר שנקרא מלטונין, המופרש בשעות החשיכה, והמפקח, בין השאר, על גידול העין. כשיש פחות מלטונין עקב שעות היום הארוכות בקיץ, העין ארוכה יותר וכך נעשית קצרת ראיה.
"

אישית, התעניינתי בכתבה היות ואני יליד חודש יוני וגם לובש משקפיים.
אבל אני מספר לכם על הכתבה משום שהצגת המסקנות שלה היא שיטחית – ונראה לי מעניין להבין במה היא שיטחית. הבא נעלה שלוש נקודות בסיסיות שיש לתת להן את הדעת.

להמשיך לקרוא ילדים שנולדו בקיץ- יש להם סיכוי יותר גדול בכ-25% לפתח קוצר ראייה