למה אנחנו רוצים סקר עם "מדגם מייצג"? (פוסט על שגיאות שאפשר ושאי-אפשר להציג)

תשובה: כי סקר עם מדגם לא מייצג צפוי לתת תוצאה לא אמינה לגבי תוצאות האמת של הבחירות.

לפני שנמשיך לדווח על סקרים ומטא-סקרים, ברשותכם רציתי לעשות קצת סדר בנושא של "מדגם מייצג ואקראי" ולנסות להסביר אותו (מה שמכונה בשפה הסטטיסטית "הטייה"). נתחיל בקריקטורה מתאימה מהבלוג המקסים דברים שקרו באמת:

Servey1500

מעבר לכך שהקריקטורה מאד חמודה, היא מציגה מצב שבו הסקר מבוצע על האוכלוסייה שלא מייצגת את אזרחי ישראל (אלא רק את חתולי ישראל).

גם בסקרי בחירות עלול מצב כזה (של דגימת אוכלוסיה לא מייצגת) להתרחש, אם הסוקר מתקשה להגיע לאוכלוסייה הצעירה, הערבית, החרדית וכן הלאה (לדוגמא, כי אין לו אפשרות לחייג לטלפונים סלולרים של צעירים, או כי קשה לראיין את האוכלוסיה הערבית ללא סוקר שדובר ערבית).

באופן כללי, בסקרי בחירות יש שני סוגים עיקריים של טעויות סטטיסטיות: טעויות "הטייה" (bias) וטעויות "שונות" (variance). המצב שמוצג בקריקטורה הוא של טעות הטייה. כעת נרחיב קצת על שתי הטעויות.

להמשיך לקרוא למה אנחנו רוצים סקר עם "מדגם מייצג"? (פוסט על שגיאות שאפשר ושאי-אפשר להציג)

חתול המטריקס – דקה וחצי של חמידות משתפכת

מידי פעם מגיע לפני קליפ שבאמת גורם לי לחשוב "היה שווה שהתחילו את היוטיוב הזה".
בקליפ רואים את החתול (לעניינו, ניאו), הודף מעליו עוד ועוד גורי כלבלבים ("הסוכני סמית'"), באופן המשחזר באופן אמין את סצינת הלחימה מהסרט השני (מה שבאופן מטריד ממחיש את מידת הרדידות של הסרט, שניתן לשחזר סצינה המשתרכת על דקות רבות באמצעות קליפ של חתלתולים וכלבלבים של דקה וחצי. לא שזה משהו שלא ידענו על הסרט השני של המטריקס.).
החמידות המתמשכת הותירו אותי ללא ברירה אלא לפרסם את הקליפ הזה כאן עבורכם: