טל גלילי

מטא-סקר בחירות: כ-7,671 איש מ-14 סקרים (תחילת דצמבר 2014)

 

מטא-סקר הוא סקר של סקרים.

בשבועיים האחרונים נסקרו למעלה מ- 7,671 איש על פני 14 סקרים, בשאלה למי הם יצביעו בבחירות הקרובות. בפוסט זה אני מאחד את תוצאות הסקרים הללו לכדי מטא-סקר (עם סייגים חשובים וקרדיטים רלוונטיים).

נתחיל בתוצאות (הקליקו לתמונה בגודל מלא):
כרגע (כתום) = חלוקת המנדטים כרגע בכנסת.
תחזית (כחול) = צפי המנדטים על סמך איחוד 14 הסקרים.

פרשנות על התוצאות

סייגים: כשבאים לפרש את התוצאות חשוב לזכור שלמרות הכמות הגדולה של הנבדקים, ייתכן והמדגם שהופיע בסקרים איננו מייצג את האוכלוסיה (לדוגמא, בגלל הקושי לסקור אזרחים/ות מהאוכלוסיה החרדית והערבית), אז קחו את הפרשנות בערבון מוגבל! כמו כן, אני מתעלם מהנושא של אחוז חסימה והסכמי עודפים. התחזיות הן של מספר מנדטים כולל שברי מנדטים.

בהנחה שאין הטיות מדגם (וסביר שיש, בעיקר באוכלוסיות קשות לדגימה!), מידת הדיוק של המטא-סקר הוא פלוס מינוס מנדט 1.4 מנדטים.

גם חשוב לזכור שבתקופה שבוצעו חלק מהסקרים הללו הייתה ההכרזה על הקמת המחנה-הציוני (האיחוד של העבודה והתנועה), כך שהסקרים השונים לא מציגים בדיוק את אותו הדבר. את ההשלכות המלאות של זה נגלה בשבועות הבאים. כמו כן, חלק מהסקרים בוצעו לפני הפיצול הסופי של ש"ס, ולפני שראינו את הרשימה של כחלון. בקיצור, יהיה עוד הרבה אקשן…

מסקנות ביניים:

אם משווים את התוצאות למטא סקר שמבצע נחמיה גרשוני-איילהו במסגרת פרוייקט 61 (קישור לתוצאותיו כאן), התוצאות דומות למדי, הבדלי התחזיות הן בטווח השגיאה של מנדט אחד למעט המחנה הציוני שמקבל 23 מנדטים אצל נחמיה ויש עתיד שמקבלים רק 8 מנדטים.

פרטים טכניים על יצירת המטא-סקר

מקור לנתונים: לקחתי את הנתונים אשר התפרסו בערוצי חדשות מרכזיים, ואשר רוכזו על ידי נחמיה גרשוני-איילהו בגוגל-דוק כאן. להלן רשימת הסקרים ששימשו את המטא סקר:

הסרתי מפלגה ואיחדתי מפלגה אחרת: בגלל הכמות הקטנה של התצפיות הורדתי את קדימה (אני עוזב לבינתיים את הנושא של מפלגות בגבול של אחוז החסימה), ואיחדתי את בל"ד עם רע"מ תע"ל (היות ובסקרים שונים הם קיבלו 0 ובאחרים לא, וכאמור, אני מעדיף שלא להתמקד במפלגות הללו שיותר קשה לקבל עליהם תחזית טובה).

הסקרים השונים הראו תוצאות לא-שונות מידי האחת מהשניה: עשיתי מבחן חי-בריבוע על תחזיות הסקרים השונות כדי לראות האם יש הבדל מובהק בתוצאות של הסקרים השונים. היות שלא היה, החלטתי להניח שכל הסקרים משקפים את האוכלוסיה של ישראל ואיחדתי את תוצאותיהן. זו הנחה אופטימית שאיננה בהכרח נכונה. וויתור על ההנחה הזו ידרוש מטא-אנליזה מורכבת יותר (מה שמכונה random effect model) שלרוב תוביל להגדלת טווח השגיאה של התחזית (ויתרתי על כך בשלב זה).

גודל השגיאה: הנחתי שגיאה פאסימית ביותר (כאילו p=0.5), וביצעתי תיקנון להשוואות מרובות של הסתכלות על טווח הטעות של כל אחת מהמפלגות (תיקון בונפרוני של 11 מפלגות). אילו היינו רוצים להתחיל להשוות מפלגות, אז היה צורך להגדיל את טווח השגיאה מעט יותר. אפשר להשתמש בטווח השגיאה באופן ששקול למבחן השערות דו-צדדי (מתוקנן להשוואות מרובות) ברמה של 95%. אני לא מתייחס לאפשרות של שגיאות שונות בגלל האופן שבו הסקר בוצע, אלא מניח שהוא "מדגם אקראי מייצג" (כפי שכתוב ברוב הסקרים), סביר שניתוח מדוייק יותר של שיטת הדגימה יוביל למספרים שונים (אבל בתקווה לא שונים מידי).

אנו מניחים שהסקרים בלתי תלויים האחד בשני: חשוב לדעת שהשגיאה מניחה שכל הנתונים נאספו באופן בלתי תלוי (וחסר הטייה). אם, לדוגמא, חלק מחברות הסקרים מסתכלות על התוצאות של מדגמים אחרים, ומשנות את הנתונים שלהם בהתאם, זה עלול לפגוע בתוקף של טווח השגיאה (והוא למעשה צריך להיות גדול יותר, כי מספר הנתונים שלנו הוא מעשית קטן יותר). ייתכן ונסתכל על זה בפוסטים הבאים.

אשמח להערות, שאלות, ושיתופים 🙂

 

 

 

Exit mobile version