הסקרים של הבחירות לכנסת ה-20 – סיכום השבועיים האחרונים!

הודעה חשובה לפני שהפוסט יתחיל: איגוד הסטטיסטיקאים הישראלי מארגן תחרות לניבוי תוצאות הבחירות 2015 (תחרות עם פרס בגובה 1,250 ש"ח, ללא דמי השתתפות – לפרטים נוספים והשתתפות, קיראו עוד כאן). ונתחיל את הפוסט:

אתמול הגיעו הסקרים האחרונים שנראה עבור הבחירות לכנסת ה- 20, וזה זמן טוב לתת מבט אחרון אחורה לסקרים שפורסמו. חשוב להדגיש שתוצאותיהן של כל סקרי הבחירות ששודרו או פורסמו עד אתמול הם כבר לא עדכניים ואין ללמוד מהם על דפוסי הצבעה או עמדות של הציבור היום או ביום הבחירות. אז למה בכל זאת להסתכל אחורה? כי אם איננו יכולים לדעת מה יהיה ביום שלישי הקרוב, אז שלפחות נדע משהו על מה סביר שהיה המצב אתמול.

לשם כך, אני מציע לכם שני תרשימים אשר נוצרו בעזרת תוכנה שכתב יוני סידי (בעזרת שפת R לתכנות סטטיסטי), אשר מסתמך על נתוני הסקרים שאסף נחמיה גרשוני.

שני התרשימים מציגים את תוצאות הסקרים מהשבועיים האחרונים (לא כולל היום, כפי שהוסבר מעלה).

1) תרשים פיזור של מספר המנדטים לכל מפלגה לאורך זמן

התרשים הראשון מציג פיזור עם קו "ממוצע מוחלק". בציר ה- X יש לנו זמן (יש בעיה קלה בעברית, אני מתנצל), בציר ה- Y את מספר המנדטים. כל נקודה מציגה מנדטים שהביא מאחד מהסקרים. הקו בכל גרף מציג סוג של ממוצע מקומי של המנדטים. הצבע שמסביב לקו נותן תחושה כללית של פיזור הנקודות סביב הקו (הקליקו על התמונה לגירסה מוגדלת).

2015-03-13 22_49_17-Clipboard

עד לתאריך ביצוע הסקר האחרון (ראו את ההסתייגות שכתבתי בתחילת הפוסט!), נראה ש:

  • "הרשימה המשותפת" נשארה באותו מספר של מנדטים – בין 12 ל- 13.
  • הבית היהודי התחיל מגמת ירידה עד לכ- 11 מנדטים
  • המחנה הציוני התחיל מגמת עליה קלה עד לכ- 25 מנדטים
  • ישראל ביתנו במגמה קלה של ירידה לכ – 5 מנדטים
  • כולנו – במגמת עליה קלה לכ-9 מנדטים
  • ליכוד – במגמת עליה קלה לכ-22 מנדטים
  • מרצ – מגמה מעורבת, באיזור ה- 5 מנדטים
  • שס – מגמה מעורבת, באיזור ה- 7 מנדטים
  • יחד – מגמה מעורבת, באיזור ה- 4 מנדטים
  • יהדות התורה – בין 6 ל- 7 מנדטים
  • יש עתיד – יציבה יחסית סביב ה- 12 מנדטים

2) תרשים קופסא של מספר המנדטים לכל מפלגה

התרשים השני הוא "תרשים קופסא". בציר ה- X יש לנו את המפלגות השונות, בציר ה- Y את מספר המנדטים. הקו העבה בכל קופסא הוא חציון מספר המנדטים. וקצוות הקווים הן המקסימום והמינימום ה"לא חריגים" של כל תחזית (כדי להבין יותר איך זה נקבע, יש לקרוא את הערך תרשים קופסא בויקיפדיה).

כך לדוגמא, החציון של מספר המנדטים של הליכוד הוא 22. הכי הרבה שהוא קיבל היה 24 מנדטים והכי מעט 20 מנדטים. אצל המחנה הציוני, החציון היה 24, הכי מעט היה 23 והכי הרבה 25 (הנקודה של ה- 26 היא קצת חריגה ביחס לנתונים)
(הקליקו על התמונה לגירסה מוגדלת)

2015-03-13 22_29_15-Clipboard

החציונים של מספר המנדטים לכל מפלגה הן: (לפי סדר יורד)

  • המחנה הציוני – 24
  • הליכוד – 22
  • הרשימה המשותפת – 13
  • הבית היהודי – 12
  • יש עתיד – 12
  • כולנו – 8
  • שס – 7
  • יהדות התורה – 7
  • ישראל ביתנו – 6
  • מרצ – 5
  • יחד – 4

לסיכום

שאלות פתוחות וחשובות:

  • מה יהיה אחוז ההצבעה הכללי ובמגזרים השונים? ייתכן והסקרים שיש לנו לא מצליחים לתפוס את ההשפעה של איחוד המפלגות הערביות, ושביום הבחירות נגלה שהמפלגה שלהם תקבל הרבה יותר קולות ממה שהופיע בכל הסקרים. באופן דומה, מפלגת יחד נמצאת על 4 מנדטים באופן די עיקבי, מה שאומר שעליה אפילו קטנה של אחוז ההצבעה, ומעט היסוס מצד המצביעים שלה – עשוי להותיר אותם מחוץ לכנסת.
  • מה לגבי ה"לא משיבים"? קמיל פוקס אמר בראיון השבוע שרק כ- 24% מהנשאלים בסקרים משיבים. האם אלו שמשיבים מייצגים גם את שאר ה- 76% שלא הסכימו להשיב?  יכול להיות שכל הסוקרים מפספסים תתי אוכלוסיות או תופעות אשר יפתיעו אותנו ביום הבחירות עצמו (כמו שהיה עם ההצלחה המדהימה של יש עתיד בבחירות הקודמות) – מה שהסברתי בעבר במאמר על שגיאות שאפשר ושאי אפשר להציג.
  • מה לגבי המתלבטים? כמו בכל מערכת בחירות, גם כעת יש "הרבה" קולות מתנדנדים (ההערכות על כך משתנות). יכול להיות שיהיה סחף של קולות לכיוון מסויים. סחף כזה הביא את יש עתיד ל- 19 מנדטים בבחירות האחרונות. מה הוא יעשה הפעם? האם הוא ילך שוב ליש עתיד? לכחלון? למחנה הציוני? או למפלגה אחרת?

כמו שנילס בוהר אמר בזמנו (למרות שזו שאלה מי אמר זאת ראשון): "מאד קשה לבצע חיזויים, בעיקר לגבי העתיד".

מה אפשר להסיק מכל מה שנעשה עד כה לגבי יום הבחירות עצמו? אני בכנות לא יודע. אני מקווה שתחרות חיזוי הבחירות שאנחנו מקדמים, באיגוד הסטטיסטיקאים הישראלי, יעזור בתחום הזה בעתיד.

יהיה מה שיהיה, אני מתכנן להצביע – ואני מקווה שגם אתם! 🙂

מגמות הסקרים של הבחירות לכנסת ה-20 (חלק 1)

הודעה חשובה לפני שהפוסט יתחיל: בסוף השבוע יתקיים מפגש דיון בחיזוי תוצאות הבחירות (להרשמה, חינם, למפגש – הקליקו כאן). המפגש מיועד לאנשים העוסקים בניתוח נתונים ומאורגן במטרה לדון בחיזוי תוצאות הבחירות, וגם כדי לעודד אתכם להשתתף בתחרות האיגוד לניבוי תוצאות הבחירות 2015 (תחרות עם פרס בגובה 1,250 ש"ח, ללא דמי השתתפות – לפרטים נוספים והשתתפות, קיראו עוד כאן). ונתחיל את הפוסט:

היום מתחיל השבוע האחרון שלפני הבחירות. אני בטוח שכולנו נרצה להסתכל על הסקרים האחרונים בתקווה לדעת מה יקרה בשבוע הבא. אבל דווקא עכשיו זה הזמן לקחת צעד אחורה, ולהסתכל על התמונה הגדולה. וכך היא נראית (הקליקו על התמונה לגירסה מוגדלת, והסברים מופיעים בהמשך):

2015-03-08 12_47_13-Clipboard

הגרף שמוצג נוצר בעזרת אתר האינטרנט שבנה יוני סידי (הוא בנה את האתר בעזרת שפת R לתכנות סטטיסטי), אשר מסתמך על נתוני הסקרים שאסף נחמיה גרשוני.

הגרף למעלה מאפשר לנו לראות את מגמת התמיכה במפלגות השונות על פני החודש וחצי האחרונים.

בגרף אנחנו רואים תרשים פיזור נפרד לכל מפלגה. בציר ה- X אנחנו רואים את תאריך ביצוע הסקר, ובציר ה- Y את מספר המנדטים שקיבלה המפלגה מהסקר. כל נקודה מציגה תחזית מנדטים למפלגה חברת סקרים שונה. הקו שמולבש על גבי הגרף הוא סוג של "קו מגמה" (לא נכנס לאיך שהוא מחושב, אבל אפשר לחשוב עליו כמו על ממוצע מקומי לטווח ערכים מסויים).

הגרף עוזר לנו לזהות את טווח הוודאות של הסוקרים השונים לגבי המפלגות השונות, והאם לאורך זמן אנחנו רואים התחזקות או היחלשות של "מרכז" תחזית המנדטים של המפלגות השונות. ברשותכם, אציע פרשנות למגמת מספר המנדטים שמקבלים המפלגות השונות, על סמך מה שהגרף מראה לנו:

  • הליכוד – הייתה מגמת היחלשות של המפלגה במהלך פברואר. אבל בשבועיים האחרנים המצב די יציב.
  • המחנה הציוני – המפלגה איבדה קצת מכוחה בסוף ינואר, אבל מאז היא שומרת באופן יחסית יציב על אותו מספר מנדטים.
  • יש עתיד – מצליחה באופן עיקבי (ודי מרשים, אני מוכרח להודות) להתחזק בסקרים. בשבועיים האחרונים נראה שיש התייצבות בעליה.
  • הבית היהודי – נראה שהם רק נחלשו בחודש וחצי האחרונים, ובשבועיים האחרונים נראה שהם התייצבו.
  • יחד – בהתחלה הם התנדנדו על אי-מעבר של אחוז החסימה, אבל בשבועות האחרונים הם הצליחו לשמור על ה-4 מנדטים שלהם בסקרים באופן יחסית עיקבי.
  • שאר המפלגות נראות ללא מגמה – כולנו, ישראל ביתנו, שס, יהדות התורה, מרצ, רשימה משותפת ערבית – כולם שומרים על יחסית יציבות בתחזיות המנדטים.

הדבר שלא מופיע בסקרים, והוא בעל חשיבות עצומה, היא השאלה של אחוז ההצבעה במגזרים השונים. ייתכן והסקרים שיש לנו לא מצליחים לתפוס את ההשפעה של איחוד המפלגות הערביות, ושביום הבחירות נגלה שהמפלגה שלהם תקבל הרבה יותר קולות ממה שהופיע בכל הסקרים. באופן דומה, מפלגת יחד נמצאת על 4 מנדטים באופן די עיקבי, מה שאומר שעליה אפילו קטנה של אחוז ההצבעה, ומעט היסוס מצד המצביעים שלה – עשוי להותיר אותם מחוץ לכנסת.

וכמובן, יכול להיות שכל הסוקרים מפספסים תתי אוכלוסיות או תופעות, אשר יפתיעו אותנו ביום הבחירות עצמו (כמו שהיה עם ההצלחה המדהימה של יש עתיד בבחירות הקודמות) – מה שהסברתי בעבר במאמר על שגיאות שאפשר ושאי אפשר להציג.

הבחירות האלה חשובות ומעניינות – צאו עם המשפחה והחברים ולכו להצביע!

(חלק 2 של הפוסט יגיעו בעוד שבוע אחרי שתוצאות התחזיות של משתתפים בתחרות החיזוי יגיעו)

מפלגת עלה ירוק עותרת כנגד מכוני הסקרים וערוצי החדשות – זה מעניין

הפוסט הבא הוא פחות מהסוג של "אי תראו, שגיאה!", ועוסק בנושא עמוק. תביאו כוס קפה, ותקראו בהנאה.

בסוף פברואר, מפלגת עלה ירוק (עם עורכי הדין חגי קלעי ואוהד רוזן) הגישו עתירה כנגד עיתון "הארץ", ידיעות אחרונות, ישראל היום, NRG, וואלה!, רשות השידור, חברת החדשות, ערוץ הכנסת, ערוץ 10, ומכוני הסקרים. בעתירה ביקשו שערוצי החדשות יפסיקו לפרסם תוצאות סקרים מעובדות למנדטים, ויעברו לפרסום תוצאות הסקרים הגולמיות באחוזים.

לצערי לא הצלחתי למצוא את קובץ העתירה המקורית (למישהו יש קישור?), ולכן אני מסתמך על

עידכון: שלחו אלי את העתירה המקורית, אתם מוזמנים להוריד אותה מכאן: Document (158)

ואף הופיעו דיווחים שלה באתרי החדשות. לדוגמא כאן (וגם כאן וכאן).

בעתירה הועלו שלל טענות, בין השאר נכתב כי:

"המצג שיוצרים המשיבים אינו משקף את המציאות אלא מתערב בה, ומעודד את הבוחרים שלא להצביע למפלגות העומדות על סף אחוז החסימה. העדר הדיווח על העליה המתמדת במצביעים הפוטנציאליים של אותן מפלגות, והצגתן כמי שזוכות ל חמישה אחוזים מהקולות, מעביר מסר שגוי לציבור כי אין כל סיכוי לכניסת מפלגות אלו לכנסת. התנהלות זו, בין אם במחדל ובין אם בכוונת מכוון עומדת בניגוד לדין, פוגעת פגיעה קשה בעיקרון החוקתי של שיוויון הבחירות, ומשפיעה השפעה לא ראויה ומוטה על ציבור הבוחרים והבוחרות".

ובכן מסתבר שיו"ר ועדת הבחירות המרכזית, השופט סלימן ג'ובראן, השיב אתמול (04/03/2015) לעתירה. הנה מה שנכתב:

החלטת ביניים -סלים ג'ובראן

הסיכום שלי של תגובת השופט:

  1. השופט דחה את הטענה שאי הכללה של "עלה ירוק" בסקרים שמעבירים הופכים אותם לפסולים. זאת משום שהעותרים לא הביאו חוות דעת סטטיסטית מקצועית בנושא, ואי לכך אין השופט יכול לקבל את דעת העותרים בנושא, והוא דוחה את טענתם.
  2. העתירה חשובה, אך לא תספיק להשפיע על הבחירות הקרובות. המשך הדיון יהיה ב- 11/03/2015
  3. השופט חושב (אך "מבלי להכריע בדבר"!) שיש מקום להתייחס למידת קירבתן של מפלגות שלא עברו את אחוז החסימה בסקר בתוצאות שמוצגות.

הסיקור של הכלכלה האמיתית – ודעתי

בדיווח שהופיע היום באתר "הכלכלה האמיתית" נכתבו כמה דברים בנושא. אפשר להגיב להרבה דברים שנאמרו שם, אני אתמקד ואתייחס למשפט המסכם שאיני מסכים איתו. הם כתבו:

אתמול החליט יו"ר ועדת הבחירות המרכזית,סלימן ג'ובראן, לקבל את עיקרי הטענות בעתירה.ערוצי התקשורת יחויבו לפיכך לפרסם את תוצאות הסקרים האמיתיות באחוזים במקום בעיבוד למנדטים.

זו לחלוטין לא הפרשנות שלי למה שכבוד השופט כתב. לפי הבנתי, השופט דחה כמה טענות בעתירה, ולגביהטענה המרכזית על החשיבות של הצגת קירבת המפלגות לאחוז החסימה – הוא חושב שראוי לקבל חוות דעת מומחית (ולכך הוא מזמין את מכוני הסקרים להגיב).

כך או אחרת, אני מסופק שהתוצאה של העתירה הזו תהיה הצגה של תוצאות הסקרים באחוזים ולא במנדטים. היות ותוצאות הבחירות ימדדו במנדטים, סביר מאד להציג לציבור את תוצאות הסקרים במנדטים ולא באחוזים.

עם זאת, לגבי הביטוי "עיבוד למנדטים", כוונת הכותבים בכלכלה האמיתית (אני משער) היא לא רק להמרה של אחוזים ל- 120 מנדטים, אלא השינויים הדרושים בתוצאות הסקר כדי לתת משקל שונה לנתונים על מנת שאלו ישקפו נאמנה יותר את אוכלוסיית ישראל ואת תוצאות הבחירות (הסברתי על הנושא של הטייה יותר בהרחבה כאן). לדעתי – אני חושב שזה יהיה פסול מאד להציג בתקשורת את תוצאות הנתונים הגולמיים ללא עיבוד מתאים. אני מסכים שהתהליך הזה כולל שיקול דעת אישי, ולכן עלול לכלול טעויות והטיות. עם זאת, לצערי, אני לא יודע על דרך טובה יותר לקבל תחזית "סבירה" לתוצאות הבחירות (היות והתוצאות הגולמיות צפויות להיות מאד מאד לא מייצגות לתוצאות האמת).

מצד שני, יכול להיות מעניין לראות האם השופט יחייב את מכוני הסקרים להציג את הנתונים הגולמיים ואת שיטות הסקירה. מצד אחד, אני משוכנע שמכוני הסקרים ילחמו לגבי זה היות ודרכי העיבוד מהווים סודות מקצועיים עבורם. אני לא יודע איזה שיקול ינצח "זכות הציבור לדעת" או "חופש העיסוק" הכולל שמירה על סודות מסחריים.

אני לא יודע איך העתירה הזו תסתיים – אבל כבר עכשיו היא מעלה סוגיות מעניינות מאד לבחינה משפטית – שכשלעצמו זה דבר טוב.

129% מהציבור רוצים שר אוצר…

הפוסט הזה הגיע מהגולש שובל צורן אשר דיווח במסגרת תחרות הסקר המוזר (אתם גם מוזמנים להגיש דיווח כאן, והמדווח על הסקר ה"מוזר" ביותר יזכה ב- 500 ש"ח. אין עלות להשתתפות).

 

הגרף הבא פורסם בדף הפייסבוק של המחנה הציוני, ומגלה שסך הכל 127% מהציבור רוצים בשר אוצר:

2015-03-04 12_11_24-Clipboard

 

"הצעירים בישראל בחרו – מהפך" – אך ללא קשר בין מספרים לעמודות

הפוסט הזה הגיע מהגולש שובל צורן אשר דיווח במסגרת תחרות הסקר המוזר (אתם גם מוזמנים להגיש דיווח כאן, והמדווח על הסקר ה"מוזר" ביותר יזכה ב- 500 ש"ח. אין עלות להשתתפות).

הגרף הבא פורסם בדף הפייסבוק של יצחק הרצוג:

2015-03-04 08_57_12-Clipboard

על הסקר כתב שובל (בצדק):

אין כל פרופורציה בין המספרים והעמודות; למרות שההפרשים בין המפלגות למטה קבועים(1) המרחקים בין עמודותיהן שונים, וההפרש בין 9% ל-20% לחלוטין לא פרופורציונלי. בנוסף, כמובן שההצגה המגמתית ממשיכה כשהם מציגים את עצמם – כש30% הרבה יותר גדול ממה שאמור להיות. אפשר גם לשים לב שעמודת ה30% *רחבה* יותר.

ואני אוסיף שהעמודה של המחנה הציוני מופיעה בצבע אחר (ניחא), אבל יותר חשוב מזה, שהיו כמה סקרי תיכונים שונים, וכל אחד החליט לשקלל אותם אחרת (לדוגמא, יש תוצאות אחרות שבהם יש עתיד זוכה כמנצחת המועדפת).