היום (19/12/2014) פרסמו מעריב סקר בחירות חדש. בהצגה הגרפית של הסקר הזה בעיתון אין (כמעט) קשר בין גובה העמודות למספר המנדטים. הבולט מכולם היא ההחלטה להציג את יש עתיד (עם 10 מנדטים) בתור עמודה בגובה של 23 מנדטים. להלן התרשים:
התרשים הזה שופע עיוותים נוספים של קשר בין מספרים לעמודות:
- סכום המנדטים שבגרף הוא 122 (במקום 120).
- יש עתיד (10) בגובה של העבודה (23), וגבוהה מהליכוד (21) והבית היהודי (16).
- כולנו (10) נמוכה מיש עתיד (10), אבל בגובה של הבית היהודי (16).
- רעם תעל (7) בגובה של חד"ש (5), אבל נמוכים ממרצ (7), וכולם נמוכים מיהדות התורה (7) ונמוכים בסידרי גודל מישראל ביתנו (8).
- הגובה של הסיפרה מספר המנדטים של אלי ישי גבוה מהמספר של ש"ס (למרות שהעמודות באותו הגובה)
וואו.
לצערי הגרף שמעל פורסם גם בעיתון המודפס (תודה לצ'יקו מנשה על הפירסום בטוויטר):
חשוב להדגיש שזה שההצגה הגרפית שהופיעה בעיתון רעה, לא אומר שהסקר עצמו היה רע. אני מוכן להניח ולהאמין שחברת הסקרים עשתה עבודה מקצועית וטובה. למעשה, אני שמח להציע תרשים מתוקן (בו יש קשר עיקבי בין גובה עמודות למספר המנדטים). התרשים כולל את טווח המנדטים ה"סביר" על סמך גודל המדגם של הסקר:
פרטים טכניים: כשאני כותב "טווח המנדטים הסביר" הכוונה היא לרווח בר-סמך מבוסס Wald לפרופורציה על סמך הקירוב הנורמלי, ברמת סמך של 95%. התעלמתי בתרשים מעל מסוגיות הקירוב של רווח הסמך עבור המפלגות הקטנות יותר (אז אם זה חשוב לכם, תצטרכו לבצע חישוב מדוייק יותר).
הערה טכנית על טווח טעות מירבי שדווח. נכתב בכתבה ש:
בסקר השתתפו 507 חברים בפאנל הפוליטי של Panel4All לביצוע מחקרים באינטרנט. הסקר בוצע על מדגם מייצג של האוכלוסייה הבוגרת במדינת ישראל – מגיל 18 ומעלה. הסקר נערך בתאריך 17 בדצמבר 2014. טעות הדגימה המרבית בסקר זה היא 3.4%. [הדגשה של כותב הפוסט]
טעות דגימה של 3.4% היא הטעות של 23 המנדטים של המחנה הציוני ("העבודה") תחת רמת סמך של בערך 95%. זאת בשונה מה- 4.5% שבדרך כלל מדווחים עליו (שהוא טעות הדגימה במקרה ה"קשה" ביותר של 0.5 מ- 60 מנדטים). אין לי בעיה עם הדיווח הזה, זה פשוט מעניין איך שבכתבות שונות בוחרים להשתמש בקריטריונים שונים של טעות דגימה מירבית.
קרדיטים:
תודה לשאול אמסטרדמסקי על שהפנה את תשומת ליבי לתמונה בטוויטר ולאלי ווינגוט על הקישור לאתר מעריב, ששותף במקור על ידי רוני אלפרן.
דווקא הקטע עם ה-122 לא נראה לי בעייתי.
יש כמה דרכי עיבוד שסביר בעיני שגוף תקשורת יעביר סקר לפני הפרסום:
1. לעגל כל מפלגה למספר מנדטים שלם – סכום המנדטים הוא לא בהכרח 120
2. להריץ את אלגוריתם באדר-עופר על תוצאות הסקר – סכום המנדטים יהיה 120
3. לחשב בהינתן הסתברויות ההצבעה בסקר מה תוצאת הבחירות הסבירה ביותר (על פני כל המפלגות) – סכום המנדטים יהיה 120
4. לחשב בהינתן תוצאות הסקר מה כמות המנדטים הכי סבירה לכל מפלגה בנפרד – סכום המנדטים לא יהיה 120
ובטח יש עוד גישות אפשריות.
נראה לי שכמעט ולא מתפרסמים סקרים בלתי מעובדים (אפשרות 1), כי לא רואים תוצאות עם מפלגות שמקבלות מנדט אחד או שניים. ואני מניח שסוג העיבוד 4 הוא מה שהיה פה, וסוג עיבוד כזה יכול לתת הפרש ששונה משמעותית מ-120, כי אחוז החסימה גבוה.
היי עמיר,
בהינתן שאר השגיאות, אני מתקשה לדעת לאיזה נתון בגרף אפשר להתייחס כאמיתי ולאיזה לא.
לדעתי מה שהם עשו זה להציג בגרף את גודל המפלגה בכנסת הנוכחית ובמספרים את הצפי בסקר. לא יצא מוצלח, אבל לא מוטעה. על ה – 122 אין לי תשובה…
היי טלי,
זה רעיון יפה – אבל לא מתיישב עם הנתונים.
לעבודה אין כרגע את אותו מספר המנדטים של יש עתיד, אז לפי הסברה שלך העמודות לא צריכות להיות באותו הגובה.
כמו כן, ל"כולנו" לא אמור להיות אף עמודה.
ומה עם העובדה שמראים שם את אחוזי התמיכה אם ביבי לא היה מתמודד?
מתעלמים לגמרי מעצם התמודדותו?
אז אפילו אחרי שהעלמתם את ביבי מהעולם ואף אחד לא בוחר בו, הרצוג לא מצליח להגיע למספר שביבי מקבל?
טוב, זו שאלה האם מדובר בשאלה מעניינת לסקר או בדמגוגיה. אפשר לחשוב על טיעונים מדוע זו שאלה סבירה, אבל בכל מקרה זה מחוויר לתרשים בפוסט…
תפרסמו את השם של מי שהכין את הגרף על מנת שנוכל להחרים אותו מהתקשורת
אין לי מושג מי זה. ואין לי רצון להכפיש ולפגוע באנשים. האחראי בסופו של יום הוא העיתון מעריב, ואני מקווה שזה שהשגיאות שמבוצעות בו מופצות, יוביל לכך שהם ימעיטו בהן.
ביג לייק עם הערה: במערכת עם כל כך הרבה מפלגות . המוד הכי מדוייק הוא כנראה התפלגות מולטינומית ולא בינומית אתה מגריל בעצם וקטור הסתברויות ולא משהו בינארי. כאמור ביג לייק
היי מושון – תודה.
אני מסכים איתך שמדובר בהתפלגות מולטינומית. הדבר בא לידי ביטוי אם רוצים לבנות רווח סמך סימולטני, או אם רוצים להשוות הפרשי פרופורציות (שאז השונות כוללת את רכיב הקורלציה השלילית בין מספרי המנדטים).
עם זאת, עבור המקרה הפשוט (של טווח המנדטים הסביר של מפלגה), התייחסות לבינומי השולי של כל מפלגה היא (למיטב הבנתי) לגיטימית בהחלט.
תודה על התמיכה 🙂
טל
יש עוד דבר מעניין בסקר הזה: סכום המנדטים הוא 122.
אכן עידו, ציינתי זאת ברשימת הבעיות האחרות שבגרף…
אכן. רמת הבנת הנקרא שלי: עורך גרפים במעריב 🙁
השימוש ב- " מחנה הציוני " יש בו משום הטעיה
שכן מדובר בשם שהומצא לצורך פרסום האיחוד עם לבני ,
אבל בפועל מפלגת העבודה ממשיכה לעשות שימוש בשמה המקורי .
כפי שליכוד ממשיך לעשות שימוש בשמו המקורי ולא במחנה הלאומי .
שלום,
נכון לכרגע זה מה שמתואר בדף ויקיפדיה:
https://he.wikipedia.org/…/%D7%94%D7%9E%D7%97%D7%A0%D7…
סקרים שונים שואלים על שמות שונים. אני משתמש בשם הזה לצורך האחידות (למרות הבעייתיות האפשרית בשימוש בו).
ברגע שיסגרו הרשימות נדע את השמות הסופיים אני משער