באולפן שישי מהימים האחרונים (30.03.2012), התנוססה לה כתבה תחת הכותרת "כך זינק המס שאנחנו משלמים על הדלק". בכתבה מופיע תרשים מרשים המראה את הטיפוס הבלתי נלאה של המס שאנחנו משלמים על הדלק בעשור האחרון. היות והרבה חברים בפייסבוק החליטו להפיץ את התרשים הזה, החלטתי להסתכל עליו קצת יותר, הנה הוא:
בתרשים הזה יש שני כשלים משמעותיים: הראשון הוא מבחינה עיצובית (תרשים עמודות תלת מימדי, במקום דו מימדי) והשני הוא מבחינת סוג הנתונים שהוצגו (נתונים גולמיים ללא תיקנון). וכעת הסבר מורחב:
הטייה 1: תלת מימד כושל בלשקף את הנתונים
נתחיל בנושא העיצוב. עד היום לא נתקלתי בשום גרף עמודות תלת מימדי שהיה יותר אינפורמטיבי מאשר הגרף הדו-מימדי. נהפוך הוא, תרשימים כאלה הם לרוב סוג של דיסאינפוגרפיקה שמעוותת את הרושם שנוצר מהנתונים. במקרה שלנו, מה שהתלת מימד עושה הוא להוסיף נפח לא מלבני לעמודות, מה שלא תורם לשימושיות של הגרף, רק גורע ממנו.
הטייה 2: הבחירה של תחילת הצירים
הבחירה של מה תהיה נקודת ההתחלה של הצירים כאן משפיעה על הגודל היחסי של כל עמודה. תסתכלו בבקשה על העמודה הכי שמאלית והכי ימנית בגרף. מדידה פשוטה של השוואת הגבהים מראה שהעמודה הימנית (מבחינה גרפית) נראית כמעט פי שלוש וחצי מהגובה של העמודה השמאלית. אבל אם טורחים לקרוא את המספרים, מגלים שמדובר במספר שהוא פחות מפי שלוש (עדיין עליה, אבל לא פי שלוש וחצי). זה כנראה בגלל הבחירה של ראשית הצירים (תודה להדב מהתגובות על התיקון שסיפקה לי)
כך נראה הגרף כאשר מציגים אותו בדו-מימד, ועם נקודת ה-0 בתחילת ציר ה- y. פחות אקשן אבל (הרבה) יותר מדוייק:
הטייה 3: תנו את הנתונים הגולמיים כדי ליצור בילבול מקסימאלי
כעת נעבור להטייה השלישית בגרף – לתת נתונים גולמיים מבלי לתקנן אותם לגורמים שאינם קשורים למשמעות שמעניינת אותנו.
אני משער שמטרתו של הגרף שהוצג בשידור הייתה לעורר זעם כלפי הממשלה. עלייה במחירי הדלק היא דבר מרגיז, שהרי מי מאיתנו רוצה לשלם לממשלה יותר מיסים? (שבין כה הולכים בשביל לשלם על דברים שאנחנו לא תמיד מסכימים לגביהם, כמו שחיתות, ותשלומים למגזרים ייעודיים, כל עוד אנחנו לא שייכים להם). אבל רגע, האם זה באמת מה שהגרף הזה מלמד שקרה? אני לא בטוח, ובואו נראה למה.
כמות הכסף שאנחנו מוציאים על דלק קשורה באחוז המיסוי של הדלק (עם תיקנון לערך השקל וכדומה), נשמע הגיוני, לא?! אך לא זה הנתון שהביאו לנו. מה שהתרשים שהוצג מתאר (כפי שמופיע בכיתוב הלבן הקטן שמופיע מתחת לצד השמאלי של הכותרת) הוא כמות ההכנסות במליארדי שקלים שנכנסו לקופת המדינה מהמס על הדלק (לפחות כך אני מבין את הכיתוב). ובכן, זה המספר הזה אכן עלה באופן די דרמטי בעשור האחרון. למעשה, הסכום הזה עלה כמעט פי שלוש בתוך עשר שנים, זה אכן הרבה.
אבל רגע, האם הסיבה לעלייה בהכנסות ממיסוי על הדלק היא בגלל שאני ואתם משלמים יותר מיסים על הדלק? כנראה שגם, אבל לא רק.
סביר מאד להניח שהעלייה בהכנסות קשורה לדברים אחרים. לדוגמא, העלייה בכמות הרכבים על הכביש, אשר יכול לשקף את העלייה בכמות האזרחים שיכולים לנהוג. לא ניסיתי למצוא נתונים כאלה, אבל כן מצאתי בזריזות את הנתונים של גודל האוכלוסייה בישראל בעשור האחרון (מקור: ויקיפדיה), והפלא ופלא, המספר הזה עולה. למעשה, כאשר מציגים את התרשים של עליית ההכנסות מהמיסוי ביחד עם העלייה בגודל האוכלוסייה, נראה ששניהם עולים "ביחד".
אם ניצור תרשים פיזור ונתאים להם קו לינארי, נראה שאפשר לתת תחזית ממש מעולה של כמות ההכנסות ממיסוי הדלק, פשוט על פי גודל האוכלוסיה (הקורלציה היא כמעט מושלמת, עם R בריבוע של 0.98):
למען ההבהרה: המשמעות של הקורלציה הכמעט מושלמת הזו איננה שכל עליית המיסים מוסברת על ידי הגידול באוכלוסיה. (זוכרים, קורלציה היא לא סיבתיות…)
המשמעות של הקורלציה היא שלתת את הנתונים הגולמיים, בתקופה שבה יש צמיחה של הרבה גורמים, היא להתיימר ולומר שכל הסיפור של עליית המיסים מנותק מההקשר של צמיחה בגורמים אחרים באותו הזמן. ברור לי שהיה עלייה במיסוי על הדלק, ברור לי שהיום אני משלם יותר על דלק. יחד עם זאת, הנתונים שערוץ החדשות בחר להביא לא עוזרים לי לדעת כמה אני משלם יותר, רק כמה הממשלה מרוויחה יותר (מה שתלוי בעוד דברים מלבד בכמה אני משלם יותר, כמו לדוגמא- כמה אנשים משלמים יותר).
אז מה זה אומר?
שהגרף שהביאו לנו בחדשות לא עוזר לנו לדעת כמה החמיר מצבנו (או שלא). מה שכן, זו הזדמנות נהדרת להדגים את שני הדיסאינפוגרפיקות עליהן עברתי בפוסט הזה.
עידכונים לפוסט:
- אבנר מ"שקרים יפים", פירסם רשומה שבה הוא כן מביא את הנתון על מחירי הדלק בתדלוק עצמי מהעשור האחרון. וממחיש כיצד גם הנתון הזה (כשלעצמו) לא מספיק בשביל להבין את מלוא המשמעות של שינויי המחירים. אין מה לעשות, העולם מורכב…
- לאור הביקורות (הלגיטימיות) בתגובות, תיקנתי שני תרשימים שמציגים את צמיחת האוכלוסיה בישראל, כך שיכללו את ה-0 בציר המספרים. בגרף הראשון זה נראה די טוב, בגרף של הקורלציות זה יוצא קצת מעוות, אבל כנראה עדיף ככה… (טועים, טעיתי, אטעה – תודה על הסובלנות, אם יש כזו 🙂 )
- תיקון נוסף לפוסט היה להבחין שהסיבה לחוסר הפרופורציות בין העמודות נבעה מתחילת הצירים ולא מהשימוש בתלת מימד (כפי ששגיתי בתחילה לחשוב)
- בינתיים, מחלקת המחקר של הכנסת בדקה את הנושא יותר לעומק. הבדיקה שלה כוללת התייחסות למחירי הדלק במונחים של כוח קנייה ונטרול של השפעת הפערים ברמת החיים בין המדינות. על פי הנתונים, ישראל במקום ה-6 באירופה מבחינת יוקר הבנזין ובמקום ה-4 מבחינת גובה המס על הדלקים. קישור.
פיספסתי משהו? הפוסט ריגש אותכם? כרגיל, אני אוהב לקרוא תגובות…
המס על הדלק המדובר הוא בלו שהוא מס קבוע לכל ליטר.
http://he.wikipedia.org/wiki/%D7%91%D7%9C%D7%95_(%D7%9E%D7%A1)
תקרא הקישור תבין ששילמת פחות מס ולא יותר, כמובן חוץ ממע"מ שהוא מס באחוזים שהוא כן עלה.
מה שכן עלה זה מחיר הדלק, ולכן שילמת יותר.
לגבי סוגייה ראשונה תלת-מימד
ייתכן שהבעיה היא אחרת או לפחות לא הוכחת את הנקודה שלך.
סוגיית ההפרש בין הגדלים היא לחלוטין לא קשורה לתלת מימד אלא לבחירת ההתחלה של הצירים.
אם נקודת ההתחלה היא 6.3 ונקודת הסיום היא 16.2 אפשר לקחת את ההפרש היחסי בין גובה העמודות לאינסוף על ידי משחק עם ראשית הצירים. (לדוגמא להתחיל את הציר מ 6.29)
אתה מניח משום מה שזה קשור לתלת-מימד.
בשביל להראות את זה צריך להראות שהגרף מהעיתון מתחיל מנקודת ה0 ולפחות בתמונה שהבאת זה לא נראה כך.
היי הדב,
נקודה טובה – אני מתקן את הפוסט כעת…
טל,
ניסיתי ליישם את הידע המוגבל שלי בסטטיסטיקה כדי לבדוק את הקשר בין מחיר הדלק בארץ ומחיר הנפט בעולם. לקחתי נתונים חודשיים (3 שנים אחרונות) מהאתרים הרלוונטיים, המרתי לדולרים, חישבתי את העליה (או הירידה) החודשית באחוזים, שמתי בתרשים פיזור את השינוי בארץ מול השינוי בעולם, ואפילו לקחתי היסט של חודש – כי בלי זה אין שום מתאם. אר-בריבוע יצא בערך 46%.
הורדתי את רכיב המס הקבוע, שלכאורה דופק את החשבון, ועדיין יצא בסביבות 50%.
מה אני מפספס? או שאולי אני לא מפספס ובאמת המתאם כל כך גרוע?
שלום יאיר,
כל הכבוד על העבודה והשיתוף.
הייתי אומר שמה שאתה מראה שבאמת יש עוד גורמים משפיעים. נראה שהגורמים העיקריים הם השילוב של מחיר הנפט ומס הבלו:
http://he.wikipedia.org/wiki/%D7%AA%D7%97%D7%A0%D7%AA_%D7%93%D7%9C%D7%A7#.D7.9E.D7.97.D7.99.D7.A8.D7.99_.D7.94.D7.93.D7.9C.D7.A7
אם גם לאחר השילוב של שני הגורמים הללו יש הרבה שונות לא מוסברת, אז זה יהיה מפתיע משהו ודורש בדיקה. גם הייתי מציע שתעשה תרשים פיזור ותראה האם יש מגמות מוזרות שפוגעות בקשר שאתה מצפה לראות.
דבר אחרון: כדאי לזכור שבתיאוריות הסטטיסטיות הקלאסיות אשר מטפלות בנושאים של קורלציות (מודלים לינאריים, רגרסיה וכו'), ההנחה המובנית בשיטות הללו (לפחות למען ביצוע של הסקה סטטיסטית תקפה), הן שהתצפיות בלתי תלויות אחת בשניה. במקרה של משהו שמשתנה לאורך זמן, בהרבה מקרים היינו מצפים שכן יהיה תלות בין התצפיות. יש גם דרכים להתמודד עם מצבים כאלה, אבל השיטות האלה כבר הרבה יותר מסובכות (מודלי AR, MA, ARIMA וכו').
המסקנה שאני מציע לקחת מזה היא שלא לקחת בקלות ראש את ההסקה הסטטיסטית שבהשוואת סדרות נתונים לאורך זמן…
שלום טל,
ריכזתי את הנתונים כאן: http://dl.dropbox.com/u/2476312/gasprices.xls
יכול להיות שפשוט מחיר הנפט בעולם כל כך תנודתי, שמחיר נקודתי לא אומר כלום ואפילו שינוי חודשי לא אומר כלום.
אופציה נוספת היא שקובעי המדיניות בישראל משחקים עם מרווח השיווק כפי שהם משחקים עם הבלו והמע"מ (שים לב לתנודתיות בעמודת הבלו בלבד).
ואולי בכלל יותר נכון להשוות את מחיר הבנזין הסופי, כולל מיסים, לאיזשהו ממוצע נע של מחירי הנפט; שהרי על המיסים ועל הנפט אנחנו משלמים בדיוק באותה מידה.
תודה!
הטיה 1.1, בהמשך לתלת ממד – שים לב שהפרספקטיבה של העמודות מראה כאילו אנחנו מסתכלים עליהן מלמטה למעלה (לא רואים את הפאה העליונה). כלומר, העמודות הן גבוהות. אם היו יוצרים את אותו גרף בדיוק אבל מציגים פרספקטיבה אחרת, בה כן רואים את הפאה העליונה, זה יכול היה ליצור יותר תחושה שאנחנו מסתכלים על העמודות כלפי מטה, ושהן "נמוכות".
נכון שגרף הדלק מטעה. אבל!
א. ישנו עניין פשוט שלומדים בתיכון: מהו קנה המידה? אם קני המידה שונים בעמודות השונות – זו טעות או הטעייה.
ב. הפסיכולוגיה של עמוד לעומת מלבן מהווה נושא משעשע לעבודת מאסטר בפסיכולוגיה חזותית אבל ציור עמוד בעובי אחיד לעומת מלבן איננו רמאות ואיננו שגיאה.
ג. הצגת שינוי במקום הצגת הערכים המשתנים איננה רמאות – היא דומה למה שעושים כל הזמן בפירסומת. ברור שעלייה מפרומיל לעשרה פרומיל היא פי עשר אבל בסך הכל זה מעט.
ד. אמנות הצגת גרפים כך שהקורא ישתכנע (לא חשוב מה נכון) הוצגה בהרחבה מזמן מזמן בספר נפלא ששמו HOW TO LIE WITH STATISTICS שאפשר עדיין להשיגו.
עוד הטיה שאני מניח שלא נלקחה בחשבון בגרפים היא שככל הנראה הערכים הם נומינלים, כלומר ללא התייחסות לעליית המדד.6.8 מיליארד ש"ח לפני 10 שנים לא שווים ל6.8 מיליארד היום.
כמו כן אין התייחסות לעליה במחירי הדלק בעולם, שאחראית לחלק מהעלייה במיסים.
מאוד אוהב את הבלוג הזה בדרך כלל, אבל הפוסט הזה נופל קשות בשתי נקודות.
2) הגרף שלך מטעה בטרוף, בגלל האופן שבו בחרת את הצירים.
2) בין כל שני דברים פחות או יותר לינאריים יש קורלציה פחות או יותר מלאה, אז מה? דוגמה פשוטה בה כל הניתוח שכתבת רק מבלבל, אבל האמת נשארה – האוכלוסייה גדלה ב- 20% אבל גביית המס גדלה כמעט פי 3.
היי איתן,
שמח שאתה בד"כ אוהב את הבלוג 🙂
1) איזה מהגרפים מטעה בגלל בחירת הצירים? נתתי הרבה גרפים…
2) המטרה שלי בחלק השני לא הייתה לבלבל, אני מצטער אם זה מה שיצא.
זה נכון שבין שני דברים לינאריים תהיה קורלציה, אבל מדוע ציפית שהעלייה בהכנסות ממיסוי דלק תהיה לינארית? אני לא ציפיתי לזה באופן הזה. אבל מסתבר שזה מה שקורה, ולכן אפשר להסביר את הצמיחה בכל גורם שצמח במקביל באותו הזמן (גודל אוכלוסיה היא דוגמא אחת).
הטענה שלי בפוסט היא *לא* שגידול האוכלוסיה מסביר את כל התופעה של העלייה במיסים. אבל שהוא בפירוש יכול להוות חלק משמעותי מהסיפור (לא כולו, אבל משמעותי), שמתעלמים ממנו כאשר מציגים את הנתונים הגולמיים של גודל המס.
איך היית מציע לשפר את הפוסט הזה?
הגרף בו הצגת את המס שמשלמים על הדלק וגודל האוכלוסיה הוא גרף שמציג תמונה מעוותת ומוביל עיין בלתי מקצועית למסקנות שגויות. על ידי הבחירה שציר ה- Y יתחיל ב- 6000 ולא באפס, ועל ידי משחק בגודל השנתה, דאגת להצמיד את הגרפים זה לזה. בחירה אחרת יכלה להמחיש עד כמה היקף המס גדל מהר ביחס לגידול באוכלוסיה (פי 15) ולהוביל להתרשמות אחרת ולטעמי נכונה יותר. מה יכלת לעשות טוב יותר? יכלת לטעון שנכון היה להציג את המס לנפש, ולא המס הכולל, ואולי אפילו מס לנפש מתורגם למדד. אגב, אם תעשה כן עדיין תהיה מאוד משמעותית – פי 2 בעשור. מכאן שהגידול באוכלוסיה הוא ממש לא חלק משמעותי בסיפור.
היי איתן,
טוב – לאחר בדיקה נוספת, אני מקבל את הביקורת שלך. תיקנתי את הגרפים שבפוסט ככה שיכללו את ה-0 בציר המספרים, ויאפשרו להשוות את השיפוע של העלייה באוכלוסיה ושל העלייה בהכנסות ממיסוי על הדלק. זה אכן נראה יותר טוב. התנצלותי…
יפה מאד! אבל.. אנחנו הרי יודעים שאחוזי המס כן עלו. אז איפה פספסת?
היי אורח,
לא טענתי בפוסט שמחירי הדלק לא עלו. רק טענתי שלהסיק איזו עלייה הייתה, מהגרפים שהראו לנו בחדשות, זה (די) בלתי אפשרי.
יכול להיות (לדוגמא) שככל שהאוכלוסיה גדלה, המס גדל מעט יותר. במצב כזה עדיין תהיה קורלציה מלאה, אבל גם יגבו מהאוכלוסיה יותר מס בכל פעם (כנראה שזה מה שקרה).
אבל גם אם זה מה שקרה, הגרף שהיינו צריכים להסתכל עליו, הוא לא הגרף שנתנו לנו בחדשות.
מכיוון שאין לי בזמין את הנתונים האלה, אני לא יכול לשרטט אותם.
מה שכתבתי עוזר?
מה שרשמת בהחלט לא עוזר. לפי הפוסט עיקר עניינך היה להטיל ספק בעובדה שנטענה בפרסום- כמות המס הנלקחת מכל אחד מאיתנו גדלה. לא עשית זאת. במקום, הכרזת על "הטיות" תוך כדי שאתה מכניס סילופים משלך כדי למקסם את קעקוע הטענה.
"מעניין" לשים לב שתוך כדי שאתה שם ללעג את ה"הטיות" המטעות בעיצוב הגרף המדובר, אתה בעצמך בוחר (באופן מכוון לגמרי) קנה מידה לנתונים שלך (על גדילת האוכלוסיה) שבאופן שקרי מוצגים כאילו הם תואמים לחלוטין את העליה במיסוי. תסביר בבקשה- איך עליה של 20% באוכלוסיה מוצגת בגרף באורח פלא *בדיוק* כמו עליה של פי 2.4 במיסוי? מילא היית מראה נתונים מתוקנים אמיתיים, יחסית לגודל האוכלוסיה, לשער הדולר, למדד, למחיר הנפט. אבל בחרת להוסיף סילוף על טענה לסילוף.
קוראים לזה דמגוגיה, אדון גלילי. תפסיק להתמם.
כרצונך, להל"ן התגובות:
1) " לפי הפוסט עיקר עניינך היה להטיל ספק בעובדה שנטענה בפרסום- כמות המס הנלקחת מכל אחד מאיתנו גדלה. לא עשית זאת. " –
* ובכן, אולי לא עשיתי זאת כי זו לא הייתה מטרתי בפוסט?
מטרתי בפוסט היא להראות איך הגרף שהם הביאו לא קשור (או קשור בעקיפין ובאופן די מסולך) בנושא שעליו הם דנים.
לא ניסיתי להתמודד עם השאלה האם הייתה עליה במיסוי או לא. המוטיבציה שלי היא בנושא של הצגת נתונים בתקשורת, לא של האם הטיעון הספציפי נכון או שגוי.
ספציפית, אגב, האמונה שלי נכון להיות היא שיש עלייה במחיר הדלק…
2) "במקום, הכרזת על "הטיות"
* באמת יש בגרף הטיות: הגרפיקה יוצרת הטיה ויזואלית. והנתונים הם חסרי קונטקסט. זה מה שכתבתי בפוסט, וזה היה הפואנטה שלו…
3) "תוך כדי שאתה מכניס סילופים משלך כדי למקסם את קעקוע הטענה."
* איזה סילופים עשיתי? אני לא מרגיש צורך לקעקע את הטענה שלהם. רק את האופן שבו הם ניסו להעביר אותה.
4) "… קוראים לזה דמגוגיה"
גיא – אם הייתי מנסה לטעון שהסיבה היחידה והבלעדית והעיקרית לעלייה במיסים שהתקבלו על הדלק היא עלייה באוכלוסיה, אז אכן, הגרף שהצגתי מציג סילוף מתאים שמצליח באופן דמגוגי להעביר את הנקודה הזו.
עם זאת, זו לא הייתה מטרתי, או האופן שבו אני מבקש שיפרשו את הגרף שהצגתי.
המטרה שלי הייתה לומר שעלייה לאורך שנים במיסוי, הולכת יד ביד (לא באותו קצב, אבל באותה המגמה!) עם מדדים אחרים שגם הם הולכים וגדלים לאורך השנים (לדוגמא, גודל האוכלוסיה).
לא ניסיתי להסביר את התופעה, ניסיתי להמחיש שהתופעה יותר מורכבת ושאפשר להסביר אותה ביותר מאופן אחד בלבד (דהיינו "הממשלה רק עושקת אותנו יותר ויותר כל שנה").
אתה צודק שהסבר מורכב יותר דורש התייחסות לעוד הרבה גורמים (וגם כתבתי זאת בפוסט שלי).
נ.ב: לעשות גרף בסקאלות ה"מתאימות" היו הופכות את כל הגרף לדחוס ומוסט ביותר, ומקשות על הפנמת הרעיון שאני מנסה להסביר (דהיינו – שהסיפור מורכב יותר). אם אתה חושב שאתה יכול לעשות טוב יותר, אדרבה – צור גרף ואני אפרסם אותו…
ובנימה אישית – גיא, ברור לך הרי שאני מאד מעריך אותך ואת פועלך. אנא הימנע מלתקוף אותי כשאני מגיע עם מטרות טובות, ועוד משקיע בזה מזמני…
להית,
טל
תודה על התשובה המנומקת, הנקודה הובנה. והכוונות וגם הבלוג שלך מאוד ראויים להערכה.
כדי לא לטחון מים, ראה את התגובה של Eitan – "מאוד אוהב את הבלוג הזה בדרך כלל, אבל…"
אתה צודק שלא הקפידו בפרסום הראשוני לתת נתונים ריאלים, מתוקנים, מנורמלים וכו'. אבל בלי לבזבז מזמנך יכולת רק לציין איך צריך היה להציג את הנתונים, ואיזה נתונים חשובים בדיווחים כאלה. אני אשמח ללמוד על כך.
ועוד דבר אחד. אני לרגע לא מתכוון לטעון שאתה "צריך" לתת כאן דוח של 20 עמודים על מחירי הדלק רק כדי להעביר את הטענה הצודקת שלך- אבל כשאתה מציג נתונים עם הטיה לא פחות משמעותית זה צורם.
היי גיא,
אני שמח שאנחנו על אותו גל 🙂
מבחינת הביקורת של איתן, כשאחזור הביתה אני אציג את הגרף בלי עיוות של הצירים אבל אני צופה שזה רק יעשה יותר בילבול מאשר תועלת. נבדוק ונראה…
לגבי "מה היה צריך לעשות", הוספתי עידכון בסוף הפוסט עם קישור לפוסט של אבנר קשתן, שבו הוא מבהיר עוד אלמנטים שהיו יכולים לעשות שכן היו עוזרים. זה לצערי לא סיפור פשוט. מצד שני, בשביל זה הייתי מצפה שאנשי מקצוע ינסו להתמודד איתו (אני, לצורך העניין, בסך הכל סטטיסטיקאי. אנשי המקצוע מבחינתי אמורים להיות הכלכלנים. אם אתה מכיר מישהו בפייסבוק שכדאי לעקוב אחריו בנושאים כאלה – אשמח לשמוע עליו).
היי גיא.
תיקנתי את הגרפים בפוסט כך שיהיו יותר משקפים.
מבחינת קונטקסט נוסף, הוספתי קישור לאבנר קשתן שכתב גם הוא לאחרונה בנושא…