תרשימי עוגה – מאיפה זה הגיע ומה עושים איתם

לפני מספר חודשים פנה אלי עורך מאחד העיתונים הכלכליים במדינה (לא נציין את שמם) וביקש ממני לכתוב מאמר על סטטיסטיקה. שאלתי אותו אם הוא רוצה מאמר על תרשימי עוגה והוא אמר "בטח, למה לא". כמעט חצי שנה מאוחר יותר, המאמר לא יצא לאור והחלטתי שהגיע הזמן לשחרר אותו כאן לאוויר העולם. תהנו 🙂

כשתרשימים נולדו – שם היו תרשימי העוגה

בשנת 1787 הגיעה חבילה לחצרו של מלך צרפת, לואיז ה- 16. השליח היה משוכנע שהמלך ימצא עניין רב בתוכן החבילה, ואכן כך היה. המתנה הייתה ספר שנכתב בידי סקוטי צעיר בשם וויליאם פלייפייר. והספר נקרא "האטלס הפוליטי כלכלי".

שלא כמו אטלסים אחרים באותה תקופה, הספר לא כלל אף מפה. במקום זאת, הוא הכיל תרשימים שלא נראו כמותם בעבר. גרפים שסיכמו נתוני מסחר (בין אנגליה למדינות שונות) ומגוון נתונים כלכליים. על אף שזו הייתה הפעם הראשונה שבה המלך נתקל בתרשימים כאלו, הרי שהוא הבין אותם מיידית וציין בשביעות רצון שהתרשימים יהיו ברורים לכל אדם, לא משנה מהי שפתו.

לקראת סוף המאה ה-18 פירסם וויליאם פלייפייר, מהנדס וייזם, את הספר אותו שלח למלך ולאחריו הוא פרסם ספר נוסף בשם "ספר-תפילות סטטיסטיות".

בספרים אלו העניק וויליאם לעולם דרכים חדשות להציג סטטיסטיקה באמצעות תרשימים. תובנות שעד כה היו קבורות בטבלאות אשר דרשו שניות ואף דקות של עיון ומחשבה, נחשפו להם פתאום בגרפים אשר הציגו את המגמות שמאחורי הנתונים באופן ברור לעין (תרתי משמע).

בספריו הציג וויליאם לעולם את תרשים-העוגה. ובעשותו כן, פתח את הדלת לאחד הקונפליקטים הנפוצים ביותר בהצגה-סטטיסטית אשר נשארה איתנו עד היום. האם בבואנו להציג נתונים עלינו להשתמש בתרשימי-עוגה או בשיטה אחרת? אין כאן מדובר בדבר פעוט. כשם שתמונה שווה אלף מילים, כך התרשים הסטטיסטי שווה אלפי מספרים. מי שרוצה להעביר מסר מהנתונים שברשותו לקוראיו, חובה עליו להעניק תשומת לב לבחירת התרשים שבו הוא משתמש.

pie_pic1

 

זיהוי החלק מהשלם לעומת השוואת החלקים

תרשים-העוגה היא אולי אחת משיטות הצגת הנתונים הנפוצות בעסקים ובתקשורת. ואף על פי כן, תרשים-העוגה זוכה לביקורת ואף יש הממליצים להימנע ממנה ככל האפשר. בשל כך אנו צפויים לראות תרשימי עוגה יותר בעיתונות ובעולם העסקים ופחות בפירסומים מדעיים.

הסיבה לכך היא שכאשר משווים פרוסות עוגה שונות האחת לשניה, קשה מאד לזהות באיזה סדר גודל פרוסה אחת גדולה מרעותה (ולעיתים גם איזו פרוסה היא הגדולה). ואף קשה מכך היא ההשוואה בין תרשימי-עוגות שונים.

הקושי נעוץ בזה שהשוואת הפרוסות בתרשים-העוגה מתבסס על השוואת זוויות או נפחי הפרוסות לעומת בתרשים כמו תרשים-עמודות שם אנו משווים קטעים באמצעות גובהם.

במחקר שנעשה במעבדות AT&T ממחיש את הנקודה האחרונה. במחקר ביקשו מנבדקים לסדר את הקטעים הבאים לפי גודל עולה, הנה דוגמא (שנוצרה באמצעות התוכנה הסטטיסטית R) :

pie_pic2

המחקר הראה שהמיון של הנבדקים את הפרוסות של העוגות היה לא מדוייק ואיטי, בעוד שמיון בתוך תרשימי העמודות היה זריז ומדוייק.

ישנם שלושה מקרים בהם תרשימי קופסא כן שימושיים (ואף עדיפים על תרשימי עמודות): הראשון הוא כאשר אנו רוצים להשוות פרוסה אחת לכלל העוגה. השני הוא כאשר הפרוסות שלנו מחולקות (באופן גס) למקטעים של 25% ו- 50%. והשלישי הוא שאפשר לעשות איתם בדיחות פק-מן.

pie_pic3

וויזואליזציה סטטיסטית נותנת לעיניים שלנו לגלות לנו תובנות מבלי להידרש למילים או מספרים. אך בפעם הבאה שתתקלו בתרשים-עוגה, בררו עם עצמכם האם הגרף שקיבלתם מאפשר לכם להבין מה קרה בנתונים.

קרדיט: שני התרשימים הראשונים לקוחים מהערך "תרשימי עוגה" בוויקיפדיה האנגלית. את התרשים השלישי אני לא מצליח למצוא מי היה הממציא המקורי שלו.

13 תגובות בנושא “תרשימי עוגה – מאיפה זה הגיע ומה עושים איתם”

  1. מסכימה עם נאמר לגבי מוגבלות התרשים ומשום כך גם ממעיטה להשתמש בו.
    תחביר חשוב גם בהקשר לסטטיסטיקה – "רעותה" ולא "ראותה"
    (פסקה שניה תחת הכותרת "זיהוי החלק מהשלם לעומת השוואת החלקים").

  2. סיקור מעניין

    נושא שלמרבה ההפתעה לא זכה כמעט להתיחסות הוא ההשואה הסטטיסטית בין תרשימי עוגה או תרשימי פרטו.

    נדמה לי שאני בין היחידים שכתבו על זה:

    Kenett, R.S., "Two Methods for Comparing Pareto Charts", Journal of Quality Technology, Vol. 23, pp. 27-31, 1991.

    Kenett, R.S."Making Sense Out of Two Pareto Charts", Quality Progress, pp. 71-74, May 1994.

    Kenett, R.S. and Zacks, S., 1. Modern Industrial Statistics: Design and Control of Quality and Reliability, Duxbury Press, San Francisco, 1998, Spanish edition 2002, 2nd paperback edition 2002, Chinese edition 2004.

  3. המומחה בתחום של הצגה גרפית של מידע כמותי הוא פרופ' אדוארד טאפטי. בויקיפדיה: http://en.wikipedia.org/wiki/Edward_tufte

    דף הבית שלו:http://www.edwardtufte.com/tufte/

    הספרים והמאמרים שלו יפיפיים, ועוסקים בנושאים:
    – איך להציג מידע בגרף?
    – מתי הגרף מטעה או חסר ערך?
    – איך לדחוס כמה מימדי מידע לדף דו-ממדי?
    – למה פאוארפוינט הוא כלי גרוע להצגת נתונים?
    וכו'

  4. אולי לא הבנתי את הבדיחה, אבל הכותרת של הגרף האחרון מדברת על תרשימי קופסה במקום תרשימי עוגה

  5. נדמה לי שהשימוש בתרשימי עוגה בעיתונות לעומת ההימנעות מהם במחקר לא מעיד על 'חוסר רצינות' של העיתונות דווקא, אלא על מטרה שונה.
    כשאני מפרסם מאמר בכתב עת מדעי, יש חשיבות לשאלה האם 25% מהאוכלוסיה עונה לקריטריון, או שרק 23%. זה מאפשר השוואה למקרים אחרים, לתופעות אחרות, וכו'.
    מצד שני, כשאני מפרסם את זה בעיתון – הקוראים לא רוצים לדעת את המספרים המדוייקים, הם רוצים לדעת סדרי גודל. ותרשימי עוגה הם דרך נוחה להגיד 'הרוב', או 'חלק גדול'.

  6. המטרה העיקרית של תרשים עוגה היא להציג חלקים משלם, כאשר אין חפיפה.
    עם תרשימי עמודות אפשר לעשות הרבה יותר דברים, אבל למטרה האמורה הם פחות מוצלחים (כי לפעמים נרצה להשוות חלק אחד, גדול, אל מול גודל מצטבר של הרבה חלקים קטנים. תחשבו על גרף עוגה של הרכב האויר באטמוספירה).

    המקור לפקמן העברי – אולי איפשהו אצלו:
    http://yaya.blogli.co.il/archives/19
    ?

  7. טוב מאוד. נחת כממטרי גשם על דשא מיובש.

    בדיוק התחלתי ללמד את תלמידי כיתות ה-ז' שלי על הצגת נתונים בעזרת גרפים. כאשר התחלו מגרף העוגה. עכשיו אני יכול להעשיר אותם גם ברקע ההיסטורי. ואני גם אפנה אותם לכאן.

    נ.ב. את הגרף האחרון לא הכרתי עד היום. הוא אדיר.

השאר תגובה