לפני מספר חודשים פנה אלי עורך מאחד העיתונים הכלכליים במדינה (לא נציין את שמם) וביקש ממני לכתוב מאמר על סטטיסטיקה. שאלתי אותו אם הוא רוצה מאמר על תרשימי עוגה והוא אמר "בטח, למה לא". כמעט חצי שנה מאוחר יותר, המאמר לא יצא לאור והחלטתי שהגיע הזמן לשחרר אותו כאן לאוויר העולם. תהנו 🙂
כשתרשימים נולדו – שם היו תרשימי העוגה
בשנת 1787 הגיעה חבילה לחצרו של מלך צרפת, לואיז ה- 16. השליח היה משוכנע שהמלך ימצא עניין רב בתוכן החבילה, ואכן כך היה. המתנה הייתה ספר שנכתב בידי סקוטי צעיר בשם וויליאם פלייפייר. והספר נקרא "האטלס הפוליטי כלכלי".
שלא כמו אטלסים אחרים באותה תקופה, הספר לא כלל אף מפה. במקום זאת, הוא הכיל תרשימים שלא נראו כמותם בעבר. גרפים שסיכמו נתוני מסחר (בין אנגליה למדינות שונות) ומגוון נתונים כלכליים. על אף שזו הייתה הפעם הראשונה שבה המלך נתקל בתרשימים כאלו, הרי שהוא הבין אותם מיידית וציין בשביעות רצון שהתרשימים יהיו ברורים לכל אדם, לא משנה מהי שפתו.
לקראת סוף המאה ה-18 פירסם וויליאם פלייפייר, מהנדס וייזם, את הספר אותו שלח למלך ולאחריו הוא פרסם ספר נוסף בשם "ספר-תפילות סטטיסטיות".
בספרים אלו העניק וויליאם לעולם דרכים חדשות להציג סטטיסטיקה באמצעות תרשימים. תובנות שעד כה היו קבורות בטבלאות אשר דרשו שניות ואף דקות של עיון ומחשבה, נחשפו להם פתאום בגרפים אשר הציגו את המגמות שמאחורי הנתונים באופן ברור לעין (תרתי משמע).
בספריו הציג וויליאם לעולם את תרשים-העוגה. ובעשותו כן, פתח את הדלת לאחד הקונפליקטים הנפוצים ביותר בהצגה-סטטיסטית אשר נשארה איתנו עד היום. האם בבואנו להציג נתונים עלינו להשתמש בתרשימי-עוגה או בשיטה אחרת? אין כאן מדובר בדבר פעוט. כשם שתמונה שווה אלף מילים, כך התרשים הסטטיסטי שווה אלפי מספרים. מי שרוצה להעביר מסר מהנתונים שברשותו לקוראיו, חובה עליו להעניק תשומת לב לבחירת התרשים שבו הוא משתמש.
זיהוי החלק מהשלם לעומת השוואת החלקים
תרשים-העוגה היא אולי אחת משיטות הצגת הנתונים הנפוצות בעסקים ובתקשורת. ואף על פי כן, תרשים-העוגה זוכה לביקורת ואף יש הממליצים להימנע ממנה ככל האפשר. בשל כך אנו צפויים לראות תרשימי עוגה יותר בעיתונות ובעולם העסקים ופחות בפירסומים מדעיים.
הסיבה לכך היא שכאשר משווים פרוסות עוגה שונות האחת לשניה, קשה מאד לזהות באיזה סדר גודל פרוסה אחת גדולה מרעותה (ולעיתים גם איזו פרוסה היא הגדולה). ואף קשה מכך היא ההשוואה בין תרשימי-עוגות שונים.
הקושי נעוץ בזה שהשוואת הפרוסות בתרשים-העוגה מתבסס על השוואת זוויות או נפחי הפרוסות לעומת בתרשים כמו תרשים-עמודות שם אנו משווים קטעים באמצעות גובהם.
במחקר שנעשה במעבדות AT&T ממחיש את הנקודה האחרונה. במחקר ביקשו מנבדקים לסדר את הקטעים הבאים לפי גודל עולה, הנה דוגמא (שנוצרה באמצעות התוכנה הסטטיסטית R) :
המחקר הראה שהמיון של הנבדקים את הפרוסות של העוגות היה לא מדוייק ואיטי, בעוד שמיון בתוך תרשימי העמודות היה זריז ומדוייק.
ישנם שלושה מקרים בהם תרשימי קופסא כן שימושיים (ואף עדיפים על תרשימי עמודות): הראשון הוא כאשר אנו רוצים להשוות פרוסה אחת לכלל העוגה. השני הוא כאשר הפרוסות שלנו מחולקות (באופן גס) למקטעים של 25% ו- 50%. והשלישי הוא שאפשר לעשות איתם בדיחות פק-מן.
וויזואליזציה סטטיסטית נותנת לעיניים שלנו לגלות לנו תובנות מבלי להידרש למילים או מספרים. אך בפעם הבאה שתתקלו בתרשים-עוגה, בררו עם עצמכם האם הגרף שקיבלתם מאפשר לכם להבין מה קרה בנתונים.
קרדיט: שני התרשימים הראשונים לקוחים מהערך "תרשימי עוגה" בוויקיפדיה האנגלית. את התרשים השלישי אני לא מצליח למצוא מי היה הממציא המקורי שלו.