מטוס עם מאה מקומות ישיבה מסומנים – חידה קטנה בהסתברות

חבר שלח לי חידה נחמדה שחשבתי לחלוק איתכם:

יהי מטוס עם מאה מקומות ישיבה מסומנים.
הנוסע הראשון נכנס למטוס, מגלה שאיבד את כרטיס הטיסה שלו ולכן מתיישב באופן אקראי באחד ממאה המושבים.
כל נוסע שמגיע אחריו (שני ועד לאחרון) פועל באופן הבא: אם מקומו נתפס כבר, הוא בוחר באקראי מקום פנוי מאלו שנותרו, ואם מקומו פנוי הוא מתיישב בו.
השאלה היא מה הסיכוי שהנוסע האחרון (המאה) ישב במקומו?

התשובה לחידה היא:
להמשיך לקרוא מטוס עם מאה מקומות ישיבה מסומנים – חידה קטנה בהסתברות

טילים על ישראל | פלסטינים שנהרגו בידי צה"ל — בין השנים 2002 ל- 2012 – גרפים, נתונים, ומחשבות

הערת הקדמה לקוראים וותיקים וחדשים: הפוסט הזה הוא מאד בסיסי מבחינת הסטטיסטיקה שבו (לטוב ולרע). עיסוקו הוא יותר במציאת נתונים והסתכלות בסיסית עליהם מאשר ניתוחים מורכבים.

חסרי סבלנות לקרוא את הפוסט? פשוט תסתכלו על הגרף שכאן (מספר הטילים על ישראל מול פלסטינים שנהרגו בידי צה"ל – לאורך זמן):

רוצים להבין למה יצרתי את הגרף הזה, באיזה נתונים השתמשתי (מופיעים בסוף הפוסט), ומה אני חושב עליו? תמשיכו לקרוא הלאה…

עידכון (18.11.2012): יצרתי להנתאכם גירסה דינמית של גרף הנתונים, כנסו לפוסט בשביל לצפות בו:

להמשיך לקרוא טילים על ישראל | פלסטינים שנהרגו בידי צה"ל — בין השנים 2002 ל- 2012 – גרפים, נתונים, ומחשבות

תרשים של מחירי דירות בשנתיים האחרונות – אני לא רואה בשורות גדולות – ואתם?

מדור הכלכלה של ווינט פירסם לפני כמה שעות את הנתונים שפרסם היום משרד הבינוי והשיכון.

המממ, כשאני אומר "פירסם", כוונתי היא שהעיתון נתן צילום מסך של טבלת נתונים, ביחד עם תיאור של היחס בין מחירי הדירות בתאריכים שונים (דהיינו, הירידה באחוזים).
אז מה הפריע לי? שלהסתכל על (צילום מסך) של טבלת נתונים גדולה לא ממש עוזר לי להבין מה קורה בשוק הדיור (ותיאור האחוזים של הכתבה גם כן לא עוזר).

הכנת הנתונים

רציתי ליצור תרשים של הנתונים. בשלב הראשון, הורדתי את התמונה של טבלת הנתונים מהאתר של ווינט (קישור) . בשלב השני נגשתי לגוגל וחיפשתי "OCR jpg to doc", כדי למצוא אתר שיאפשר לי להמיר את התמונה למספרים (כדי שאני לא אצטרך להתאמץ יותר מידי בהקלדה). הנה קישור לאתר שהצליח לא רע להמיר את התמונה למסמך וורד (קישור). את הטבלה שבקובץ וורד העברתי לאקסל, ותיקנתי כל מיני שגיאות (פסיקים, נקודות, ואפסים חסרים).
אתם מוזמנים להוריד את הקובץ שהתקבל ולחשוב על דברים יצירתיים אחרים לעשות איתו (קישור לקובץ הנתונים).

התרשים של מחירי הדירות בשנתיים האחרונות

מה שמצער אותי זה שאני לא מבין את המשמעות המדוייקת של המחיר. אני לא יודע אם זה מחיר ממוצע לדירה בגודל מסויים. באיזה איזורים בארץ, וכן הלאה. המשמעות המדוייקת של הנתון לוטה בערפל, לא מתואר בכתבה של ווינט, ודורש חפירה באתר של משרד השיכוי והבינוי (וזה בהנחה שהם רשמו את ההסבר שם איפשהו).
אבל בואו נניח שהנתון הזה בכל זאת מייצג משהו על מה שקורה בארץ. הנה התרשים:

הקו הכחול הוא של מחירי דירות יד שניה, בעוד שהקו האדום הוא של מחירי דירות חדשות. הקו השחור שהוספתי על גבי הנתונים הוא החלקה על פני 4 תקופות (אפשר לחשוב על זה כעל קו המגמה "הממוצע" של מחירי הדירות).

מחשבות על הנתונים (ומחאת האוהלים)

כמה תופעות מעניינות צצות כשמסתכלים על הגרף:

  1. מחירי הדירות הם נתון "רועש" בין חודש לחודש (שזה די מרשים לראות כשחושבים על זה שמדובר בממוצע של מחירים). אחת המסקנות שמתקבלות מזה היא שלהשוות חודש ספציפי עם חודש ספציפי בשנה שלפני כן, זה לא בהכרח ההשוואה הכי טובה. מדוע? כי ייתכן שבמקרה (או בכוונה שאיננה "נקיית כפיים") נבחר להשוות שני חודשים עבורם היה הפרש גדול. וייתכן וההפרש הזה הוא מיקרי, ויהיה מתון יותר בחודש שלאחר מכן. זה אומר שלשם השוואות בין תקופות, ייתכן ועדיף להסתכל על נתונים שעברו "החלקה" (דהיינו, "מיצוע", מה שמופיע בתרשיימים למעלה בתור הקו השחור).
    זה גם אומר שיכול להיות חודש שבו פתאום יכריזו ש"מחירי הדירות מתרסקים" (בעיקר כאשר מדובר במחירי הדירות החדשות), אבל שחודש לאחר מכן המחירים שלהם יתאזנו חזרה למחירים הקודמים.
  2. נראה שיש יותר תנודתיות במחירי הדירות החדשות לעומת מחירי הדירות יד-שניה (זה רק מהסתכלות בעין, לא בהכרח מדובר בהבדל מובהק סטטיסטית). הסבר אחד על כך נתן אוהד דנוס, יו"ר לשכת שמאי המקרקעין, אשר אמר בעקבות פרסום הנתונים כי "הודעת משרד השיכון תואמת אחת לאחת את תחזיות לשכת השמאים בדבר ירידת מחירים זמנית, בשיעורים מינוריים, כשהקבלנים מוכנים להתפשר מעט יותר משוק דירות היד השנייה, וזאת רק הממונפים שבהם".
  3. מאז תחילת מחאת האוהלים (דהיינו, יולי 2011), נראה שהייתה "ירידה" במחירי הדירות החדשות והיד-שניה (בהשוואה לשיא). אם כי הירידה היא על פני המגמה, יותר משמעותית בדירות החדשות – ובכל מקרה די זעומה ביחס לשונות הכללית של הנתונים. האם הנתונים האלה מלמדים אותנו שמחאת האוהלים השפיע על שוק הדיור והורידה את מחיריו? זו שאלה מצויינת, אינני יודע את התשובה. ייתכן ומחאת האוהלים הגיע באותו הזמן שהתחילה להתהפך מגמת העלייה של מחירי הדיור.

בשורה התחתונה, אני לא רואה בשורה גדולה בנתונים האלה, רק קצת תובנות שלא ברור לי מה אפשר לעשות איתן.

אם יש לכם מחשבות על מה לעשות עם הנתונים, או איך לפרש אותם – אשמח לקרוא עליהם בתגובות, אני אוהב ללמוד דברים חדשים…

מחירי החשמל עולים, אבל לא ככה – ביקורת על גרפיקה מהעיתון

דף הפייסבוק של ידיעות אחרונותפירסם הודעה עם הגרף שמתחת, ומעליו הטקסט הבא:

התעצבנתם מחשבון החשמל המנופח? כשתקבלו את החשבון הבא תתעצבנו עוד יותר. כתבנו עמיר בן-דוד מדווח כי תעריפי החשמל יעלו בשבוע הבא בעוד 8.9%, ובכך ישלימו זינוק של 24% בתוך שנה. תראו כמה שילמתם אז – וכמה אתם עומדים לשלם עכשיו

אין ספק שכעס זה דבר שמושך תשומת לב של קוראים, ועלייה במחירי החשמל בפירוש עונה על הקריטריון הזה. אבל רגע, האם אתם שמים לב לאיזושהי בעיה בגרף שלמעלה? להמשיך לקרוא מחירי החשמל עולים, אבל לא ככה – ביקורת על גרפיקה מהעיתון

הזמנה לערב הרצאות (כולל אחת שלי) לכבוד יום הסטטיסטיקה הבינלאומי

ב-14.11.2011 יתקיים ערב בן 5 הרצאות קצרות שיסקרו את נושא הסטטיסטיקה מכיוונים שונים לכבוד יום הסטטיסטיקה הבינלאומי (שכבר התקיים ב-20.10.2011).

התכנסות בשעה 20:00, ההרצאות יחלו ב-20:30. האירוע יערך בפאב גורדו (נראה שהכתובת היא הירקון 121, חוף גורדון, טיילת תל אביב)

ניתן להרשם ולהפיץ לחבריכם או שונאיכם באמצעות האירוע בפייסבוק.

10 ש"ח דמי השתתפות לכיסוי הוצאות לוגיסטיות.

אני אתן בערב את ההרצאה "כיצד חוקרים עכברים שחוקרים את סביבתם", הנה התקציר:

יום אחד עכבר קם בבוקר, מחליט שהוא סקרן, ומתחיל ללכת. לאן הוא הולך? מתי הוא חוזר? כמה הוא מטייל? האם הוא מתרגש? ולמה זה בכלל מעניין אותנו (כחוקרים) לדעת?
טל גלילי, הוא דוקטורנט לסטטיסטיקה באוניברסיטת תל אביב, אוהב קוד פתוח ומידע חופשי, ובלוגר במדריך לטרמפיסט בסטטיסטיקה.

כנסו לאתר הספקנים בפאב, בשביל פירוט של שאר ההרצאות שיתקיימו בערב. שאר ההרצאות יתקיימו על ידי אנשים מעניינים ומקצועיים בתחום הסטטיסטיקה, יהיה מעניין…

להתראות שם,
טל.