השפעת סדר האירוח במפגשי גומלין בכדורגל על זהות המנצחת

בניגוד לדעה הרווחת, לא ניתן לקבוע שסדר האירוח במפגשי גומלין בליגת האלופות מקנה יתרון למארחת המשחק השני.

בסמסטר ב' של 2014, התלמידים אורי פריילכמן, אריאל בוקאי, יותם חרובי ונעמה לסט, החליטו לבדוק במסגרת פרוייקט המחקר שלהם לקורס מבוא לסטטיסטיקה לסטטיסטיקאים אודות ההשפעה של סדר אירוח על המשחק השני במסגרת ליגת האלופות. הנתונים נאספו באופן יסודי, הניתוח הסטטיסטי נעשה היטב, תחת הסייג שהוא ברמה של קורס מבוא, עם כל ההשלכות מכך – לא מדובר במחקר מדעי שעבר ביקורת עמיתים, אז כל מסקנה שמופיע בפוסט זה יש לקחת בערבון מוגבל ולהפעיל חשיבה ספקנית (אף יותר מהרגיל!).
לצורך ההתאמה למדיום, הרשיתי לעצמי לקצץ חלקים מסויימים מהעבודה (אך לא ביצעתי/שיפרתי את המחקר עצמו. כך שאם יש שאלות – מקומן הוא בתגובות).
אם יש לכם שאלות של סקרנות, הצעות לשיפור, ומחמאות לתלמידים (ורצוי שיהיו!) אתם מוזמנים לכתוב אותם בתגובות.
וללא מילים נוספות – אני גאה להציג בפניכם את תוצאות המחקר:

תמצית המחקר

ליגת האלופות של אירופה, טורניר הכדורגל היוקרתי ביותר למועדונים, נערך מדי שנה על ידי אופ"א (UEFA), ארגון הגג של התאחדויות הכדורגל האירופאיות. חלק משלבי התחרות נערכים במתכונת המכונה מפגשי גומלין (knockout ties). לפי מתכונת זו, נפגשות שתי קבוצות לזוג משחקים. המנצחת היא זו אשר הבקיעה יותר שערים בסיכום שני המשחקים. כדי לקיים תחרות הוגנת, מארחת כל קבוצה משחק אחד.

במחקר הבא נציג שתי שאלות מחקר. שאלת המחקר הראשונה תתייחס למדגם כולו ותבדוק האם יש לסדר האירוח השפעה על זהות המנצחת במפגשי גומלין. שאלת המחקר השנייה תעסוק רק באותם מפגשים בהם הסתיים המשחק הראשון מבין השניים בתיקו אפס. כאן נרצה לדעת האם סיכוייה של המארחת השנייה לנצח גבוהים מאלה של המארחת ראשונה.

לצורך המחקר אספנו נתונים אודות כל 394 מפגשי הגומלין שהתקיימו בין השנים 1970 – 2012, בהם נקבע סדר האירוח על ידי הגרלה. גילינו כי 53% מהמפגשים הסתיימו בניצחונה של המארחת השנייה, אך לא היה בממצא זה כדי לקבוע כי אירוח המשחק השני מקנה יתרון. לעומת זאת, מצאנו כי 69% מהמפגשים בהם הייתה תוצאת המשחק הראשון תיקו אפס, הסתיימו בניצחונה של המארחת השנייה.

לסיכום, לא ניתן לקבוע באופן כללי, שסדר האירוח משפיע על זהות המנצחת במפגשי גומלין, עם זאת, ניתן לקבוע כי אם המשחק הראשון מסתיים בתיקו אפס, סיכויי המארחת השנייה לנצח גבוהים מאלה של המארחת הראשונה.

מבוא

טורניר ליגת האלופות, בשמות שונים ותחת תקנונים שונים, מתקיים ברציפות משנת 1955, ומרכז עניין עצום בקרב אוהדי כדורגל באירופה ומחוצה לה[1]. במרבית השנים, נערכו השלבים המתקדמים ביותר: שמינית הגמר, רבע הגמר וחצי הגמר, בשיטת מפגשי גומלין. אי לכך, הפכו מפגשי הגומלין לשלבים המרתקים ביותר בתחרות, אשר במסגרתם נפגשות הקבוצות הטובות ביותר באירופה.

המנצחת במפגש גומלין היא הקבוצה אשר הבקיעה מספר רב יותר של שערים בסיכום שני המשחקים. לעיתים, לאחר תום הזמן החוקי של המשחק השני (90 דקות), מחזיקות שתי הקבוצות במאזן שערים זהה. במקרה זה, על פי חוק שערי החוץ[2], תוכרז כמנצחת הקבוצה לה מספר שערי החוץ הרב יותר. אם מתקיים שוויון גם בשערי החוץ, מאריך השופט את המשחק ב-30 דקות נוספות (extra time – הארכה). אם בתום ההארכה, השוויון עומד בעינו, מוכרע המפגש בדו קרב בעיטות 11 מטר (penalties – פנדלים)[3]. הטבלה הבאה מדגימה כיצד נקבעת המנצחת במפגש גומלין:

משחק ראשון(מגרש א') משחק שני(מגרש ב') סיכום שני המשחקים הקבוצה המנצחת סוג הניצחון
קבוצה א' קבוצה ב' קבוצה א' קבוצה ב' קבוצה א' קבוצה ב'
0 0 1 1 1 1 א' שערי חוץ
1 0 1 2 2 2 א' שערי חוץ
1 0 1 3 2 3 ב' הפרש שערים חיובי
2 1 1 2 3 3 תיקו הארכה או פנדלים

טבלה 1: דוגמאות שונות לתוצאות מפגשי גומלין. נניח שמגרשה הביתי של קבוצה א' נקרא מגרש א', ובדומה מגרשה הביתי של קבוצה ב' נקרא מגרש ב'. כל שורה בטבלה מציינת מפגש גומלין אפשרי; הערכים המספריים בטבלה מציינים את מספר השערים שהבקיעה קבוצה. שני המפגשים הראשונים הם דוגמאות למצבים בהם מופעל חוק שערי חוץ, ושני האחרונים מהווים דוגמה למצבים בהם לא מופעל חוק שערי חוץ.

יתרון הביתיות בתחרויות ספורט נחקר רבות, וקיים קונצנזוס כי אכן קיים אפקט כזה[4]. במפגשי גומלין, לעומת זאת, מתקיימת סימטריה, שכן כל אחת מקבוצות מארחת משחק אחד, אך עולה השאלה האם סדר האירוח מקנה יתרון למי מהקבוצות. אוהדים, מאמנים, שחקנים ועיתונאים רבים סבורים שאירוח המשחק השני מעניק יתרון. סברה זו קנתה לה אחיזה גם אצל ראשי אופ"א, אשר החליטו בשנת 2003 להעניק את אירוח המשחק השני בשמינית הגמר כ"פרס" לקבוצות בעלות ההישגים הגבוהים ביותר בשלב הבתים, הקודם לשלב שמינית הגמר. אנו החלטנו לבחון את האמונה הרווחת הזו בשאלת המחקר הראשונה שלנו.

שאלת המחקר השנייה עוסקת במפגשים, בהם הסתיים המשחק הראשון בתיקו 0. דומה כי מפגשים אלו מהווים מבחן מעניין: מחד, המארחת הראשונה לא השכילה להבקיע שערים במגרשה הביתי, וסביר כי במפגש הגומלין, במגרש זר, תהייה הבקעת שערים אף קשה יותר עבורה. מכאן, שהיא מוצאת עצמה כעת בעמדת נחיתות. מאידך, אם בכל זאת תצליח המארחת הראשונה להבקיע במפגש הגומלין, הרי שיהיה זה שער חוץ. במילים אחרות, כל שער שתבקיע במפגש הגומלין יהיה בעל ערך רב מזה שתבקיע יריבתה הביתית. אנו ביקשנו לבדוק מי מהקבוצות היא זו אשר סביר יותר שתנצח בנסיבות אלו.

נתונים ודרכי ניתוח

הנתונים אודות משחקי ליגת האלופות נאספו מאתר האינטרנט הרשמי של אופ"א[5]. תכנית שכתבנו בשפת R, פונה לעמודי אינטרנט שונים באתר, מחלצת מכל עמוד נתונים עבור משחק בודד או מספר משחקים ומרכיבה קובץ csv. משהיה בידינו אוסף רשומות, מסודרות בסדר כרונולוגי, אשר מתארות משחקים בודדים, נדרשנו לכתוב תכנית נוספת, שמתאימה זוגות משחקים, המרכיבים מפגש גומלין. לאחר שהתאימה זוגות, בודקת התכנית מי היא הקבוצה המנצחת, האם המנצחת היא זו שאירחה את המשחק השני ומסווגת את הניצחונות (למשל: ניצחון בפנדלים). בסופו של התהליך, היה בידינו תיעוד של 394 מפגשי גומלין, שהם 788 משחקים, בהשתתפות 152 קבוצות, מטורנירים שנערכו במהלך 42 השנים האחרונות.

תהליך טיוב הנתונים כלל את הפעולות הבאות:

  1. בחלק מהרשומות המקוריות, באתר אופ"א, הייתה התייחסות לאותה קבוצה תחת שני שמות שונים. הדבר הקשה על חלוקה של המשחקים לזוגות על ידי התכנית, והיינו צריכים לוודא שאכן מדובר באותה קבוצה ולקבוע שמות עקביים.
  2. משחקים שבוטלו הופיעו באתר ללא ציון התוצאה, והיינו צריכים לוודא שאכן לא התקיימו. למשל, קבוצה מקפריסין סירבה לשחק נגד קבוצה מטורקיה מסיבות פוליטיות, והעדיפה לספוג הפסד טכני. מפגשים כאלו הושמטו מהמדגם.
  3. מקרים בהם משחקים לא התקיימו במועדם המקורי, התבטאו ברשומות כפולות, והיה צורך לבדוק באיזה תאריך המשחק התקיים ולמחוק את הרשומה המיותרת.

על אף שהתחרות הראשונה התקיימה כבר בשנת 1955, ושהמידע אודות כל שנות התחרות זמין, בחרנו לנתח תוצאות רק החל משנת 1970; זאת משום שרק משנה זו הוחל באופן מלא חוק שערי החוץ[6], אשר לו השפעה ניכרת על זהות העולה, ועל הטקטיקה בה בוחרות הקבוצות. בנוסף, דאגנו להתייחס רק למפגשים בהם סדר האירוח נקבע באקראי. לדוגמא, החל משנת 2003 לא כללנו בנתונים מפגשי שמינית גמר, משום שסדר האירוח בשלב זה של התחרות נקבע לפי הישגים בשלבי התחרות הקודמים, כך שקבוצות שהצליחו יותר אירחו את המשחק השני.

אי התלות בין התצפיות אינה מוחלטת. ראשית, יתכן יותר ממפגש יחיד בין אותן קבוצות על פני פרק זמן קצר יחסית. למשל, שני מפגשים בשנתיים עוקבות. אם בפרק זמן זה, לא השתנו משמעותית סגלי הקבוצות, המאמן או פרמטרים אובייקטיביים אחרים, ניתן לומר שלא מתקיימת אי תלות. שנית, העובדה שבחרנו לכלול בנתונים מפגשים משלבים עוקבים באותה שנה עשויה לפגום באי התלות בין התצפיות, משום שאם הקבוצות נחלקות לכאלה שמושפעות מסדר האירוח ולכאלה שאינן מושפעות ממנו, הרי ששכיחותן של האחרונות עשויה לגדול ככל שהשלבים מתקדמים[7].

במבחני ההשערות, ובחישוב רווחי הסמך, השתמשנו במבחן בינומי מדויק ((Exact binomial test המבוצע על ידי הפונקציה binom.test בשפת R.

תוצאות

במדגם הכולל 394 מפגשי גומלין, מצאנו כי 209 מנצחות אירחו את המשחק השני. האומדן הנקודתי לפרופורציית המארחות את המשחק השני מבין המנצחות הוא לפיכך, 53.05%. במבחן השערות בינומי דו צדדי, עם השערת אפס לפיה הפרופורציה האמורה היא 50%, מובהקות התוצאה התקבלה להיות 24.65%. על כן, איננו דוחים את השערת האפס ברמת מובהקות של 5%. כלומר, לא ניתן לקבוע שאירוח המשחק השני במפגש גומלין מעניק יתרון. רווח הסמך לפרופורציה זו, ברמת סמך 95%, נמצא להיות: [58.06% , 47.98%].

כאשר מפלחים את המפגשים לפי סוג הניצחון, ניתן לראות כי במפגשים בהם התקיימה סימטריה מלאה בין שני המשחקים[8], אפקט סדר האירוח קטן מזה שהתקבל במדגם הכללי, כ-51.7%. התרשים הבא מתאר את תלות פרופורציית המארחות את המשחק השני בקרב המנצחות בסוג הניצחון:

aaaaaaaaaaaaaaaaaaaaaUntitled

תרשים 1: פרופורציית המארחות את המשחק השני בקרב המנצחות, לפי סוג הניצחון. צבע המלבן מייצג את הקבוצה המנצחת: כחול כהה במקרים שבהם המארחת הראשונה ניצחה, וכחול בהיר במקרים בהם המארחת השנייה ניצחה; המספרים על גבי המלבנים מייצגים את מספר המפגשים. לדוגמא: 23 מפגשים, מתוך 39 אשר הוכרעו לפי חוק שערי חוץ, הסתיימו בניצחון המארחת השנייה.

תת הקבוצה של כל מפגשי הגומלין בהם הסתיים המשחק הראשון בתיקו 0, מונה 49 מפגשים. בקרב המנצחות במפגשים אלה, נמצאו 34 אשר אירחו את המשחק השני. האומדן הנקודתי לפרופורציית המארחות את המשחק השני בקרב המנצחות הוא על כן, 69.39%. במבחן השערות בינומי דו צדדי, עם השערת אפס לפיה הפרופורציה האמורה היא 50%, התקבלה מובהקות תוצאה של 0.94%. על כן אנו דוחים את השערת האפס ברמת מובהקות של 5%  וקובעים כי סיכוייה של המארחת השנייה לנצח גבוהים מאלה של המארחת את הראשונה, בהינתן שהמשחק הראשון הסתיים בתיקו 0. רווח הסמך לפרופורציה זו, ברמת סמך 95%, נמצא להיות [54.58% , 81.74%].

מסקנות ודיון

האמונה הרווחת לפיה מפגשי גומלין בליגת האלופות מוטים לטובת הקבוצה אשר אירחה את המשחק השני נבדקה במסגרת עבודה זו, ולא נמצא לה ביסוס. במדגם שכלל 394 מפגשי גומלין בהם נקבע סדר האירוח באקראי, אשר נערכו בין השנים 1970 ל- 2012, נמצא ש-53% מהמנצחות אירחו את המשחק השני, אך תוצאה זו עדיין סבירה מספיק תחת ההנחה שאין לסדר האירוח השפעה על זהות המנצחת.

יתרה מכך, ניכר מתרשים 1, שרוב המפגשים במדגם (כ-82%) הוכרעו בהפרש שערים חיובי. נראה שבסוג כזה של מפגשים אפקט סדר האירוח, אם קיים, משני לאפקטים אובייקטיביים. יש לצפות שהאפקט יעשה דומיננטי יותר במפגשים בהם התקיימה הארכה, משום שהארכה[9] תמיד משוחקת במגרשה של המארחת שנייה, אך ההסתברות מלכתחילה שבמפגש גומלין תתקיים הארכה נאמדת במחקר זה בכ-7.36%.

באשר לשאלת המחקר השנייה, ניתן בהחלט לקבוע כי במפגשים בהם הסתיים המפגש הראשון בתיקו 0, הקבוצה המארחת את המשחק השני היא זו שסיכוייה לנצח במפגש הגומלין גבוהים יותר. עם זאת, אין לקבוע שהדבר נובע מסדר האירוח. ההסתייגות מקביעת סיבתיות במקרה זה נובעת מכך, שעקרון ההקצאה האקראית לא מתקיים עבור תצפיות אלה. לכן, אי אפשר לשלול את קיומו של גורם מתערב בדמות פער איכות בין הקבוצות, ויתכן כי קבוצות המשיגות תוצאת תיקו 0 במגרש חוץ, עדיפות אובייקטיבית על הקבוצות שהשיגו תוצאה זו במגרשן הביתי.

יש לסייג את תוצאות המחקר מכמה סיבות: ראשית, משום שאי התלות בין התצפיות איננה מוחלטת. מדגם שהיה כולל רק שלב מפגשי גומלין יחיד מכל שנה, היה פותר חלקית את בעיית אי התלות, אך היה זה מדגם קטן יותר. לדעתנו, ההנחה שמתקיימת אי תלות היא סבירה והצדקה לכך תופיע בחלק "הנחות למבחנים סטטיסטיים" בנספח. הסתייגות נוספת נובעת מכך שיתכן שהשפעת סדר האירוח השתנתה לאורך השנים מהן נאספו נתונים, כתוצאה מהתמקצעות הענף והפיכתו לבינלאומי[10]. עוד על כך בחלק "שאלות פתוחות" בנספח.

 

[1] גמר ליגת האלופות היה בשנת 2009 אירוע הספורט השנתי הנצפה ביותר בעולם: http://news.bbc.co.uk/sport2/hi/football/europe/8490351.stm

[2] שער חוץ: שער שהובקע במגרשה של היריבה.

[3] הארכה ופנדלים עשויים להיות רק בתום המשחק השני. במקרה כזה נשברת סימטרית האירוח.

[4] ראה למשל http://wjh.harvard.edu/~jamieson/JJ_JASP.pdf

[5]http://www.uefa.com/uefachampionsleague/history/index.html

[6] עוד על חוק שערי החוץ והטמעתו בתקנון: http://en.wikipedia.org/wiki/Away_goals_rule

[7] עוד על כך בחלק "הנחות עבור המבחנים הסטטיסטיים"

[8] כלומר, מפגשים בהם הסתיים המשחק השני בתום 90 דקות. מפגשים אלה עשויים להיות מוכרעים רק ע"י שערי חוץ או ע"י הפרש שערים חיובי

[9] וממילא גם פנדלים, משום שאלה עשויים להתרחש רק בתום ההארכה

[10] בהתמקצעות הענף הכוונה להכרה בצדדים המנטליים של המשחק. בהפיכתו של הענף לבינלאומי הכוונה לכך שמעמד השחקן הזר נהייה נפוץ יותר, כתוצאה משינוי חוקי העבודה באיחוד האירופי, ושחקנים רבים יותר הפכו מורגלים במשחקי חוץ.

תגובה אחת בנושא “השפעת סדר האירוח במפגשי גומלין בכדורגל על זהות המנצחת”

  1. אחלה עבודה! אהבתי בעיקר את איסוף וטיוב הנתונים והיקפם. הניתוח די פשוט (וטוב שכך. לא מדובר בבעיה סבוכה)

    שני דברים חסרים לי:
    1. התייחסות או נסיון לשלוט ב(או לנטרל את) האפקט של פערי הרמות בין הקבוצות. אמנם סדר המשחקים נקבע אקראית ולכן לא צפויה הטייה. אך המדגם קטן יחסית, וכפו שציינתם ישנה תלות מסויימת שקשה לכמתה בין המשחקים – שני אלה עשויים לגרום לכך שבפועל תהיה הטיה קטנה שניתן לנטרל בקלות יחסית על ידי פילוג הקבוצה. את פערי הרמות אפשר להעריך, למשל על ידי יחס הימורים למשחק, ואז להתייחס רק למשחקים בהם יחס ההימורים הוא שוויוני יחסית, וכמו כן לבדוק בכמה מקרים ביתיות השפיעה ההיפך מפערי רמות.

    2. ההתייחסות לתת הקבוצה בה המשחק הראשון הסתיים בתיקו אפס נראית לי מאולצת. גם נקודת הייחוס נראית לי לא מתאימה – מדוע לא להשוות את האפקט של תיקו אפס ראשון ביחס לתוצאות תיקו בכל במשחק הראשון? עלול להתקבל הרושם כאילו נבדקו מספר רב של חיתוכים ופילוגים אפשריים, ונבחרו לדיווח רק אותם פילוגים שנמצאו "משמעותיים סטטיסטית". במידה שזה אכן נעשה, זו פרקטיקה גרועה למדי שמעמידה בספק את המסקנה.

השאר תגובה