Πρόβλεψη αποτελεσμάτων ποδοσφαιρικών αγώνων Αυτόνομοι Πράκτορες 2012-2013 Δουγιάκης Λάζαρος 2007030101
Εισαγωγή Σκοπός Ιδέα Χρήση Bayesian Network Υλοποίηση προγράμματος για πρόβλεψη των αποτελεσμάτων της τρέχουσας αγωνιστικής Ιδέα Εκτίμηση του αποτελέσματος ενός ποδοσφαιρικού αγώνα βάσει του ιστορικού των αναμετρήσεων των δυο ομάδων Εκτίμηση για Under/Over (goal>2.5) Χρήση Bayesian Network Γλώσσα προγραμματισμού : Matlab
Δεδομένα Dataset Από το dataset εξάγουμε Ιστορικό 4 μεγάλων πρωταθλημάτων (Αγγλία, Ισπανία, Ιταλία , Γαλλία). Αποτελέσματα αγώνων για τα τελευταία 19 χρόνια (1993/1994 - 2011/2012) για όλα τα παραπάνω πρωταθλήματα. Από το dataset εξάγουμε Τελική βαθμολογία κάθε χρονιάς για κάθε πρωτάθλημα Αριθμός εντός/εκτός έδρας νικών/ηττών για κάθε ομάδα Αριθμός εντός/εκτός έδρας goal για κάθε ομάδα «Δυναμικότητα» κάθε ομάδας (αναλυτικά παρακάτω)
Υλοποίηση Πρώτη «Αποτυχημένη» Προσέγγιση - Χρήση ιστορικού για αγώνα μεταξύ : (ομάδα Α) vs (ομάδα Β) Προβλήματα Η δυναμικότητα των ομάδων μπορεί να αλλάζει πολύ μέσα σε λίγα χρόνια Πολύ λίγα δεδομένα για ομάδες με λίγες συμμέτοχες στη πρώτη κατηγορία Καθόλου δεδομένα για «νεοφώτιστες» ομάδες Δεύτερη Προσέγγιση - Χρήση ιστορικού για αγώνα μεταξύ : (ομάδα «δυναμικότητας» Α) vs (ομάδα «δυναμικότητας» Β) Πλεονεκτήματα Αντικαθιστούμε το όνομα της ομάδας με ένα αριθμό που αναπαριστά τη δυναμικότητα της Δε μας ενδιαφέρει η απόδοση μιας συγκεκριμένης ομάδας κάθε season Για ομάδες με λίγο ή καθόλου ιστορικό , χρησιμοποιούνται τα αποτελέσματα ομάδων ίδιας δυναμικότητας Μπορεί να γίνει πρόβλεψη και για πρωταθλήματα που δεν υπάρχουν στο Dataset !!
Δυναμικότητα Υπολογισμός Παρατηρήσεις Για κάθε season κρατάμε τη τελική βαθμολογία Επιλέγουμε max τιμή τη βαθμολογία της πρώτης ομάδας και min της τελευταίας Διαιρούμε το σε x ίσα διαστήματα Ανάλογα με το διάστημα επιλέγετε η δυναμικότητα Παρατηρήσεις Πειραματικά καλύτερα αποτελέσματα για 13≤x≤16 Υπολογισμός στο τέλος της κάθε season
Υλοποίηση Εκτίμηση αποτελέσματος Υπολογίζουμε την πιθανότητα 𝑃 𝑟𝑒𝑠𝑢𝑙𝑡 𝐴,𝐵) result : home , draw , away A : 1 … x B : 1 … x Εκτίμηση under/over Υπολογίζουμε την πιθανότητα 𝑃 𝑈_𝑂 𝐴,𝐵) 𝑈_𝑂 : under , over
Αποτελέσματα Πρωταθλήματα εντός Dataset Πρωταθλήματα εκτός Dataset English Premier League Year : 2011-2012 - 49.21 % Year : 2010-2011 - 50.10 % Spanish Primera Division Year : 2011-2012 – 52.63% Year : 2010-2011 – 59.21% Με ξεχωριστού Dataset για κάθε πρωτάθλημα Year : 2011-2012 - 49.74% Year : 2010-2011 - 48.68% Year : 2011-2012 – 59.21% Year : 2010-2011 – 60.00% Greek Super League Year : 2011-2012 - 45.83 % Year : 2010-2011 - 50.41 % Portugal Primeira Liga Year : 2011-2012 – 52.23% Year : 2010-2011 – 59.50%
Αποτελέσματα : Under/Over Πρωταθλήματα εντός Dataset Πρωταθλήματα εκτός Dataset Με χρήση όλου Dataset English Premier League Year : 2011-2012 - 50.26 % Year : 2010-2011 - 48.42 % Spanish Primera Division Year : 2011-2012 – 55.26 % Year : 2010-2011 – 51.31 % Με ξεχωριστού Dataset για κάθε πρωτάθλημα Year : 2011-2012 - 43.15 % Year : 2011-2012 - 46.84% Year : 2010-2011 – 49.82% Greek Super League Year : 2011-2012 - 59.58 % Year : 2010-2011 - 50.83 % Portugal Primeira Liga Year : 2011-2012 – 56.25% Year : 2010-2011 – 53.75%
Συμπεράσματα Εκ των προτέρων δύσκολη προσπάθεια πρόβλεψης με χρήση μόνο του ιστορικού . Ως γνωστών το τελικό αποτέλεσμα ενός αγώνα επηρεάζεται από πολλούς επιπλέον παράγοντες , αγωνιστικούς και έξω-αγωνιστικούς. Παρόμοιες εργασίες έχουν υλοποιηθεί μόνο για συγκεκριμένα πρωταθλήματα . Δεν έχει υλοποιηθεί αντίστοιχη πρόβλεψη για πρωταθλήματα εκτός dataset Με χρήση πολύ μεγαλυτέρου όγκου πληροφορίας (π.χ. απουσίες , κούραση κτλ) – αποτελέσματα 55%-60% Τα αποτελέσματα για το τελικό αποτέλεσμα μπορούν να θεωρηθούν αρκετά ικανοποιητικά . Τα αποτελέσματα για under/over μάλλον απογοητευτικά .
Football Predictor
Ερωτήσεις