Μοντέλο Στοιχηματικών Προβλέψεων
Με το παρόν άρθρο μου έρχομαι να
γνωστοποιήσω κάποια ευρήματα στατιστικής ανάλυσης και τη δημιουργία ενός
«βασικού» μοντέλου στοιχηματικών προβλέψεων.
Ας πάρουμε τα πράγματα από την αρχή όμως. Έχω αναφερθεί στο παρελθόν στο «Απόλυτο Στοιχηματικό Σύστημα»,
και το άρθρο που θα διαβάσετε αφορά στο 1 από τα 2 βασικά υποσυστήματα,
αυτό της μεθόδου της πρόβλεψης ή αλλιώς της επιλογής σημείων. Επίσης
στο παρελθόν έχω αναφέρει ότι μου αρέσει η Στατιστική σαν εργαλείο και
θεωρώ ότι μπορεί να συνεισφέρει και όσον αφορά το Στοίχημα. Προσωπικά
δεν μπορώ να εμβαθύνω αρκετά, παρόλα αυτά προσπαθώ χρησιμοποιώντας τα
βασικά να αποκομίσω ότι είναι δυνατόν.
Με απασχολεί συνεχώς η ιδέα δημιουργίας
ενός μοντέλου στοιχηματικών προβλέψεων οπότε συχνά πυκνά αναρωτιέμαι για
τα συστατικά του. Λέγοντας συστατικά του εννοώ φυσικά τι θα πρέπει να
λαμβάνει υπόψιν του το οποιοδήποτε μοντέλο. Αν κάνετε την ερώτηση στον
εαυτό σας σίγουρα θα σας έρθουν στο μυαλό διάφορες ιδέες. Για παράδειγμα
μπορεί να σκεφτείτε ότι όσο περισσότερη κατοχή έχει μία ομάδα τόσο πιο
πολλές πιθανότητες έχει να κερδίσει. Επίσης κάποιος μπορεί να σκεφτεί
ότι όσο περισσότερα φάουλ στο αντίπαλο τρίτο κερδίζει μία ομάδα αυξάνει
τις πιθανότητες νίκης. Επόμενη ιδέα είναι τα κόρνερ, οι σέντρες από τα
πλάγια, τα κλεψίματα, τα σουτ προς την εστία και πολλά άλλα.
Καταλαβαίνουμε όμως ότι η συλλογή και η
επεξεργασία των στατιστικών αυτών είναι σίγουρα χρονοβόρα για τον μέσο
παίχτη του στοιχήματος. Επίσης όσο πιο πολλά τα συστατικά τόσο πιο
πολύπλοκο το μοντέλο και προσωπικά δεν έχω τις απαιτούμενες γνώσεις για
να πετύχω κάτι τέτοιο.
Άρα αποφάσισα να επικεντρώσω την
προσπάθεια μου σε κάτι όσον το δυνατόν πιο εύχρηστο απλό και
κατανοητό. Για να καταλήξω εκεί πρώτα κατέληξα στο εξής: Ρώτησα τον
εαυτό μου:
«Τι είναι αυτό που ζητάς από το μοντέλο σου;»
Να σου υποδεικνύει την ομάδα που θα
παίζει «την καλύτερη μπάλα» ή την ομάδα με τις περισσότερες πιθανότητες
επικράτησης; Ασφαλώς και από στοιχηματικής άποψης θέλουμε το μοντέλο να
επιλέγει νικητές έστω και αν έχουν μόλις 30% κατοχή, μηδέν κόρνερ και 1
σουτ προς την εστία.
Ποια ομάδα κερδίζει λοιπόν στο
ποδόσφαιρο; Μα φυσικά και απλά εκείνη που θα πετύχει τα περισσότερα
τέρματα. Άρα θα πρέπει να επικεντρωθούμε στα τέρματα και συγκεκριμένα
στη διαφορά τερμάτων για ένα ματς. Δηλαδή διαφορά τερμάτων γηπεδούχου
μείον διαφορά τερμάτων φιλοξενούμενου στα συνολικά τους τέρματα.
Αν η ομάδα Α πριν το ματς με την ομάδα Β
έχει τέρματα υπέρ 12 και κατά 9 έχει διαφορά τερμάτων 3. Αν η Β έχει
υπέρ 15 και κατά 16 έχει διαφορά τερμάτων -1. Η διαφορά λοιπόν τερμάτων
για την αναμέτρηση είναι 3- (-1)=3+1=4.
Θα πρέπει λοιπόν να ερευνήσουμε αν
υπάρχει κάποια σχέση μεταξύ της τιμής της διαφοράς των τερμάτων και της
πιθανότητας επαλήθευσης του σημείου του άσσου ή του διπλού. Η διαφορά
τερμάτων είναι πιστεύω ένα εύκολο στην εύρεση του στατιστικό. Από την
άλλη εύκολα έχουμε και ποσοστά σημείων εκ των αποδόσεων. Οπότε ας ερευνήσουμε πιθανή σχέση διαφοράς τερμάτων και ποσοστού άσσου/διπλού βάσει αποδόσεων bookmaker.
Στο πρακτικό κομμάτι λοιπόν σαν δείγμα
έλαβα αποδόσεις ΟΠΑΠ από τη σαιζόν 2001-2002 εώς 2010-2011 για την
Premier League και χρησιμοποίησα τη σαιζόν 2011-2012 για τεστ. Από κάθε
σαιζόν έλαβα υπόψη τα παιχνίδια του Β’ Γύρου ώστε να έχουμε μία εικόνα
των ομάδων αφού έχουν αντιμετωπίσει όλες τις υπόλοιπες ομάδες έστω μόνο
εντός ή μόνο εκτός.
Το σκεπτικό λοιπόν είναι το εξής:
- Σχέση τιμής διαφοράς τερμάτων και ποσοστού Άσσου και Διπλού βάσει αποδόσεων ΟΠΑΠ
- Σχέση ποσοστού των πάνω σημείων και του μέσου όρου τερμάτων γηπεδούχου και φιλοξενούμενου
- Χρήση μέσου όρου τερμάτων σε Poisson για την παραγωγή ποσοστών πιθανοτήτων σημείων
- Αξιολόγηση των ποσοστών μέσω Poisson με τα πραγματικά αποτελέσματα.
Για την εξεύρεση πιθανής συσχέτισης
δεδομένων θα χρησιμοποιήσουμε διαγράμματα διασποράς στο excel ώστε να
υπολογίσουμε τις συναρτήσεις που συνδέουν τα χ και ψ και να υπολογίσουμε
την τιμή R2 η οποία όσο πλησιέστερα στη μονάδα είναι τόσο καλύτερη διασπορά δεδομένων γύρω από τη γραμμή συνάρτησης έχουμε.
Ας δούμε λοιπόν αρχικά τα διαγράμματα διασποράς διαφοράς τερμάτων και ποσοστών βάσει αποδόσεων ΟΠΑΠ.
Στο παραπάνω γράφημα διασποράς έχουμε τη
συνάρτηση ευθείας που συνδέει τα Χ (διαφορά τερμάτων) και Ψ (ποσοστό %
Άσσου βάσει αποδόσεων). Η τιμή R2 μας κάνει λόγο για μία
αρκετά καλή σχέση των δεδομένων. Παρατηρούμε ότι όσο μεγαλώνει η διαφορά
τερμάτων μεταξύ γηπεδούχου και φιλοξενούμενου τόσο αυξάνεται και η
πιθανότητα άσσου (τουλάχιστον από πλευράς ΟΠΑΠ).
Αυτό ίσως και να σημαίνει ότι οι εταιρείες στοιχήματος λαμβάνουν υπόψιν τους τη διαφορά τερμάτων για την τιμολόγηση των σημείων.
Με γνωστό λοιπόν το Χ μπορούμε να έχουμε
μία εκτίμηση του ποσοστού του Άσσου (Ψ) βάζοντας την τιμή του Χ(διαφορά
τερμάτων) στην εξίσωση Ψ=0,005Χ+0,445. Για παράδειγμα αν για κάποιο
ματς η διαφορά τερμάτων (Χ) είναι 10 τότε το ποσοστό άσσου (Ψ) είναι:
0,005*10+0,445=0,05+0,445=0,50 το οποίο το μετατρέπουμε σε ποσοστό % δηλαδή 50%.
Αν η διαφορά τερμάτων ήταν -10 τότε το ποσοστό άσσου θα ήταν 40%. Ας δούμε τώρα και το διάγραμμα εκτίμησης ποσοστού % για το διπλό βάσει διαφοράς τερμάτων.
Στο διάγραμμα πάνω λοιπόν βλέπουμε την
συνάρτηση εξίσωσης που «περιγράφει» όσο γίνεται καλύτερα τη σχέση μεταξύ
διαφοράς τερμάτων και ποσοστού % του διπλού. Εδώ η τιμή R2 είναι
χαμηλότερη από το πρώτο διάγραμμα αλλά το θετικό είναι ότι είναι πάνω
από 0,7 ώστε να θεωρείται κάπως αξιόλογη. Και εδώ μπορούμε να
εφαρμόσουμε το παράδειγμα της διαφοράς τερμάτων με τιμή 10(Χ) και να
υπολογίσουμε το % διπλού (Ψ).
Το Ψ λοιπόν θα είναι 0,26 δηλαδή σε ποσοστό 26%.
Άρα αν θέλουμε να συνδέσουμε τα 2
παραδείγματα μπορούμε να πούμε ότι σε ένα ματς με διαφορά τερμάτων
(διαφορά τερμάτων γηπεδούχου-διαφορά τερμάτων φιλοξενούμενου στα
συνολικά τέρματα τους) 10 ο άσσος από την πλευρά του ΟΠΑΠ θα έχει κατά
προσέγγιση ποσοστό 50% ενώ το διπλό 26%. Η ισοπαλία λοιπόν γύρω στο 24%.
Τα ποσοστά αυτά είναι πάντοτε κατά
προσέγγιση όσον αφορά τον ΟΠΑΠ αφού το μοντέλο μας «γυμνάστηκε» με
δεδομένα από τον ΟΠΑΠ. Άρα λοιπόν με αυτές τις 2 συναρτήσεις και έχοντας
σαν δεδομένο απλά τη διαφορά τερμάτων έχουμε μία κατά προσέγγιση ιδέα
του πως βλέπει ο ΟΠΑΠ το εκάστοτε ματς (πάντα για την Premier
League). Και τονίζω το κατά προσέγγιση διότι το οποιοδήποτε μοντέλο δεν
«γνωρίζει» τις όποιες ειδικές συνθήκες διεξαγωγής του αγώνα π.χ
απουσίες, καιρός, παράδοση κτλ.
Η επόμενη σχέση που ερεύνησα ήταν αυτή
μεταξύ του ποσοστού % για τον άσσο και τα τέρματα που πετυχαίνει ο
γηπεδούχος από την μία και το ποσοστό % του διπλού με τα τέρματα που
πετυχαίνει ο φιλοξενούμενος. Τακτοποιώντας τα ποσοστά % των σημείων ανά
κλάσεις των 5 δηλαδή 1-5% 6-10% πήρα τους μέσους όρους των κλάσεων (σαν
τα Χ) και τους μέσους όρους τερμάτων (σαν τα Ψ). Κατασκεύασα λοιπόν και
για αυτές τις περιπτώσεις διαγράμματα διασποράς τα οποία είναι τα
παρακάτω.
Στο πάνω διάγραμμα λοιπόν έχουμε την
εξίσωση ψ=2,896χ+0,261 όπου χ= το % άσσου και ψ= ο εκτιμώμενος μέσος
όρος τερμάτων για τον γηπεδούχο.
Παρατηρούμε την υψηλή τιμή R2 πράγμα το οποίο είναι απολύτως θετικό.
Πάνω έχουμε και το διάγραμμα σχέσης μέσου όρου τερμάτων φιλοξενούμενου βάσει ποσοστού % του διπλού. Η τιμή R2 είναι
και εδώ αρκετή υψηλή γεγονός πολύ θετικό όπως είπαμε και πριν αφού η
συνάρτηση περιγράφει σχεδόν τέλεια την διασπορά των σημείων.
Στο σημείο αυτό ας συνδέσουμε όλες αυτές
τις εξισώσεις για να δούμε που φτάνουμε. Όλα αρχίζουν με την τιμή της
διαφοράς τερμάτων.
Έχουμε λοιπόν:
- Τιμή Διαφοράς τερμάτων 10
- Ποσοστό % Άσσου 50%
- Ποσοστό % Διπλού 26%
- Εκτιμώμενος Μ.Ο τερμάτων γηπεδούχου 1,70
- Εκτιμώμενος Μ.Ο τερμάτων φιλοξ/νου 0,94
Αν χρησιμοποιήσουμε τώρα τους μέσους όρους αυτούς στη POISSON
μπορούμε να υπολογίσουμε τα ποσοστά % για τα 3 σημεία 1-Χ-2 τα οποία
στο παράδειγμα μας είναι 54%-25%21% χοντρικά. Απο τη διαφορά τερμάτων
λοιπόν έχουμε φτάσει σε μία εκτίμηση ποσοστών % για τα σημεία βάσει
Poisson. Το τελικό στάδιο λοιπόν είναι να δοκιμαστεί η απόδοση της
Poisson.
Όπως ανέφερα χρησιμοποίησα την σαιζόν
11’-12’ για τον σκοπό αυτό λαμβάνοντας σαν δείγμα και πάλι τον Β’
Γύρο. Κατασκεύασα και εδώ διαγράμματα διασποράς ανάμεσα στην πρόβλεψη
της Poisson και στα πραγματικά αποτελέσματα. Κατασκεύασα ένα διάγραμμα
βάσει % Άσσου και ένα βάσει % Διπλού. Δηλαδή πρακτικά ζητάμε απάντηση
στην ερώτηση:
«Πόσο τοις % επαλήθευση έχουν τα σημεία του άσσου με ποσοστό 45% βάσει Poisson;»
Και αναλόγως την απάντηση για το
διπλό. Έτσι λοιπόν έχτισα σε κλάσεις των 10 (1-9%, 10-19% κ.τ.λ) τις
προβλέψεις της Poisson (Χ) για τα σημεία και υπολόγισα τους μέσους όρους
των κλάσεων. Απέναντι τοποθέτησα τα πραγματικά ποσοστά επαλήθευσης των
κλάσεων (Ψ). Τα διαγράμματα διασποράς είναι τα παρακάτω:
Το θετικό στα παραπάνω διαγράμματα είναι
ότι όσο μεγαλύτερη είναι η εκτίμηση βάσει Poisson τόσο μεγαλύτερη είναι
και η πραγματική επαλήθευση. Με άλλα λόγια είναι σαν να έχουμε μία
μετριόφρουσα Poisson.
Στο αρχικό μας παράδειγμα είχαμε φτάσει στα εξής ποσοστά σημείων βάσει Poisson: 54%-25%21% (1-Χ-2)
Βάσει των τελευταίων συναρτήσεων
θεωρούμε ως Χ για τη συνάρτηση του άσσου το 0,54 και για την συνάρτηση
διπλού το 0,21. Δηλαδή λέμε ότι όταν ένα σημείο άσσου έχει 0,51 βάσει
Poisson έχει περίπου το ίδιο ποσοστό 51% πραγματική
επαλήθευση. Αντίστοιχα όταν ένα σημείο διπλού έχει ποσοστό 21% (0,21 για
την εξίσωση) βάσει Poisson έχει ποσοστό πραγματικής επαλήθευσης περίπου
17%.
Υπενθυμίζω για ακόμα μία φορά ότι όλα
είναι κατά προσέγγιση. Ας συγκεντρώσουμε τώρα όλες τις συναρτήσεις που
απαρτίζουν το μοντέλο μας, ώστε να καταλάβουμε και πως συνδέονται.
Πρώτη ομάδα συναρτήσεων είναι οι συναρτήσεις υπολογισμού ποσοστού % για τα σημεία του Άσσου και του Διπλού.
- Για τον Άσσο έχουμε: ψ(α)=0,005χ+0,445
- Για το Διπλό έχουμε: ψ(δ)=-0,004χ+0,295
Όπου χ και στις 2 συναρτήσεις είναι η διαφορά τερμάτων.
Δεύτερη ομάδα συναρτήσεων είναι εκείνες
που μας δίνουν τον εκτιμώμενο μέσο όρο τερμάτων του γηπεδούχου και του
φιλοξενούμενου βάσει ποσοστού % αυτών.
- Για τον μέσο όρο τερμάτων γηπεδούχου έχουμε: ψ(γ)=2,895χ+0,261
- Για τον φιλοξενούμενο: ψ(φ)=1,738χ2+1,405χ+0,480
Στις πάνω συναρτήσεις τα χ είναι τα ψ(α),ψ(δ) των 2 πρώτων.
Τα ψ των πάνω συναρτήσεων θα
χρησιμοποιηθούν στην Poisson για να υπολογιστούν τα ποσοστά % των 3
σημείων.
Η τρίτη ομάδα συναρτήσεων είναι οι συναρτήσεις με τις οποίες
αξιολογούμε τις προβλέψεις της Poisson.
- Για την αξιολόγηση των σημείων του άσσου της Poisson έχουμε: ψ(pγ)=1,229χ2-0,022χ+0,201.
- Για την αξιολόγηση των σημείων του διπλού της Poisson έχουμε: ψ(pφ)=1,151χ-0,067.
Ας τρέξουμε ένα αριθμητικό
παράδειγμα και πάλι. Έστω διαφορά τερμάτων μεταξύ 2 αντιπάλων ίση με
μηδέν. Από τις 2 πρώτες συναρτήσεις έχουμε την εκτίμηση για τα ποσοστά
άσσου και διπλού:
Ψ(α)=0,445=44,5%
Ψ(δ)=0,295=29,5%
Εν συνεχεία θα υπολογίσουμε τον μέσο όρο
τερμάτων που πετυχαίνει κάποιος γηπεδούχος με ποσοστό 44,5% ή 0,445 και
κάποιος φιλοξενούμενος με ποσοστό 29,5 ή 0,295:
Ψ(γ)=1,55
Ψ(φ)=1,05
Αν χρησιμοποιήσουμε τους μέσους όρους
αυτούς στη Poisson υπολογίζουμε τα ποσοστά των 3 σημείων 1-Χ-2 τα οποία
στην περίπτωση μας είναι:
48,06%-26,07%-25,87%
Με τις τελευταίες συναρτήσεις θα
αξιολογήσουμε τον άσσο με ποσοστό 48,06% και το διπλό με 25,87 τα οποία
τα έχουμε πάρει μέσω Poisson.
ψ(pγ)=47%
ψ(pφ)=23%
Εν τέλει μπορούμε να καταλήξουμε ότι τα
τελικά ποσοστά σημείων της αναμέτρησης είναι 47%-30%-23% βάσει του
μοντέλου μας και συνεπώς μπορούμε να υπολογίσουμε και ποιες θα έπρεπε να
είναι οι value αποδόσεις για το εκάστοτε σημείο, δηλαδή 2,13-3,33-4,35.
Κλείνοντας να τονίσω ότι τα δεδομένα που
παράγονται με το παραπάνω «μοντέλο» θα πρέπει να χρησιμοποιηθούν σαν
εργαλείο βελτίωσης των επιλογών μας και όχι να ακολουθούνται τυφλά για
τον στοιχηματισμό μας. Θα πρέπει και εσείς όπως και εγώ να
παρακολουθήσουμε για αρκετό χρόνο τις επιδόσεις του μοντέλου πριν
καταλήξουμε σε οποιαδήποτε συμπεράσματα. Κυρίως τροφή προς σκέψη και
έρευνα προσφέρει παρά οτιδήποτε άλλο.
Για οτιδήποτε διευκρινήσεις-ερωτήσεις
αλλά και για ανταλλαγή απόψεων και τυχόν διορθώσεις και προτάσεις
(ειδικότερα από άτομα που έχουν σπουδάσει στατιστική) μην διστάσετε να
επικοινωνήσετε στο betakos@hotmail.com.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου