[2026-2027] Statistiques et autres comparaisons

Modérateurs : Papy, angevin4ever, lacouture.49, footpassion49, S©O 1958, petitfute, christophe h

Répondre
Avatar du membre
Cisco
Administrateur
Messages : 16192
Enregistré le : sam. 27 mars, 2004 12:42 pm
Localisation : Trélazé

[2026-2027] Statistiques et autres comparaisons

Message par Cisco »

Des stats et analyses qu’on ne retrouve que sur le forum !
Suivez le compte Twitter du forum ! => https://twitter.com/SCO_1919
Avatar du membre
maximus49000
Donateur
Messages : 216
Enregistré le : jeu. 17 déc., 2015 6:20 pm

Re: [2026-2027] Statistiques et autres comparaisons

Message par maximus49000 »

C'est l'été, mais les stats ne s'arrêtent jamais. Mise à jour pour la saison 2026 2027 : voici les % pour angers au début de la saison prochaine.

Saison 2026-2027 : Probabilité J0

Image

Calendrier des matchs

Image
Modifié en dernier par maximus49000 le ven. 26 juin, 2026 3:36 pm, modifié 3 fois.
La Dalle Angevine
Avatar du membre
S©O 1958
Donateur
Messages : 13214
Enregistré le : sam. 28 nov., 2009 7:02 pm
Localisation : Agen

Re: [2026-2027] Statistiques et autres comparaisons

Message par S©O 1958 »

Très heureux pour ta participation dès la J1 :D
Pourrais-tu nous faire un rappel de ta méthode ?
Merci :up:
tout l'historique sur les joueurs du SCO http://www.sco1919.com/index.php?r=joueurs%2Fjoueurs
Avatar du membre
maximus49000
Donateur
Messages : 216
Enregistré le : jeu. 17 déc., 2015 6:20 pm

Re: [2026-2027] Statistiques et autres comparaisons

Message par maximus49000 »

Avec grand plaisir !

la méthode N'EST PAS une méthode de probabilité pur, mais une simulation de un million de championnat basé sur des probabilités de V/N/D par match (système de probabilité Monté Carlos) :

Concepts Du Monté Carlos :

c'est une technique qui utilise des tirages aléatoires répétés pour estimer un résultat ou une probabilité lorsqu'un calcul exact est difficile (c'est pas mal utilisé en finance entre autre).

En très bref

1. On définit les variables incertaines.
2. On génère des milliers de scénarios aléatoires (dans notre simulation : Un Million)
3. On analyse les résultats obtenus pour estimer les probabilités et les risques (c'est ici que l'on sort les % qui vont évoluer tout au long de l'année.

Les Chiffres suivis :

Pour chaque Chiffre, on fait un pourcentage du nombre de tirage parmi ces 1 million de tirages qui a entrainé à ce résultat. On suit les chiffres suivants :

% de Champion (1er) : ici le sco est 0.03% de fois champion (soit 300 simulation dans lesquelles le SCO est champion)
% Européen : La somme des % de :
- LDC (1er / 2ème ou 3ème)
- Barrage LDC (4ème)
- Europa League (5ème)
- EL Conférence (6 ème)
% Maintenu (Entre la 1ère et la 15ème Place)
% Barragiste (16ème)
% Relégué (17 ou 18ème)

On suit aussi les scénarios :
- Max : Le scénario de la simulation la plus optimiste (ici un SCO premier avec 66 points)
- Moyenne : La moyenne de position de tout les scénarios ainsi que le nombre de point moyen (ici le SCO est 15ème avec 37 points).
- Min : Le pire scénario (ici le SCO est dernier et 18ème avec... 5 points en espérant ne pas y arriver !).

Enfin, un graphe journée par journée est visible sur la partie gauche et qui montre l'évolution des probabilités de maintien (trait continu vert) et joue la relégation (trait continu rouge) avec chacune des positions finales (trait de couleur différentes en pointillé.

Les variables incertaines :

Dans notre simulation, nous avons deux variables :

La probabilité de V / N / D initiale :

Cette probabilité est calculée de manière la plus exhaustive possible en prenant en compte les résultats des confrontations sur les 10 dernières années. Pour ne pas donner la même importance à tout les matchs, des critères d'importance sont donnés :

- Les matchs les plus récents sont plus important : En effet, le contexte d'un club est changeant aussi, pour se rapprocher du contexte actuel, il est nécessaire de donner plus d'importance aux matchs les plus récents (Année N = 1 / Année N-1 = 0.82 / Année N-2 = 0.67 / Année N-3 = 0.55 / Année N-4 et N-5 = 0.37 / Année N-6 et N-7 et N-8 = 0.2 / Les autres années = 0.14)

- La localisation du match : On le sait, une équipe peut être la meilleure à domicile et être nulle à l'exterieur. Aussi, si l'équipe est à domicile, nous donnerons plus d'importance à l'historique des confrontations à domicile (une part de 1 match à domicile = 2 matchs à l'exterieur).

Mais si je n'ai pas assez de résultat pour avoir une probabilité significative?

Dans certains cas, il s'avère que le nombre de match n'est pas assez conséquent pour évaluer un réel rapport de force (exemple : Le Mans - Angers // Zéro affrontement dans les 10 dernières années). Aussi, pour éviter le 0.33 de base (ce qui est faux car... Un Le Mans - PSG, n'allons pas dire que Le Mans à 0.33% de chance de gagner !), nous allons trouver une autre manière de calculer le rapport de force.

Pour ce faire, nous allons nous baser sur une information connue : les performances de la saison dernière en terme de point/Match ET différence de but.

Pour chaque équipe, nous allons calculer sa force à domicile et à l'exterieur avec la méthodo suivante :

- Force = 70% * Nb Points Moyen + 30% * Différence de but moyenne

Exemple : la force du SCO pour la saison dernière à domicile est de :
NB Moyen de point à domicile la saison dernière : 1.36
Diff de but moyenne à domicile : -0.59

- Force Dom = 70%*1.36+30%*(-0.59)
- Force Dom = 0.77

Prenons comme adversaire Lille lors du premier match :

- Force Ext = 70%*1.86+30%*0.65
- Force Ext = 1.51

Nous voyons (et c'est logique) que le rapport de force est supérieur pour Lille. Pour voir quel rapport affecté, nous allons réaliser une mise en commun des rapports de force :

-RForceDom = 0.77 / (1.51+0.77) = 0.34
-RForceExt = 1.51 / (1.51+0.77) = 0.66

Maintenant, avec ce rapport de force, nous allons calculer une probabilité de V/N/D. Nous allons d'abord calculer la proba du match nul. Plus les rapports de forces sont proche, et plus le match nul est plausible, à l'inverse, plus c'est éloigné, et plus le match nul est faible. Pour ce faire, nous allons calculer l'écart entre les deux forces, et lui apposer un pourcentage entre 0.18% et 0.35% grace à cette formule :

=0,28-0,15*ABS(RForceDom-RForceExt)

Dans notre exemple : = 0.23

Par la suite, on va apposer 0.66% du reste pour Lille et 0.34 pour Angers.

PDom = (1-0.23)*0.34 = 0.26
PExt = (1-0.23)*0.66 = 0.51

On a donc une probabilité de 0.26 / 0.23 / 0.51

La particularité Ligue 2

Un club de ligue 2 qui monte est un club qui a performé à l'étage inférieur. Ses chiffres seront donc plutôt élevé. Pour évité de fausser le rapport de force, on appose un malus de 40% à ceux qui monte de ligue 2. Ainsi, à force calculé égale, le club de ligue 1 sera supérieur au club de ligue 2.

Et comment un appose le résultat dans tout cela?

On a maintenant deux probabilités :

- Une probabilité simple de VND
- Une probabilité liée à la forme

Plus nous avons d'historique, et plus la probabilité VND sera la probabilité la plus fiable. Néanmoins pour les clubs avec peu de confrontation, c'est plutôt la performance N-1 qui devrait avoir de l'importance. Ainsi, nous allons faire la part des deux. Considérons 20 matchs d'historique (soit 10 saisons pleine). Nous réaliserons un % par rapport à ces 20 matchs de référence pour calculer la probabilité finale grace à cette méthode ce calcul :

- Proba VND * MIN(NBMatch/20;1) + (1-MIN(NBMatch/20;1)*RForce

NB : notre MIN retourne soit la part de match divisé par notre référence ou MAXIMUM 1).

Ainsi, nous avons une probabilité plus fine qui n'a plus de 0.33 car pas de confrontation directe et donc cela permet donc une simulation plus fine.

Nous avons calculé la probabilité pure, celle-ci est mathématique. Maintenant, nous allons instaurer une variable d'ajustement de performance. En effet, Une équipe peut être parmi les meilleures sur les 10 dernières années et totalement rater sa saison (exemple : Nice la saison dernière). Pour prendre en compte cet aléa, nous ajustons la variable avec une variable de performance de l'équipe.

La performance Kesako?

La performance est une variable connu après chaque match qui calcul la performance sur une rencontre par rapport au résultat attendu. Elle est soit positive (sur performance) soit négative (sous performance), et est comprise entre -1 (sous performance massive) et 1 (sur performance extrême).

Pour chaque équipe, Celle-ci se compose des chiffres suivants :

- La performance sur les 5 derniers matchs Dom / Ext => On prends les 5 derniers matchs à Dom OU Ext (selon la situation), et on y appose la performance
- La performance sur les 5 derniers matchs secs => On prends les 5 derniers matchs (qu'importe la situation), et on y appose la performance
- La performance globale de la saison => On prends la totalité du championnat joué, et on y appose la performance globale.

De ces performances, on en fait un chiffre de performance globale d'une équipe constituée de : Performance de la saison*0.5 + Performance 5M Dom / Ext*0.3 + Performance 5M Sec*0.2

dès lors On fait la différence des deux niveaux de performance de chaque équipe (Perf Equipe Dom - Perf Equipe Ext), et on a la variable d'ajustement : Variable positive : l'équipe à domicile surperforme par rapport à l'équipe à l'exterieur / Variable négative : l'équipe à l'exterieur surperforme par rapport à l'équipe à domicile.

On appose ce chiffre à la variables des résultats pour ajuster le %, et nous avons notre probabilité pondéré aux résultats.

NB : au début de la saison, comme nous n'avons pas de variable de résultat, cette variable est égale à 0.

En exemple ça donne quoi?

Prenons pour exemple le premier match de la saison du SCO de cette saison : Angers - Lille

- Dans notre exemple, nous mettrons (D pour victoire de l'équipe à domicile / E pour victoire de l'équipe à l'exterieure / N pour nul)
- Dans notre exemple, je vous mets la valeur du match entre parenthèse

Lors des 10 dernières années, voici les résultats des matchs

- Match (Match Dom / Match Ext)

- 2026-2027 (0 / 0) : La saison n'est pas débuté donc pas de résultat pour le moment

- 2025 - 2026 (0.82 / 0.82) =
Angers - Lille : E
Lille - Angers : D

- 2024 - 2025 (0.67 / 0.67)
Angers - Lille : E
Lille - Angers : D

- 2023 - 2024 (0 / 0) : Nous étions en ligue 2

- 2022 - 2023 (0.37 / 0.37)
Angers - Lille : D
Lille - Angers : D

- 2021 - 2022 (0.37 / 0.37)
Angers - Lille : N
Lille - Angers : N

- 2020 - 2021 (0.2 / 0.2)
Angers - Lille : E
Lille - Angers : E

- 2019 - 2020 (0.2 / 0.2)
Angers - Lille : E
Lille - Angers : D

- 2018 - 2019 (0.2 / 0.2)
Angers - Lille : D
Lille - Angers : D

- 2017 - 2018 (0.14 / 0.14)
Angers - Lille : N
Lille - Angers : E

- 2016 - 2017 (0.14 / 0.14)
Angers - Lille : D
Lille - Angers : E

Calcul de Match = Valeur dans le contexte du match
- Nombre de match = 0+0.82+0.67+0+0.37+0.37+0.2+0.2+0.2+0.14+0.14 = 3.11
- Nombre de victoire Angers = 0.37+0+0.2+0.14 = 0.71 Soit un % de victoire Dom de 0.71/3.11 = 0.228
- Nombre de Nul = 0.14+0.37=0.51 Soit un % de Nul de 0.51/3.11=0.163
- Nombre de victoire Lille = 0.82+0.67+0.37+0.2+0.2=1.89 Soit un % de Victoire Ext de 1.89/3.11 = 0.608

Calcul de Match' = Valeur dans le contexte inversé
- Nombre de match = 0+0.82+0.67+0+0.37+0.37+0.2+0.2+0.2+0.14+0.14 = 3.11
- Nombre de victoire Angers = 0.2+0.14+0.14 = 0.48 Soit un % de victoire Dom de 0.48/3.11 = 0.154
- Nombre de Nul= 0.37 Soit un % de Nul de 0.37/3.11=0.118
- Nombre de victoire Lille = 0.82+0.67+0.2+0.2=2.26 Soit un % de Victoire Ext de 2.26/3.11 = 0.727

Pour calculer les probabilités (en respectant la part de 1 match à domicile = 2 matchs exterieurs) nous avons donc :
- Victoire de Angers = (0.228*2+0.154)/3 = 0.20
- Nul = (0.163*2+0.118)/3 = 0.15
- Victoire de Lille = (1.89*2+2.26)/3 = 0.65

à cela nous ajouterons à partir de la seconde journée la performance (car pour la première journée, nous n'avons pas d'indice de performance) => C'est une évolution à laquelle je songe pour avoir encore plus précis, prendre la forme de la saison dernière dans le cas ou nous n'avons pas d'information de la forme pour ajuster, néanmoins comme un mercato passe entre temps, nous ne pouvons pas considérer que la forme d'une équipe à la saison N-1 est la même que le niveau de forme du début de la saison N.

Focus sur la lecture des sections :


Pour chaque équipe vous pouvez consulter :
les 5 derniers matchs (résultat + performance de l'équipe)
Les 5 prochains matchs avec les statistiques des résultats des dernières saisons :
- 1er ensemble : confrontation sur les 11 dernières saisons tout match confondu
- 2nd ensemble (Dom) : confrontation sur le terrain de l'équipe à domicile
- 3ème ensemble (Ext) : confrontation sur le terrain de l'équipe à l'exterieur
- 4ème ensemble (5S) : 5 dernières saisons avec des confrontations
- 5ème ensemble (5SD) : 5 dernières saisons sur le terrain de l'équipe à Dom
- 6ème ensemble (5SE) : 5 dernières saisons sur le terrain de l'équipe à l'extérieur

---------------------------------------------------------------------------------------------

Conclusion :

Voici l'explication complète. J'ai essayé d'être le plus précis mais en même temps le plus vulgarisateur pour expliquer la démarche et la raison de ces résultats. En outre, ce système est voué à évoluer. Ce qui est intéréssant, c'est que selon les données disponibles, on pourrait rajouter d'autres données incertaines pour ajuster le résultat et les rajouter facilement. Pour le moment je n'ai pas trouvé de variable d'ajustement avec assez données fiable en open data (exemple : masse salariale? performances individuelles? xG?) et de plus je ne sais pas quel impact mettre néanmoins, on peux faire évoluer le modèle assez facilement donc... Si vous voyez d'autres variables d'ajustement n'hésitez pas à m'en faire part !

D'ici là merci beaucoup pour cette lecture, bonne journée à tous et toute ! j'essayerai de poster l'évolution du SCO (... Et de nos concurrents dès lors que l'on aura de la visibilité sur qui ils sont ! :) ).

Allez rendez-vous après la première journée, Allez le SCO et... Bonne vacances d'ici là !
Modifié en dernier par maximus49000 le ven. 26 juin, 2026 4:05 pm, modifié 2 fois.
La Dalle Angevine
Avatar du membre
BisounoursDuSCO
Scoïste, enfin !
Messages : 6780
Enregistré le : dim. 08 oct., 2017 12:34 pm

Re: [2026-2027] Statistiques et autres comparaisons

Message par BisounoursDuSCO »

Merci beaucoup, ça rend tout très lisible !
Avatar du membre
maximus49000
Donateur
Messages : 216
Enregistré le : jeu. 17 déc., 2015 6:20 pm

Re: [2026-2027] Statistiques et autres comparaisons

Message par maximus49000 »

Petit Update d'affichage (juste pour info : j'ai rajouté les résultats des confrontations des deux équipes :

- 1er ensemble : confrontation sur les 11 dernières saisons tout match confondu
- 2nd ensemble (Dom) : confrontation sur le terrain de l'équipe à domicile
- 3ème ensemble (Ext) : confrontation sur le terrain de l'équipe à l'exterieur
- 4ème ensemble (5S) : 5 dernières saisons avec des confrontations
- 5ème ensemble (5SD) : 5 dernières saisons sur le terrain de l'équipe à Dom
- 6ème ensemble (5SE) : 5 dernières saisons sur le terrain de l'équipe à l'extérieur

Update Numéro 2 : Ajout du tableau des probabilités
La Dalle Angevine
Avatar du membre
S©O 1958
Donateur
Messages : 13214
Enregistré le : sam. 28 nov., 2009 7:02 pm
Localisation : Agen

Re: [2026-2027] Statistiques et autres comparaisons

Message par S©O 1958 »

Merci
tout l'historique sur les joueurs du SCO http://www.sco1919.com/index.php?r=joueurs%2Fjoueurs
Avatar du membre
maximus49000
Donateur
Messages : 216
Enregistré le : jeu. 17 déc., 2015 6:20 pm

Re: [2026-2027] Statistiques et autres comparaisons

Message par maximus49000 »

UPDATE :

Mise à jour des probabilités avec évolution de la méthode de calcul pour prendre en compte un nouveau composant : Si nous n'avons pas assez de résultat pour avoir une information fiable (exemple : pas de match contre le Mans dans les 10 dernières années en match offciel), ajout d'une étude sur la saison dernière pour émuler le rapport de force entre les deux équipes (Voir mon descriptif de la méthode plus haut, je vais l'Update pour expliquer le calcul).
La Dalle Angevine
Répondre

Retourner vers « Angers SCO »