Statistiques et football, Partie 1

Mai 17, 2022 | Blog

Championnat national, un focus sur une saison de Ligue 1

 

Description du jeu de données 

Nous avons analysé les données de Ligue 1, saison 2017-2018, disponibles en accès libre. 

Vingt clubs se sont affrontés, comptabilisant un total de 380 matchs joués. A l’issue de la saison, le classement définitif était le suivant : 

ClubPointsClubPoints
PSG93Dijon48
Monaco80Guingamp47
Olympique Lyonnais78Amiens45
Olympique de Marseille77Angers41
Rennes58Strasbourg38
Bordeaux55Caen38
Saint-Etienne55Lille38
Nice54Toulouse37
Nantes52Troyes33
Montpellier51Metz26

Classement des clubs sur la saison 2017-2018

 

Performances offensives, défensives et classement général

Les données mises à disposition par Wyscout ont permis des premières analyses descriptives de la saison.

 

Performances offensives et defensives 

Au regard de leur nombre de points accumulés et à la tendance à marquer des clubs, ceux qui ont produit les meilleures performances offensives sont le PSG, l’Olympique Lyonnais, Dijon et Strasbourg (voir Figure 1). 

Metz, dernier du classement, a aussi paradoxalement montré un bon rapport nombre de buts marqués / nombre de points. A contrario, les équipes qui, en moyenne, ont peu marqué se situent dans le « ventre mou » du classement. On peut retrouver notamment Rennes, Saint-Etienne, Montpellier, Nantes, Amiens et Caen. 

Dans la même logique, on attribue les moins bonnes performances à Dijon, Lille, Strasbourg et Metz (voir Figure 2). Les meilleures défenses, relatives au nombre de points gagnés par équipe, se retrouvent essentiellement dans le milieu du classement, avec notamment Amiens, Nantes et Montpellier.  

De manière générale, on se rend compte que les matchs offrant le plus de buts sont liés aux oppositions d’équipes de haut et de bas de tableau. En revanche, les matchs avec des équipes de milieu de tableau sont plus fermés. 

 

La ligne bleue représente la relation moyenne entre le nombre de buts marqués par match et le nombre de points par match. Une équipe positionnée au-dessus de cette ligne a marqué plus de buts que la moyenne, au vu de son nombre de points. Inversement, une équipe positionnée en-dessous de cette ligne a marqué moins de buts que la moyenne, au vu de son nombre de points.

Figure 1 : Nombre de buts marqués par match en fonction du nombre de points par match, pour les 20 équipes.

Sur cette figure, la ligne bleue représente la relation moyenne entre le nombre de buts marqués par match et le nombre de points par match. Un club positionné au-dessus de cette ligne a marqué plus de buts que la moyenne, au vu de son nombre de points. Inversement, celui positionné en-dessous de cette ligne a marqué moins de buts que la moyenne, au vu de son nombre de points.

Figure 2 : Nombre de buts encaissés par match en fonction du nombre de points par match, pour les 20 équipes.

Ici, la ligne bleue représente la relation moyenne entre le nombre de buts encaissés par match et le nombre de points par match. Un club positionné au-dessus de cette ligne a encaissé plus de buts que la moyenne, au vu de son nombre de points. Inversement, celui positionné en-dessous de cette ligne a encaissé moins de buts que la moyenne, au regard de son nombre de points.

 

Performance et localisation

Concernant la capacité des clubs à marquer des points à domicile et à l’extérieur, on distingue 4 groupes (voir Figure 3) :

  • Les clubs bons à domicile comme à l’extérieur (PSG, Monaco, Olympique Lyonnais, Olympique de Marseille)
  • Les clubs moyens à domicile et à l’extérieur (Rennes, Montpellier, Saint-Etienne, Bordeaux, Nantes, Nice et Angers)
  • Les clubs mauvais à domicile et moyens à l’extérieur (Dijon, Guingamp, Amiens, Lille, Caen, Strasbourg, Toulouse, Troyes)
  • Les clubs mauvais à domicile comme à l’extérieur (Metz)

 

Figure 3 : Classification des 20 clubs selon leur nombre de points par match à domicile (home) et à l’extérieur (away). Chaque cluster (ou groupe) est représenté par une couleur.
Les données est ont été normalisées puis un classifieur de type k-means a été utilisé.

Sur le même principe, les clubs ont été regroupés selon leurs résultats. Il en ressort à nouveau 4 groupes (voir Figure 4) :

  • Les clubs qui gagnent majoritairement. On y retrouve le top 4 (PSG, Monaco, Olympique Lyonnais et Olympique de Marseille).
  • Les clubs qui ont des résultats équilibrés mais qui gagnent moins souvent (Rennes, Nice, Saint-Etienne, Nantes, Dijon, Guingamp, Dijon, Amiens, Strasbourg et Toulouse)
  • Les clubs qui font énormément de matchs nuls (Angers et Montpellier)
  • Les clubs qui perdent majoritairement (Bordeaux, Caen, Lille, Troyes et Metz)

 

Figure 4 : Clustering des 20 clubs selon leur pourcentage de victoire et de match nul. Chaque cluster est représenté par une couleur.
Ici également, les données est ont été normalisées puis un classifieur de type k-means a été utilisé.

Quand on compare ces groupes selon leur classement (voir Figure 5), on remarque que Bordeaux est bien classé mais est dans le groupe des clubs qui perdent beaucoup, notamment du fait d’un faible pourcentage de match nul. Par ailleurs, Angers et Montpellier semblent quelque peu à part, montrant peu de victoires et de défaites pour une majorité de matchs nuls.

 

Figure 5 : Positionnement des clubs selon leurs pourcentages de victoire et de matchs nuls.

La ligne bleue représente la relation moyenne entre le pourcentage de victoire et le pourcentage de match nul. La couleur des clubs correspond à leur classement à la fin de la saison.

 

 

Dans un second article, nous porterons intérêt à quelques championnats majeurs européens avec une analyse des classements nationaux puis la qualification des facteurs influant la performance collective.

Stay tuned ! 

 

Coupe du monde de rugby : analyse des performances

Coupe du monde de rugby : analyse des performances

La Coupe du Monde en chiffres La coupe du monde de rugby 2023 s’est achevée par le sacre de l’Afrique du Sud. Après avoir fini 2e de son groupe, elle a remporté tous ses matchs de phase finale d’un point ! Il est désormais temps de faire un bilan sur cette édition....

La science des données au cœur de la mêlée

Aperçu des performances des équipes avant le dernier carré de la compétition   Une professionnalisation qui ne laisse plus de place au hasard ?  L’utilisation et l’analyse de la donnée dans le sport est devenue à ce jour incontournable. Exploitée comme une...

Outils de collecte et utilisation de la donnée

Outils de collecte et utilisation de la donnée

Un indicateur devient la star d’une conférence de presse Après un match en 2017, Arsène Wenger fut le premier à employer le terme "d’Expected goals" (xG) en public. Alors que son équipe venait de s’incliner 3-1, ses propos ont marqué le début d’une nouvelle ère. Cette...