Statistiques et football, Partie 1

Mai 17, 2022 | Articles

Championnat national, un focus sur une saison de Ligue 1

 

Description du jeu de données 

Nous avons analysé les données de Ligue 1, saison 2017-2018, disponibles en accès libre. 

Vingt clubs se sont affrontés, comptabilisant un total de 380 matchs joués. A l’issue de la saison, le classement définitif était le suivant : 

ClubPointsClubPoints
PSG93Dijon48
Monaco80Guingamp47
Olympique Lyonnais78Amiens45
Olympique de Marseille77Angers41
Rennes58Strasbourg38
Bordeaux55Caen38
Saint-Etienne55Lille38
Nice54Toulouse37
Nantes52Troyes33
Montpellier51Metz26

Classement des clubs sur la saison 2017-2018

 

Performances offensives, défensives et classement général

Les données mises à disposition par Wyscout ont permis des premières analyses descriptives de la saison.

 

Performances offensives et defensives 

Au regard de leur nombre de points accumulés et à la tendance à marquer des clubs, ceux qui ont produit les meilleures performances offensives sont le PSG, l’Olympique Lyonnais, Dijon et Strasbourg (voir Figure 1). 

Metz, dernier du classement, a aussi paradoxalement montré un bon rapport nombre de buts marqués / nombre de points. A contrario, les équipes qui, en moyenne, ont peu marqué se situent dans le « ventre mou » du classement. On peut retrouver notamment Rennes, Saint-Etienne, Montpellier, Nantes, Amiens et Caen. 

Dans la même logique, on attribue les moins bonnes performances à Dijon, Lille, Strasbourg et Metz (voir Figure 2). Les meilleures défenses, relatives au nombre de points gagnés par équipe, se retrouvent essentiellement dans le milieu du classement, avec notamment Amiens, Nantes et Montpellier.  

De manière générale, on se rend compte que les matchs offrant le plus de buts sont liés aux oppositions d’équipes de haut et de bas de tableau. En revanche, les matchs avec des équipes de milieu de tableau sont plus fermés. 

 

La ligne bleue représente la relation moyenne entre le nombre de buts marqués par match et le nombre de points par match. Une équipe positionnée au-dessus de cette ligne a marqué plus de buts que la moyenne, au vu de son nombre de points. Inversement, une équipe positionnée en-dessous de cette ligne a marqué moins de buts que la moyenne, au vu de son nombre de points.

Figure 1 : Nombre de buts marqués par match en fonction du nombre de points par match, pour les 20 équipes.

Sur cette figure, la ligne bleue représente la relation moyenne entre le nombre de buts marqués par match et le nombre de points par match. Un club positionné au-dessus de cette ligne a marqué plus de buts que la moyenne, au vu de son nombre de points. Inversement, celui positionné en-dessous de cette ligne a marqué moins de buts que la moyenne, au vu de son nombre de points.

Figure 2 : Nombre de buts encaissés par match en fonction du nombre de points par match, pour les 20 équipes.

Ici, la ligne bleue représente la relation moyenne entre le nombre de buts encaissés par match et le nombre de points par match. Un club positionné au-dessus de cette ligne a encaissé plus de buts que la moyenne, au vu de son nombre de points. Inversement, celui positionné en-dessous de cette ligne a encaissé moins de buts que la moyenne, au regard de son nombre de points.

 

Performance et localisation

Concernant la capacité des clubs à marquer des points à domicile et à l’extérieur, on distingue 4 groupes (voir Figure 3) :

  • Les clubs bons à domicile comme à l’extérieur (PSG, Monaco, Olympique Lyonnais, Olympique de Marseille)
  • Les clubs moyens à domicile et à l’extérieur (Rennes, Montpellier, Saint-Etienne, Bordeaux, Nantes, Nice et Angers)
  • Les clubs mauvais à domicile et moyens à l’extérieur (Dijon, Guingamp, Amiens, Lille, Caen, Strasbourg, Toulouse, Troyes)
  • Les clubs mauvais à domicile comme à l’extérieur (Metz)

 

Figure 3 : Classification des 20 clubs selon leur nombre de points par match à domicile (home) et à l’extérieur (away). Chaque cluster (ou groupe) est représenté par une couleur.
Les données est ont été normalisées puis un classifieur de type k-means a été utilisé.

Sur le même principe, les clubs ont été regroupés selon leurs résultats. Il en ressort à nouveau 4 groupes (voir Figure 4) :

  • Les clubs qui gagnent majoritairement. On y retrouve le top 4 (PSG, Monaco, Olympique Lyonnais et Olympique de Marseille).
  • Les clubs qui ont des résultats équilibrés mais qui gagnent moins souvent (Rennes, Nice, Saint-Etienne, Nantes, Dijon, Guingamp, Dijon, Amiens, Strasbourg et Toulouse)
  • Les clubs qui font énormément de matchs nuls (Angers et Montpellier)
  • Les clubs qui perdent majoritairement (Bordeaux, Caen, Lille, Troyes et Metz)

 

Figure 4 : Clustering des 20 clubs selon leur pourcentage de victoire et de match nul. Chaque cluster est représenté par une couleur.
Ici également, les données est ont été normalisées puis un classifieur de type k-means a été utilisé.

Quand on compare ces groupes selon leur classement (voir Figure 5), on remarque que Bordeaux est bien classé mais est dans le groupe des clubs qui perdent beaucoup, notamment du fait d’un faible pourcentage de match nul. Par ailleurs, Angers et Montpellier semblent quelque peu à part, montrant peu de victoires et de défaites pour une majorité de matchs nuls.

 

Figure 5 : Positionnement des clubs selon leurs pourcentages de victoire et de matchs nuls.

La ligne bleue représente la relation moyenne entre le pourcentage de victoire et le pourcentage de match nul. La couleur des clubs correspond à leur classement à la fin de la saison.

 

 

Dans un second article, nous porterons intérêt à quelques championnats majeurs européens avec une analyse des classements nationaux puis la qualification des facteurs influant la performance collective.

Stay tuned ! 

 

Seenovate participe au Salon Sport UnlimiTECH !

Seenovate participe au Salon Sport UnlimiTECH !

L’innovation au service de la performance sportive ! Nous sommes heureux de participer au Salon Unlimitech les 15 et 16 septembre prochains au Grand Palais de Lille. Sport Unlimitech est le premier rendez vous dédié au sport et à l’innovation ! Au programme de ces...

🎾 Seesports by Seenovate X Alice Soulié !

🎾 Seesports by Seenovate X Alice Soulié !

Nous sommes heureux de soutenir Alice Soulié dans le lancement de sa carrière !   Actuelle numéro 3 Française junior de sa catégorie, et 556è du classement ITF, Alice Soulié est le futur du tennis français ! Elle a d’ailleurs signé sa première participation à...

[Recherche] Etude de validité du capteur de puissance Stryd

[Recherche] Etude de validité du capteur de puissance Stryd

La data dans le sport est de plus en plus présente grâce aux progrès technologiques et à l'émergence de nombreux outils de mesure. Découvrez l'étude sur le capteur de puissance Stryd qui a pour but de valider les données mesurées par celui-ci. Validité du capteur de...