Une approche quantitative rigoureuse pour analyser des combats qui n’auront jamais lieu.
INTRODUCTION
Qui gagnerait : Khabib Nurmagomedov dans son prime ou Islam Makhachev aujourd’hui ? Depuis qu’Islam a conquis le titre des lightweights, la question divise la communauté MMA. Les fans débattent, les analystes spéculent, mais les comparaisons reposent le plus souvent sur des impressions, des highlights ou des arguments difficilement quantifiables.
Chez SeeSports, nous avons développé un modèle de machine learning conçu pour tester ce type de débat à partir de données, en appliquant les mêmes exigences méthodologiques que pour une prédiction UFC réelle.
Le MMA reste un sport fondamentalement chaotique : un combat peut basculer sur un knockdown, une soumission, une blessure ou un décrochage. Pourtant, derrière cette variance apparente, des patterns robustes émergent lorsqu’on analyse des milliers de combats de manière systématique.
Nous appliquons ce cadre à quatre matchups impossibles, qui cristallisent certains des plus grands débats du MMA moderne :
• Khabib Nurmagomedov (prime 2020) vs Islam Makhachev (prime 2025) – Lightweight
• Conor McGregor (prime 2015) vs Ilia Topuria (prime 2024) – Featherweight
• Georges St-Pierre (prime 2013) vs Kamaru Usman (prime 2022) – Welterweight
• Jon Jones (prime 2020) vs Alex Pereira (prime 2024) – Light heavyweight
Ces combats n’auront jamais lieu. Mais ils peuvent être modélisés, à condition de respecter les contraintes méthodologiques nécessaires à toute analyse prédictive crédible.
DEFI MAJEUR : EVITER LE DATA LEAKAGE
Avant toute prédiction, il est indispensable de rappeler un point méthodologique central : la majorité des modèles prédictifs MMA publiés souffrent de data leakage temporel. La littérature académique rapporte régulièrement des performances comprises entre 58 % et 64 % d’accuracy, mais ces chiffres reposent souvent sur des hypothèses de validation inadaptées à des données chronologiques, ce qui introduit involontairement des informations futures dans l’entraînement du modèle.
ERREUR 1 : FEATURES CALCULÉES SUR L’ENSEMBLE DE LA CARRIÈRE
Un biais fréquent consiste à calculer certaines features sur l’ensemble de la carrière d’un combattant. Utiliser, par exemple, un taux de victoire cumulé pour prédire un combat de 2015 revient à intégrer des combats disputés après cette date. Le modèle “voit le futur”, ce qui favorise artificiellement les profils qui progresseront plus tard, indépendamment de leur niveau réel au moment du combat analysé. Dans notre approche, toutes les features sont calculées strictement jusqu’à la date de l’événement, sans aucune exception.
Exemple : différence entre dataset brut par combat et dataset de modélisation temporelle
L’image ci-dessous illustre la différence entre un dataset de statistiques brutes par combat et un dataset de modélisation correctement temporalisée pour le calcul du pourcentage moyen de coups significatifs.

Le premier combat d’Islam Makhachev à l’UFC a lieu le 23 mars 2015. À cette date, aucune donnée préalable n’est disponible : la valeur moyenne est donc logiquement absente (NaN).
Lors du combat suivant, le 3 octobre 2015, la moyenne est calculée uniquement à partir du combat du 23 mars 2015. Le combat du 17 septembre 2016 intègre ensuite les données des deux combats précédents, et ainsi de suite.
Cette construction garantit que chaque valeur utilisée par le modèle correspond exclusivement à l’information réellement disponible avant le combat analysé.
À l’inverse, si la moyenne était calculée sur l’ensemble des combats connus, y compris ceux disputés après la date du combat, le modèle intégrerait indirectement des performances futures, introduisant un biais temporel majeur.
Ce type de fuite d’information gonfle artificiellement les métriques de performance en validation, tout en produisant des modèles qui échouent dès qu’ils sont confrontés à de véritables prédictions hors échantillon.
ERREUR 2 : K-FOLD CROSS-VALIDATION ET TRAIN-TEST SPLIT ALÉATOIRE
Le même problème apparaît lors de l’utilisation de méthodes de validation classiques comme le k-fold cross-validation ou les train/test splits aléatoires. Appliquées à des données UFC couvrant plus d’une décennie, ces techniques mélangent combats passés et combats futurs, permettant au modèle de s’entraîner sur des patterns qui n’existaient pas encore à l’époque des combats testés.
Pour éviter ce biais, la validation est entièrement temporelle : aucun combat futur n’est utilisé pour prédire un combat passé, et l’évaluation est réalisée sur des saisons complètes strictement hors échantillon.
ERREUR 3 : NORMALISATION GLOBALE DES FEATURES
Un dernier biais, plus subtil, concerne la normalisation des variables. Normaliser l’ensemble des combats à partir de moyennes et d’écarts-types calculés sur toute la période 2012–2025 revient à injecter indirectement l’évolution future du sport dans les combats anciens.
Nous utilisons donc une normalisation temporelle : pour chaque combat, les statistiques de référence sont calculées uniquement à partir des données disponibles avant la date de l’événement.
METHODOLOGIE ET FONCTIONNEMENT
Comment le modèle analyse-t-il les combats ?
Chaque combattant est évalué selon cinq dimensions clés, générant plus de 500 features par combat. L’objectif n’est pas d’attribuer un niveau global abstrait, mais d’identifier les déséquilibres structurels susceptibles d’influencer un matchup donné.
PERFORMANCE TECHNIQUE
Le modèle analyse l’ensemble des dimensions techniques du combat.
• Le striking est évalué à travers la précision, le volume et l’impact, enrichis par des métriques dérivées (formes récentes, performance contre adversaires classés, efficacité relative)
• Le grappling / wrestling est mesuré via le taux de réussite des takedowns, les tentatives de soumission et le temps de contrôle au sol, avec une normalisation par le niveau des adversaires affrontés
• La défense est quantifiée de manière distincte, notamment via la striking defense, le takedown defense et la capacité à renverser des positions défavorables, afin de capturer les déséquilibres entre attaque et protection
• Le clinch, la distance, le ground, souvent sous-exploités dans les analyses classiques, sont aussi intégrés précisément
• Les performances sont analysées round par round afin d’estimer la capacité à maintenir l’output dans le temps, et d’en déduire un indice de cardio et de dégradation de performance
FORME RÉCENTE & MOMENTUM
Le modèle intègre une dimension temporelle visant à capter la dynamique actuelle d’un fighter.
Les performances des derniers combats sont pondérées à l’aide d’un Robust Exponential Decreasing Index (REDI, Moussa et al., 2019), qui applique une décroissance exponentielle aux combats anciens.
Cette approche permet de distinguer :
• Une progression
• Une régression
• Une stagnation des performances
Un fighter historiquement dominant mais en perte de vitesse récente sera pénalisé, tandis qu’un profil en pleine ascension sera valorisé. Cette analyse reflète la forme réelle du moment, et non un simple historique cumulé.
MATCHUP RELATIF
Le MMA n’est pas une question de niveau absolu, mais de compatibilité de styles.
Le modèle compare directement les forces et faiblesses des deux fighters afin d’identifier les edges tactiques spécifiques au matchup : interactions striking/grappling, vulnérabilités défensives, et asymétries structurelles.
Certains aspects de cette logique restent volontairement confidentiels dans ce document.
TRACK RECORD & EXPÉRIENCE
Tous les combats n’ont pas la même valeur. Le modèle intègre le niveau réel de la compétition affrontée.
Sont notamment pris en compte :
• La qualité des adversaires (UFC et hors UFC)
• L’évolution du ranking dans le temps
• Les performances spécifiques contre le top 5, 10, 15, 50 et 100
• L’expérience en main event, title fights et combats de 5 rounds
L’objectif est d’évaluer la capacité à performer sous pression, au plus haut niveau, et sur la durée.
ATTRIBUTS PHYSIQUES & CONTEXTE
Les facteurs physiques et contextuels ont un impact mesurable sur la performance.
Le modèle intègre les attributs physiques (âge, taille, allonge, poids), mais aussi :
• L’activité récente
• Les périodes d’inactivité (layoffs)
• Les effets cumulés des camps et des weight cuts
• Certains facteurs environnementaux (home advantage) lorsque pertinents.
Ces éléments non techniques sont quantifiés et intégrés au modèle, car ils influencent directement la performance en combat.
En résumé, le modèle ne cherche pas à attribuer un niveau moyen aux combattants, mais à identifier les déséquilibres structurels spécifiques à chaque matchup.
PERIMETRE ET DONNEES UTILISEES
Le modèle s’appuie exclusivement sur des données officielles, structurées et vérifiées.
Les sources exploitées sont les suivantes :
• Données détaillées par combat depuis l’UFC 1 (1993)
• Données de carrière complètes de l’ensemble des combattants, incluant les résultats globaux UFC et hors UFC
Certaines sources sont volontairement exclues afin de limiter les biais et toute forme de fuite d’information :
• Données issues des réseaux sociaux, interviews ou médias
• Cotes des bookmakers, écartées en raison de leur biais circulaire (elles intègrent déjà des anticipations similaires à celles du modèle)
Plusieurs types de combats sont exclus du périmètre d’analyse :
• Combats féminins, en raison d’un volume de données insuffisant et de dynamiques statistiques différentes de celles observées chez les hommes
• Combats opposant deux débutants UFC simultanés, pour lesquels l’historique exploitable est trop limité
• Combats présentant des données manquantes, à la fois sur les statistiques UFC et les données de carrière
Processus de prédiction
FEATURE ENGINEERING
Les statistiques brutes UFC sont insuffisantes pour capturer la réalité d’un combat.
Elles doivent être transformées en features informatives, capables de révéler des avantages tactiques réels.
Le modèle ne se contente pas d’utiliser des métriques isolées (striking accuracy, takedowns, control time), mais construit des features dérivées à forte valeur ajoutée, notamment :
• Ratios comparatifs entre les deux fighters (forces vs faiblesses)
• Features normalisées par division et niveau de compétition
• Features opponent-adjusted (pondérées par la qualité des adversaires affrontés)
• Features temporels de forme et de momentum
• Features contextuelles spécifiques au matchup
• Gestion des small samples par bayesian shrinkage
Ces transformations permettent de passer d’une comparaison de statistiques brutes à une lecture tactique du combat.
Résultat : plus de 500 features construites par combat, conçues à partir d’une compréhension métier du MMA, et non de simples transformations mathématiques génériques.
ENSEMBLE MODELING
Aucun algorithme de machine learning n’est optimal sur l’ensemble des situations possibles.
Chaque modèle possède ses biais, ses angles morts et ses points forts.
Le modèle repose donc sur une combinaison de cinq modèles complémentaires, afin de :
• Réduire la variance
• Limiter le sur-apprentissage
• Améliorer la robustesse et la calibration
Les modèles utilisés sont : XGBoost, LightGBM, CatBoost, Random Forest, NGBoost
Cette approche permet de tirer parti des forces spécifiques de chaque algorithme, tout en évitant une dépendance excessive à un seul modèle.
CALIBRATION
Une probabilité n’a de valeur que si elle est fidèle à la réalité. Une prédiction à 80 % est inutile si le fighter ne gagne que 60 % du temps.
Pendant et après l’entraînement des modèles, une étape dédiée de calibration est appliquée sur un ensemble de validation afin d’aligner les probabilités prédites avec les fréquences observées.
Brier Score obtenu : ~0.21, indiquant une bonne calibration (0.25 correspondant à un modèle aléatoire).
VALIDATION
Les performances du modèle sont évaluées exclusivement sur des combats non vus durant l’entraînement et les optimisations d’hyperparamètres.
La validation est réalisée en sur deux années strictement out-of-sample (2024–2025)
• Données d’entraînement : 2012–2023
• Données de test : 2024–2025
Résultats obtenus sur le modèle XGBoost :
• 68 % d’accuracy
• 73 % d’AUC
Les résultats précis du modèle d’ensemble restent confidentiels.
Forces du modèle
Les performances chiffrées ne suffisent pas à juger un modèle prédictif. Ce qui distingue ce modèle, c’est sa fiabilité opérationnelle et sa capacité à produire des décisions exploitables.
Quantitatif et objectif
Les prédictions reposent exclusivement sur l’analyse systématique de plusieurs milliers de combats depuis 2012. Aucune intuition subjective, aucun biais d’humeur ou d’opinion : chaque prédiction est le résultat d’un traitement statistique reproductible.
Probabilités calibrées
Les probabilités produites sont cohérentes avec les fréquences observées. Un fighter prédit à 70 % gagne effectivement ~70 % du temps (Brier Score : ~0.21). Le modèle est explicitement optimisé pour la calibration, et non pour l’accuracy brut uniquement.
Transparence des prédictions
Chaque prédiction est explicable. Le modèle identifie les facteurs clés contribuant au résultat et leur poids relatif. Il ne s’agit pas d’une boîte noire opaque.
Validation rigoureuse
Les performances sont mesurées sur deux années complètes de combats futurs (out-of-sample). Il ne s’agit pas d’une performance gonflée sur des données d’entraînement, mais d’une capacité prédictive réelle.
PERFORMANCE DE LA MODELISATION
Positionnement des performances
La prédiction de combats MMA fait l’objet de travaux depuis plus de dix ans. Les publications académiques rapportent souvent des performances autour de 58–64 % d’accuracy, mais beaucoup de modèles souffrent de biais méthodologiques (notamment temporels), qui peuvent surestimer la performance hors échantillon.
Dans un cadre opérationnel, un autre repère courant est la performance des favoris (odds) sur le long terme, généralement située autour de 62–66 % d’accuracy selon les périodes et les distributions de combats.
Dans ce contexte, le modèle présenté ici atteint, sur des données strictement out-of-sample (2024–2025) :
• 68 % d’accuracy
• 73 % d’AUC
• 0.21 de Brier Score
Les résultats présentés ci-dessous concernent un modèle XGBoost représentatif. Les performances détaillées de l’ensemble restent volontairement non détaillées dans ce document.

Les courbes ci-dessus illustrent à la fois la capacité de discrimination du modèle (ROC, Precision-Recall) et la fiabilité de ses probabilités (calibration), confirmant une performance stable en conditions hors échantillon.
| Métrique | Score | Description |
|---|---|---|
| Accuracy | 0.6800 | Prédictions correctes |
| Precision | 0.6805 | Fiabilité des prédictions positives |
| Recall | 0.6788 | Capacité à identifier les vrais gagnants |
| F1 score | 0.6797 | Équilibre Precision/Recall |
| AUC | 0.7296 | Discrimination victoire/défaite |
| Logloss | 0.6124 | Qualité des probabilités |
| Brier score | 0.2119 | Calibration |
Facteurs explicatifs de la performance
FEATURE ENGINEERING ORIENTE METIER
Les performances observées ne reposent pas sur un algorithme isolé, mais sur des choix structurants en matière de représentation des données et de modélisation.
La majorité des travaux académiques s’appuient sur 20 à 80 variables, souvent issues directement des statistiques UFC.
À l’inverse, ce modèle repose sur plus de 500 features par combat, construites pour refléter les déséquilibres tactiques réels observés en MMA :
• Features ajustées par le niveau des adversaires
• Ratios comparatifs spécifiques au matchup
• Indicateurs temporels de forme et de momentum (REDI)
• Normalisation temporelle par division et contexte de combat
Cette richesse de représentation permet de capturer des patterns invisibles dans les statistiques brutes, et constitue l’un des principaux leviers de performance du modèle.
ENSEMBLE MODELING ET ROBUSTESSE
Plutôt que de s’appuyer sur un algorithme unique, le modèle combine cinq modèles complémentaires.
Cette approche permet de réduire la variance, d’améliorer la généralisation, et d’obtenir des probabilités plus stables et mieux calibrées.
Les prédictions sont combinées par soft voting pondéré, avec des poids optimisés par validation croisée temporelle.
L’objectif n’est pas seulement la performance brute, mais la fiabilité opérationnelle des prédictions.
CONVERGENCE ENTRE EXPERTISE ML ET EXPERTISE MMA
La principale différenciation du modèle ne réside pas uniquement dans l’algorithme, mais dans la conception des features et des hypothèses de modélisation.
• Les travaux académiques privilégient la rigueur statistique, mais peinent à intégrer les subtilités tactiques du MMA.
• Les bookmakers disposent de données riches et des traders experts, mais sont contraints par des logiques de marché et de gestion du risque propres à leur activité.
• Les coaches maîtrisent l’analyse technique, sans pouvoir la systématiser à grande échelle.
Ce modèle se situe à l’intersection de ces trois mondes :
• Expertise avancée en machine learning
• Connaissance approfondie du MMA
• Pratique personnelle du sport, permettant une compréhension physique et tactique du combat
Cette convergence permet de concevoir des features alignées avec la réalité du combat, et non de simples abstractions statistiques.
LES MATCHUPS DE LEGENDE
COMMENT LIRE LES ANALYSES
Le graphique radar compare les deux fighters sur 25 dimensions clés, normalisées par rapport à la division avant la date de l’événement.
Le cercle gris hachuré représente la médiane de la catégorie, servant de point de référence.
Il s’agit d’une analyse descriptive, dont l’objectif est d’identifier les zones de domination structurelle et les avantages contextuels de chaque fighter.
| Variable | Catégorie | Définition |
|---|---|---|
| TD Defense | Grappling | % de takedowns adverses défendus |
| Ctrl Absorbed/Min | Grappling | Secondes par minute passées sous contrôle adverse |
| Reversals/15min | Grappling | Nombre de renversements par 15 minutes |
| Control/15min | Grappling | Secondes de contrôle au sol par 15 minutes |
| Ground Domination | Grappling | Indice synthétique de domination au sol |
| TD/15min | Grappling | Takedowns réussis par 15 minutes |
| Sub Att/15min | Grappling | Tentatives de soumission par 15 minutes |
| Sub Rate | General | Pourcentage de victoires par soumission |
| Delta Rank 3y | General | Évolution du classement sur les 3 dernières années |
| Ranking Points | General | Score composite de classement |
| Win Rate | General | Taux de victoires en carrière |
| Nb Fights | General | Nombre total de combats |
| Age | General | Âge du combattant au moment du combat |
| Height | General | Taille en centimètres |
| Reach | General | Allonge en centimètres |
| KO Rate | General | Pourcentage de victoires par KO ou TKO |
| KD/15min | Striking | Knockdowns infligés par 15 minutes |
| Strike/Min | Striking | Coups significatifs portés par minute |
| Strike Acc | Striking | Pourcentage de coups significatifs réussis |
| Strike Domination | Striking | Indice synthétique de domination en striking |
| Ratio Clinch | Striking | Proportion de coups portés au clinch |
| Ratio Ground | Striking | Proportion de coups portés au sol |
| Ratio Distance | Striking | Proportion de coups portés à distance |
| Strike Defense | Striking | Pourcentage de coups adverses évités |
| Absorbed/Min | Striking | Coups significatifs encaissés par minute |
Pour assurer une interprétation cohérente du graphique radar, certaines variables ont été réorientées lors de la normalisation afin que l’éloignement du centre traduise toujours une performance plus favorable. C’est notamment le cas pour l’âge ou les coups absorbés par minute, où une valeur plus faible est considérée comme plus avantageuse.
Le module d’explicabilité (SHAP) décompose la prédiction finale en contributions individuelles.
Au lieu de produire une probabilité brute, le modèle identifie précisément quels facteurs influencent la prédiction, dans quel sens et avec quelle intensité (grappling, âge, striking, dynamique récente, etc.).
Lecture du graphique :
Les barres roses représentent les facteurs qui augmentent la probabilité de victoire du premier combattant.
Les barres bleues représentent les facteurs qui favorisent le second combattant. Chaque barre correspond à l’impact marginal d’un facteur sur la probabilité finale.
Pour des raisons de confidentialité, le détail précis des variables utilisées n’est pas communiqué.
Khabib Nurmagomedov (2020) vs Islam Makhachev (2025)
Depuis qu’Islam Makhachev a remporté le titre des lightweights (-70 kg) en 2022, une question obsède la communauté MMA : le disciple a-t-il dépassé le maître ?
Khabib Nurmagomedov (prime lightweight 2020), l’invaincu (29-0), qui a terrorisé la division pendant des années avec sa domination implacable au sol. Jamais mis en difficulté en championnat. Une domination méthodique, sans merci, même si moins spectaculaire en termes de finitions que certains champions.
Islam Makhachev (prime lightweight 2025), son protégé, désormais champion et considéré par beaucoup comme une version « améliorée » de Khabib : meilleur striker, plus de soumissions, tout aussi dominant au grappling.
Les deux hommes sont plus que coach et élève. Ils sont comme deux frères, entraînés ensemble depuis l’enfance par le légendaire et regretté Abdulmanap Nurmagomedov, père de Khabib et architecte du système de grappling daghestanais qui domine aujourd’hui le MMA mondial.
Ce lien indéfectible rend le débat d’autant plus fascinant : comment comparer deux produits du même moule, forgés par le même entraineur ?
Le consensus populaire penche pour Islam. « Plus complet », « plus moderne », « Khabib 2.0 ». Sur les forums, les analystes et même certains fighters affirment qu’Islam battrait Khabib aujourd’hui.
Le modèle dit le contraire : 62 % de chance de victoire pour Khabib

ZONE ORANGE (KHABIB) : DOMINATION EN GRAPPLING
• Ground Domination (40.47 vs 5.28)
L’écart le plus spectaculaire du matchup. Khabib possède un indice de ground domination de 40.47 contre 5.28 pour Islam.
Cette métrique composite capture la qualité de la domination au sol : ground and pound, avancement de position, maintien de contrôle sous pression, capacité à ne pas subir d’inversion de position.
Khabib ne se contentait pas de contrôler au sol, il punissait. Son sol était dévastateur, transformant chaque takedown en calvaire pour l’adversaire. Islam contrôle excellemment, mais sans la même intensité oppressante.
• Control/15min (510 vs 430 secondes)
8 minutes 30 vs 7 minutes 10 de contrôle par combat de 15 minutes. Khabib maintenait ses adversaires cloués 1 minute 20 de plus par combat.
Cette différence de 80 secondes reflète une capacité supérieure à imposer son rythme et à maintenir des positions dominantes malgré les tentatives d’échappement.
• TD/15min (5.35 vs 3.19)
Khabib réussissait 5.35 takedowns par 15 minutes contre 3.19 pour Islam. Cette pression incessante ne laissait aucun répit à l’adversaire.
Khabib était plus actif en takedown car il avait un striking moins efficient qu’Islam.
• Ctrl Absorbed/Min : 0.84 vs 5.43 secondes
Statistique la plus révélatrice de la domination absolue de Khabib : il n’absorbait que 0.84 seconde de contrôle adverse par minute de combat. Khabib était rarement contrôlé au sol par ses adversaires.
Islam, malgré son excellence, absorbe 5.43 secondes de contrôle par minute, soit 6.5 fois plus que Khabib. Cette différence colossale révèle une vérité : Khabib était quasiment impossible à contrôler en grappling, tandis qu’Islam, bien que dominant, peut être contenu par des combattants élites (Volkanovski a réussi quelques moments de contrôle).
ZONE BLEUE (ISLAM) : MODERNITE TECHNIQUE
• Strike Accuracy (60% vs 50%)
Islam est un meilleur striker technique. 60% de précision contre 50% pour Khabib. Il place mieux ses coups, gaspille moins d’énergie, et peut gagner des rounds debout, ce que Khabib faisait rarement.
• Ratio Distance (56% vs 40%)
Islam porte 56% de ses coups à distance contre 40% pour Khabib. Cela reflète sa meilleure capacité à combattre debout et à maintenir la distance. Khabib, lui, portait 56% de ses coups au sol (Ratio Ground) contre seulement 24% pour Islam.
Cette différence est cruciale : Khabib était un grappler pur qui cherchait le sol immédiatement. Islam est plus hybride, capable de s’adapter selon le matchup.
• TD Defense (91% vs 85%)
Islam défend mieux les takedowns (91% vs 85%). Dans un combat normal, cet avantage serait significatif. Mais contre Khabib qui réussit 5.35 TD/15min avec une pression cage implacable, cette différence risque d’être insuffisante.
• Sub Att/15min (1.06 vs 0.73) et Sub Rate (42% vs 36%)
Islam cherche plus activement les soumissions (1.06 tentatives par combat vs 0.73) et a un meilleur taux de finition par soumission (42% vs 36%).
C’est une des armes principales d’Islam dans ce matchup : s’il ne peut pas battre Khabib en contrôle, il peut tenter de le soumettre.

Le graphique SHAP décompose la prédiction finale (62.1 % Khabib) en contributions individuelles : chaque barre représente l’impact marginal d’un facteur sur la probabilité, dans un sens ou dans l’autre.
L’objectif n’est pas de « prouver » une vérité, mais d’identifier quels blocs de performance structurent la prédiction (grappling, striking, attributs, dynamique récente, etc.). Pour des raisons de confidentialité, le détail précis des variables internes n’est pas communiqué.
Dans ce matchup, la domination au sol ressort comme l’un des contributeurs principaux : l’écart sur l’indice de Ground Domination (40.47 vs 5.28), combiné à l’avantage sur le contrôle et le volume de takedowns, pèse fortement dans la balance. S’y ajoutent des facteurs de contexte (profil physique et période de référence), et une pression globale qui se traduit par des séquences de contrôle plus longues et plus oppressantes.
En face, Islam récupère des contributions positives liées à sa technicité debout, à sa capacité à maintenir la distance, à une activité récente continue au plus haut niveau, ainsi qu’à un grappling offensif orienté finition (volume et taux de soumissions). Ces éléments offrent à Islam des chemins de victoire plausibles : limiter les séquences de contrôle ou convertir une transition en soumission.
VERDICT
Khabib favori clair (62.1%), mais Islam reste dangereux (37.9%).
Ce n’est pas un écrasement. 62-38 signifie que si ce combat avait lieu 100 fois, Khabib gagnerait 62 fois, Islam 38 fois. Plus d’un tiers de chances pour Islam.
Le consensus voyant Islam comme « Khabib 2.0 amélioré » sous-estime l’oppression que Khabib exerçait au sol. Les compétences d’Islam au striking (réels et mesurables) ne compensent pas cet écart dans un combat qui se jouerait majoritairement au grappling. Les données penchent pour Khabib.
Conor McGregor (2015) vs Ilia Topuria (2024)
Deux strikers dévastateurs. Deux champions featherweight (-66 kg) dans leurs primes respectifs. Neuf ans d’évolution du MMA entre eux.
Conor McGregor (prime featherweight 2015), le phénomène irlandais qui a révolutionné le sport. L’homme qui a mis KO José Aldo, invincible pendant 10 ans, en 13 secondes chrono. Il deviendra plus tard le premier double champion simultané de l’histoire UFC. 89% de taux de KO à ce moment de sa carrière. Une striking qui a mis au sol les plus grands. Une aura psychologique et un trash talk capables de détruire mentalement ses adversaires avant même d’entrer dans l’octogone. Conor ne combattait pas juste physiquement, il gagnait dans la tête de ses adversaires des semaines avant le combat.
Ilia Topuria (prime featherweight 2024), le prodige hispano-géorgien qui représente la nouvelle génération. Né en Allemagne, formé en Géorgie, développé en Espagne, invaincu partout. L’homme qui a mis fin au règne d’Alexander Volkanovski, le GOAT featherweight, par KO au deuxième round. Un grappling défensif d’élite (93% takedown defense) couplé à l’une des plus belles boxes de l’UFC. Il annonce ses victoires, il entre, il combat, il gagne. L’efficacité pure.
Le débat divise la communauté. Les fans de Conor invoquent son timing légendaire, sa capacité à finir n’importe qui d’un seul coup, son avantage physique (13 cm d’allonge). Les fans de Topuria soulignent son invincibilité, sa complétude technique, sa défense solide, sa boxe efficiente qui lui ont permis de dominer Volkanovski, puis plus tard Holloway et Oliveira en lightweight.
Le consensus est incertain. Certains voient Conor d’autres parient sur Topuria.
Le modèle prédit : 56.1% de chance de victoire pour Conor.

ZONE ORANGE (CONOR) : TIMING ET DEVASTATION
• Reach (188 vs 175 cm) + Height (175 vs 170 cm)
Conor possède un avantage physique significatif : 13 cm d’allonge supplémentaire et 5 cm de taille. À 66 kg, où chaque centimètre compte, cet avantage lui permet de contrôler la distance et de toucher sans être touché. Topuria devra rentrer dans la pocket, exactement là où Conor est le plus dangereux.
• KO Rate (89% vs 29%) + KD/15min (1.93 vs 0.97)
L’écart de finishing power est massif. Conor terminait 89% de ses combats featherweight par KO contre 29% pour Topuria. Il mettait 1.93 knockdowns par 15 minutes contre 0.97 pour Topuria, le double. Ses poings étaient des canons. Un seul timing parfait pouvait tout changer. Demandez à José Aldo.
• Strike/Min (5.44 vs 4.44) + Strike Domination (1.80 vs 1.46)
Conor frappait plus (5.44 coups significatifs par minute vs 4.44) et dominait davantage au striking (score composite). Son volume et sa pression offensive étaient supérieurs. Dans un combat de strikers où les deux peuvent finir, celui qui impose le rythme et le volume a un avantage décisif.
• Nb Fights (21 vs 15) + Expérience grands combats
Conor avait vingt et un combats UFC en prime contre quinze pour Topuria. Plus important : Conor avait affronté et dominé José Aldo (invaincu 10 ans, GOAT FW de l’époque), Chad Mendes (wrestler d’élite), Dustin Poirier, Max Holloway. Des tueurs. Sous pression médiatique maximale. Topuria a battu Volkanovski (immense), mais son échantillon de grands combats reste plus limité à ce moment de sa carrière.
ZONE BLEUE (TOPURIA) : ARSENAL COMPLET
• TD Defense (93% vs 67%) + Ground Domination (3.64 vs 1.64)
L’avantage grappling de Topuria est net. 93% de takedown defense contre 67% pour Conor, un écart considérable. Si le combat va au sol, Topuria possède un indice de ground domination de 3.64 contre seulement 1.64 pour Conor.
• Sub Att/15min (1.46 vs 0.00) + Sub Rate (57% vs 6%)
Topuria cherche activement les soumissions (1.46 tentatives par combat vs 0.00 pour Conor) avec un taux de soumission de 57% contre 6%. Si le combat va au sol, Topuria est létal. C’est une asymétrie importante : Topuria peut gagner debout ou au sol.
• Strike Accuracy (46% vs 44%) + KD/15min (0.97 vs 1.93)
Topuria frappe légèrement plus précis (46% vs 44%) avec une boxe technique supérieure. Il provoquait 0.97 knockdowns/15min. Moins explosif que Conor (1.93 KD/15min), mais tout aussi dangereux : son KO de Volkanovski au R2 a prouvé qu’il possède le one-shot power. Sa boxe, déjà excellente en featherweight, est devenue dévastatrice en lightweight (KO Holloway, Oliveira). En 2024 featherweight, elle était déjà redoutable, précision, timing, puissance progressive.
• Win Rate (100% vs 90%) + Invincibilité
Topuria est invaincu en MMA contre 90% de victoires pour Conor en prime featherweight. Il n’a jamais perdu. Jamais été en danger réel. Il arrive en pleine confiance, momentum maximal, ayant battu le GOAT de la division.

Le graphique SHAP décompose la prédiction finale (56.1% Conor) en contributions individuelles.
L’avantage physique (allonge, taille) ressort comme un contributeur majeur pour Conor, combiné à son taux de KO exceptionnel et sa capacité à générer des knockdowns. Sa domination striking via volume et pression offensive pèse également. Ces facteurs matérialisent son chemin de victoire principal : contrôler la distance avec son allonge, toucher propre, finir par KO rounds 1-2.
En face, Topuria récupère des contributions liées à sa précision striking légèrement supérieure, son KO power démontré (Volkanovski R2), sa défense takedown exceptionnelle, son grappling offensif orienté soumission, son invincibilité, et sa meilleure défense globale. Ces éléments offrent des chemins de victoire plausibles : battre Conor au striking via précision et timing, survivre aux deux premiers rounds explosifs puis exploiter sa fatigue late rounds, ou chercher le takedown/soumission si opportunité se présente.
La somme des facteurs favorisant Conor dépasse légèrement ceux favorisant Topuria, expliquant la prédiction 56-44, le combat le plus serré de la série.
VERDICT
Conor légèrement favori (56.1%), mais Topuria très dangereux (43.9%).
Ce n’est pas une domination. 56-44 signifie que si ce combat avait lieu 100 fois, Conor gagnerait 56 fois, Topuria 44 fois.
C’est du pile ou face avec léger avantage Conor. Le facteur poids : Cette analyse compare leurs primes respectives à 66 kg. Si ce combat avait lieu à 70 kg (lightweight), la donne changerait probablement. Topuria a depuis déplacé sa carrière vers le lightweight, où sa boxe est devenue encore plus létale, il frappe plus fort et plus propre à 70 kg, comme en témoignent ses performances récentes.
À l’inverse, Conor à 66 kg était au sommet de son explosivité et sa puissance. À 70 kg, l’équation serait différente.
Georges St-Pierre (2013) vs Kamaru Usman (2022)
Le débat ultime de la division : qui est le GOAT welterweight ?
Georges St-Pierre (prime welterweight 2013), la légende canadienne. Vingt-six combats MMA, 26 victoires, 2 défaites (toutes deux vengées). Champion pendant neuf ans. L’un des fighters les plus complets de l’histoire du MMA : wrestling d’élite, jab légendaire, striking précis, superman punch, soumissions dangereuses. GSP n’avait pas de faiblesse. Il dominait partout, contre tout le monde. Son prime culmine en 2013 après sa victoire sur Johny Hendricks, un combat controversé, mais qui démontre sa capacité à gagner même dans l’adversité.
Kamaru Usman (prime welterweight 2022), “The Nigerian Nightmare”. Champion pendant cinq ans. Quinze victoires consécutives en welterweight à l’UFC. Une pression physique suffocante, un cardio inhumain, une défense de takedown parfaite (100%). Usman représente l’évolution moderne du MMA : athlétisme supérieur, volume de frappe intense, wrestling défensif impénétrable. Il a dominé Woodley, Masvidal (x2), Covington (x2), Burns, Dos Anjos, Maia, Strickland, tous les meilleurs de sa génération.
Le débat divise. Les puristes voient GSP comme le plus complet techniquement, le plus intelligent tactiquement, le plus clutch sous pression. Les modernistes voient Usman comme plus athlétique, plus puissant, défensivement supérieur en lutte et grappling.
Le modèle prédit : 61.8% de chance de victoire pour GSP.

ZONE ORANGE (GSP) : MAÎTRISE TOTALE
• Strike Defense (75% vs 59%)
L’avantage défensif le plus marqué du matchup. GSP possédait une striking defense de 75% contre 59% pour Usman, un écart considérable de 16 points. GSP était l’un des fighters les plus difficiles à toucher proprement de l’histoire UFC. Son mouvement, son jab, son fight IQ lui permettaient d’éviter les coups tout en contrôlant la distance. Usman, malgré sa domination, était plus hittable.
• Strike Domination (3.00 vs 1.80)
GSP dominait au striking avec une statistique de 3.00 contre 1.80 pour Usman. Cette différence reflète une efficacité supérieure : GSP touchait plus propre, encaissait moins, contrôlait mieux les échanges. Son jab était une arme de contrôle légendaire, il gérait la distance, cassait le rythme, accumulait les points.
• TD/15min (4.16 vs 3.00) + Control/15min (462 vs 425 secondes)
GSP réussissait plus de takedowns (4.16 vs 3.00 par 15 minutes) et maintenait légèrement plus de contrôle au sol (462 vs 425 secondes, soit 7 minutes 42 vs 7 minutes 06). Son wrestling offensif était supérieur en volume.
• Sub Att/15min (1.09 vs 0.12) + Sub Rate (21% vs 5%)
GSP était bien plus dangereux en soumission. 1.09 tentatives par combat contre 0.12 pour Usman, et 21% de victoires par soumission contre 5%. Si le combat va au sol, GSP possède une dimension offensive qu’Usman n’a jamais développée. Usman contrôle au sol, mais ne finit pas. GSP cherchait activement.
ZONE BLEUE (USMAN) : PRESSION MODERNE
• Ground Domination (23.97 vs 11.26)
L’avantage le plus net d’Usman. Son indice de ground domination (23.97) surpasse largement celui de GSP (11.26). Usman au sol était oppressant : pression physique constante, ground and pound lourd, contrôle étouffant. Usman écrasait physiquement.
• TD Defense (100% vs 88%) + Ctrl Absorbed/Min (1.18 vs 2.74 secondes)
Usman possédait une takedown defense parfaite (100%) contre 88% pour GSP. Plus important encore : Usman absorbait deux fois moins de contrôle adverse au sol (1.18 vs 2.74 secondes par minute). Il était difficile à takedown et difficile à maintenir. GSP devra imposer son wrestling offensif contre une muraille défensive qui se relève immédiatement.
• Strike/Min (4.66 vs 3.80) + KO Rate (45% vs 33%)
Usman frappait plus (4.66 coups/min vs 3.80) et finissait plus par KO (45% vs 33%). Son volume offensif était supérieur, sa puissance également. Il a mis KO Masvidal et Burns. Usman pouvait gagner par domination ou par finish.

Le graphique SHAP décompose la prédiction finale (61.8% GSP) en contributions individuelles.
L’avantage défensif de GSP en striking ressort comme un contributeur majeur, combiné à son fight IQ supérieur, sa précision technique, et sa dangerosité en soumission. Sa capacité à éviter les coups (75% defense) tout en dominant les échanges matérialise son chemin de victoire principal : contrôler la distance via le jab, mélanger takedowns et striking, gagner aux points ou chercher soumission late rounds.
En face, Usman récupère des contributions liées à sa domination au sol supérieure, sa défense de takedown parfaite, son volume de frappe et sa puissance. Ces éléments offrent des chemins de victoire plausibles : imposer sa pression physique, étouffer GSP contre la cage, l’user late rounds, ou chercher le finish via ground and pound ou striking puissant. La somme des facteurs favorisant GSP dépasse nettement ceux favorisant Usman, expliquant la prédiction 62-38. Mais Usman reste dangereux via sa pression et son athlétisme.
VERDICT
GSP favori clair (61.8%), mais Usman reste dangereux (38.2%). Ce n’est pas un écrasement. 62-38 signifie que si ce combat avait lieu 100 fois, GSP gagnerait 62 fois, Usman 38 fois. Presque 40% de chances pour Usman.
L’avantage de GSP repose sur sa maîtrise technique, sa striking defense supérieure, sa domination aux échanges, et sa dangerosité en soumission. Son fight IQ légendaire lui permet d’exploiter les failles d’Usman : hittable au striking (Edwards l’a prouvé plus tard), et vulnérable aux transitions grappling/striking intelligentes.
Usman possède les outils pour renverser : takedown defense parfaite, domination au sol écrasante (indice 23.97), volume et puissance offensifs supérieurs.
Si le combat devient une guerre d’attrition physique, Usman a l’avantage. S’il peut imposer sa pression contre la cage et user GSP, il peut gagner late rounds ou finish.
Jon Jones (2020) vs Alex Pereira (2024)
Le matchup le plus polarisant de notre série. D’un côté, le plus grand talent de l’histoire du MMA. De l’autre, le striker le plus dévastateur de la division actuelle. Deux philosophies opposées : la domination totale contre la finition explosive.
Jon Jones (prime light heavyweight 2020). Champion light à 23 ans, le vice incarné dans la cage. Invaincu pendant plus d’une décennie (seule « défaite » par disqualification pour coups de coude illégaux). Un combattant d’une complétude rare : wrestling d’élite, clinch étouffant, striking créatif, soumissions dangereuses, fight IQ hors normes. Jones ne cherchait pas simplement à battre ses adversaires, mais à les neutraliser systématiquement. Sa capacité à imposer le combat là où il l’avait décidé, combinée à une allonge exceptionnelle de 213 cm, en a fait un problème insoluble pour toute une génération. Mais Jones reste une figure controversée. Il traîne un lourd passif hors octogone (affaires judiciaires, violations antidopage) qui divise la communauté MMA.
Alex Pereira (prime light heavyweight 2024). Le tueur brésilien. Champion dans deux catégories de poids différentes. Ancien champion du Glory Kickboxing. 82% de taux de KO UFC. Il a mis KO Adesanya (x2), Prochazka (x2), Hill. Pereira ne domine pas, il exécute. Left hook légendaire, timing parfait, puissance dévastatrice. Une puissance brute qui transforme chaque échange debout en menace immédiate. Son parcours, de l’alcoolisme à un double titre UFC, porté par une rivalité hors norme avec Adesanya à travers deux sports, inspire et humanise le tueur froid que l’on voit dans l’octogone.
Le débat divise radicalement. Les puristes voient Jones détruire Pereira en grappling, l’user en clinch, le soumettre ou gagner décision facile. Les fans de Pereira croient au one-shot KO. « Jones n’a jamais affronté quelqu’un qui frappe aussi fort ».
Le modèle prédit : 76.4% de chance de victoire pour Jones.

ZONE ORANGE (JONES) : DOMINATION TOTALE
• Reach (213 vs 201 cm) + Height (193 vs 193 cm)
Jones possède 12 cm d’allonge supplémentaire, un avantage colossal. Cette allonge lui permet de contrôler la distance, d’attaquer sans risque, et de frustrer les strikers qui doivent rentrer dans sa zone pour toucher. Contre Pereira qui a besoin de rentrer pour son left hook dévastateur, cet avantage est décisif. Jones peut piquer de l’extérieur avec ses oblique kicks, tout en restant hors de portée du danger.
• Ground Domination (11.88 vs 0.09) + Control/15min (231 vs 24 secondes)
L’écart le plus spectaculaire de tous nos matchups. Jones possède un indice de ground domination de 11.88 contre 0.09 pour Pereira, un ratio de 132:1. Au sol, Jones contrôlait 231 secondes par combat (3 minutes 51) contre 24 secondes pour Pereira. Si ce combat va au sol, c’est terminé. Pereira n’a aucune arme là-bas. Jones peut le soumettre, le ground and pound, ou simplement l’user pendant 25 minutes.
• Ctrl Absorbed/Min (1.30 vs 17.49 secondes)
Jones absorbait 1.30 seconde de contrôle adverse par minute. Pereira absorbe 17.49 secondes, treize fois plus. Pereira peut être contrôlé au sol, maintenu, usé. Jones était quasiment impossible à contrôler. Cette asymétrie est forte.
• Strike Defense (66% vs 51%) + Absorbed/Min (1.92 vs 3.51)
Jones défendait mieux (66% vs 51%) et encaissait presque deux fois moins de coups (1.92 vs 3.51 par minute). Sa défense, combinée à son allonge, le rendait difficile à toucher proprement. Contre le striking créatif de Jones (oblique kicks, spinning elbows, clinch), Pereira devra encaisser pour rentrer.
ZONE BLEUE (POATAN) : LA PUISSANCE PURE
• KO Rate (82% vs 40%) + KD/15min (1.04 vs 0.20)
L’avantage explosif de Pereira. 82% de finitions par KO contre 40% pour Jones. 1.04 knockdowns par 15 minutes contre 0.20 pour Jones, cinq fois plus. Pereira possède une puissance de frappe que Jones n’a jamais eue. Un seul left hook bien placé peut changer l’histoire. Demandez à Hill.
• Strike/Min (5.23 vs 4.18) + Strike Acc (64% vs 58%)
Pereira frappe plus (5.23 coups/min vs 4.18) et plus précis (64% vs 58%). Son striking technique est supérieur, normal pour un champion de kickboxing. Chaque coup qu’il porte à l’intention de finir. Pereira frappe pour tuer.
• Ratio Distance (79% vs 61%)
Pereira porte 79% de ses coups à distance contre 61% pour Jones. C’est là qu’il est le plus dangereux, en kickboxing range, où il peut utiliser ses low kicks et son left hook dévastateur. Jones portait 20% de ses coups au sol et 19% au clinch, zones où Pereira n’a que peu de réponse.

Le graphique SHAP décompose la prédiction finale (76.4% Jones) en contributions individuelles.
L’avantage physique de Jones (allonge) ressort comme un contributeur majeur, combiné à son écart colossal au grappling (ground domination, contrôle, takedowns), sa meilleure défense globale, et son expérience supérieure. Ces facteurs matérialisent son chemin de victoire principal : contrôler la distance avec l’allonge, piquer de l’extérieur, chercher le clinch, takedown, dominer au sol pendant 25 minutes ou chercher soumission.
En face, Pereira récupère toutes ses contributions de sa puissance explosive (KO rate, knockdowns), son volume et précision striking supérieurs, et son statut de spécialiste élite. Ces éléments offrent un chemin de victoire unique : survivre aux tentatives de grappling early rounds, toucher Jones propre avec le left hook, finish par KO.
La somme des facteurs favorisant Jones dépasse massivement ceux favorisant Pereira, expliquant la prédiction 76-24. Mais le one-shot power de Pereira empêche toute certitude absolue.
VERDICT
Jones large favori (76.4%), mais Pereira garde l’arme du KO (23.6%).
Ce n’est pas un combat équilibré sur le papier. 76-24 signifie que si ce combat avait lieu 100 fois, Jones gagnerait 76 fois, Pereira 24 fois. Pourtant, ces 24 fois sont réelles ? et toutes passent probablement par le même scénario : un left hook parfait qui change tout.
L’avantage de Jones est écrasant dans toutes les dimensions sauf une : il peut dominer au grappling (ground domination 11.88 vs 0.09), contrôler au clinch, piquer de l’extérieur avec son allonge (213 vs 201 cm), défendre mieux (66% vs 51%), et imposer son rythme pendant 25 minutes. Pereira aura difficilement des réponses au sol,il n’a aucune expérience contre un grappler de ce calibre.
Mais Pereira possède la seule arme qui compte vraiment : le one-shot power. 82% de KO rate. Left hook dévastateur. Timing parfait. Il a mis KO Adesanya, un des strikers les plus élitistes de l’histoire UFC. Il a exécuté Prochazka (x2) avec une facilité déconcertante. Jones n’a jamais été mis KO, mais il n’a jamais affronté quelqu’un qui frappe aussi fort que Pereira.
CONCLUSION
Ces combats n’existeront jamais. Mais les données existent, et elles racontent une histoire moins romantique que les débats, mais souvent plus vraie. Quand on enlève la nostalgie, les highlights et les narratifs, il reste des déséquilibres mesurables : contrôle au sol, défense, distance, volume, finishing power, et capacité à imposer son plan A sans subir le plan B.
Le modèle ne promet pas l’infaillibilité. Il propose mieux : une méthode temporellement propre, calibrée, et explicable. Il ne dit pas « qui gagnera », il dit « dans quels scénarios, et à quelle fréquence ». C’est là que la prédiction devient intéressante : elle transforme une opinion en hypothèse.
Le MMA est chaotique à l’échelle d’un combat, mais moins chaotique à l’échelle d’une carrière, et encore moins quand on compare des styles, des attributs et des trajectoires avec les bons outils. Les « matchups de légende » resteront des fantasmes. Mais, ils ne sont pas impossibles à analyser.
Références
Moussa, I., Leroy, A., Sauliere, G., Schipman, J., Toussaint, J. F., & Sedeaud, A. (2019). Robust Exponential Decreasing Index (REDI): adaptive and robust method for computing cumulated workload. BMJ Open Sport & Exercise Medicine, 5(1).



