Trouver les meilleurs joueurs des Drafts NBA 2015-2018 avec IA

J’ai toujours été intéressé par le suivi de la progression de jeunes joueurs. Dans les sports actuels, et plus particulièrement dans les sports américains comme la NBA, il est vraiment important de repérer les jeunes joueurs pour la Draft annuelle.

La Draft de la NBA a lieu chaque année à la fin de la saison régulière et les équipes peuvent y sélectionner de jeunes joueurs issus de la NCAA (Ligue Universitaire) et du monde entier. Ce processus est utilisé pour introduire de nouveaux joueurs dans la ligue et équilibrer les franchises : la pire équipe de la saison a plus de chances de choisir la première. Ainsi, logiquement, les meilleurs joueurs seront choisis en premières positions. Cependant, être choisi en premier ne signifie pas forcément que le joueur aura une grande carrière : Anthony Bennett a été le premier choix de la draft NBA 2013 (choisi par les Cleveland Cavaliers) mais n’a jamais réussi en NBA. Au contraire, certains joueurs ont été choisis plus tard et sont de bons joueurs : Isaiah Thomas (choix 60 en 2011) ou Draymond Green (choix 35 en 2012) par exemple.

Dans cet article, je me suis intéressé à trouver les meilleurs joueurs des Drafts NBA en fonction de leurs statistiques pendant leurs saisons de Rookie (1ère saison) et de Sophomore (2ème saison) en NBA. Pour chaque année depuis 2015, j’ai essayé de prédire les 9 meilleurs joueurs de chaque Draft : les joueurs qui seront les meilleurs 5 ans après leur arrivée dans la Ligue. Par exemple, je prévois les meilleurs joueurs en 2023 qui ont été draftés 5 ans plus tôt, donc en 2018. J’ai choisi 5 ans car cela permet d’avoir une bonne vision du à la fois du potentiel et de la régularité.

L’objectif est d’utiliser un algorithme capable d’évaluer la progression entre la première et la deuxième année pour prédire si le joueur jouera encore dans la ligue dans 5 ans mais aussi et surtout s’il sera un joueur de haut niveau, un bon joueur ou un joueur moyen. J’ai donc recueilli les données suivantes sur NBA stats et Basketball-Reference pour tous les joueurs draftés entre 1996 et 2018 :

Pour années Rookie et Sophomore. PIE signifie Player Impact Estimate et sera la mesure utilisée pour prédire la qualité d’un joueur 5 ans après avoir été sélectionné.

Quelques visualisations

Avant d’entrer dans le vif du sujet, j’ai voulu dessiner quelques graphiques pour illustrer brièvement nos données.

Tout d’abord, voici les 10 premières universités qui ont envoyé des joueurs à la Draft et les 10 premières équipes qui ont le plus drafté au cours des 25 dernières années.

Les 76ers de Philadelphie apparaissent en premier avec leur “Trust the Process”, tandis que pour l’Université, les Kentucky Wildcats sont en première position avec quelques joueurs célèbres : DeMarcus Cousins, Anthony Davis, Karl-Anthony Towns ou Devin Booker.

Ensuite, j’ai voulu voir s’il y avait vraiment un lien entre le fait d’être choisi dans les premiers choix et le fait d’avoir un PIE élevé. J’ai tracé les graphiques suivants :

  • PIE en fonction du choix et des années après Draft : les choix 1 à 10 sont en tête quelles que soient les années. Pour les deux premières années (Rookie et Sophomore), cela semble assez mixte, alors qu’au bout de cinq ans on observe un classement relativement bien trié.
  • La moyenne des PIE pour chaque sélection en fonction des années : les joueurs sélectionnés entre 1 et 10 semblent bien meilleurs que les autres. Il est intéressant de noter que les joueurs du deuxième tour (picks 30-60) sont en moyenne meilleurs que les joueurs de la fin du premier tour (picks 21-29).
  • Les bons joueurs, quels que soient leurs picks, au fil du temps : la première chose à observer est que de nombreux joueurs draftés ne jouent pas plus de deux ans. A la fin, seuls les bons joueurs restent en NBA, il est donc logique de voir la partie verte (proportion de bons joueurs) augmenter au fil du temps. (Pour définir les bons joueurs, j’ai pris les joueurs avec un PIE supérieur à 8,5 pour l’année Rookie, supérieur à 10 pour l’année Sophomore et supérieur à 11 pour 5 ans dans la ligue).
  • Répartition des bons joueurs : les choix 1-10 représentent près de 50%. Comme nous l’avons déjà mentionné, après 5 ans, il y a plus de joueurs du 2e tour de sélection que de la fin du 1er tour. (Cela s’explique en partie par le fait qu’il y a 3 fois plus de joueurs pour les picks 30-60 que 21-29).

Pour compléter, j’ai dessiné les histogrammes de chaque groupe. Cela permet de vérifier que nos données ont une distribution gaussienne car une somme de gaussiennes indépendantes (ce qui est vrai ici) donne une gaussienne. De plus, nous pouvons confirmer que la plupart du temps, le niveau du joueur est lié avec la position à la Draft.

Le modèle

(Tous les détails mathématiques à la fin)

Je vous rappelle que le but du modèle est de prédire le niveau d’un joueur (son Player Impact Estimate plus précisément) 5 ans après avoir été drafté en fonction de ses statistiques en année Rookie et année Sophomore. Les meilleurs joueurs sont ceux qui ont un PIE supérieur à 15.

J’ai essayé de nombreux algorithmes d’apprentissage automatique pour la régression (arbre de décision, kNN, forêt aléatoire, bagging, boosting, régression linéaire, régression LASSO/Ridge et régression Elastic Net). Pour évaluer ces modèles, j’ai utilisé le coefficient R2 allant de 0 (mauvais) à 1 (bon) et le meilleur est la régression Elastic Net (R2 = 0,6 sur l’ensemble de test). J’ai entraîné le modèle et l’ai testé avec une validation croisée sur les joueurs draftés entre 1996 et 2013 et je l’ai testé une nouvelle fois sur la Draft 2014.

Pour cette dernière, les meilleurs joueurs sont Joël Embiid (choix 3), Nikola Jokic (choix 41) et Andrew Wiggins (choix 1). Les bons joueurs sont Bogdan Bogdanovic (choix 27), Zach LaVine (choix 13), Jabari Parker (choix 2), Dario Saric (choix 12), TJ Warren (choix 14) et Marcus Smart (choix 6).

Comme vous pouvez le voir, le modèle n’est pas si mauvais : Embiid et Jokic font sans aucun doute partie des meilleurs joueurs de la NBA aujourd’hui. A l’inverse, je pense qu’il y a de meilleurs joueurs que Dario Saric ou Jabari Parker si on les regarde aujourd’hui.

Les résultats

Maintenant que nous disposons d’un modèle assez performant, nous pouvons prédire les meilleurs et les bons joueurs des Drafts 2015 à 2018.

Tops : Karl Anthony Towns (choix 1), Devin Booker (choix 13), Kirstaps Porzingis (choix 4)

Bons : D’Angelo Russel (choix 2), Montrezl Harrell (choix 32), Jahlil Okafor (choix 3), Richaun Holmes (choix 37), Myles Turner (choix 11) et Norman Powell (choix 46)

 

Tops : Ben Simmons (choix 1), Brandon Ingram (choix 2), Domantas Sabonis (choix 11)

Bons : Jaylen Brown (choix 3), Jamal Murray (choix 7), Caris LeVert (choix 20), Buddy Hield (choix 6), Malcolm Brogdon (choix 36) et Ivica Zubac (choix 32)

Tops : Donovan Mitchell (pioche 13), John Collins (pioche 19), De’Aaron Fox (pioche 5)

Bons : Jayson Tatum (choix 3), Bam Adebayo (choix 14), Kyle Kuzma (choix 27), Lonzo Ball (choix 2), Lauri Markkanen (choix 7) et Jonathan Isaac (choix 6)

Tops : Luka Doncic (choix 3), Trae Young (choix 5), De’Andre Ayton (choix 1)

Bons : Shai Gilgeous-Alexander (choix 11), Mitchell Robinson (choix 36), Jaret Jackson Jr (choix 4), Collin Sexton (choix 8), Devonte’ Graham (choix 34) et Donte Divicenzo (choix 17)

Je dirais que tous les joueurs nommés ici sont déjà des joueurs de haut niveau ou de bons joueurs et peuvent encore s’améliorer, mais je suis assez surpris de certains : par exemple quand on voit le niveau de Jayson Tatum actuellement, difficile de ne pas l’imaginer Top joueur. De plus, il manque probablement des joueurs comme Pascal Siakam par exemple.

Les limites
  • Les joueurs sélectionnés qui ne jouent pas ou qui se blessent au cours des premières années sont pénalisés (Markelle Fultz par exemple)
  • Être drafté dans une équipe mal classée donne plus de minutes de jeu, ce qui signifie plus de minutes pour briller.
  • Le modèle ne tient pas compte des blessures : les blessures peuvent ralentir la progression du joueur ou même mettre fin à sa carrière.
  • Il est “assez facile” de prédire le niveau des joueurs après les avoir observés pendant deux ans dans la ligue (nous n’avons pas besoin de l’IA pour prédire que Doncic sera un joueur de haut niveau par exemple).
Détails mathématiques

Régression linéaire

En statistique, la régression linéaire est utilisée pour modéliser une variable cible (pour nous PIE) étant la relation entre une ou plusieurs variables (dans notre cas : minutes jouées, points marqués etc.). Elle est mathématiquement définie comme suit.

Nous devons estimer les Betas à l’aide de l’ensemble des données.

Elastic Net

Elastic Net est une méthode de régularisation qui utilise à la fois les régularisations L1 (LASSO) et L2 (Ridge) afin de “contrôler” les valeurs des paramètres Betas estimés. Les estimations sont définies comme suit.

(Argmin : valeur qui minimise la fonction)

L’avantage est que nous conservons les avantages des deux méthodes LASSO et Ridge :

  • Sélection des variables pertinentes
  • Groupes de variables corrélées

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *