Presentamos DRIP: nuestra evaluación diaria del desempeño individual en la NBA

Para la temporada 2021-22, presentaremos el modelo de rendimiento de jugador de equipo Stats Perform AI, que proyecta más/menos ofensivo, defensivo y general ajustado. La clasificación se actualiza diariamente.


Desde los primeros años de análisis de baloncesto, muchos han intentado condensar las estadísticas de los jugadores en métricas fácilmente digeribles, incluida la «calificación única para todos». Métricas como RAPM, BPMy rpm todos se han utilizado para describir el rendimiento general del jugador, o incluso para predecir el rendimiento futuro.

En los últimos años, estas medidas han aumentado rápidamente en número y alcance, tales como DPM OSCURO, JAIME, EPMy RAPTOR. Si bien las calificaciones todo en uno pueden simplificar demasiado los atributos de un jugador, son extremadamente poderosas para las evaluaciones de equipo, el ajuste de lesiones y una buena base para el valor general del jugador.

Ingrese las estadísticas de Perform GOTA. Como, «Russell Westbrook tiene GOTApero LeBron tiene aún más.

Nuestro enfoque es similar al de PIPM y DARKO DPM: tomamos puntajes de cuadro, jugada por jugada y datos de la lista, y pronosticamos la contribución de cada jugador a las clasificaciones ofensivas y defensivas de su equipo para la temporada regular. Pero en lugar de promediar estas estadísticas de entrada durante una sola temporada o carrera, ahora «presentamos» la estimación actual del «verdadero talento» de un jugador para cada estadística. Esta parte del modelo puede responder preguntas como «¿Cuál es el porcentaje actual de 2 puntos de Giannis?» o «¿Qué tan real es el salto de gol de Michael Porter Jr.?»

Así es como funciona:

Jugadores anteriores

Para los novatos, usamos atributos simples como la altura, el peso, la edad y el número de selección del draft para predecir el primer juego de la carrera de un jugador. Para hacer esto, construimos un modelo para reclutas anteriores en nuestro conjunto de datos y obtuvimos una estimación de «juego 1 ajustado» para cada estadística. Se ha realizado un trabajo cuidadoso para garantizar que estas proyecciones no se utilicen para desarrollar los modelos para el resto de las carreras de estos jugadores.

Características de la serie temporal

La mayoría de las calificaciones de los jugadores le informan las contribuciones de un jugador durante una sola temporada, o tal vez incluso varias temporadas. Esto causa dos problemas: primero, muchos jugadores tienen un tamaño de muestra muy pequeño. Si un jugador dispara 7 de 10 desde 3, sería una tontería suponer que es un tirador de 3 puntos del 70%, en lugar de que solo tuvo un poco de suerte. En segundo lugar, si un jugador ha mejorado significativamente en el transcurso de alrededor de 20 juegos, los datos de una temporada completa lo pintarán de manera negativa. Encontramos el término medio óptimo utilizando características de series de tiempo. Al igual que DARKO, usamos el método de tapicería, filtros bayesianos y más para obtener una buena línea de base «ahora rodante» para cada estadística que acumula un jugador. Entonces, en lugar de usar un solo juego, temporada o porcentaje de tiros libres de carrera, por ejemplo, nuestro modelo usa todos los datos disponibles sobre un jugador, comenzando con su novato anterior.

posición deslizante

La posición del jugador es una herramienta extremadamente útil para contextualizar datos +/-. Para mejorar el ajuste del modelo y brindarnos flexibilidad futura, también modelamos la posición del jugador. En lugar de simplemente categorizar a cada jugador como base, tirador, etc., estimamos la posición de juego proyectada actual de cada jugador en función de marcadores estadísticos como asistencias y rebotes. Este rango de estimación de posición en nuestra página de revisión es de 1 a 100, donde 1 es el punto de guardia más real y 100 es el centro más real.

aprendizaje automático

Tomamos todas estas características como entradas y las ejecutamos a través de árboles de decisión mejorados con gradientes para ofrecer proyecciones de alta calidad para cada jugador. Tenga en cuenta que estas proyecciones están en el vacío y no tienen en cuenta la fuerza del oponente en su próximo partido programado.

Modelos robustos de reproductores personalizados

Dado que todos los actores son muy diferentes entre sí, encontramos que incluso los modelos de aprendizaje automático tienen dificultades para proyectar sus habilidades; esto es especialmente evidente con jugadores atípicos. Un buen ejemplo es Stephen Curry, a quien nuestro enfoque tradicional ha alcanzado entre un 40 % y un 41 % de triples. El problema es que ha sido significativamente mejor que eso durante gran parte de su carrera. Excluyendo 2016-17 y su temporada de cinco juegos en 2019-20, Steph ha disparado por encima del 42% en cada temporada de su carrera, incluido el 44% o más en cinco de seis temporadas desde 2010-11 hasta 2015-16. Por esta razón, hemos hecho un trabajo minucioso al crear modelos personalizados para ciertas estadísticas. Vea a Steph Curry a continuación:

Los mismos resultados ocurren para un jugador como Joe Harris, que es el cuarto de todos los tiempos en porcentaje de triples en su carrera con un 43,8 %:

Predecir más-menos ajustado

Al igual que otras métricas de baloncesto todo en uno, tomamos cada uno de nuestros resultados estadísticos y proyectamos la contribución de los jugadores a +/- por cada 100 posesiones tanto en ataque como en defensa, usando +/- ajustado como meta. Este resultado final es DRIP en ataque, defensa y en general.

Ahora apliquémoslo históricamente, primero observando los picos ofensivos que se remontan a la temporada 2012-13. Esto está limitado a un valor por jugador para mostrar más variedad:

Líderes O-DRIP

Isaiah Thomas, en su último año con los Celtics, fue uno de los jugadores ofensivos más impactantes de la liga. Si bien 2016-17 fue su única temporada entre los 10 primeros en puntos por juego (¡terminó tercero!), DRIP sintió que esta racha era legítima, superando incluso a Kyrie en la ofensiva. Para Thomas, su anotación y aumento de eficiencia fueron validados por otros anotadores, como un porcentaje mejorado de tiros libres (el máximo de su carrera en ese momento del 91%). Esto llevó a una mayor «confianza» en su tiro de tres puntos mejorado (un récord personal empatado de .379). Si bien un aficionado promedio podría sentir que Thomas estaba jugando fenomenalmente, nuestro modelo de aprendizaje automático permite cierta afirmación de esas creencias, ya que el modelo es de naturaleza predictiva.

En el otro extremo:

Líderes D-DRIP

Los Warriors de vanguardia sin duda fueron famosos por las bombas de 3 puntos de Klay Thompson y Steph Curry, pero finalmente fue DPOY Draymond Green quien mantuvo las cosas del otro lado de la cancha. En 2015-16, los Warriors tuvieron 12 puntos por cada 100 posesiones mejor defensivamente con Draymond por tierra, y Draymond estuvo cerca de liderar la liga en % de bloqueo y % de robo. A DRIP defensivo le gusta más el pico de Draymond, incluso venciendo al mejor Gobert de DPOY tres veces.

Usaremos DRIP ampliamente en nuestra cobertura de la NBA esta temporada, y lo hemos incluido en nuestra clasificación de la NBA. El trabajo futuro relacionado incluirá datos de composición ajustados al azar y el uso de datos de seguimiento para predecir mejor los antecedentes de los reclutas.


DRIP fue creado por Nathan Walker, el autor de este artículo, con aportes de miembros del equipo de inteligencia artificial de Stats Perform. Lucas Elevado, mate scott y Kyle Cunningham-Rhoads. Además, un gran agradecimiento a Kostya Medvedosky. Visualización de datos por Peter McKeever. Diseño gráfico por Matt Sisneros.

———————————————————————————————————————–
Esperamos que te haya gustado el contenido de nuestro Blog El Diario del Mundo, sí fue así, por favor compártelo nos ayudarías mucho para seguir publicando más contenido.

Entradas relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada.