La Matriz de confusión y el equilibrio entre precisión y recuperación
Contenidos de la página
La matriz de confusión y el gráfico de precisión-recuperación le ayudan a evaluar la precisión de su modelo.
Matriz de confusión
Digamos que estás pensando en regalar un terrón de azúcar extra a los clientes que probablemente regresen. Pero, por supuesto, usted quiere evitar regalar terrones de azúcar innecesariamente, por lo que sólo se los da a clientes que, según el modelo, tienen al menos un 30 % de probabilidades de regresar.
Si pasaran por tu casa nuevos clientes…
| ID de cliente | Edad | Género |
|---|---|---|
| … | … | … |
| 324 | 54 | Mujer |
| 325 | 23 | Mujer |
| 326 | 62 | Hombre |
| 327 | 15 | Mujer |
| … | … | … |
…podría utilizar nuestro modelo de regresión para predecir la probabilidad de que regresen…
| ID de cliente | Edad | Género | Probabilidad de retorno estimada por el modelo |
|---|---|---|---|
| … | … | … | … |
| 324 | 54 | Mujer | 34% |
| 325 | 23 | Mujer | 24% |
| 326 | 62 | Hombre | 65% |
| 327 | 15 | Mujer | 7% |
| … | … | … | … |
…y decide clasificar a los clientes con al menos un 30% de probabilidad como “Volverán” y darles terrones de azúcar:
| ID de cliente | Edad | Género | Probabilidad de retorno estimada por el modelo | Predicción del modelo (30% de corte) |
|---|---|---|---|---|
| … | … | … | … | … |
| 324 | 54 | Mujer | 34% | Volverá |
| 325 | 23 | Mujer | 24% | No |
| 326 | 62 | Hombre | 65% | Volverá |
| 327 | 15 | Mujer | 7% | No |
| … | … | … | … | … |
Sin embargo, para comprender mejor la precisión de nuestro modelo, puede aplicar a los puntos de datos que ya tiene, donde ya sabe si ese cliente finalmente regresó…
| ID de cliente | Edad | Género | Probabilidad de retorno estimada por el modelo | Predicción del modelo (30% de corte) | Devuelto |
|---|---|---|---|---|---|
| 1 | 21 | Hombre | 44% | Volverá | Devuelto |
| 2 | 34 | Mujer | 4% | No | Devuelto |
| 3 | 13 | Mujer | 65% | Volverá | No |
| 4 | 25 | Mujer | 27% | No | No |
| … | … | … | … | … | … |
…y evaluar la precisión de los datos…
| ID de cliente | Edad | Género | Probabilidad de retorno estimada por el modelo | Predicción del modelo (30% de corte) | Devuelto | Precisión de la predicción |
|---|---|---|---|---|---|---|
| 1 | 21 | Hombre | 44% | Volverá | Devuelto | Correcto |
| 2 | 34 | Mujer | 4% | No | Devuelto | Incorrecto |
| 3 | 13 | Mujer | 65% | Volverá | No | Incorrecto |
| 4 | 25 | Mujer | 27% | No | No | Correcto |
| … | … | … | … | … | … | … |
…y luego lo desglosamos en las siguientes categorías:
- Verdadero Positivo:Clasificado por el modelo como “Regresará” y de hecho “Regresó” en realidad.
- Falso positivo:Clasificado por el modelo como “Regresará” pero en realidad “No regresó”.
- Verdadero negativo:Clasificado por el modelo como “No volverá” y en realidad “No volvió”.
- Falso negativo:Clasificado por el modelo como “No volverá” pero en realidad “Devolvió”.
| ID de cliente | Edad | Género | Probabilidad de retorno estimada por el modelo | Predicción del modelo (30% de corte) | Devuelto | Precisión de la predicción | Tipo de precisión |
|---|---|---|---|---|---|---|---|
| 1 | 21 | Hombre | .44 | Volverá | Devuelto | Correcto | Verdadero positivo |
| 2 | 34 | Mujer | .04 | No | Devuelto | Incorrecto | Falso negativo |
| 3 | 13 | Mujer | .65 | Volverá | No | Incorrecto | Falso positivo |
| 4 | 25 | Mujer | .27 | No | No | Correcto | Verdadero negativo |
| … | … | … | … | … | … | … | … |
Por último, podríamos resumir todo este trabajo en precisión y recuperación.
Precisión:
- De aquellos clasificados como “regresarán”, ¿qué proporción lo hizo realmente?
- Verdadero positivo / (Verdadero positivo + Falso positivo)
Recordar:
- Recordemos: De aquellos que efectivamente “regresaron”, ¿qué proporción fueron clasificados de esa manera?
- Verdadero positivo / (Verdadero positivo + Falso negativo)
Los mejores modelos tienen valores más altos de precisión y recuperación.
- Se puede imaginar un modelo con un 94% de precisión (casi todos los identificados como “Regresarán” lo hacen de hecho) y un 97% de recuperación (casi todos los que “Regresaron” fueron identificados como tales).
- Un modelo más débil puede tener una precisión del 95% pero una recuperación del 50% (cuando identifica a alguien como “Regresará”, es en gran medida correcto, pero etiqueta erróneamente como “No regresará” a la mitad de los que de hecho “Regresarán” más tarde).
- O tal vez el modelo tiene un 60% de precisión y un 60% de recuperación.
Estos números deberían darle una buena idea de qué tan preciso es su modelo, incluso si en realidad nunca desea hacer ninguna predicción.
Precisión vs. Curva de recuperación
Dentro de cualquier modelo, también puedes decidir enfatizar la precisión o la recuperación. Tal vez te falten terrones de azúcar y solo quieras dárselos a personas que estás muy seguro de que volverán, por lo que decides dárselos solo a clientes que tengan un 60 % de probabilidades de volver (en lugar del 30 %).
Nuestra precisión aumentará porque sólo entregarás terrones de azúcar cuando estés realmente seguro de que alguien “regresará”. Nuestro retiro se reducirá porque habrá mucha gente que finalmente “regresará” y a la que no confiaste lo suficiente como para darle un terrón de azúcar.
Precisión: 62% —> 80%
Recordatorio: 60% —> 30%
O, si te sientes rico en terrones de azúcar, podrías dárselos a cualquier persona que tenga al menos un 10% de posibilidades de volver.
Precisión: 62% —> 40%
Recordatorio: 60% —> 90%
Puedes rastrear este equilibrio entre precisión y recuperación con este gráfico:
Puede ser útil elegir un punto en el gráfico que represente una buena combinación de precisión y recuperación, y luego tener una idea de qué tan preciso es el modelo en ese punto.
Preguntas frequentes
¿Cómo creo una nueva variable de Stats iQ?
¿Cómo creo una nueva variable de Stats iQ?
¿Cuáles son las opciones para analizar mis datos en Stats iQ?
¿Cuáles son las opciones para analizar mis datos en Stats iQ?
- Describir: Seleccionar una variable de la lista y luego hacer clic en Describir le proporcionará una visualización de los datos contenidos en esa variable. Utilícelo cuando desee ver cómo se distribuyen los datos para una variable determinada.
- Relacionar: Al seleccionar dos variables y, a continuación, hacer clic en Relacionar se ejecutará un análisis estadístico de la relación entre las dos variables. Utilícelo cuando desee saber en qué medida se correlacionan dos variables.
- Tabla dinámica: si selecciona dos o más variables y hace clic en Tabla dinámica, se creará una tabla que muestra los valores de las variables como filas y columnas. Las celdas se pueden configurar para mostrar una variedad de información diferente, incluidos el porcentaje de columna y fila, la suma y la desviación. Utilícelo cuando desee comparar el solapamiento entre valores específicos de un conjunto de variables.
- Regresión: Al seleccionar dos variables y hacer clic en Regresión se obtendrá la relación matemática entre las variables. Utilícelo cuando desee predecir valores para una variable basada en los valores de otra.
- Clúster: Si selecciona de dos a diez variables demográficas y hace clic en Clúster, se mostrarán agrupaciones de rasgos que es más probable que ocurran juntos, revelando así los segmentos de población capturados en sus datos.
No sé qué significa este término estadístico. ¿Puedes decírmelo?
No sé qué significa este término estadístico. ¿Puedes decírmelo?
- Pruebas estadísticas: ANOVA, T-test y Chi-cuadrado son todas pruebas estadísticas que Stats iQ realiza para probar si la relación entre dos variables es significativa o no. Estas pruebas se utilizan para generar un valor P.
- Valor P: Este valor representa la probabilidad de que los resultados observados se vieran si no existe correlación entre las variables. Un valor P inferior significa más datos correlacionados.
- Tamaño del efecto: El tamaño del efecto es una medida de cuán grande es la correlación entre dos variables. Esto se mide de diferentes maneras en función del tipo de prueba estadística realizada. Algunos ejemplos son el d de Cohen, el r de Pearson y el v de Cramer. Cuanto mayor sea el valor del tamaño del efecto, más correlacionadas estarán las variables.
¿Cómo filtro los datos que aparecen en Stats iQ?
¿Cómo filtro los datos que aparecen en Stats iQ?
¿Cómo consigo que mis nuevas respuestas aparezcan en Stats iQ?
¿Cómo consigo que mis nuevas respuestas aparezcan en Stats iQ?
¿Cómo se ordenan las tarjetas de análisis en mi espacio de trabajo Stats iQ?
¿Cómo se ordenan las tarjetas de análisis en mi espacio de trabajo Stats iQ?
¿Qué es Stats iQ? / ¿Dónde está la comunicación?
¿Qué es Stats iQ? / ¿Dónde está la comunicación?
¿Qué hago si mis datos no se cargan correctamente?
¿Qué hago si mis datos no se cargan correctamente?
¡Genial! ¡Gracias por tus comentarios!
¡Gracias por tus comentarios!