A Matriz confusão e a troca entre precisão e recall
O que há nesta página
A matriz de confusão e o gráfico de precisão-recall o ajudam a avaliar a precisão do modelo.
Matriz de confusão
Digamos que você esteja pensando em dar um cubo de açúcar extra aos clientes que provavelmente retornarão. Mas é claro que você quer evitar distribuir cubos de açúcar desnecessariamente, então você só os dá aos clientes que o modelo diz que têm pelo menos 30% de probabilidade de retornar.
Se alguns clientes novos passassem por você..
| ID do cliente | Idade | Sexo |
|---|---|---|
| … | … | … |
| 324 | 54 | Feminino |
| 325 | 23 | Feminino |
| 326 | 62 | Masculino |
| 327 | 15 | Feminino |
| … | … | … |
…você poderia usar nosso modelo de regressão para prever a probabilidade de eles retornarem..
| ID do cliente | Idade | Sexo | Probabilidade de retorno estimada pelo modelo |
|---|---|---|---|
| … | … | … | … |
| 324 | 54 | Feminino | 34% |
| 325 | 23 | Feminino | 24% |
| 326 | 62 | Masculino | 65% |
| 327 | 15 | Feminino | 7% |
| … | … | … | … |
…e decidir classificar os clientes com pelo menos 30% de probabilidade como “Voltarão” e dar a eles cubos de açúcar:
| ID do cliente | Idade | Sexo | Probabilidade de retorno estimada pelo modelo | Previsão do modelo (corte de 30%) |
|---|---|---|---|---|
| … | … | … | … | … |
| 324 | 54 | Feminino | 34% | Retornará |
| 325 | 23 | Feminino | 24% | Não vai |
| 326 | 62 | Masculino | 65% | Retornará |
| 327 | 15 | Feminino | 7% | Não vai |
| … | … | … | … | … |
Para entender melhor a precisão do nosso modelo, no entanto, você pode aplicar aos pontos de dados que já possui, nos quais você já sabe se o cliente retornou..
| ID do cliente | Idade | Sexo | Probabilidade de retorno estimada pelo modelo | Previsão do modelo (corte de 30%) | Devolvido |
|---|---|---|---|---|---|
| 1 | 21 | Masculino | 44% | Retornará | Devolvido |
| 2 | 34 | Feminino | 4% | Não vai | Devolvido |
| 3 | 13 | Feminino | 65% | Retornará | Não foi |
| 4 | 25 | Feminino | 27% | Não vai | Não foi |
| … | … | … | … | … | … |
…e avaliar a precisão dos dados..
| ID do cliente | Idade | Sexo | Probabilidade de retorno estimada pelo modelo | Previsão do modelo (corte de 30%) | Devolvido | Precisão da previsão |
|---|---|---|---|---|---|---|
| 1 | 21 | Masculino | 44% | Retornará | Devolvido | Correto |
| 2 | 34 | Feminino | 4% | Não vai | Devolvido | Incorreto |
| 3 | 13 | Feminino | 65% | Retornará | Não foi | Incorreto |
| 4 | 25 | Feminino | 27% | Não vai | Não foi | Correto |
| … | … | … | … | … | … | … |
…e depois dividi-lo nas seguintes categorias:
- Verdadeiro positivo: Classificado pelo modelo como “Retornará” e de fato “Retornou” na realidade.
- Falso positivo: Classificado pelo modelo como “Retornará”, mas, na realidade, “Não retornou”.
- Verdadeiro negativo: Classificado pelo modelo como “Não retornará” e, na realidade, “Não retornou”.
- Falso negativo: Classificado pelo modelo como “Não retornará”, mas na realidade “Retornou”.
| ID do cliente | Idade | Sexo | Probabilidade de retorno estimada pelo modelo | Previsão do modelo (corte de 30%) | Devolvido | Precisão da previsão | Tipo de precisão |
|---|---|---|---|---|---|---|---|
| 1 | 21 | Masculino | .44 | Retornará | Devolvido | Correto | Verdadeiro positivo |
| 2 | 34 | Feminino | .04 | Não vai | Devolvido | Incorreto | Falso negativo |
| 3 | 13 | Feminino | .65 | Retornará | Não foi | Incorreto | Falso positivo |
| 4 | 25 | Feminino | .27 | Não vai | Não foi | Correto | Verdadeiro negativo |
| … | … | … | … | … | … | … | … |
Por fim, você poderia resumir todo esse trabalho em precisão e recuperação.
Precisão:
- Dos que foram classificados como “Voltarão”, que proporção realmente voltou?
- Verdadeiro positivo / (Verdadeiro positivo + Falso positivo)
Recall:
- Lembre-se: Das pessoas que de fato “retornaram”, que proporção foi classificada dessa forma?
- Verdadeiro positivo / (Verdadeiro positivo + Falso negativo)
Modelos melhores têm valores mais altos para precisão e recuperação.
- Você pode imaginar um modelo com 94% de precisão (quase todos os identificados como “Voltarão” de fato voltam) e 97% de recuperação (quase todos os que “Voltaram” foram identificados como tal).
- Um modelo mais fraco pode ter 95% de precisão, mas 50% de recuperação (quando identifica alguém como “Retornará”, está amplamente correto, mas rotula erroneamente como “Não retornará” metade das pessoas que de fato “Retornaram” posteriormente).
- Ou talvez o modelo tenha 60% de precisão e 60% de recuperação.
Esses números devem lhe dar uma boa noção da precisão do seu modelo, mesmo que você não queira fazer nenhuma previsão.
Precisão vs. Curva de recall
Em qualquer modelo, você também pode decidir enfatizar a precisão ou a recuperação. Talvez você tenha poucos cubos de açúcar e queira distribuí-los apenas para pessoas que você tem certeza de que retornarão, então você decide distribuí-los apenas para clientes que têm 60% de probabilidade de retornar (em vez de 30%).
Nossa precisão aumentará porque você só distribuirá cubos de açúcar quando estiver realmente confiante de que alguém “voltará” Nosso recall diminuirá porque haverá muitas pessoas que acabarão “retornando” e para as quais você não estava confiante o suficiente para dar um cubo de açúcar.
Precisão: 62% -> 80%Recall
:
60% -> 30%Ou
, se você estiver se sentindo rico em cubos de açúcar, poderá distribuí-los a qualquer pessoa com pelo menos 10% de chance de ser um retornador.
Precisão: 62% -> 40%Recall
:
60% -> 90%Você
pode rastrear essa troca entre precisão e recuperação com este gráfico:
Pode ser útil escolher um ponto no gráfico que represente uma boa combinação de precisão e recuperação e, em seguida, ter uma noção de quão preciso é o modelo nesse ponto.
Perguntas frequentes
Como crio uma nova variável do Stats iQ?
Como crio uma nova variável do Stats iQ?
Quais são as opções para analisar meus dados no Stats iQ?
Quais são as opções para analisar meus dados no Stats iQ?
- Descrever: selecionar uma variável da lista e clicar em Descrever fornecerá uma visualização dos dados contidos nessa variável. Use quando você quiser ver como os dados de uma determinada variável são distribuídos.
- Relacionar: selecionar duas variáveis e, em seguida, clicar em Relacionar executará uma análise estatística da relação entre as duas variáveis. Use quando quiser saber a intensidade com que duas variáveis estão correlacionadas.
- Tabela dinâmica: selecionar duas ou mais variáveis e clicar em Tabela dinâmica criará uma tabela que exibe os valores das variáveis como linhas e colunas. As células podem ser configuradas para exibir uma variedade de informações diferentes, incluindo porcentagem de coluna e linha, soma e desvio. Use quando você quiser comparar a sobreposição entre valores específicos de um conjunto de variáveis.
- Regressão: Selecionar duas variáveis e clicar em Regressão dará a relação matemática entre as variáveis. Use quando você quiser prever valores para uma variável com base nos valores de outra.
- Cluster: selecionar de duas a dez variáveis demográficas e clicar em Cluster exibirá agrupamentos de características com maior probabilidade de ocorrer juntas, revelando assim os segmentos populacionais capturados em seus dados.
Não sei o que esse termo estatístico significa. Você pode me dizer?
Não sei o que esse termo estatístico significa. Você pode me dizer?
- Testes estatísticos: ANOVA, teste T e Qui-quadrado são todos testes estatísticos que o Stats iQ realiza para testar se a relação entre duas variáveis é ou não significativa. Estes testes são utilizados para gerar um valor P.
- Valor P: Esse valor representa a probabilidade de que os resultados observados sejam vistos se não houver correlação entre as variáveis. Um valor P mais baixo significa mais dados correlacionados.
- Tamanho do Efeito: O tamanho do efeito é uma medida do tamanho da correlação entre duas variáveis. Isso é medido de diferentes formas, dependendo do tipo de teste estatístico realizado. Exemplos são o d de Cohen, r de Pearson e v de Cramer. Quanto maior o valor do tamanho do efeito, mais correlacionadas são as variáveis.
Como filtro os dados que aparecem no Stats iQ?
Como filtro os dados que aparecem no Stats iQ?
Como faço para que minhas novas respostas apareçam no Stats iQ?
Como faço para que minhas novas respostas apareçam no Stats iQ?
Como os cartões de análise são pedidos no meu espaço de trabalho do Stats iQ?
Como os cartões de análise são pedidos no meu espaço de trabalho do Stats iQ?
O que é Stats iQ? / Onde está o Statwing?
O que é Stats iQ? / Onde está o Statwing?
O que faço se meus dados não estiverem sendo carregados corretamente?
O que faço se meus dados não estiverem sendo carregados corretamente?
Isso é ótimo! Obrigado pelo seu feedback!
Obrigado pelo seu feedback!