A Matriz confusão e a troca entre precisão e recall

Suite

Customer Experience Employee Experience Strategy & Research

Produto

Qualtrics

O que há nesta página

A matriz de confusão e o gráfico de precisão-recall o ajudam a avaliar a precisão do modelo.

Matriz de confusão

Digamos que você esteja pensando em dar um cubo de açúcar extra aos clientes que provavelmente retornarão. Mas é claro que você quer evitar distribuir cubos de açúcar desnecessariamente, então você só os dá aos clientes que o modelo diz que têm pelo menos 30% de probabilidade de retornar.

Se alguns clientes novos passassem por você..

ID do cliente	Idade	Sexo
…	…	…
324	54	Feminino
325	23	Feminino
326	62	Masculino
327	15	Feminino
…	…	…

…você poderia usar nosso modelo de regressão para prever a probabilidade de eles retornarem..

ID do cliente	Idade	Sexo	Probabilidade de retorno estimada pelo modelo
…	…	…	…
324	54	Feminino	34%
325	23	Feminino	24%
326	62	Masculino	65%
327	15	Feminino	7%
…	…	…	…

…e decidir classificar os clientes com pelo menos 30% de probabilidade como “Voltarão” e dar a eles cubos de açúcar:

ID do cliente	Idade	Sexo	Probabilidade de retorno estimada pelo modelo	Previsão do modelo (corte de 30%)
…	…	…	…	…
324	54	Feminino	34%	Retornará
325	23	Feminino	24%	Não vai
326	62	Masculino	65%	Retornará
327	15	Feminino	7%	Não vai
…	…	…	…	…

Para entender melhor a precisão do nosso modelo, no entanto, você pode aplicar aos pontos de dados que já possui, nos quais você já sabe se o cliente retornou..

ID do cliente	Idade	Sexo	Probabilidade de retorno estimada pelo modelo	Previsão do modelo (corte de 30%)	Devolvido
1	21	Masculino	44%	Retornará	Devolvido
2	34	Feminino	4%	Não vai	Devolvido
3	13	Feminino	65%	Retornará	Não foi
4	25	Feminino	27%	Não vai	Não foi
…	…	…	…	…	…

…e avaliar a precisão dos dados..

ID do cliente	Idade	Sexo	Probabilidade de retorno estimada pelo modelo	Previsão do modelo (corte de 30%)	Devolvido	Precisão da previsão
1	21	Masculino	44%	Retornará	Devolvido	Correto
2	34	Feminino	4%	Não vai	Devolvido	Incorreto
3	13	Feminino	65%	Retornará	Não foi	Incorreto
4	25	Feminino	27%	Não vai	Não foi	Correto
…	…	…	…	…	…	…

…e depois dividi-lo nas seguintes categorias:

Verdadeiro positivo: Classificado pelo modelo como “Retornará” e de fato “Retornou” na realidade.
Falso positivo: Classificado pelo modelo como “Retornará”, mas, na realidade, “Não retornou”.
Verdadeiro negativo: Classificado pelo modelo como “Não retornará” e, na realidade, “Não retornou”.
Falso negativo: Classificado pelo modelo como “Não retornará”, mas na realidade “Retornou”.

ID do cliente	Idade	Sexo	Probabilidade de retorno estimada pelo modelo	Previsão do modelo (corte de 30%)	Devolvido	Precisão da previsão	Tipo de precisão
1	21	Masculino	.44	Retornará	Devolvido	Correto	Verdadeiro positivo
2	34	Feminino	.04	Não vai	Devolvido	Incorreto	Falso negativo
3	13	Feminino	.65	Retornará	Não foi	Incorreto	Falso positivo
4	25	Feminino	.27	Não vai	Não foi	Correto	Verdadeiro negativo
…	…	…	…	…	…	…	…

Por fim, você poderia resumir todo esse trabalho em precisão e recuperação.

Precisão:

Dos que foram classificados como “Voltarão”, que proporção realmente voltou?
Verdadeiro positivo / (Verdadeiro positivo + Falso positivo)

Recall:

Lembre-se: Das pessoas que de fato “retornaram”, que proporção foi classificada dessa forma?
Verdadeiro positivo / (Verdadeiro positivo + Falso negativo)

Modelos melhores têm valores mais altos para precisão e recuperação.

Você pode imaginar um modelo com 94% de precisão (quase todos os identificados como “Voltarão” de fato voltam) e 97% de recuperação (quase todos os que “Voltaram” foram identificados como tal).
Um modelo mais fraco pode ter 95% de precisão, mas 50% de recuperação (quando identifica alguém como “Retornará”, está amplamente correto, mas rotula erroneamente como “Não retornará” metade das pessoas que de fato “Retornaram” posteriormente).
Ou talvez o modelo tenha 60% de precisão e 60% de recuperação.

Esses números devem lhe dar uma boa noção da precisão do seu modelo, mesmo que você não queira fazer nenhuma previsão.

Precisão vs. Curva de recall

Em qualquer modelo, você também pode decidir enfatizar a precisão ou a recuperação. Talvez você tenha poucos cubos de açúcar e queira distribuí-los apenas para pessoas que você tem certeza de que retornarão, então você decide distribuí-los apenas para clientes que têm 60% de probabilidade de retornar (em vez de 30%).

Nossa precisão aumentará porque você só distribuirá cubos de açúcar quando estiver realmente confiante de que alguém “voltará” Nosso recall diminuirá porque haverá muitas pessoas que acabarão “retornando” e para as quais você não estava confiante o suficiente para dar um cubo de açúcar.

Precisão: 62% -> 80%Recall
:

60% -> 30%Ou

, se você estiver se sentindo rico em cubos de açúcar, poderá distribuí-los a qualquer pessoa com pelo menos 10% de chance de ser um retornador.

Precisão: 62% -> 40%Recall
:

60% -> 90%Você

pode rastrear essa troca entre precisão e recuperação com este gráfico:

Gráfico da compensação entre Recall e Precisão

Pode ser útil escolher um ponto no gráfico que represente uma boa combinação de precisão e recuperação e, em seguida, ter uma noção de quão preciso é o modelo nesse ponto.

Perguntas frequentes

Como crio uma nova variável do Stats iQ?

Você pode criar uma nova variável clicando em Criar ou Limpar variável no canto inferior esquerdo da área de trabalho. Para mais informações, visite a página de suporte em Criação de variável.

Quais são as opções para analisar meus dados no Stats iQ?

O Stats iQ fornece quatro opções para analisar dados:

Descrever: selecionar uma variável da lista e clicar em Descrever fornecerá uma visualização dos dados contidos nessa variável. Use quando você quiser ver como os dados de uma determinada variável são distribuídos.
Relacionar: selecionar duas variáveis e, em seguida, clicar em Relacionar executará uma análise estatística da relação entre as duas variáveis. Use quando quiser saber a intensidade com que duas variáveis estão correlacionadas.
Tabela dinâmica: selecionar duas ou mais variáveis e clicar em Tabela dinâmica criará uma tabela que exibe os valores das variáveis como linhas e colunas. As células podem ser configuradas para exibir uma variedade de informações diferentes, incluindo porcentagem de coluna e linha, soma e desvio. Use quando você quiser comparar a sobreposição entre valores específicos de um conjunto de variáveis.
Regressão: Selecionar duas variáveis e clicar em Regressão dará a relação matemática entre as variáveis. Use quando você quiser prever valores para uma variável com base nos valores de outra.
Cluster: selecionar de duas a dez variáveis demográficas e clicar em Cluster exibirá agrupamentos de características com maior probabilidade de ocorrer juntas, revelando assim os segmentos populacionais capturados em seus dados.

Não sei o que esse termo estatístico significa. Você pode me dizer?

Testes estatísticos: ANOVA, teste T e Qui-quadrado são todos testes estatísticos que o Stats iQ realiza para testar se a relação entre duas variáveis é ou não significativa. Estes testes são utilizados para gerar um valor P.
Valor P: Esse valor representa a probabilidade de que os resultados observados sejam vistos se não houver correlação entre as variáveis. Um valor P mais baixo significa mais dados correlacionados.
Tamanho do Efeito: O tamanho do efeito é uma medida do tamanho da correlação entre duas variáveis. Isso é medido de diferentes formas, dependendo do tipo de teste estatístico realizado. Exemplos são o d de Cohen, r de Pearson e v de Cramer. Quanto maior o valor do tamanho do efeito, mais correlacionadas são as variáveis.

Para mais informações, visite a página de suporte Premissas do teste estatístico e detalhes técnicos.

Como filtro os dados que aparecem no Stats iQ?

Você pode filtrar os dados que aparecem no Stats iQ em dois níveis diferentes: em cartões individuais e no espaço de trabalho geral. Você pode encontrar instruções na página Filtrando dados do Stats iQ.

Como faço para que minhas novas respostas apareçam no Stats iQ?

No Stats iQ, clique no botão Configurações e selecione Importar dados mais recentes. Isso importará quaisquer novas respostas ao Stats iQ e as incluirá em sua análise.

Como os cartões de análise são pedidos no meu espaço de trabalho do Stats iQ?

Os cartões de análise são ordenados automaticamente para mostrar os resultados mais estatisticamente significativos. Você pode alterar a ordem em que as variáveis aparecem no conjunto de dados navegando para o menu Configurações da análise.

O que é Stats iQ? / Onde está o Statwing?

Stats iQ é o novo nome para Statwing. Você pode encontrar o Stats iQ indo para qualquer projeto, indo para Dados e análise e selecionando Stats iQ.

O que faço se meus dados não estiverem sendo carregados corretamente?

Certifique-se de ter carregado seu conjunto de dados atual clicando em Importar dados mais recentes no Stats iQ. Se os seus dados ainda não estiverem sendo carregados corretamente, entre contato o Suporte Técnico Qualtrics.

Muitas das páginas neste site foram traduzidas do inglês original usando tradução automática. Embora na Qualtrics tenhamos feito nossa diligência prévia para obter as melhores traduções automáticas possíveis, a tradução automática nunca é perfeita. O texto original em inglês é considerado a versão oficial, e quaisquer discrepâncias entre o inglês original e as traduções automáticas não são juridicamente vinculativas.

Isto foi útil?

O feedback que você envia aqui é usado apenas para ajudar a melhorar essa página.

Isso é ótimo! Obrigado pelo seu feedback!

Obrigado pelo seu feedback!

A Matriz confusão e a troca entre precisão e recall

Matriz de confusão

Precisão vs. Curva de recall

Perguntas frequentes

Get the latest news on XM events, research, and product launches