Matrice di confusione e compromesso tra precisione e richiamo

Suite
Customer Experience Employee Experience Strategy & Research
Prodotto
Qualtrics

Cosa puoi trovare in questa pagina

La matrice di confusione e il grafico precisione-richiamo aiutano a valutare l’accuratezza del modello.

Matrice di confusione

Supponiamo che stiate pensando di dare una zolletta di zucchero in più ai clienti che probabilmente torneranno. Ma naturalmente si vuole evitare di distribuire zollette di zucchero inutilmente, quindi si danno solo ai clienti che secondo il modello hanno almeno il 30% di probabilità di tornare.

Se passassero dei nuovi clienti..

ID cliente Età Genere
324 54 Femmina
325 23 Femmina
326 62 Maschio
327 15 Femmina

… si potrebbe usare il nostro modello di regressione per prevedere la probabilità che ritornino..

ID cliente Età Genere Probabilità di rendimento stimata dal modello
324 54 Femmina 34%
325 23 Femmina 24%
326 62 Maschio 65%
327 15 Femmina 7%

… e decidono di classificare i clienti con almeno il 30% di probabilità come “Torneranno” e di dare loro delle zollette di zucchero:

ID cliente Età Genere Probabilità di rendimento stimata dal modello Previsione del modello
(cutoff del 30%)
324 54 Femmina 34% Tornerà
325 23 Femmina 24% Non
326 62 Maschio 65% Tornerà
327 15 Femmina 7% Non

Per capire meglio quanto sia accurato il nostro modello, però, è possibile applicarlo ai dati già in possesso, dove si sa già se quel cliente è tornato..

ID cliente Età Genere Probabilità di rendimento stimata dal modello Previsione del modello
(cutoff del 30%)
Restituito
1 21 Maschio 44% Tornerà Restituito
2 34 Femmina 4% Non Restituito
3 13 Femmina 65% Tornerà Non
4 25 Femmina 27% Non Non

… e valutare l’accuratezza dei dati..

ID cliente Età Genere Probabilità di rendimento stimata dal modello Previsione del modello
(cutoff del 30%)
Restituito Accuratezza della previsione
1 21 Maschio 44% Tornerà Restituito Corretto
2 34 Femmina 4% Non Restituito Non corretto
3 13 Femmina 65% Tornerà Non Non corretto
4 25 Femmina 27% Non Non Corretto

… e poi ulteriormente suddivisi nelle seguenti categorie:

  • Vero positivo: Classificato dal modello come “Tornerà” e in realtà “Tornato”.
  • Falso positivo: Classificato dal modello come “Tornerà” ma in realtà “Non è tornato”.
  • Vero negativo: Classificato dal modello come “Non tornerà” e in realtà “Non è tornato”.
  • Falso negativo: Classificato dal modello come “Non tornerà”, ma in realtà è “Tornato”.
ID cliente Età Genere Probabilità di rendimento stimata dal modello Previsione del modello
(cutoff del 30%)
Restituito Accuratezza della previsione Tipo di precisione
1 21 Maschio .44 Tornerà Restituito Corretto Vero positivo
2 34 Femmina .04 Non Restituito Non corretto Falso negativo
3 13 Femmina .65 Tornerà Non Non corretto Falso positivo
4 25 Femmina .27 Non Non Corretto Vero negativo

Infine, si potrebbe riassumere tutto questo lavoro in precisione e richiamo.

Precisione:

  • Di coloro che sono stati classificati come “torneranno”, qual è la percentuale di coloro che sono effettivamente tornati?
  • Vero positivo / (Vero positivo + Falso positivo)

Richiamo:

  • Ricordiamo: Di quelli che sono effettivamente “rientrati”, quale percentuale è stata classificata in questo modo?
  • Vero positivo / (Vero positivo + Falso negativo)

I modelli migliori hanno valori più elevati di precisione e richiamo.

  • Si può immaginare un modello con una precisione del 94% (quasi tutti quelli identificati come “Torneranno” lo fanno davvero) e un richiamo del 97% (quasi tutti quelli che “Sono tornati” sono stati identificati come tali).
  • Un modello più debole potrebbe avere una precisione del 95% ma un richiamo del 50% (quando identifica qualcuno come “Tornerà”, è in gran parte corretto, ma etichetta erroneamente come “Non tornerà” la metà di coloro che in realtà sono poi “Tornati”).
  • O forse il modello ha una precisione del 60% e un richiamo del 60%.

Questi numeri dovrebbero darvi un’idea dell’accuratezza del vostro modello, anche se non volete mai fare previsioni.

Precisione vs. precisione. Curva di richiamo

All’interno di un modello, si può anche decidere di enfatizzare la precisione o il richiamo. Forse siete a corto di zollette di zucchero e volete distribuirle solo a chi siete sicuri che tornerà, quindi decidete di darne solo ai clienti che hanno il 60% di probabilità di tornare (invece del 30%).

La nostra precisione aumenterà perché distribuirete le zollette di zucchero solo quando siete davvero sicuri che qualcuno “tornerà” Il nostro richiamo diminuirà perché ci saranno molte persone che alla fine “ritorneranno” a cui non si era abbastanza sicuri di dare una zolletta di zucchero.

Precisione: 62% -> 80%Recall
:

60% -> 30%Oppure

, se vi sentite ricchi di zollette di zucchero, potreste distribuirle a chiunque abbia almeno il 10% di probabilità di essere un giocatore di ritorno.

Precisione: 62% -> 40%Recall
:

60% -> 90%È

possibile tracciare questo compromesso tra precisione e richiamo con questo grafico:

Può essere utile scegliere un punto del grafico che rappresenti un buon mix di precisione e richiamo, per poi farsi un’idea di quanto sia accurato il modello in quel punto.

FAQs

Come posso creare una nuova variabile Stats iQ?

Quali sono le opzioni per analizzare i miei dati in Stats iQ?

Non so cosa significhi questo termine statistico. Me lo puoi dire?

Come posso filtrare i dati visualizzati in Stats iQ?

Come faccio a far comparire le mie nuove risposte in Stats iQ?

Come vengono ordinate le schede di analisi nel mio workspace Stats iQ?

Che cos'è Stats iQ? / Dov'è Statwing?

Cosa fare se i dati non vengono caricati correttamente?

Molte delle pagine di questo sito sono state tradotte dall'originale in inglese mediante traduzione automatica. Sebbene in Qualtrics abbiamo profuso il massimo impegno per avere le migliori traduzioni automatiche possibili, queste non sono mai perfette. Il testo originale inglese è considerato la versione ufficiale, e qualsiasi discrepanza tra questo e le traduzioni automatiche non è legalmente vincolante.

Ti è stato utile?

Il feedback inviato qui viene utilizzato solo per migliorare questa pagina.

È fantastico! Grazie per il tuo feedback!

Grazie per il tuo feedback!