混乱マトリックスと精度と再現性のトレードオフ

混同マトリックスと精度-再現チャートは、モデルの精度を評価するのに役立ちます。

混同行列

例えば、リピーターになりそうな顧客には角砂糖を1個おまけしようと考えているとしよう。しかしもちろん、不必要に角砂糖を配ることは避けたいので、モデルが少なくとも30％の再来店の可能性があるとした顧客にのみ角砂糖を配る。

もし新しいお客さんが通りかかったら…。

…回帰モデルを使って、彼らが戻ってくる可能性を予測することができる。

カスタマーID	年齢	性別	モデル推定によるリターンの可能性
…	…	…	…
324	54	女性	34%
325	23	女性	24%
326	62	男性	65%
327	15	女性	7%
…	…	…	…

…そして、少なくとも30％の可能性がある顧客を「再来店する」と分類し、角砂糖を渡すことにした：

カスタマーID	年齢	性別	モデル推定によるリターンの可能性	モデル予測 (30% カットオフ)
…	…	…	…	…
324	54	女性	34%	必ず戻る
325	23	女性	24%	そうしない
326	62	男性	65%	必ず戻る
327	15	女性	7%	そうしない
…	…	…	…	…

我々のモデルの精度をよりよく理解するために、すでに持っているデータポイントにモデルを適用することができる。

カスタマーID	年齢	性別	モデル推定によるリターンの可能性	モデル予測 (30% カットオフ)	返品
1日	21	男性	44%	必ず戻る	返品
2	34	女性	4%	そうしない	返品
3	13	女性	65%	必ず戻る	そうではない
4日	25	女性	27%	そうしない	そうではない
…	…	…	…	…	…

…そしてデータの正確さをアセスメントする。

カスタマーID	年齢	性別	モデル推定によるリターンの可能性	モデル予測 (30% カットオフ)	返品	予測精度
1日	21	男性	44%	また来る	返品	正しい
2	34	女性	4%	そうしない	返品	不正解
3	13	女性	65%	必ず戻る	そうではない	不正解
4日	25	女性	27%	そうしない	そうではない	正しい
…	…	…	…	…	…	…

…そして、それをさらに以下のカテゴリーに分類する：

カスタマーID	年齢	性別	モデル推定によるリターンの可能性	モデル予測 (30% カットオフ)	返品	予測精度	精度タイプ
1日	21	男性	.44	必ず戻る	返品	正しい	トゥルー・ポジティブ
2	34	女性	.04	そうしない	返品	不正解	偽陰性
3	13	女性	.65	また来る	そうではない	不正解	偽陽性
4日	25	女性	.27	そうしない	そうではない	正しい	トゥルーネガティブ
…	…	…	…	…	…	…	…

最後に、これらの作業を精度と再現率にまとめることができる。

精度が高い：

リコールだ：

ウェルビーイング・モデルは、精度と想起の値が高い。

精度94％（「復帰する」と特定されたほぼ全員が実際に復帰している）、再現率97％（「復帰した」と特定されたほぼ全員が復帰している）のモデルを想像してほしい。
より弱いモデルは、精度が95％でも再現率が50％かもしれない（誰かを「戻ってくる」と特定した場合、それはほぼ正しいが、後に実際に「戻ってきた」人の半分を「戻ってこない」と誤認してしまう）。
あるいは、精度が60％、再現率が60％のモデルかもしれない。

これらの数値は、実際に予測をすることがないとしても、あなたのモデルがどの程度正確であるかを知るのに役立つはずだ。