混乱マトリックスと精度と再現性のトレードオフ

Question 1

Stats iQの変数を新規に作成する方法を教えてください。

ワークスペースの左下隅にあるCreate Variable または Clean Variable をクリックすると、新しい変数を作成することができます。詳しくは、サポートページVariable Creation をご覧ください。

Question 2

Stats iQでデータを分析する際のオプションは何ですか？

Stats iQは、データ解析のための4つのオプションを提供しています。

Describe:リストから変数を選択し、Describe をクリックすると、その変数に含まれるデータを視覚化することができます。ある変数のデータがどのように分布しているかを確認したい場合に使用します。
Relate:2つの変数を選択し、Relateをクリックすると、2つの変数間の関係の統計分析が実行されます。2つの変数がどの程度強く相関しているかを知りたいときに使用します。
ピボットテーブル:2 つ以上の変数を選択してピボットテーブルをクリックすると、変数の値を行と列で表示する表が作成されます。セルには、列や行のパーセンテージ、Sum、Varianceなど、さまざまな情報を表示するように設定することができます。変数の特定の値間の重なりを比較したい場合に使用します。
Regression:2つの変数を選択し、回帰をクリックすると、変数間の数学的関係が表示されます。ある変数の値から別の変数の値を予測したい場合に使用します。
クラスター:2～10個の人口統計変数を選択し、「クラスタ」をクリックすると、一緒に発生する可能性が最も高い形質のグループ分けが表示され、データに含まれる人口層が明らかにされます。

Question 3

この統計用語の意味がわからない。教えてもらえますか？

統計テスト:ANOVA、T-test、カイ二乗はすべてStats iQが2つの変数間の関係が有意であるかどうかを検定するために行う統計検定です。これらの検定はP-Valueを生成するために使用されます。
P-Value:この値は、変数間に相関が存在しない場合に、観測された結果が見られる確率を表しています。P-Valueが低いほど、相関のあるデータであることを意味する。
効果量:効果量とは、2つの変数間の相関がどの程度大きいかを示す指標である。これは、実施した統計検定の種類によって異なる方法で測定されます。例えば、Cohenのd、Pearsonのr、Cramerのvなどがあり、効果量の数値が大きいほど、変数の相関が高いことを意味する。

詳細については、 Statistical Test Assumptions and Technical Details サポートページをご覧ください。

Question 4

Stats iQに表示されるデータをフィルタリングする方法を教えてください。

Stats iQに表示されるデータは、個々のカードとワークスペース全体の2つのレベルでフィルタリングすることができます。この方法は、Stats iQ のFiltering Data ページに記載されています。

Question 5

Stats iQに新しい回答を表示させるにはどうしたらよいですか？

Stats iQで、設定ボタンをクリックし、最新データのインポート を選択します。これにより、新しい回答がStats iQにインポートされ、分析に含まれるようになります。

Question 6

Stats iQ Workspaceでは、分析カードはどのように並べられるのですか？

分析カードは、統計的に有意な結果を示すように自動的に並べられます。Analysis Settings メニューに移動して、データセットに表示される変数の順序を変更することができます。

Question 7

Stats iQって何？/ スタットウィングはどこ？

Stats iQは、Statwingの新しい名称です。Stats iQ は、任意のプロジェクトにアクセスし、Data & Analysis に移動し、Stats iQ を選択することで見つけることができます。

Question 8

What do I do if my data isn't loading properly?

Make sure you've loaded your current dataset by clicking Import Latest Data in Stats iQ. If your data is still not loading properly, then please contact Qualtrics Technical Support.

カスタマーID	年齢	性別	モデル推定によるリターンの可能性
…	…	…	…
324	54	女性	34%
325	23	女性	24%
326	62	男性	65%
327	15	女性	7%
…	…	…	…

カスタマーID	年齢	性別	モデル推定によるリターンの可能性	モデル予測 (30% カットオフ)
…	…	…	…	…
324	54	女性	34%	必ず戻る
325	23	女性	24%	そうしない
326	62	男性	65%	必ず戻る
327	15	女性	7%	そうしない
…	…	…	…	…

カスタマーID	年齢	性別	モデル推定によるリターンの可能性	モデル予測 (30% カットオフ)	返品
1	21	男性	44%	また来る	返品
2	34	女性	4%	そうしない	返品
3	13	女性	65%	必ず戻る	そうではない
4	25	女性	27%	そうしない	そうではない
…	…	…	…	…	…

カスタマーID	年齢	性別	モデル推定によるリターンの可能性	モデル予測 (30% カットオフ)	返品	予測精度
1	21	男性	44%	また来る	返品	正しい
2	34	女性	4%	そうしない	返品	不正解
3	13	女性	65%	必ず戻る	そうではない	不正解
4	25	女性	27%	そうしない	そうではない	正しい
…	…	…	…	…	…	…

混同行列