Daten verknüpfen
Informationen zum Verknüpfen von Daten
Relate untersucht die Beziehungen zwischen Variablen. Wenn Sie zwei Variablen auswählen und dann Verknüpfen wählen, wählt Stats iQ den entsprechenden statistischen Test basierend auf der Struktur der Daten aus, führen diesen Test aus und übersetzen dann die Ergebnisse in eine einfache und klare Erklärung.
Wenn Sie drei oder mehr Variablen auswählen, verknüpft Stats iQ jede Variable mit der Variablen, die den Schlüssel enthält, und bringt dann die stärksten Beziehungen nach oben. Sie können Dutzende von Variablen gleichzeitig auswählen, sodass Sie viele Beziehungen schnell durchgehen können.
Die Schlüsselvariable
Die erste im Variablenbereich ausgewählte Variable ist die Schlüsselvariable. Die Schlüsselvariable hat zwei Funktionen:
- Wenn mehr als zwei Variablen ausgewählt werden (wie oben beschrieben), bezieht sich jede Nicht-Schlüsselvariable auf die eine Schlüsselvariable (wenn Sie z.B. zehn Variablen auswählen, wird die eine Schlüsselvariable mit jeder der anderen neun verknüpft, was zu neun separaten Relational-Karten führt).
- Die Schlüsselvariable ist standardmäßig die “Ausgabe”-Variable. Wenn Sie beispielsweise „Alter“ und „Lokation“ auswählen, wirkt sich „Alter“ (Eingabe) möglicherweise auf „Lokation“ (Ausgabe) aus, aber es wäre nicht sinnvoll, wenn „Lokation“ Auswirkungen auf „Alter“ hätte. In diesem Fall würden Sie den Schlüssel nach „Ort“ setzen. (In vielen Analysen spielt diese Unterscheidung keine Rolle, aber die Eingabe- und Ausgabevariablen können nach dem Anlegen der Karte immer vertauscht werden.) Wenn Sie die Schlüsselvariable anstelle der Ausgabevariablen zur Eingabevariablen machen möchten, wählen Sie die kleinen Pfeile auf der rechten Seite der Drucktaste Verknüpfen.
Zahlen und Zahlenvariablen
Wenn Sie zwei Zahlenvariablen (einschließlich umgewandelter Kategorien) in Beziehung setzen, führt Stats iQ in der Regel eine Korrelation aus und erstellt ein Streudiagramm, um die Beziehung zwischen den beiden Variablen visuell darzustellen.
Wenn die Variablen viele überlappende Punkte auf dem Streudiagramm aufweisen, zeigt Stats iQ stattdessen ein „gebundenes“ Streudiagramm an, bei dem dunklere Rechtecke auf ein größeres Clustering der Ergebnisse hinweisen. Stats iQ zeigt eine Zeile mit der besten Anpassung an, wenn die Daten angeben, dass die Zeile nützlich ist (insbesondere, wenn die Daten keine Ausreißer haben, die von der Linie ausgehen könnten).
Um die statistischen Details der zugehörigen Analyseergebnisse anzuzeigen, wählen Sie Statistische Testergebnisse anzeigen. Wenn zwei Zahlenvariablen verknüpft werden, berechnet Stats iQ einen p-Wert und (für die Effektgröße) entweder ein Pearson-r oder ein Spearman-Rho. Weitere Informationen darüber, wie Stats iQ den statistischen Test auswählt, finden Sie auf der Seite Statistische Testannahmen und technische Details.
Es ist möglich, dass Sie weniger daran interessiert sind, ob die Variablen korreliert sind und mehr daran interessiert sind, welche Variable im Durchschnitt höher ist. Wenn sich die beiden Variablen auf ähnlichen Skalen befinden, bietet Stats iQ oben eine Option zum Wechsel von Korrelation zu Paired Difference, mit der Sie Durchschnittswerte vergleichen können.
Zahlen- und Kategorievariablen verknüpfen
Wenn Sie eine Zahlenvariable mit einer Kategorievariablen verknüpfen, führt Stats iQ einen statistischen Test aus und erstellt eine Tabelle, die die Anzahl, den Durchschnitt, den Median und die Verteilung der Zahlenvariablen jeder Kategorie anzeigt.
Sie möchten beispielsweise feststellen, ob Gäste in einem Hotel mit Kindern oder Gäste ohne Kinder im Durchschnitt zufriedener sind. In diesem Fall ist die Variable „Kinder vorhanden“ kategorisch und „Zufriedenheit“ numerisch.
Die Ausgabe dieses statistischen Tests können Sie anzeigen, indem Sie auf der Karte Statistische Testergebnisse anzeigen wählen. Wenn die Kategorievariable nur zwei Kategorien hat, führt Stats iQ einen t-Test oder einen Ranking-t-Test durch. Wenn es mehr hat, führt Stats iQ eine ANOVA oder eine ANOVA mit Rang aus sowie einen Games-Howell-Post-Hoc-Test. Weitere Informationen darüber, wie Stats iQ den statistischen Test auswählt, finden Sie auf der Seite Statistische Testannahmen und technische Details.
Verknüpfen von Kategorien und Kategorievariablen
Wenn Sie eine Kategorievariable und eine Kategorievariable verknüpfen, führt Stats iQ einen statistischen Test aus und erstellt eine Kreuztabelle.
Jede Spalte in der Kreuztabelle summiert sich auf 100 %. Im Beispiel unten waren 69 % der Befragten in „USA“ „Returning“ und 31 % „New“. Sie können Zeile % auswählen, um die Zeilen zu 100 % zu summieren, Anzahl, um die Rohanzahl in jeder Zelle anzuzeigen, oder Alle %, um die gesamte Tabellensumme zu 100 % anzuzeigen. Alternativ können Sie die Zeilen mit den Spalten komplett umdrehen, indem Sie im oberen Bereich des Analyseergebnisses eine Option auswählen.
Im folgenden Beispiel lautet die Frage, da sich die Spalten auf 100 % belaufen, die Frage: „Welcher Anteil der Teilnehmer aus den USA waren zurückkehrende Gäste?“ Wenn wir Zeile % auswählen (oder die Spalten und Zeilen vertauschen), fragen wir nun „Welchen Anteil der zurückkehrenden Gäste gab es in den USA?“ In diesem Fall kann es sinnvoll sein, eine dieser Fragen zu stellen. Manchmal wird nur eine Frage wirklich sinnvoll sein.
Grüne und rote Pfeile in Zellen geben an, ob der Wert einer Zelle statistisch höher oder niedriger ist, als Sie erwarten würden, wenn es keine Beziehung zwischen den Variablen gäbe. Wenn Spalte % ausgewählt ist, vergleichen die Pfeile die Anzahl der Zelle mit den anderen Zahlen in dieser Zeile. Mehr Pfeile entsprechen einem höheren Grad an statistischer Signifikanz. Zellen mit hohen Zahlen erscheinen dunkler als andere Zellen.
Im folgenden Beispiel sind 75,2 % höher als die Summe der anderen Zahlen in dieser Zeile, sodass das Vereinigte Königreich einen höheren Anteil als typisch zurückkehrende Besucher hat.
Die Ausgabe des statistischen Tests können Sie anzeigen, indem Sie auf der Karte Statistische Testergebnisse anzeigen wählen. Stats iQ führt entweder einen Fisher’s Exact Test oder einen Chi-Squared Test durch, wenn zwei kategorische Variablen zusammenhängen. In einer Zelle werden bis zu drei Pfeile angezeigt, abhängig vom p-Wert, der aus dem angepassten Rest der Zelle berechnet wird. Weitere Informationen darüber, wie Stats iQ den statistischen Test auswählt, finden Sie auf der Seite Statistische Testannahmen und technische Details.
Zusätzlich zur allgemeinen Kreuztabelle generiert Stats iQ auch eine Paarweise Vergleichstabelle, die die Werte von Kategoriepaaren in einer bestimmten Zeile vergleicht. Die folgende Kreuztabelle zeigt beispielsweise den Anteil der Kunden, die Besucher von verschiedenen Orten zurücksenden. Die Tabelle für den paarweisen Vergleich zeigt beispielsweise, dass der Anteil der zurückkehrenden Besucher im Vereinigten Königreich um 6 Prozentpunkte höher ist als in den USA. Die grünen und roten Pfeile in Zellen zeigen statistisch signifikante Unterschiede an.
Ankreuzfelder und Zahlenvariablen verknüpfen
Wenn Sie eine Kontrollkästchenvariable und eine Zahlenvariable verknüpfen, führt Stats iQ einen statistischen Test aus und erstellt eine Zusammenfassungstabelle.
Stats iQ zeigt eine Tabelle mit zwei Zeilen für jedes Kontrollkästchen an: eine für den Fall, dass das Kontrollkästchen markiert wurde, und eine für, wenn es nicht markiert war. Wenn beispielsweise eines der Kontrollkästchen angibt, ob ein Umfrageteilnehmer den Pool verwendet hat, gibt es eine Zeile für die Verwendung (aktiviert) und nicht für die Verwendung (nicht aktiviert) des Pools sowie die durchschnittliche Zufriedenheitsbewertung der Teilnehmer, die in eine dieser beiden Gruppen fallen.
Diese Tabelle kann wie die meisten in Stats iQ sortiert werden. Sie können beispielsweise nach Durchschnitt sortieren oder danach, ob das Kontrollkästchen aktiviert wurde oder nicht. Klicken Sie auf den Spaltenkopf (z.B. Durchschnitt), um die Tabelle nach den Werten in dieser Spalte zu sortieren.
Obwohl die Tabelle statistische Informationen wie Median und Durchschnitt anzeigt, werden in dieser Situation keine statistischen Tests durchgeführt. Gehen Sie wie folgt vor, um eine separate Analyse durchzuführen, bei der die Durchschnittswerte der Benutzer, die den Pool verwendet haben, mit denen, die den Pool nicht verwendet haben, verglichen werden:
Verknüpfen von Ankreuzfeldern und Kategorievariablen
Wenn Sie eine Kontrollkästchenvariable mit einer Kategorievariablen verknüpfen, führt Stats iQ statistische Tests aus und erstellt eine Zusammenfassungstabelle.
Je nachdem, welche Variable den Schlüssel verwendet, enthält eine der ersten beiden Spalten die Variablenoptionen der Kategorie und die andere die Ankreuzfeldoptionen. Die Spalte „%“ gibt den Anteil der ersten Spaltengruppe an, die die zweite Spaltengruppe ausgewählt hat.
Im Beispiel unten gibt die erste Zeile Folgendes an:
- Es gab 1663 Befragte, die Neukunden sind.
- Von diesen 1663 Befragten nutzten 359 den Pool.
- Das bedeutet, dass 21,6 % der 1663 Befragten den Pool nutzten.
- Die roten Pfeile in der letzten Spalte zeigen an, dass dieser Anteil geringer ist als der typische Anteil.
Die Pfeile in der letzten Spalte werden wie in der Kreuztabelle für kategorische Variablen berechnet.
Zahlen und Zeitvariablen verknüpfen
Wenn Sie eine Zahlenvariable und eine Zeitvariable verknüpfen, erstellt Stats iQ ein Diagramm, das anzeigt, wie die Zahlenvariable im Laufe der Zeit variiert hat. Um die Bin-Größe zu ändern (z.B. von Tagen in Wochen), klicken Sie oberhalb des Diagramms auf Bin-Größe.
Zusätzlich zu den Datumslagerplätzen zeigt Stats iQ eine Zeile für einen bestimmten statistischen Wert im Zeitverlauf an. Der Standardwert ist der Mittelwert. Wenn Sie oben im Diagramm eine andere Option (Median, Min oder Max) auswählen, ändert sich, welcher Wert als Linie im Diagramm dargestellt wird. Wenn Sie den Schieberegler unterhalb des Diagramms anpassen, wird der angezeigte Datumsbereich eingegrenzt.
Die Ausgabe dieses statistischen Tests können Sie anzeigen, indem Sie auf der Karte Statistische Testergebnisse anzeigen wählen. Die statistischen Tests Stats iQ -Läufe sind dieselben wie die, die ausgeführt würden, wenn die Zeitvariable eine Zahlenvariable wäre. Dies bedeutet insbesondere, dass Stats iQ eine Korrelation zwischen den Variablen ausführt.
Zeitpunkt- und Kategorievariablen verknüpfen
Wenn Sie eine Zeitvariable und eine Kategorievariable verknüpfen, erstellt Stats iQ ein Diagramm, das anzeigt, wie sich die Anzahl dieser Kategorien im Laufe der Zeit geändert hat. Um die Bin-Größe zu ändern (z.B. von Tagen in Wochen), klicken Sie oberhalb des Diagramms auf Bin-Größe.
Für diesen Kartentyp haben Sie die Möglichkeit, den Diagrammtyp auszuwählen, der angezeigt wird. Der Diagrammtyp wird geändert, wenn eine andere Option (Balken, Linie oder Bereich) über dem Diagramm ausgewählt wird. Das Diagramm zeigt die Daten als Prozent oder als Anzahl an, je nachdem, welche Option oben im Diagramm ausgewählt ist. Prozent ist besonders hilfreich, um zu sehen, wie sich die Verteilung von Gruppen im Laufe der Zeit geändert hat. Für diese Art von Karte werden keine statistischen Tests durchgeführt.
Statistische Tests in Stats iQ
Stats iQ wählt statistische Tests basierend auf den Variablentypen und der Struktur der analysierten Spalten aus. Als Referenz finden Sie hier eine vollständige Liste der statistischen Nicht-Regressionstests und der Kennzahlen zur Effektgröße in Stats iQ:
- T-Test (2 Kategorien vs. Zahlen)
- ANOVA (3+ Kategorien vs. Zahlen)
- Games-Howell nach Hoc-Tests (3+ Kategorien vs. Zahlen)
- Cohen’s f
- Korrelation (Zahlen vs. Zahlen)
- Korrelation nach Pearson
- Spearman-Korrelation
- Punkt-Biserial-Korrelation
- Cohen’s d
- Paarweise t-Test (Zahlen vs. Zahlen)
- Exakter Test von Fisher (2 Kategorien vs. 2 Kategorien)
- Chi-Quadrat (3+ Kategorien vs. Kategorien)
- Cramer V
- Z-Test (Kategorien vs. Kategorien)
- Zeitreihenanalyse
- Differenz der Differenzen (DID, DD)
Statistische Tests auswählen
Stats iQ wählt den richtigen statistischen Test für Sie aus, da er die Daten versteht (z. B. ob eine Variable eine Zahlenvariable oder eine Kategorievariable ist). Sie können den Variablentyp jedoch ändern, um ein anderes Ergebnis auszulösen.
Sie können beispielsweise eine 1/0 mit einer Skala von 1 bis 7 verknüpfen. Wenn 1/0 als kategorisch betrachtet wird, ist das Ergebnis ein t-Test. Wenn es als numerisch betrachtet wird, ist das Ergebnis eine Korrelation (die Ergebnisse dieser beiden Analysen sind sehr ähnlich).
Stats iQ führt eine „Rangfolge“-Beziehung aus, wenn numerische Daten nicht normal verteilt sind oder Ausreißer aufweisen. Wenn Sie die Beziehung “unranked” (oder umgekehrt) sehen möchten, ist diese Option in den statistischen Testergebnissen verfügbar. Weitere Informationen zu Ranglistentests finden Sie auf der Seite Statistische Testannahmen und Technische Details.
Problem mit mehreren Vergleichen
Das Problem “Mehrere Vergleiche” kann auftreten, wenn Sie die Relate-Analyse mit einer großen Anzahl von ausgewählten Nicht-Schlüsselvariablen verwenden. In dieser Analyse sehen Sie wahrscheinlich, dass etwa 5 der Ergebnisse durch reines Glück als statistisch signifikant und nicht unbedingt als aussagekräftige Beziehung angezeigt werden. Dies ist eine notwendige Folge der Funktionsweise der statistischen Analyse.
Wenn Sie in Stats iQ viele Analysen auf einmal ausführen und Ergebnisse sehen, bei denen der p-Wert eng signifikant ist (z.B. 0,03 statt 0,00004), ist dies ein guter Hinweis darauf, dass diese Korrelationen nicht unbedingt signifikant sind.
Statistiken in Sätze übersetzen
Stats iQ erläutert die Ergebnisse der Relate-Analyse auf eine leicht verständliche Weise, auch ohne Expertenwissen in Bezug auf Statistiken.
Wenn der p-Wert nicht unter dem Schwellenwert der statistischen Signifikanz liegt (der Standardwert hierfür in Stats iQ ist 0,05), erklären die Sätze, dass es keine statistisch signifikante Beziehung gibt.
Wenn der p-Wert unter dem Schwellenwert liegt, prüft Stats iQ die Effektgröße. Je nach Effektgröße fügt Stats iQ dem Satz Wörter wie „schwach“ oder „stark“ hinzu, um die Beziehung zu charakterisieren. Weitere Informationen zur Interpretation von Effektgröße und p-Wert finden Sie, indem Sie auf die Informationsdrucktaste (i) unter Statistische Testergebnisse anzeigen klicken.
Die folgende Tabelle zeigt, wie variable Beziehungen für t-Tests basierend auf der Effektgröße beschrieben werden.
Effektgröße | Interpretation der Effektgröße | Stats iQ Sprache |
Unter 0,2 | Trivialer oder kein Effekt | Es gibt keine statistisch signifikante Beziehung zwischen den Variablen. |
zwischen 0,2 und 0,5 | Kleiner Effekt | Variablen sind statistisch verwandt. Wir würden nicht ein zusätzliches Adjektiv verwenden, um ihre Beziehung zu charakterisieren. |
zwischen 0,5 und 0,8 | Mittlerer Effekt | Variablen sind statistisch verwandt. Wir würden nicht ein zusätzliches Adjektiv verwenden, um ihre Beziehung zu charakterisieren. |
Über 0,8 | Großer Effekt | Variablen sind “stark” verwandt. |
Je nach Art des verwendeten statistischen Tests unterscheiden sich die Schwellenwerte für die Effektgröße geringfügig. Es gilt jedoch das gleiche allgemeine Muster.