Joins (CX)
Joins im Überblick
Mit Joins können Sie Zeilen aus zwei oder mehr Datenquellen basierend auf einer zugehörigen Datenspalte kombinieren, die sie gemeinsam nutzen. Durch die Verwendung eines Joins können Sie die kombinierten Daten effizienter und effektiver sammeln und analysieren und so mehr Erkenntnisse gewinnen.
Der CX-Datenmodellierer unterstützt in erster Linie Left Outer Joins. Nur linke äußere Joins werden kontinuierlich aktualisiert.
Tasten verbinden
Ein Verknüpfungsschlüssel ist ein Feld, das beim Abgleich mehrerer Datensätze hilft und angibt, welche Datensätze kombiniert werden sollen. Zum Beispiel eindeutige Bezeichner, die Sie Ihren Dashboard-Daten zuordnen, wie IDs und Benutzernamen. Verbindungsschlüssel sind wichtig, um sicherzustellen, dass eine Verbindung korrekt eingerichtet ist.
Der Datenmodellierer unterstützt keine Join-Schlüssel, die:
- Wurden neu codiert.
- Sind bearbeitet worden.
- Werden durch ein beliebiges Text iQ-Feld (z. B. Themen, Stimmungen, Handlungsfähigkeit usw.) aufgefüllt.
- Mehr als 50.000 eindeutige Werte haben.
Weder der auf der rechten noch der auf der linken Seite hinzugefügte Verknüpfungsschlüssel unterstützt diese Konfigurationen.
Linke äußere Joins verstehen
Um zu verstehen, wie ein Left Outer Join funktioniert, sehen wir uns ein Beispiel an. Hier fügen wir dem Feedback unserer Kunden weitere Informationen über den Standort einer Filiale hinzu.
Sehen Sie sich das Bild des Datensatzes unten an. Die erste Datenquelle oben ist unsere „linke“ Datenquelle, und die zweite Datenquelle unten ist unsere „rechte“ Datenquelle.
In den folgenden Tabellen finden Sie die Daten, die Sie in den einzelnen Umfragen finden können
:Feedback der Kunden (Linke Quelle)
Kunden-ID | Zufriedenheit (1-5) | Standort-ID |
101 | 2 | 555 |
102 | 4 | 777 |
103 | 5 | 999 |
104 | 5 | 222 |
105 | 3 | 555 |
Store Locations (Rechte Quelle)
Standort-ID | Standortname |
555 | Provo |
777 | Dublin |
999 | Seattle |
1000 | Tokio |
Sie entscheiden sich für die Verknüpfung der Daten basierend auf Lokations-ID. Dieses Feld wird als “Join-Schlüssel” bezeichnet.
Dies sind die einzigen Daten des zweiten (rechten) Datensatzes. Dies wäre entfernt:
Standort-ID | Standortname |
1000 | Tokio |
Dies ist die endgültige Ausgabe oder alle Daten, die enthalten in Ihren Ergebnisse:
Kunden-ID | Zufriedenheit (1-5) | Standort-ID | Standortname |
101 | 2 | 555 | Provo |
102 | 4 | 777 | Dublin |
103 | 5 | 999 | Seattle |
104 | 5 | 222 | null |
105 | 3 | 555 | Provo |
Beachten Sie, dass die Ergebnisse Datenspalten sowohl aus der rechten als auch aus der linken Quelle enthalten, da diese Zeilen gemeinsame Standort-IDs geteilt haben.
In der Datenquelle gab es keine Feedback-Daten für Tokio, daher ist Tokio nicht im endgültigen Datensatz enthalten. Außerdem gibt es keine Locations mit der ID 222, so dass der Name dieses Geschäfts als “null” zurückgegeben wird
Bedeutung eindeutiger VerknüpfungsschlüsselDa
Verknüpfungsschlüssel dazu beitragen, Zeilen zu identifizieren, die aus den linken und rechten Quellen kombiniert werden müssen, empfehlen wir, sicherzustellen, dass der verwendete Verknüpfungsschlüssel wie ein eindeutiger Bezeichner wirkt. Wenn in der rechten Quelle mehrere Datensätze vorhanden sind, die mit dem Join-Schlüssel der linken Quelle übereinstimmen, wird nur einer von ihnen zufällig abgerufen..
Beispiel: Sehen wir uns das oben besprochene Beispiel an. Wir haben die gleiche linke Quelle. Aber in der richtigen Quelle gibt es folgende Zeilen:
Standort-ID | Standortname |
338 | Raleigh |
338 | Charlotte |
In der resultierenden Verknüpfung wird nur eine der 338 Zeilen gespeichert, nicht aber beide.
Wenn der Join-Schlüssel nicht für jeden Datensatz in einer rechten Quelle eindeutig ist und Sie alle Datensätze aus der rechten und linken Quelle einschließen möchten, Union stattdessen verwendet werden. Unionen ziehen jeden Datensatz separat ein, anstatt die Informationszeilen zu kombinieren.
Verstehen von Inner Joins
Bei einer inneren Verknüpfung enthält der resultierende, zusammengeführte Datensatz nur übereinstimmende Zeilen, die in beiden Datensätzen gefunden wurden. Da innere Verknüpfungen Datensätze aus beiden Quellen ausschließen, in denen Daten fehlen, haben die resultierenden Datensätze in der Regel weniger leere Spalten, und die Reihenfolge der Quellen (links oder rechts) ist weniger wichtig als bei anderen Verknüpfungsarten.
Nehmen wir an, diese Tabellen stellen die Daten dar, die Sie in den einzelnen Umfragen finden können
:Kundenbelohnungsstufe (Linke Quelle)
Kunden-ID | Name | Belohnungsstufe |
101 | Phil Stein | Smaragd |
102 | Amir Dar | Gold |
103 | Beth Green | Silber |
104 | Lucia Vasquez | Smaragd |
Store Experience Feedback (richtige Quelle)
Kunden-ID | Zufriedenheit (1-5) | Filiale |
101 | 1 | Provo |
104 | 3 | Provo |
113 | 5 | Scranton |
Sie entscheiden sich für die Verknüpfung der Daten auf der Grundlage der Kunden-ID. Dieses Feld wird als “Verknüpfungsschlüssel” bezeichnet
Dies sind alle Daten aus jeder Datenquelle, die aus dem endgültigen Datensatz ausgeschlossen werden sollen.
Kunden-ID | Name | Belohnungsstufe | Zufriedenheit (1-5) | Filiale |
102 | Amir Dar | Gold | Null | Null |
103 | Beth Green | Silber | Null | Null |
113 | Null | Null | 5 | Scranton |
Dies ist die endgültige Ausgabe bzw. alle Daten, die in Ihre Ergebnisse aufgenommen werden sollen:
Kunden-ID | Zufriedenheit (1-5) | Name | Filiale | Belohnungsstufe |
101 | 1 | Phil Stein | Provo | Smaragd |
104 | 3 | Lucia Vasquez | Provo | Smaragd |
Obwohl diese Quellen nach Kunden-ID zusammengeführt werden, werden die Kunden mit den IDs 102, 103 und 113 aus dem endgültigen Datensatz ausgeschlossen, da ihnen zu viele Informationen fehlen. Nur für Phil (101) und Lucia (104) liegen vollständige Daten aus beiden Quellen vor.
Vollständige äußere Verknüpfungen verstehen
Bei einer vollständigen äußeren Verknüpfung enthält der resultierende, zusammengeführte Datensatz alle Zeilen aus beiden Datensätzen. Während die Datensätze nach dem Verknüpfungsschlüssel abgeglichen und zusammengeführt werden, werden auch Datensätze, bei denen Daten für den Verknüpfungsschlüssel fehlen, in den endgültigen Datensatz aufgenommen.
Nehmen wir an, diese Tabellen stellen die Daten dar, die Sie in den einzelnen Umfragen finden können
:Kundenbelohnungsstufe (Linke Quelle)
Kunden-ID | Name | Belohnungsstufe |
101 | Phil Stein | Smaragd |
102 | Amir Dar | Gold |
104 | Lucia Vasquez | Smaragd |
Null | Beth Green | Silber |
Store Experience Feedback (richtige Quelle)
Kunden-ID | Zufriedenheit (1-5) | Filiale |
101 | 1 | Provo |
104 | 3 | Provo |
113 | 5 | Scranton |
Sie entscheiden sich für die Verknüpfung der Daten auf der Grundlage der Kunden-ID. Dieses Feld wird als “Verknüpfungsschlüssel” bezeichnet
Dies ist die endgültige Ausgabe bzw. alle Daten, die in Ihre Ergebnisse einfließen würden.
Kunden-ID | Zufriedenheit (1-5) | Name | Filiale | Belohnungsstufe |
101 | 1 | Phil Stein | Provo | Smaragd |
102 | Null | Amir Dar | Null | Gold |
104 | 3 | Lucia Vasquez | Provo | Smaragd |
113 | 5 | Null | Scranton | Null |
Null | Null | Beth Green | Null | Silber |
Beachten Sie, dass keine Daten ausgeschlossen sind. Sogar Beth Green, der die Daten für die Kunden-ID fehlen, ist in den Ergebnissen enthalten. Wenn es mehrere Null-Kunden-ID-Zeilen gibt, wird jede dieser Zeilen einbezogen und bleibt ein separater, eindeutiger Datensatz.
Joins anlegen
- Datenmodell anlegen.
- Fügen Sie Ihrem Datenmodell mindestens zwei Quellen hinzu.
Tipp: Stellen Sie sicher, dass Sie alle Felder einschließen, die Sie in Ihren Datenquellen benötigen, einschließlich des allgemeinen Felds, das Sie zum Verknüpfen Ihrer Daten verwenden werden (z. B. eine eindeutige ID). - Klicken Sie auf das Pluszeichen ( + ) weiter der Datenquelle, die Sie als Ihre Links Datenquelle.
- Auswählen Join.
- Benennen Sie die Ausgabe. Dies ist hilfreich, wenn Sie Ihrem Datenset mehrere Joins hinzufügen möchten.
- Unter Eingabewählen Sie die Option Rechts Datenquelle.
- Legen Sie eine Bedingung. Entspricht dem Feld, das jeder Datensatz gemeinsam hat.
Beispiel: Hier bilden wir unsere Eindeutige ID Feld aus jeder Datenquelle aufeinander.Qtip: Fast alle Feldtypen können in Verknüpfungsbedingungen verwendet werden, mit Ausnahme von Datumsfeldern und Feldern mit Mehrfachantworten. Wir empfehlen dringend die Verwendung eines eindeutige ID die über beides Datenquellen.
- Sie können separate Joins im selben Datenset. In diesem Screenshot würden Sie den Daten aus „2022 Umfrage and Actionability“ beitreten, aber nicht den beiden wichtigsten Datenquellen.
- Fertigstellen Anlegen Ihres Datenmodells mit einem Ausgabedatenset.
Hilfs-Joins verwenden
Mit zusätzlichen Joins können Sie mehrere Quellen mit derselben Bedingung verknüpfen. Daher sind sie nützlich, wenn Sie mehrere überlappende Joins mit denselben Datenquellen erstellen möchten.
Zuvor haben wir darüber gesprochen, wie Left Outer Joins funktionieren mit 2 Quellen: einer rechten und einer linken Quelle. Mithilfe von Hilfs-Joins können Sie mehrere rechte Quellen für dieselbe linke Quelle in einem Join festlegen.
Beispiel für einen Auxiliary JoinAngenommen
, Sie haben eine Kundendatenbank mit Namen, die mit IDs verknüpft sind. Sie haben 2 Jahre lang Umfragen durchgeführt, in denen Sie das Feedback Ihrer Kunden gesammelt haben. Im folgenden Beispiel finden wir die Zufriedenheitsbewertung und den Namen des Kunden für das Feedback aus den Jahren 2020 und 2021.
Liste der Kunden (Linke Quelle)
Kunden-ID | Name des Kunden |
101 | Jimmy Horowitz |
102 | Deepti Pathan |
103 | Gina Chung |
104 | Daniel Wagner |
Feedback 2020 (richtige Quelle)
Kunden-ID | Zufriedenheit (1-5) |
101 | 2 |
102 | 4 |
103 | 5 |
Feedback 2021 (zusätzliche rechte Quelle)
Kunden-ID | Zufriedenheit (1-5) |
101 | 3 |
104 | 5 |
838 | 4 |
Sie verknüpfen die Daten basierend auf Lokations-ID.
Dies ist die endgültige Ausgabe oder alle Daten, die enthalten in Ihren Ergebnisse:
Kunden-ID | Name des Kunden | Befriedigung 2020 | Befriedigung 2021 |
101 | Jimmy Horowitz | 2 | 3 |
102 | Deepti Pathan | 4 | null |
103 | Gina Chung | 5 | null |
104 | Daniel Wagner | null | 5 |
Erfahren Sie, wie die Daten für 2020 und 2021 separat Spalten im selben Ausgabedatenset.
Sie werden feststellen, dass Jimmy der einzige Kunde ist, der für beide Jahre Feedback abgegeben hat, so dass seine beiden Spalten Werte aufweisen. Alle anderen haben eine leere “Null”-Zelle unter dem Jahr des verpassten Feedbacks.
Datensätze mit der Kunden-ID “838” wurden aus der endgültigen Datenquelle ausgeschlossen, da die Liste der Kunden keinen entsprechenden Namen/Datensatz für diese ID enthielt. Siehe Linke äußere Joins verstehen für eine Erläuterung, wie Daten ausgeschlossen werden.
Anlegen eines Hilfs-Joins
- Klicken Sie auf eine bestehende Verbindung.
- Bleiben Sie in Join-Einstellungen.
- Klicken Sie ganz unten auf das Pluszeichen ( + ).
- Wählen Sie den rechten Eingang für die neue, zweite Verbindung.
Beispiel: Dies ist die zweite Quelle, die Sie mit Ihrer linken Quelle verknüpfen möchten. In unserem Beispiel oben wäre dies die Umfrage zum Feedback aus dem Jahr 2021. - Legen Sie die Bedingung.
- Legen Sie die Bedingung.
Wiederholen Sie die Schritte nach Bedarf, um weitere Hilfs-Joins hinzuzufügen.
Vermeidung von verketteten Verknüpfungen
Sie können mehrere Joins in einem Datenmodell haben. Es ist jedoch wichtig, darauf zu achten, wie diese Verbindungen zusammenwirken (oder nicht zusammenwirken). Datenmodelle unterstützen derzeit keine verketteten Joins.
Eine verkettete Verknüpfung unterscheidet sich von einer Hilfsverknüpfung. Bei einer verketteten Verknüpfung erstellen Sie eine Verknüpfung mit einer anderen Verknüpfung innerhalb dieser Verknüpfung.
Das folgende Beispiel ist eine Hilfsverbindung und wird unterstützt. Beachten Sie, dass die Verknüpfung innerhalb desselben einzelnen Knotens mit überlappenden Quellen definiert ist:
Das folgende Beispiel ist eine verkettete Verknüpfung und wird nicht unterstützt. Beachten Sie, dass es separate Verbindungen innerhalb anderer Verbindungen gibt.