Datenersetzung und Redaktion
Datenersetzung und Redaktion
Mit der Datensubstitution und -unktion können Sie sensible Daten ausblenden oder bestimmte Wörter und Phrasen in Kundenfeedback und -interaktionen automatisch ersetzen.
So funktioniert es:
- Für Ersetzungen definieren Sie Substitutionsregeln in einer Textdatei und wenden sie auf einen Daten-Upload-Job an. Phrasen und Wörter, die in der Ersetzungsdatei definiert sind, werden in den unstrukturierten Feldern ersetzt.
- Für Redactions definieren Sie Datenmuster, die in einer Textdatei mithilfe regulärer Ausdrücke maskiert werden sollen. Wörter und Zahlen, die den regulären Ausdrücken entsprechen, werden in den unstrukturierten Feldern durch vier “X”-Symbole ersetzt.
Auf Datensubstitutions- und Redaktionsoptionen zugreifen
Sie haben zwei Möglichkeiten, auf die Optionen zur Datensubstitution und Unkenntlichmachung für einen Job zuzugreifen:
- Beim Anlegen eines Jobs haben Sie die Möglichkeit, Datenersetzungs- und Redaktionsregeln auf einen Job für die Datenersetzung und -redaktion anzuwenden. In diesem Fall werden Datenersetzungs- und Redaktionsregeln auf alle Daten angewendet, die über diesen Job hochgeladen werden.
Tipp: Ersetzungen und Redactions sind optional: Sie können beide, nur eine oder keine angeben.
- Für vorhandene Jobs können Sie auf Datensubstitutions- und Ungültigkeitsoptionen zugreifen, indem Sie die Option Datensubstitution und Unkenntlichmachung im Aktionsmenü des Jobs auswählen. Sie können dann Datensubstitutions- und Ungültigkeitsregeln über das angezeigte Fenster für die Datensubstitution und die Unkenntlichmachung auf einen Job anwenden. In diesem Fall werden Datensubstitutions- und Ungültigkeitsregeln auf alle Daten angewendet, die über diesen Job hochgeladen werden.
Datensubstitutions- und Redaktionsaufgaben
Sie können beim Anlegen eines Jobs eine Reihe von Datenersetzungs- und Ungültigkeitsaufgaben auf der Seite Datenersetzung und -unktion oder beim Verwalten von Datenersetzungs- und Redaktionsregeln für vorhandene Jobs über das Fenster für die Datenersetzung und die Unkenntlichmachung ausführen.
Vertretungsregeln hochladen
- Klicken Sie im Abschnitt Substitution auf die Schaltfläche Klicken Sie, um eine Datei für den Upload auszuwählen, und zeigen Sie auf die Ersatzdatei, oder legen Sie Ihre Datei auf dem grauen Grafikbereich ab.
- Klicken Sie auf Anwenden.
Die neue Datei ersetzt ggf. zuvor definierte Ersetzungen.
Redaktionsregeln hochladen
- Klicken Sie im Abschnitt Redaktion auf die Schaltfläche Klicken Sie, um eine Datei für den Upload auszuwählen, und zeigen Sie auf die Redaktionsdatei, oder legen Sie Ihre Datei auf dem grauen Grafikbereich ab.
- Klicken Sie auf Anwenden.
Die neue Datei ersetzt ggf. zuvor definierte Redaktionen.
Vorhandene Regeln herunterladen (optional)
Wenn für den Job bereits Substitutions- oder Redaktionsregeln definiert wurden, können Sie diese herunterladen, indem Sie im entsprechenden Abschnitt auf die Drucktaste Aktuelle Datei klicken.
Vorhandene Regeln bereinigen (optional)
- Wählen Sie im entsprechenden Abschnitt die Drucktaste Zurücksetzen.
- Klicken Sie auf Anwenden.
Ersatzvorlage herunterladen (optional)
Wenn Sie wissen möchten, wie Ihre Ersetzungslisten aussehen sollen, wählen Sie im Abschnitt Vertretung die Drucktaste Vorlage.
Redaktionsvorlage herunterladen (optional)
Wenn Sie wissen möchten, wie Ihre Redaktionslisten aussehen sollen, wählen Sie im Abschnitt Redaktion die Drucktaste Vorlage.
Führendes oder nachfolgendes Leerzeichen ausschließen (optional)
Wenn Sie Leerzeichen in einer Vorlage mit Ersetzungs- oder Redaktionsregeln entfernen möchten, um Ihre Ausgabe zu formatieren, lassen Sie das Kontrollkästchen Führendes oder nachfolgendes Leerzeichen ausschließen in der oberen linken Ecke standardmäßig markiert.
Substitutions- und Redaktionsregeln testen (optional)
- Laden Sie die Vertretungs- und Redaktionsregeln hoch.
- Klicken Sie auf Anwenden.
- Klicken Sie auf Testen.
- Fügen Sie im angezeigten Fenster Substitution und Redaktion testen ein Feedback-Beispiel in das Eingabefeld ein.
- Klicken Sie auf Transformieren, um das Ergebnis der Transformation im Feld Ausgabe anzuzeigen.
- Wählen Sie Schließen, um das Fenster Vertretung und Redaktion testen zu schließen.
Herunterladen von Beispieldaten
- Laden Sie die Vertretungs- und Redaktionsregeln hoch.
- Klicken Sie auf Anwenden.
- Klicken Sie auf Beispieldaten herunterladen.
- Die heruntergeladene Excel-Datei enthält zwei Arbeitsblätter:
- Standarddaten: Nicht zugeordnete Quellfelder mit Standardnamen und -werten (vor der Zuordnung).
- Zugeordnete Daten: Zugeordnete Felder mit transformierten Namen und Werten (nach der Zuordnung). Substitutions- oder Datenzuordnungsregeln, die mit dem unstrukturierten Text in Ihren Beispieldaten übereinstimmen, werden angewendet.
- Speichern Sie die Excel-Tabelle auf Ihrer Festplatte.
Format der Substitutionsregeln
Sie können Substitutionsregeln in einer Textdatei im folgenden Format definieren:
- Jede Zeile kennzeichnet eine Substitutionsregel.
- Eine Substitutionsregel besteht aus den Wörtern oder Phrasen, die ersetzt werden sollen (im Beispiel links dargestellt), und den Ersatzwörtern oder Phrasen, die (im Beispiel rechts dargestellt) sind.
- Die Wörter oder Phrasen, die ersetzt werden sollen, und die ersetzenden Wörter werden durch einen Doppelpunkt (:) getrennt.
- Bei Vertretungsregeln wird zwischen Groß- und Kleinschreibung unterschieden.
- Um einen Kommentar hinzuzufügen, beginnen Sie die Zeile mit dem Symbol #.
Beispiel: Diese Substitutionsregel ersetzt einige häufige Rechtschreibfehler des Wortes “Coronavirus”:
# häufige Coronavirus-Rechtschreibfehler ersetzen
Korrodiertes Virus: Coronavirus
Caronna-Virus: Coronavirus
Crooner-Virus: Coronavirus
Redaktionsregelformat
Sie können Redaktionsregeln in einer Textdatei mit dem folgenden Format definieren:
- Jede Zeile kennzeichnet eine Redaktionsregel.
- Eine Redaktionsregel besteht aus einem regulären Ausdruck, der ein zu maskierendes Datenmuster definiert.
- Negative Lookaheads werden nicht unterstützt.
- Um einen Kommentar hinzuzufügen, beginnen Sie die Zeile mit dem Symbol #.
Beispiel: Die folgende Redaktionsregel maskiert alle Instanzen einer aufeinanderfolgenden Gruppe von 3, 2 und 4 Ziffern, die durch Bindestriche getrennt sind:
# Sozialversicherungsnummern maskieren
\d{3}-\d{2}-\d{4}