通話記録データフォーマット

スイート

Customer Experience

製品

Qualtrics

このページの内容

通話録音のデータ形式について

XM Discoverでは、CSV、Excel、JSON、またはWebVTT形式でトランスクリプト（音声会話のトランスクリプト）を呼び出すことができます。通話記録は、会話の参加者を特定し、各メッセージを参加者に属性付けする。

通常、通話トランスクリプトには、顧客と企業のエンティティ間の会話を表す、構造化および非構造化データフィールドが多数含まれています（たとえば、顧客と自動電話サービス間のトランスクリプト、または顧客とライブサポート担当者間の通話トランスクリプト）。構造化フィールドには、日付、数字、または高度に組織化されたテキストデータ（ブランド名、参加者名、製品名など）を含めることができる。非構造化フィールドには、メモ、コメント、その他自由記述のテキストフィールドが含まれます。

以下のフォーマットでコールをアップロードできます：

CSV
XLS または XLSx (Microsoft Excel)
JSON
ウェブヴイティーティー

通話録音のCSVおよびExcelフォーマット化

このセクションでは、CSVおよびExcelファイルの通話録音の書式設定について説明します。どちらのファイルタイプも書式と条件は同じです。

CSVおよびExcelファイルでは、通話記録は複数の行を使用して定義されます。ITの仕組みはこうだ：

各行には、参加者データおよびタイムスタンプとともに、会話の個々の行が含まれます。
別々の行は、同じ会話IDを共有することで、1つの会話にまとめられる。
会話全体のフィールド値（ドキュメント日付やカスタム属性など）は、会話の最初の行から取得されます。

要素	説明
`conversationId` 必須	会話全体のユニークなID。同じIDを持つ各行は、1つの会話内で別々の行として扱われる。このフィールドを`natural_id` 属性にマップすると、ドキュメントの Natural ID として使用できます。
`conversationTimestamp` 必須	会話全体の日時。秒単位の精度でISO 8601フォーマットを使用する。このフィールドを`document_date` 属性にマッピングすると、文書日付として使用できます。
`participantId` 必須	参加者のID。会話（文書）ごとにユニークでなければならない。
`participantType` 必須	参加者のタイプ。可能な値： AGENT：企業の担当者またはチャットボットを示す。 CLIENT：顧客を示す。 TYPE_UNKNOWN：未確認の参加者を示す。これらの値は、レポートおよび参加者の図表のために、CB参加者タイプ属性に渡される。未指定の場合、CB参加者タイプはレポート可能な値を持ちません。
`is_ivr` （任意）	参加者がインタラクティブボイスレスポンス（IVR）ボットであるか、人であるかを示すブール値フィールド。 true：IVRボットを示す。 false：人を示す。これらの値は、レポートと参加者の図表のために、CB Kind of Participant属性に渡される。未指定の場合、参加者の種類は報告されない。
`text` 必須	スピーチ原稿。注意: すべてのテキスト要素の合計が100,000文字を超えることはできません。その場合、ドキュメントはスキップされる。
`start` 必須	発話開始のタイミング（会話開始からの経過ミリ秒）。
`end` 必須	会話が終了したタイミング（会話開始からの経過ミリ秒）。
`contentSegmentType` 必須	このパラメータはトランスクリプトのフォーマットを識別し、自然言語処理（NLP）エンジンがデータを正しく処理できるようにします。可能な値： TOKEN：書き起こされたデータは1単語ずつ提供される。センテンス：書き起こされたデータは1文ずつ提供される。 TURN：書き起こされたデータは、一度に一人のスピーカーのターンで提供される。
`custom fields` （任意）	会話に構造化属性を追加するために、複数のフィールドを提供することができます。

通話録音のJSONフォーマット

このセクションには、通話録音のJSONフォーマットが含まれています。

トップレベル・オブジェクト

次の表は、ドキュメント・ノードのトップレベル・オブジェクトについて説明したものです。

要素	説明
`conversationId`	会話全体のユニークなID。このフィールドを`natural_id` 属性にマップすると、ドキュメントの Natural ID として使用できます。
`conversationTimestamp`	会話全体の日時。秒単位の精度でISO 8601フォーマットを使用する。このフィールドを`document_date` 属性にマッピングすると、文書日付として使用できます。
`content`	会話の内容を含むオブジェクト。これらのネストされたオブジェクトを含む： `participants` `conversationContent` `contentSegmentType`
カスタムフィールド（属性）	会話に構造化属性を追加するために、複数のキーと値のペアを提供することができます。

コンテンツオブジェクト

次の表は、コンテンツ・オブジェクトの内部に入れ子になっているオブジェクトについて説明したものである。

要素	説明
`participants`	会話の参加者に関する情報を提供するオブジェクトの配列。これらのフィールドを含む： `participant_id` `type` `is_ivr`
`conversationContent`	会話の行を含むオブジェクトの配列。これらのフィールドを含む： `participant_id` `text` `start` `end`
`contentSegmentType` （必須）	このパラメータはトランスクリプトのフォーマットを識別し、自然言語処理（NLP）エンジンがデータを正しく処理できるようにします。可能な値： TOKEN：書き起こされたデータは1単語ずつ提供される。センテンス：書き起こされたデータは1文ずつ提供される。 TURN：書き起こされたデータは、一度に一人のスピーカーのターンで提供される。

要素

説明

participants

会話の参加者に関する情報を提供するオブジェクトの配列。これらのフィールドを含む：

participant_id
type
is_ivr

conversationContent

会話の行を含むオブジェクトの配列。これらのフィールドを含む：

participant_id
text
start
end

contentSegmentType

（必須）

このパラメータはトランスクリプトのフォーマットを識別し、自然言語処理（NLP）エンジンがデータを正しく処理できるようにします。

可能な値：

TOKEN：書き起こされたデータは1単語ずつ提供される。
センテンス：書き起こされたデータは1文ずつ提供される。
TURN：書き起こされたデータは、一度に一人のスピーカーのターンで提供される。

参加者オブジェクト

以下の表は、参加者オブジェクトの中に入れ子になっているフィールドを説明している。

要素	説明
`participant_id` （必須）	参加者のID。会話（文書）ごとにユニークでなければならない。
`type` 必須	参加者のタイプ。可能な値： AGENT：企業の担当者またはチャットボットを示す。顧客：顧客を示す。 TYPE_UNKNOWN：未確認の参加者を示す。これらの値は、レポートおよび参加者の図表のために、CB参加者タイプ属性に渡される。未指定の場合、CB参加者タイプはレポート可能な値を持ちません。
`is_ivr` （任意）	参加者がインタラクティブボイスレスポンス（IVR）ボットであるか、人であるかを示すブール値フィールド。 true：IVRボットを示す。 false:人を示す。これらの値は、レポートと参加者の図表のために、CB Kind of Participant属性に渡される。未指定の場合、参加者の種類は報告されない。

要素

説明

participant_id

（必須）

参加者のID。会話（文書）ごとにユニークでなければならない。

type

必須

参加者のタイプ。可能な値：

AGENT：企業の担当者またはチャットボットを示す。
顧客：顧客を示す。
TYPE_UNKNOWN：未確認の参加者を示す。

これらの値は、レポートおよび参加者の図表のために、CB参加者タイプ属性に渡される。

未指定の場合、CB参加者タイプはレポート可能な値を持ちません。

is_ivr

（任意）

参加者がインタラクティブボイスレスポンス（IVR）ボットであるか、人であるかを示すブール値フィールド。

true：IVRボットを示す。
false:人を示す。

これらの値は、レポートと参加者の図表のために、CB Kind of Participant属性に渡される。

未指定の場合、参加者の種類は報告されない。

会話内容オブジェクト

以下の表は、conversationContentオブジェクトの中にネストされたフィールドを説明する。

要素	説明
`participant_id` 必須	発言している参加者のID。参加者配列で指定されたIDのいずれかと一致しなければならない。
`text` 必須	スピーチ原稿。注意: すべてのテキスト要素の合計が100,000文字を超えることはできません。その場合、ドキュメントはスキップされる。
`start` 必須	発話開始のタイミング（会話開始からの経過ミリ秒）。
`end` 必須	会話が終了したタイミング（会話開始からの経過ミリ秒）。

例

{

"conversationId"："46289", "conversationTimestamp"："2020-07-30T10:15:45.000Z", "content"：{ "参加者"：[ { "participant_id"："1", "type"："AGENT", "is_ivr": false }, { "participant_id"："2", "type"："CLIENT", "is_ivr": false } ], "conversationContent"：[ { "participant_id"："1", "text"："This is Emily, how may I help you?", "start": 22000, "end"：32000 }, { "participant_id"："2", "text"："Hi, I have a couple of questions.", "start"：32000, "end"：42000 } ], "contentSegmentType"："TURN" }, "city"："Boston", "source"："Call Center" } ]。

通話録音のWebVTTフォーマット

WebVTTフォーマットを使用して通話記録をアップロードできます。

文書の日付は、ファイル名から自動的に取得されます。文書の日付を自動的に設定するには、ファイル名が以下の接頭辞で始まることを確認してください：

<Timezone><YYYY><MM><DD>-

例: GMT20201011-meeting.vtt

ファイル名が異なるフォーマットを使用している場合は、マッピングステップのDocument Dateフィールドに日付変換を適用する。詳しくは、「特定の文書の日付を設定する」をご覧ください。

例

以下は、WebVTTフォーマットによるZoom通話のトランスクリプトの例です。

WEBVTT 1 00:00:00.599 --> 00:00:02.280 ジョン・スミスです： 2 00:00:04.230 --> 00:00:05.339 John Smith: start sharing 3 00:00:12.809 --> 00:00:13.469 John Smith： 4 00:00:15.750 --> 00:00:18.119 ジョン・スミスです： 5 00:00:19.050 --> 00:00:28.890 Paul Jones：はい、見えます。

当サポートサイトの日本語のコンテンツは英語原文より機械翻訳されており、補助的な参照を目的としています。機械翻訳の精度は十分な注意を払っていますが、もし、英語・日本語翻訳が異なる場合は英語版が正となります。英語原文と機械翻訳の間に矛盾があっても、法的拘束力はありません。

この記事は役に立ちましたか

いただいたフィードバックはこのページの改善の目的のみに利用します。

素晴らしい！フィードバックありがとうございます！

フィードバックありがとうございます！