Ir para o conteúdo principal
Loading...
Skip to article
  • Qualtrics Platform
    Qualtrics Platform
  • Customer Journey Optimizer
    Customer Journey Optimizer
  • XM Discover
    XM Discover
  • Qualtrics Social Connect
    Qualtrics Social Connect

Chamar formatos de dados de transcrições


Was this helpful?


This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

The feedback you submit here is used only to help improve this page.

That’s great! Thank you for your feedback!

Thank you for your feedback!


Sobre formatos de dados de transcrições de chamada

O XM Discover permite que você chame transcrições (ou seja, transcrições de conversas de áudio) pelo formato CSV, Excel, JSON ou WebVTT. As transcrições de chamada identificam os participantes em uma conversação e atribuem cada mensagem a um participante.

Normalmente, as transcrições de chamada contêm vários campos de dados estruturados e não estruturados que representam uma conversa entre um cliente e uma entidade em sua empresa (por exemplo, a transcrição entre um cliente e seu serviço telefônico automatizado ou a transcrição da chamada entre um cliente e um representante de suporte ao vivo). Os campos estruturados podem conter datas, números ou dados de texto com um alto grau de organização (como nomes de marcas, nomes de participantes e produtos). Os campos não estruturados contêm notas, comentários e outros campos de texto aberto.

Você pode efetuar o upload da chamada por meio dos seguintes formatos:

  • CSV
  • XLS ou XLSX (Microsoft Excel)
  • JSON
  • WebVTT

Formatação CSV e Excel para transcrições de chamada

Esta seção abrange a formatação de transcrições de chamada para arquivos CSV e Excel. A formatação e os requisitos para os dois tipos de arquivo são os mesmos.

Em arquivos CSV e Excel, as transcrições de chamada são definidas usando várias linhas. Veja como funciona:

  • Cada linha contém uma linha individual de diálogo em uma conversação, juntamente com os dados do participante e um registro da hora.
  • As linhas separadas são roladas em uma única conversação compartilhando o mesmo ID de conversação.
  • Os valores de campo para toda a conversação (como Data do documento ou atributos personalizados) são retirados da primeira linha da conversação.
Elemento Descrição
conversationId

(obrigatório)

Um código exclusivo para toda a conversação. Cada linha que tem o mesmo código é tratada como uma linha separada em uma única conversação.

Você pode mapear este campo para o atributo natural_id para usá-lo como o ID natural do documento.

conversationTimestamp

(obrigatório)

A data e hora de toda a conversa. Use o formato ISO 8601 com precisão de segundos.

Você pode mapear este campo para o atributo document_date para usá-lo como Data do documento.

participantId

(obrigatório)

O código do participante. Deve ser exclusivo por conversação (documento).
participantType

(obrigatório)

O tipo do participante. Valores possíveis:

  • AGENTE: indica um representante da empresa ou um chatbot.
  • CLIENT: indica um cliente.
  • TYPE_UNKNOWN: indica um participante não identificado.

Esses valores são transferidos para o atributo Tipo de participante CB para relatórios e visualização de participantes.

Se não especificado, o Tipo de Participante CB não terá valor relatável.

is_ivr

(opcional)

Um campo booliano que indica se um participante é um bot Interactive Voice Response (IVR) ou uma pessoa.

  • true: indica um bot IVR.
  • false: indica uma pessoa.

Esses valores são transferidos para o atributo Tipo de participante CB para relatórios e visualização de participantes.

Se não especificado, o tipo de participante CB não terá valor sujeito a notificação.

texto

(obrigatório)

Transcrição da fala.

Atenção: um total de todos os elementos de texto não pode exceder 100.000 caracteres. Em caso afirmativo, o documento é ignorado.
início

(obrigatório)

A hora em que o discurso começa (em milissegundos passou desde o início da conversa).
end

(obrigatório)

O tempo que a fala termina (em milissegundos passou desde o início da conversa).
contentSegmentType

(obrigatório)

Este parâmetro identifica o formato de transcrição, que permite que o mecanismo de processamento de linguagem natural (NLP) processe os dados corretamente.

Valores possíveis:

  • TOKEN: Os dados transcritos são fornecidos uma palavra de cada vez.
  • SENTENCE: Os dados transcritos são fornecidos uma frase de cada vez.
  • TURN: Os dados transcritos são fornecidos um turno de alto-falante de cada vez.
campos personalizados

(opcional)

Você pode fornecer vários campos para adicionar atributos estruturados à conversação.

Formatação JSON para transcrições de chamada

Esta seção contém formatação JSON para transcrições de chamada.

Objetos de nível superior

A tabela a seguir descreve os objetos de nível superior de um nó de documento.

Elemento Descrição
conversationId Um código exclusivo para toda a conversação.

Você pode mapear este campo para o atributo natural_id para usá-lo como o ID natural do documento.

conversationTimestamp A data e hora de toda a conversa. Use o formato ISO 8601 com precisão de segundos.

Você pode mapear este campo para o atributo document_date para usá-lo como Data do documento.

conteúdo Um objeto que contém o conteúdo da conversação. Inclui estes objetos aninhados:

  • participantes
  • conversationContent
  • contentSegmentType
campos personalizados (atributos) Você pode fornecer vários pares chave-valor para adicionar atributos estruturados à conversação.

Objeto de conteúdo

A tabela seguinte descreve os objetos aninhados dentro do objeto de conteúdo.

Elemento Descrição
participantes Uma matriz de objetos que fornece informações sobre os participantes da conversação. Inclui estes campos:

  • participant_id
  • tipo
  • is_ivr
conversationContent Uma matriz de objetos que contém as linhas da conversação. Inclui estes campos:

  • participant_id
  • texto
  • início
  • fim
contentSegmentType

(obrigatório)

Este parâmetro identifica o formato de transcrição, que permite que o mecanismo de processamento de linguagem natural (NLP) processe os dados corretamente.

Valores possíveis:

  • TOKEN: Os dados transcritos são fornecidos uma palavra de cada vez.
  • SENTENCE: Os dados transcritos são fornecidos uma frase de cada vez.
  • TURN: Os dados transcritos são fornecidos um turno de alto-falante de cada vez.

objeto participante

A tabela seguinte descreve os campos aninhados dentro do objeto de participantes.

Elemento Descrição
participant_id

(obrigatório)

O código do participante. Deve ser exclusivo por conversação (documento).
tipo

(obrigatório)

O tipo do participante. Valores possíveis:

  • AGENTE: indica um representante da empresa ou um chatbot.
  • CLIENT: indica um cliente.
  • TYPE_UNKNOWN: indica um participante não identificado.

Esses valores são transferidos para o atributo Tipo de participante CB para relatórios e visualização de participantes.

Se não especificado, o Tipo de Participante CB não terá valor relatável.

is_ivr

(opcional)

Um campo booliano que indica se um participante é um bot Interactive Voice Response (IVR) ou uma pessoa.

  • true: indica um bot IVR.
  • false: indica uma pessoa.

Esses valores são transferidos para o atributo Tipo de participante CB para relatórios e visualização de participantes.

Se não especificado, o tipo de participante CB não terá valor sujeito a notificação.

Objeto conversationContent

A tabela seguinte descreve os campos aninhados dentro do objeto conversationContent.

Elemento Descrição
participant_id

(obrigatório)

O ID do participante que está falando. Deve corresponder a um dos códigos fornecidos na matriz de participantes.
texto

(obrigatório)

Transcrição da fala.

Atenção: um total de todos os elementos de texto não pode exceder 100.000 caracteres. Em caso afirmativo, o documento é ignorado.
início

(obrigatório)

A hora em que o discurso começa (em milissegundos passou desde o início da conversa).
end

(obrigatório)

O tempo que a fala termina (em milissegundos passou desde o início da conversa).

Exemplo

Aqui está um exemplo de transcrição de chamada entre um agente e um cliente.

[
{
"conversationId": "46289",
"conversationTimestamp": "2020-07-30T10:15:45.000Z",
"content": {
"participant": [
"participant_id": "

,

type

" {

ENT AGisr:" ivr" "
" "
",
"start": 22000,
"end": 32000
},
{
"participant_id": "2",
"text": "Oi, eu tenho algumas perguntas.",
"start": 32000,
"end": 42000

"contentSegmentType": "TURN"
},
"city": "Boston",

"
"

Formatação WebVTT para certificados de chamada

Você pode carregar transcrições de chamada utilizando a formatação WebVTT.

A Data do documento é retirada automaticamente do nome do arquivo, se disponível. Para definir a Data do documento automaticamente, certifique-se de que o nome do arquivo começa com o seguinte prefixo:

<Timezone><YYYY><MM><DD>-

Exemplo: GMT20201011-meeting.vtt

Se os nomes de arquivo usarem um formato diferente, aplique uma transformação de data ao campo Data do documento no passo de mapeamentos. Para obter detalhes, consulte Definindo uma data do documento específica.

Exemplo

Aqui está um exemplo de uma transcrição de chamada Zoom no formato WebVTT.

WEBVTT
1
00:00:00.599 --> 00:00:02.280
John Smith: Tudo bem
2
00:00:04.230 --> sim; 00:00:00:05.339

John Smith: começar a compartilhar
3
00:12.809 --:
:
:
&4

Muitas das páginas neste site foram traduzidas do inglês original usando tradução automática. Embora na Qualtrics tenhamos feito nossa diligência prévia para obter as melhores traduções automáticas possíveis, a tradução automática nunca é perfeita. O texto original em inglês é considerado a versão oficial, e quaisquer discrepâncias entre o inglês original e as traduções automáticas não são juridicamente vinculativas.