Boas práticas do Assistente

Guia rápido para o modo de ajuste fino, transcrição, modelo e outras configurações para uma melhor experiência em chamadas.

Última atualização: 1º de setembro de 2025 Obter ótimos resultados geralmente depende de escolher as configurações corretas do motor. Use esta lista de verificação para configurar um assistente:

1. Escolha um Modo

Modo	Por que você?	Observações
Dualplex (Beta)	Troca rápida de turnos + vozes premium/clonadas	Recomendado como padrão. Combine com Gemini Flash 2.0/2.5 ou GPT‑5 Realtime.
Fala para fala (multimodal)	Troca de voltas mais rápida e fluxo mais natural	Modelo recomendado: GPT‑5 Realtime.
Gasoduto	Controle máximo sobre voz e respostas longas	Modelo recomendado: GPT‑5 Mini. Se você selecionar Pipeline, continue para a etapa do Transcriber abaixo.

Quer saber mais sobre as diferenças entre os modos? Leia o Guia de modos do assistente .

Experimente os três modos: grave o mesmo cenário em cada um e compare o tempo de resposta e a satisfação do cliente.

2. Escolha um Transcriptor (apenas Pipeline)

Transcritor	Preferência	Latência	Mais indicado para
Azure	⭐⭐⭐⭐	⏱️⏱️⏱️ (mais lento)	Quando você precisa da maior fidelidade na transcrição.
Gladia	⭐⭐⭐	⏱️ (mais rápido)	Bom desempenho geral para a maioria dos idiomas.
Deepgram	⭐⭐⭐	⏱️ (mais rápido)	Outra opção sólida — teste qual funciona melhor para seu idioma e configuração de áudio.

Dica: Diferentes idiomas, sotaques ou ruídos de fundo podem impactar cada motor de forma diferente. Faça um teste rápido A/B e mantenha o que tiver o melhor desempenho.

3. Selecione um Modelo LLM

Modelo	Pontos fortes	Compromissos
GPT-5 Mini	Raciocínio equilibrado com baixa latência	Pode ser mais lento que modelos em tempo real para trocas rápidas de curvas.
GPT-5 em tempo real	Projetado para trocas de voz ultra-baixa latência	Melhor para Speech-to-Speech e Dualplex.
GPT-4o	Raciocínio forte e compreensão multimodal	Maior.
Gemini Flash 2.0 / 2.5	Ultra-rápido para trocas de voz em Dualplex/Multimodal	Excelente para minimizar a latência percebida.

Se a velocidade for crítica, use GPT‑5 Realtime (ideal para Speech-to-Speech) ou Gemini Flash 2.0/2.5 (ideal com Dualplex). Para esclarecer mais complexo, use GPT-4o ou GPT-5 Mini e compense a latência usando áudios de preenchimento.

4. Cancelamento de Ruído

Se os clientes estiverem sem viva-voz ou em um ambiente silencioso, mantenha o cancelamento de ruído ligado . Se o volume da chamada estiver baixo ou algumas palavras antes “cortadas”, desligue-o para que o transcritor receba a forma de onda completa.

Se o seu assistente não estiver ouvindo você claramente, tente desligar o cancelamento de ruído.

5. Temporizadores de Conversa

Parâmetro	!	Por quê
Reengajamento	≈ 30 s	Dá tempo suficiente para os clientes pensarem. Valores menores podem parecer insistentes.
Duração máxima de silêncio	≈ 60 s	Evite desligamentos prematuros, mas ainda feche chamadas realmente silenciosas.

Teste diferentes valores em chamadas reais — valores muito baixos podem interromper, valores muito altos deixam lacunas constrangedoras.

6. Mensagem Inicial

Modo	Como é usado	Melhor prática
Gasoduto	Lido exatamente como escrito (convertido por TTS)	Escreva a saudação literalmente: “Olá, aqui é o Alex da …”.
Dualplex	Lido exatamente como escrito (renderizado via ElevenLabs TTS)	Escreva a saudação literal e selecione sua voz clonada.
Fala para fala	Interpretado como prompt pelo modelo	Inclua instruções como “Cumprimente o cliente e diga …” ou anteponha say exactly:para garantir a saída literal.

7. Som ambiente

Ativado por padrão, o som ambiente é um recurso que adiciona ruído de fundo à voz do assistente.

Se o assistente não estiver ouvindo você claramente, tente desligar o som ambiente ou reduzir o volume.

8. Controles de Endpointing

Controle quando seu assistente começa a falar usando o controle deslizante de sensibilidade de endpoint na parte inferior das configurações do assistente.

Configuração	efeito	Quando usar
Sensibilidade baixa	Assistente responde mais rápido após o cliente parar de falar	Para conversas rápidas e dinâmicas
Sensibilidade alta	Assistente espera mais antes de responder	Quando os clientes dão respostas mais longas e apresentadas

Dica profissional: Se o assistente interromper o cliente no meio da frase, aumente a sensibilidade. Se as respostas parecerem lentas, diminua-a.

9. Depuração usando a transcrição da chamada

Se você tiver problemas com seu assistente, pode usar a transcrição da chamada para depurar o problema.

Acesse a página de Histórico de Chamadas.
Clique na última chamada que você testou.
A transcrição da chamada será exibida, incluindo chamadas de função e suas parâmetros.

10. Ainda tem dúvidas?

Se você tiver alguma pergunta, entre em contato com nossa equipe de suporte pelo widget de chat dentro do aplicativo.

Teste diferentes configurações em chamadas reais — o equilíbrio ideal depende do fluxo da conversa e dos padrões de comportamento dos clientes.

Precisa de uma lista completa de todos os botões e controles deslizantes? Veja a referência completa de Configurações do Assistente .

Começar

Fundamentos

Guias

Boas práticas do Assistente

Junte-se a nós para criar algo extraordinário

Empresa

Sobre

Missão e Visão

Parcerias

Suporte

Central de Ajuda

Documentação

Contate o suporte

Links de navegação

Home

Serviços

Política Privacidade

Termos e Condições