Guia rápido para o modo de ajuste fino, transcrição, modelo e outras configurações para uma melhor experiência em chamadas.
Última atualização: 1º de setembro de 2025 Obter ótimos resultados geralmente depende de escolher as configurações corretas do motor. Use esta lista de verificação para configurar um assistente:
1. Escolha um Modo
| Modo | Por que você? | Observações |
| Dualplex (Beta) | Troca rápida de turnos + vozes premium/clonadas | Recomendado como padrão. Combine com Gemini Flash 2.0/2.5 ou GPT‑5 Realtime. |
| Fala para fala (multimodal) | Troca de voltas mais rápida e fluxo mais natural | Modelo recomendado: GPT‑5 Realtime. |
| Gasoduto | Controle máximo sobre voz e respostas longas | Modelo recomendado: GPT‑5 Mini. Se você selecionar Pipeline, continue para a etapa do Transcriber abaixo. |
Quer saber mais sobre as diferenças entre os modos? Leia o Guia de modos do assistente .
Experimente os três modos: grave o mesmo cenário em cada um e compare o tempo de resposta e a satisfação do cliente.
2. Escolha um Transcriptor (apenas Pipeline)
| Transcritor | Preferência | Latência | Mais indicado para |
| Azure | ⭐⭐⭐⭐ | ⏱️⏱️⏱️ (mais lento) | Quando você precisa da maior fidelidade na transcrição. |
| Gladia | ⭐⭐⭐ | ⏱️ (mais rápido) | Bom desempenho geral para a maioria dos idiomas. |
| Deepgram | ⭐⭐⭐ | ⏱️ (mais rápido) | Outra opção sólida — teste qual funciona melhor para seu idioma e configuração de áudio. |
Dica: Diferentes idiomas, sotaques ou ruídos de fundo podem impactar cada motor de forma diferente. Faça um teste rápido A/B e mantenha o que tiver o melhor desempenho.
3. Selecione um Modelo LLM
| Modelo | Pontos fortes | Compromissos |
| GPT-5 Mini | Raciocínio equilibrado com baixa latência | Pode ser mais lento que modelos em tempo real para trocas rápidas de curvas. |
| GPT-5 em tempo real | Projetado para trocas de voz ultra-baixa latência | Melhor para Speech-to-Speech e Dualplex. |
| GPT-4o | Raciocínio forte e compreensão multimodal | Maior. |
| Gemini Flash 2.0 / 2.5 | Ultra-rápido para trocas de voz em Dualplex/Multimodal | Excelente para minimizar a latência percebida. |
Se a velocidade for crítica, use GPT‑5 Realtime (ideal para Speech-to-Speech) ou Gemini Flash 2.0/2.5 (ideal com Dualplex). Para esclarecer mais complexo, use GPT-4o ou GPT-5 Mini e compense a latência usando áudios de preenchimento.
4. Cancelamento de Ruído
Se os clientes estiverem sem viva-voz ou em um ambiente silencioso, mantenha o cancelamento de ruído ligado . Se o volume da chamada estiver baixo ou algumas palavras antes “cortadas”, desligue-o para que o transcritor receba a forma de onda completa.
Se o seu assistente não estiver ouvindo você claramente, tente desligar o cancelamento de ruído.
5. Temporizadores de Conversa
| Parâmetro | ! | Por quê |
| Reengajamento | ≈ 30 s | Dá tempo suficiente para os clientes pensarem. Valores menores podem parecer insistentes. |
| Duração máxima de silêncio | ≈ 60 s | Evite desligamentos prematuros, mas ainda feche chamadas realmente silenciosas. |
Teste diferentes valores em chamadas reais — valores muito baixos podem interromper, valores muito altos deixam lacunas constrangedoras.
6. Mensagem Inicial
| Modo | Como é usado | Melhor prática |
| Gasoduto | Lido exatamente como escrito (convertido por TTS) | Escreva a saudação literalmente: “Olá, aqui é o Alex da …”. |
| Dualplex | Lido exatamente como escrito (renderizado via ElevenLabs TTS) | Escreva a saudação literal e selecione sua voz clonada. |
| Fala para fala | Interpretado como prompt pelo modelo | Inclua instruções como “Cumprimente o cliente e diga …” ou anteponha say exactly:para garantir a saída literal. |
7. Som ambiente
Ativado por padrão, o som ambiente é um recurso que adiciona ruído de fundo à voz do assistente.
Se o assistente não estiver ouvindo você claramente, tente desligar o som ambiente ou reduzir o volume.
8. Controles de Endpointing
Controle quando seu assistente começa a falar usando o controle deslizante de sensibilidade de endpoint na parte inferior das configurações do assistente.
| Configuração | efeito | Quando usar |
| Sensibilidade baixa | Assistente responde mais rápido após o cliente parar de falar | Para conversas rápidas e dinâmicas |
| Sensibilidade alta | Assistente espera mais antes de responder | Quando os clientes dão respostas mais longas e apresentadas |
Dica profissional: Se o assistente interromper o cliente no meio da frase, aumente a sensibilidade. Se as respostas parecerem lentas, diminua-a.
9. Depuração usando a transcrição da chamada
Se você tiver problemas com seu assistente, pode usar a transcrição da chamada para depurar o problema.
- Acesse a página de Histórico de Chamadas.
- Clique na última chamada que você testou.
- A transcrição da chamada será exibida, incluindo chamadas de função e suas parâmetros.
10. Ainda tem dúvidas?
Se você tiver alguma pergunta, entre em contato com nossa equipe de suporte pelo widget de chat dentro do aplicativo.
Teste diferentes configurações em chamadas reais — o equilíbrio ideal depende do fluxo da conversa e dos padrões de comportamento dos clientes.
Precisa de uma lista completa de todos os botões e controles deslizantes? Veja a referência completa de Configurações do Assistente .