Configuração Geral
Configurações básicas do seu assistente de IA, incluindo direção da chamada, números de telefone de voz e configurações avançadas.
Configure as configurações fundamentais do seu assistente de IA, incluindo direção da chamada , números de telefone , seleção de voz e parâmetros técnicos .
Guia de cada
Pronto para configurar seu primeiro assistente de IA?
Aqui está o fluxo essencial:
- Escolha a Direção da Chamada:
Recebida (Inbound) para atender chamadas ou Efetuada (Outbound) para realizar chamadas - Defina o Nome do Assistente:
Um rótulo interno como “Bot de Suporte” ou “Bot de Vendas” - Configurar os Números de Telefone:
Atribuir números da plataforma, SIP ou Caller ID - Selecione a Voz e o Idioma:
Escolha entre vozes integradas ou clones de vozes personalizadas - Ajuste as Configurações Avançadas:
Faça o ajuste fino de modelos, tempos de resposta e intervalos de áudio
Sempre teste suas alterações realizando uma chamada com o assistente ou executando uma
pequena campanha para confirmar se ele está se comportando conforme o esperado.
Tipo de Assistente
Escolha se o seu assistente irá lidar com chamadas recebidas (inbound) ou chamadas efetuadas (outbound) .
Essa escolha fundamental afeta quais outras opções estarão disponíveis.
Inbound (Receber chamadas): Lida com chamadas de clientes que entram. Consulte Visão geral de chamadas recebidas.
Outbound (Efetuar chamadas): Inicia chamadas para leads ou clientes. Consulte Visão geral de chamadas efetuadas.
________________________________________
Nome do Assistente
Um nome descritivo para identificar seu assistente no painel.
Utilize algo que descreva o propósito do assistente (ex: “Qualificador de Vendas” , “Bot de Suporte” , “Agendador de Consultas” ).
________________________________________
Configuração de Número de Telefone
Seu assistente precisa de um número de telefone para operar.
As opções disponíveis variam da direção da chamada escolhida.
Para Assistentes Outbound
Você pode usar:
Números da plataforma: Números exclusivos da plataforma
Números SIP: Conecte seu sistema VOIP/PBX existente
Somente Caller ID: Verifique a propriedade de um número existente para exibi-lo em chamadas efetuadas
Para Assistentes Inbound
Você pode usar:
Números da plataforma: Números exclusivos da plataforma
Números SIP: Conecte seu sistema VOIP/PBX existente
Observação: Números Caller ID only não podem receber chamadas — eles apenas exibem o identificador em chamadas outbound.
________________________________________
Preços e Custos
Números da plataforma: Taxa mensal a partir de US$ 3,99/mês . Veja aluguel de número dedicado para detalhes detalhados.
Integração SIP: Sem taxa mensal, apenas US$ 0,00045/minuto para ponte de IA. Consulte preços de integração SIP.
Caller ID: Sem taxa mensal, tarifas por minuto baseadas na região (ex: US$ 0,01/min nos EUA). Veja preços Caller ID.
Consulte Tipos de número de telefone para explicação detalhada e o guia de integração SIP para configuração VOIP.
________________________________________
Tipo de Motor (Modo de Processamento de Voz)
Escolha como sua IA processará a fala e gerará respostas.
Cada modo é otimizado para diferentes casos de uso. Consulte Modos de Assistente para comparações desenvolvidas.
Modo Pipeline
Fluxo tradicional Fala para Texto → LLM → Texto para Fala .
Oferece controle sobre a seleção de voz máxima e geração de respostas.
Melhor para: esclarecimentos complexos, chamadas de função e requisitos de voz personalizados.
Modo de fala para fala
Geração direta de fala para fala, sem processamento intermediário de texto.
Oferece um fluxo de conversa mais natural.
Melhor para: conversas rápidas e diálogo fluido.
Modo Dualplex (Beta)
Combina processamento multimodal rápido com saída de voz premium da ElevenLabs .
Melhor para: a maioria dos casos de uso – configuração padrão recomendada.
________________________________________
Configuração de Idioma
Idioma Principal
O idioma principal que seu assistente usará para reconhecimento e propriedade de fala. Isso afeta:
Precisão do reconhecimento de fala
Opções de voz disponíveis
Frases de preenchimento (áudio de preenchimento)
Seleção do modelo de voz
Consulte Suporte de Idiomas para ver todos os idiomas e idiomas disponíveis.
Idiomas Secundários
Idiomas adicionais que seu assistente pode compreender e falar. Util para:
Suporte ao cliente multilíngue
Empresas
Conversas com alternância de idiomas (troca de código)
Observação: O IA pode detectar automaticamente o idioma do cliente e responder de forma correspondente.
________________________________________
Seleção de Voz da IA
Seu assistente pode escolher entre vozes existentes, clonar vozes personalizadas ou solicitar vozes da biblioteca ElevenLabs .
Opções de Voz
Você tem três maneiras de obter a voz ideal para seu assistente:
Escolher entre vozes existentes:
Vozes profissionais: opções pré-treinadas e de alta qualidade da ElevenLabs
Múltiplos sotaques: disponíveis para a maioria dos idiomas
Opções de gênero: vozes masculinas e femininas
Variedade de tons: do formal e corporativo ao casual e conversacional
Clonar uma voz personalizada:
Crie uma voz exclusiva enviando amostras de áudio.Requisitos:
Áudio claro e de alta qualidade (1 a 5 minutos recomendados)
Formato MP3 ou WAV
Ritmo e tom consistentes
Mínimo de ruído de fundo
Mesma voz usada em toda a gravação
Processo:
Grave você mesmo ou contrate um dublador lendo um texto de amostra
Envie o arquivo de áudio nas configurações do assistente
Aguarde o treinamento ser concluído (de minutos a algumas horas)
Teste a voz clonada antes de usá-la em produção
Casos de uso:
Consistência de marca com o porta-voz da empresa
Contato pessoal nas interações com clientes
Voz homologada à pessoa do negócio
Solicitar a biblioteca ElevenLabs:
Você pode solicitar votações específicas da biblioteca pública da ElevenLabs.
Entre em contato com o suporte para adicionar sua conta.
Explore a Biblioteca de Vozes ElevenLabs para descobrir milhares de vozes profissionais em diversos idiomas, sotaques e estilos.
Consulte o Guia de Seleção de Voz para instruções simples de configuração.
________________________________________
Configuração do Fuso Horário
Fuso Horário
Defina o fuso horário em que seu assistente irá operar. Isso afeta:
Variáveis baseadas em tempo durante conversas
Funções de agendamento de compromissos
Referências de “hora atual” nos prompts do sistema
Carimbos de tempo em registros de chamadas e extração de dados
Importante: Escolha o fuso horário onde sua empresa opera ou onde está a maioria dos clientes.
O assistente usará essa configuração para cálculos e agendamentos relacionados ao horário.
________________________________________
Configurações de Aprimoramento de Áudio
Som Ambiente
Som de fundo opcional misturado à voz do assistente, para mascarar eventuais atrasos de processamento e criar uma experiência de áudio mais natural.Opções:
Nenhum: sem som de fundo (padrão)
Escritório: sons sutis de ambiente de escritório
Controle de volume:
Ajusta o nível do som ambiente em relação à voz.
Valores mais baixos costumam ser melhores — alguns excessivos podem interferir no reconhecimento de fala.
Desative ou reduza o volume se o assistente não estiver ouvindo o cliente com clareza .
Áudio de Preenchimento (Filler Audio)
Frases curtas de conversa como “mhm” , “okay” , “entendi” que são reproduzidas durante o tempo de processamento da IA.
Consulte o Guia de Áudio de Preenchimento para mais detalhes.
Benefícios
Elimina silêncios constrangedores durante o processamento
Mantém os chamadores engajados
Crie um fluxo de conversa mais natural
Reduza a taxa de
Configuração sensível ao idioma:
As frases de preenchimento são definidas automaticamente para o idioma selecionado .
Personalização: Você pode editar as frases padrão de cada categoria para combinar com a voz de sua marca ou de preferências regionais .
Ativar por padrão – a maioria das conversas se beneficia do uso de preenchimentos.
Teste com seu público-alvo e ajuste as frases para combinar com a personalidade do assistente .
Configurações Avançadas #
Seleção do Modelo LLM #
Escolha o melhor modelo de linguagem para o modo do seu assistente.
Consulte o Guia de Seleção de Modelos LLM para recomendações feitas.Modelos recomendados por modo:
| Modelo | Pontos Fortes | Melhor Para |
|---|---|---|
| GPT-5 Mini | Raciocínio equilibrado com baixa latência | Modo Pipeline para cálculo complexo |
| GPT-5 em tempo real | Respostas de voz com latência ultra baixa | Reconhecimento de fala e multiplex |
| GPT-4o | Raciocínio avançado e compreensão multimodal | Tarefas complexas (latência maior) |
| Gemini Flash 2.0/2.5 | Ultra-rápido para respostas de voz | Dualplex/Multimodal para latência mínima |
Guia Rápido de Seleção:
- Velocidade crítica: Use GPT-5 Realtime ou Gemini Flash 2.0/2.5
- Raciocínio complexo necessário: Use GPT-4o ou GPT-5 Mini com preenchimento de áudios para compensar a latência
Temperatura do LLM #
- Intervalo: 0,0 – 1,0 | Padrão: 0,1
- Ajuste o nível de criatividade da IA ao gerar respostas.
- Valores mais baixos obtidos melhores resultados em chamadas de função .
Mais Baixo (0,0-0,3) #
Mais estável: Respostas previsíveis, ideais para chamadas de função e casos de uso empresarial .
Mais Alto (0,7-1,0) #
Mais aleatório: Respostas criativas e variadas, ideais para conversas informais .
Dito pelo ChatGPT:Comportamento especial: Para os modelos GPT-5 Mini e GPT-5 Nano no Pipeline Mode , a temperatura é ajustada automaticamente para 1.0 para desempenho otimizado.
Configurações de Duração #
Controle o tempo e os limites de chamadas para otimizar a experiência do usuário e os custos:
Intervalo de Reengajamento
Intervalo: 7 – 600 segundos | Padrão: 30 segundosA IA tentará reengajar o usuário se nenhuma resposta for bloqueada dentro desse período.Recomendação: 30-60 segundos para chamadas profissionais.
Duração Máxima de Chamada
Intervalo: 20 – 1200 segundos | Padrão: 600 segundos (10 minutos)A chamada será encerrada automaticamente se esse valor for atingido.Recomendação: 5-10 minutos para qualificação de custos de leads, a fim de controlar .
Duração Máxima de Silêncio
Intervalo: 1 – 120 segundos | Padrão: 40 segundosA chamada será encerrada se o usuário não responder dentro desse período.Recomendação: 30-45 segundos para equilibrar paciência e eficiência .
Tempo de Toque
Intervalo: 1 – 60 segundos | Padrão: 30 segundosDeterminar quanto tempo a chamada tocará antes de ser marcada como não atendida.
Útil para evitar caixa postal , definindo um valor menor.
Otimização de custos: Limites de duração menores ajudam a controlar os custos por minuto , especialmente importante em campanhas de alto volume.
Configurações de Proteção de Chamadas
Cancelamento de Ruído
✓: AtivadoFiltra ruído de fundo do chamador para um reconhecimento de fala mais claro.
Desative se houver recortes de áudio (clipping) .
Fechar Chamada na Caixa Postal
✓: AtivadoEncerra a chamada imediatamente para caixas postais bloqueadas em chamadas de saída (economiza custos).
Gravação da Chamada
✓: AtivadoGrava o áudio da chamada para revisão e análise.
Garanta conformidade com os leis locais de gravação .
Silêncio Inicial Máximo
Intervalo: 1 – 120 segundos | Padrão: 20 segundos (quando ativado)Se ativado, encerra a chamada se não houver resposta do usuário dentro desse período.
Conta apenas do início da chamada até a primeira resposta do usuário .Caso de uso: Detectar se alguém realmente atendeu o telefone.
Configurações do Sintetizador
Configure as configurações de voz text-to-speech para conversas mais naturais.Disponível para: apenas modos Pipeline e Dualplex .
O modo Speech-to-Speech utiliza geração de voz nativa.
Parâmetros de Ajuste de Voz
Ajuste finamente as características da voz do assistente para desempenho ideal:
Estabilidade da Voz
Intervalo: 0,0 – 1,0 | Padrão: 0,7Valores mais baixos tornam a voz mais expressiva , mas menos previsível, enquanto valores mais altos tornam a voz mais estável , porém menos emocional.
Mais Expressivo (0,0-0,3)
Entrega dinâmica e variada, porém menos previsível
Menos Estável (0,7-1,0)
Consistente e estável, porém com menor variação emocional
Semelhança de Voz
Intervalo: 0,0 – 1,0 | Padrão: 0,5Determinar o quão fiel a IA será à voz original .
Valores mais altos podem incluir ruídos indesejados da gravação original.
Mais Estável (0,0-0,4)
Áudio mais limpo, porém menos fiel à voz original
Mais semelhantes (0,6-1,0)
Fiel à voz original, mas pode incluir ruído de fundo
Para vozes clonadas: Comece em 0.5 e aumente gradualmente.
Valores mais altos de similaridade podem introduzir artefatos indesejados da gravação original.
Velocidade da Fala
Intervalo: 0,7 – 1,2 | Valor padrão: 1,0Ajuste a velocidade da fala da IA para otimizar a compreensão e a experiência do usuário.
Mais Lento (0,7-0,85)
Melhor para informações complexas ou para públicos mais velhos
Normal (0,9-1,1)
Ritmo de conversa padrão para a maioria dos casos de uso
Mais Rápido (1.15-1.2)
Conversas rápidas ou cenários com limite de tempo
Configurações do Transcriptor
Configure o reconhecimento de fala para texto para obter precisão e velocidade ideais.Disponível para: apenas no modo Pipeline. Os modos Speech-to-Speech e Dualplex utilizam transcrição integrada.Seleção de FornecedorEscolha o transcritor mais adequado ao seu idioma e caso de uso. O provedor selecionado será usado para transcrever a fala do usuário. Latência: mais rápidaUma ótima opção para inglês e outros idiomas importantes.
Azure
Precisão: ⭐⭐⭐⭐ Latência: Mais lentaMelhor para máxima fidelidade na transcrição quando a precisão é crítica.
Gladia
Precisão: ⭐⭐⭐Latência: Mais rápidoBom para uso geral na maioria dos idiomas. Suporte configurações multilíngues.
Deepgram
Precisão: ⭐⭐⭐Latência: Mais rápidaBoa opção para inglês e principais idiomas.
Idiomas diferentes, sotaques ou ruído de fundo podem impactar cada provedor de forma diferente. Teste qual funciona melhor para seu idioma e configuração de áudio específico.
Configuração de Endpoint
Detecção de curvas por IA
Utilize IA para detectar de forma inteligente quando o interlocutor terminou de falar
Detecção de Atividade de Voz (VAD)
Padrão: Detecção tradicional de atividade vocalEscolha como a IA detectará o final da frase do usuário.
Detecção de Atividade de Voz (VAD)
Controle quando seu assistente começa e para falar. Consulte o guia de Tratamento de Interrupções para Configuração Detalhada do VAD.
Ajuste essas configurações finamente se você tiver problemas de interrupção ou respostas lentas.
Ponto final de sensibilidade
Intervalo: 0 – 5 segundos | Padrão: 0,5Ajuste o tempo que a IA aguardará o usuário falar após a última palavra. Valores menores tornam a IA mais rápida; valores são melhores para frases longas do usuário maiores.0 (Mais rápido): Respostas rápidas, mas podem interromper o usuário.5 (Mais lento): Aguarda mais tempo, intermitente.
Sensibilidade à Interrupção
Com que facilidade a assistente para quando o interlocutor fala por cima. Controle a sensibilidade para detectar quando alguém está tentando interromper.
Palavras de Interrupção Mínima
Exigir pelo menos N palavras do interlocutor antes de interromper o assistente.Uso: Evita disparos falsos causados por ruído de fundo ou sons breves.
Dica profissional: Comece com as configurações padrão do VAD e ajuste com base em testes reais de chamadas. Aumente a sensibilidade do endpoint se os interlocutores forem interrompidos; diminua se as respostas parecerem lentas.