Configuração Geral

Configuração Geral

Configurações básicas do seu assistente de IA, incluindo direção da chamada, números de telefone de voz e configurações avançadas.

Configure as configurações fundamentais do seu assistente de IA, incluindo direção da chamada , números de telefone , seleção de voz e parâmetros técnicos .

Guia de cada

Pronto para configurar seu primeiro assistente de IA?
Aqui está o fluxo essencial:

Escolha a Direção da Chamada:
Recebida (Inbound) para atender chamadas ou Efetuada (Outbound) para realizar chamadas
Defina o Nome do Assistente:
Um rótulo interno como “Bot de Suporte” ou “Bot de Vendas”
Configurar os Números de Telefone:
Atribuir números da plataforma, SIP ou Caller ID
Selecione a Voz e o Idioma:
Escolha entre vozes integradas ou clones de vozes personalizadas
Ajuste as Configurações Avançadas:
Faça o ajuste fino de modelos, tempos de resposta e intervalos de áudio

Sempre teste suas alterações realizando uma chamada com o assistente ou executando uma
pequena campanha para confirmar se ele está se comportando conforme o esperado.

Tipo de Assistente

Escolha se o seu assistente irá lidar com chamadas recebidas (inbound) ou chamadas efetuadas (outbound) .

Essa escolha fundamental afeta quais outras opções estarão disponíveis.

Inbound (Receber chamadas): Lida com chamadas de clientes que entram. Consulte Visão geral de chamadas recebidas.

Outbound (Efetuar chamadas): Inicia chamadas para leads ou clientes. Consulte Visão geral de chamadas efetuadas.

________________________________________

Nome do Assistente

Um nome descritivo para identificar seu assistente no painel.

Utilize algo que descreva o propósito do assistente (ex: “Qualificador de Vendas” , “Bot de Suporte” , “Agendador de Consultas” ).

________________________________________

Configuração de Número de Telefone

Seu assistente precisa de um número de telefone para operar.

As opções disponíveis variam da direção da chamada escolhida.

Para Assistentes Outbound

Você pode usar:

Números da plataforma: Números exclusivos da plataforma

Números SIP: Conecte seu sistema VOIP/PBX existente

Somente Caller ID: Verifique a propriedade de um número existente para exibi-lo em chamadas efetuadas

Para Assistentes Inbound

Você pode usar:

Números da plataforma: Números exclusivos da plataforma

Números SIP: Conecte seu sistema VOIP/PBX existente

Observação: Números Caller ID only não podem receber chamadas — eles apenas exibem o identificador em chamadas outbound.

________________________________________

Preços e Custos

Números da plataforma: Taxa mensal a partir de US$ 3,99/mês . Veja aluguel de número dedicado para detalhes detalhados.

Integração SIP: Sem taxa mensal, apenas US$ 0,00045/minuto para ponte de IA. Consulte preços de integração SIP.

Caller ID: Sem taxa mensal, tarifas por minuto baseadas na região (ex: US$ 0,01/min nos EUA). Veja preços Caller ID.

Consulte Tipos de número de telefone para explicação detalhada e o guia de integração SIP para configuração VOIP.

________________________________________

Tipo de Motor (Modo de Processamento de Voz)

Escolha como sua IA processará a fala e gerará respostas.

Cada modo é otimizado para diferentes casos de uso. Consulte Modos de Assistente para comparações desenvolvidas.

Modo Pipeline

Fluxo tradicional Fala para Texto → LLM → Texto para Fala .

Oferece controle sobre a seleção de voz máxima e geração de respostas.

Melhor para: esclarecimentos complexos, chamadas de função e requisitos de voz personalizados.

Modo de fala para fala

Geração direta de fala para fala, sem processamento intermediário de texto.

Oferece um fluxo de conversa mais natural.

Melhor para: conversas rápidas e diálogo fluido.

Modo Dualplex (Beta)

Combina processamento multimodal rápido com saída de voz premium da ElevenLabs .

Melhor para: a maioria dos casos de uso – configuração padrão recomendada.

________________________________________

Configuração de Idioma

Idioma Principal

O idioma principal que seu assistente usará para reconhecimento e propriedade de fala. Isso afeta:

Precisão do reconhecimento de fala

Opções de voz disponíveis

Frases de preenchimento (áudio de preenchimento)

Seleção do modelo de voz

Consulte Suporte de Idiomas para ver todos os idiomas e idiomas disponíveis.

Idiomas Secundários

Idiomas adicionais que seu assistente pode compreender e falar. Util para:

Suporte ao cliente multilíngue

Empresas

Conversas com alternância de idiomas (troca de código)

Observação: O IA pode detectar automaticamente o idioma do cliente e responder de forma correspondente.

________________________________________

Seleção de Voz da IA

Seu assistente pode escolher entre vozes existentes, clonar vozes personalizadas ou solicitar vozes da biblioteca ElevenLabs .

Opções de Voz

Você tem três maneiras de obter a voz ideal para seu assistente:

Escolher entre vozes existentes:

Vozes profissionais: opções pré-treinadas e de alta qualidade da ElevenLabs

Múltiplos sotaques: disponíveis para a maioria dos idiomas

Opções de gênero: vozes masculinas e femininas

Variedade de tons: do formal e corporativo ao casual e conversacional

Clonar uma voz personalizada:

Crie uma voz exclusiva enviando amostras de áudio.Requisitos:

Áudio claro e de alta qualidade (1 a 5 minutos recomendados)

Formato MP3 ou WAV

Ritmo e tom consistentes

Mínimo de ruído de fundo

Mesma voz usada em toda a gravação

Processo:

Grave você mesmo ou contrate um dublador lendo um texto de amostra

Envie o arquivo de áudio nas configurações do assistente

Aguarde o treinamento ser concluído (de minutos a algumas horas)

Teste a voz clonada antes de usá-la em produção

Casos de uso:

Consistência de marca com o porta-voz da empresa

Contato pessoal nas interações com clientes

Voz homologada à pessoa do negócio

Solicitar a biblioteca ElevenLabs:

Você pode solicitar votações específicas da biblioteca pública da ElevenLabs.

Entre em contato com o suporte para adicionar sua conta.

Explore a Biblioteca de Vozes ElevenLabs para descobrir milhares de vozes profissionais em diversos idiomas, sotaques e estilos.

Consulte o Guia de Seleção de Voz para instruções simples de configuração.

________________________________________

Configuração do Fuso Horário

Fuso Horário

Defina o fuso horário em que seu assistente irá operar. Isso afeta:

Variáveis baseadas em tempo durante conversas

Funções de agendamento de compromissos

Referências de “hora atual” nos prompts do sistema

Carimbos de tempo em registros de chamadas e extração de dados

Importante: Escolha o fuso horário onde sua empresa opera ou onde está a maioria dos clientes.

O assistente usará essa configuração para cálculos e agendamentos relacionados ao horário.

________________________________________

Configurações de Aprimoramento de Áudio

Som Ambiente

Som de fundo opcional misturado à voz do assistente, para mascarar eventuais atrasos de processamento e criar uma experiência de áudio mais natural.Opções:

Nenhum: sem som de fundo (padrão)

Escritório: sons sutis de ambiente de escritório

Controle de volume:

Ajusta o nível do som ambiente em relação à voz.

Valores mais baixos costumam ser melhores — alguns excessivos podem interferir no reconhecimento de fala.

Desative ou reduza o volume se o assistente não estiver ouvindo o cliente com clareza .

Áudio de Preenchimento (Filler Audio)

Frases curtas de conversa como “mhm” , “okay” , “entendi” que são reproduzidas durante o tempo de processamento da IA.

Consulte o Guia de Áudio de Preenchimento para mais detalhes.

Benefícios

Elimina silêncios constrangedores durante o processamento

Mantém os chamadores engajados

Crie um fluxo de conversa mais natural

Reduza a taxa de

Configuração sensível ao idioma:

As frases de preenchimento são definidas automaticamente para o idioma selecionado .

Personalização: Você pode editar as frases padrão de cada categoria para combinar com a voz de sua marca ou de preferências regionais .

Ativar por padrão – a maioria das conversas se beneficia do uso de preenchimentos.
Teste com seu público-alvo e ajuste as frases para combinar com a personalidade do assistente .

Configurações Avançadas #

Seleção do Modelo LLM #

Escolha o melhor modelo de linguagem para o modo do seu assistente.
Consulte o Guia de Seleção de Modelos LLM para recomendações feitas.Modelos recomendados por modo:

Modelo	Pontos Fortes	Melhor Para
GPT-5 Mini	Raciocínio equilibrado com baixa latência	Modo Pipeline para cálculo complexo
GPT-5 em tempo real	Respostas de voz com latência ultra baixa	Reconhecimento de fala e multiplex
GPT-4o	Raciocínio avançado e compreensão multimodal	Tarefas complexas (latência maior)
Gemini Flash 2.0/2.5	Ultra-rápido para respostas de voz	Dualplex/Multimodal para latência mínima

Guia Rápido de Seleção:

Velocidade crítica: Use GPT-5 Realtime ou Gemini Flash 2.0/2.5
Raciocínio complexo necessário: Use GPT-4o ou GPT-5 Mini com preenchimento de áudios para compensar a latência

Temperatura do LLM #

Intervalo: 0,0 – 1,0 | Padrão: 0,1
Ajuste o nível de criatividade da IA ao gerar respostas.
Valores mais baixos obtidos melhores resultados em chamadas de função .

Mais Baixo (0,0-0,3) #

Mais estável: Respostas previsíveis, ideais para chamadas de função e casos de uso empresarial .

Mais Alto (0,7-1,0) #

Mais aleatório: Respostas criativas e variadas, ideais para conversas informais .

Dito pelo ChatGPT:Comportamento especial: Para os modelos GPT-5 Mini e GPT-5 Nano no Pipeline Mode , a temperatura é ajustada automaticamente para 1.0 para desempenho otimizado.

Configurações de Duração #

Controle o tempo e os limites de chamadas para otimizar a experiência do usuário e os custos:

Intervalo de Reengajamento

Intervalo: 7 – 600 segundos | Padrão: 30 segundosA IA tentará reengajar o usuário se nenhuma resposta for bloqueada dentro desse período.Recomendação: 30-60 segundos para chamadas profissionais.

Duração Máxima de Chamada

Intervalo: 20 – 1200 segundos | Padrão: 600 segundos (10 minutos)A chamada será encerrada automaticamente se esse valor for atingido.Recomendação: 5-10 minutos para qualificação de custos de leads, a fim de controlar .

Duração Máxima de Silêncio

Intervalo: 1 – 120 segundos | Padrão: 40 segundosA chamada será encerrada se o usuário não responder dentro desse período.Recomendação: 30-45 segundos para equilibrar paciência e eficiência .

Tempo de Toque

Intervalo: 1 – 60 segundos | Padrão: 30 segundosDeterminar quanto tempo a chamada tocará antes de ser marcada como não atendida.
Útil para evitar caixa postal , definindo um valor menor.

Otimização de custos: Limites de duração menores ajudam a controlar os custos por minuto , especialmente importante em campanhas de alto volume.

Configurações de Proteção de Chamadas

Cancelamento de Ruído

✓: AtivadoFiltra ruído de fundo do chamador para um reconhecimento de fala mais claro.
Desative se houver recortes de áudio (clipping) .

Fechar Chamada na Caixa Postal

✓: AtivadoEncerra a chamada imediatamente para caixas postais bloqueadas em chamadas de saída (economiza custos).

Gravação da Chamada

✓: AtivadoGrava o áudio da chamada para revisão e análise.
Garanta conformidade com os leis locais de gravação .

Silêncio Inicial Máximo

Intervalo: 1 – 120 segundos | Padrão: 20 segundos (quando ativado)Se ativado, encerra a chamada se não houver resposta do usuário dentro desse período.
Conta apenas do início da chamada até a primeira resposta do usuário .Caso de uso: Detectar se alguém realmente atendeu o telefone.

Configurações do Sintetizador

Configure as configurações de voz text-to-speech para conversas mais naturais.Disponível para: apenas modos Pipeline e Dualplex .
O modo Speech-to-Speech utiliza geração de voz nativa.

Parâmetros de Ajuste de Voz

Ajuste finamente as características da voz do assistente para desempenho ideal:

Estabilidade da Voz

Intervalo: 0,0 – 1,0 | Padrão: 0,7Valores mais baixos tornam a voz mais expressiva , mas menos previsível, enquanto valores mais altos tornam a voz mais estável , porém menos emocional.

Mais Expressivo (0,0-0,3)

Entrega dinâmica e variada, porém menos previsível

Menos Estável (0,7-1,0)

Consistente e estável, porém com menor variação emocional

Semelhança de Voz

Intervalo: 0,0 – 1,0 | Padrão: 0,5Determinar o quão fiel a IA será à voz original .
Valores mais altos podem incluir ruídos indesejados da gravação original.

Mais Estável (0,0-0,4)

Áudio mais limpo, porém menos fiel à voz original

Mais semelhantes (0,6-1,0)

Fiel à voz original, mas pode incluir ruído de fundo

Para vozes clonadas: Comece em 0.5 e aumente gradualmente.
Valores mais altos de similaridade podem introduzir artefatos indesejados da gravação original.

Velocidade da Fala

Intervalo: 0,7 – 1,2 | Valor padrão: 1,0Ajuste a velocidade da fala da IA para otimizar a compreensão e a experiência do usuário.

Mais Lento (0,7-0,85)

Melhor para informações complexas ou para públicos mais velhos

Normal (0,9-1,1)

Ritmo de conversa padrão para a maioria dos casos de uso

Mais Rápido (1.15-1.2)

Conversas rápidas ou cenários com limite de tempo

Configurações do Transcriptor

Configure o reconhecimento de fala para texto para obter precisão e velocidade ideais.Disponível para: apenas no modo Pipeline. Os modos Speech-to-Speech e Dualplex utilizam transcrição integrada.Seleção de FornecedorEscolha o transcritor mais adequado ao seu idioma e caso de uso. O provedor selecionado será usado para transcrever a fala do usuário. Latência: mais rápidaUma ótima opção para inglês e outros idiomas importantes.

Azure

Precisão: ⭐⭐⭐⭐ Latência: Mais lentaMelhor para máxima fidelidade na transcrição quando a precisão é crítica.

Gladia

Precisão: ⭐⭐⭐Latência: Mais rápidoBom para uso geral na maioria dos idiomas. Suporte configurações multilíngues.

Deepgram

Precisão: ⭐⭐⭐Latência: Mais rápidaBoa opção para inglês e principais idiomas.

Idiomas diferentes, sotaques ou ruído de fundo podem impactar cada provedor de forma diferente. Teste qual funciona melhor para seu idioma e configuração de áudio específico.

Configuração de Endpoint

Detecção de curvas por IA

Utilize IA para detectar de forma inteligente quando o interlocutor terminou de falar

Detecção de Atividade de Voz (VAD)

Padrão: Detecção tradicional de atividade vocalEscolha como a IA detectará o final da frase do usuário.

Detecção de Atividade de Voz (VAD)

Controle quando seu assistente começa e para falar. Consulte o guia de Tratamento de Interrupções para Configuração Detalhada do VAD.

Ajuste essas configurações finamente se você tiver problemas de interrupção ou respostas lentas.

Ponto final de sensibilidade

Intervalo: 0 – 5 segundos | Padrão: 0,5Ajuste o tempo que a IA aguardará o usuário falar após a última palavra. Valores menores tornam a IA mais rápida; valores são melhores para frases longas do usuário maiores.0 (Mais rápido): Respostas rápidas, mas podem interromper o usuário.5 (Mais lento): Aguarda mais tempo, intermitente.

Sensibilidade à Interrupção

Com que facilidade a assistente para quando o interlocutor fala por cima. Controle a sensibilidade para detectar quando alguém está tentando interromper.

Palavras de Interrupção Mínima

Exigir pelo menos N palavras do interlocutor antes de interromper o assistente.Uso: Evita disparos falsos causados por ruído de fundo ou sons breves.

Dica profissional: Comece com as configurações padrão do VAD e ajuste com base em testes reais de chamadas. Aumente a sensibilidade do endpoint se os interlocutores forem interrompidos; diminua se as respostas parecerem lentas.

Começar

Fundamentos

Guias

Configuração Geral

Configurações Avançadas #

Seleção do Modelo LLM #

Temperatura do LLM #

Mais Baixo (0,0-0,3) #

Mais Alto (0,7-1,0) #

Configurações de Duração #

Junte-se a nós para criar algo extraordinário

Empresa

Sobre

Missão e Visão

Parcerias

Suporte

Central de Ajuda

Documentação

Contate o suporte

Links de navegação

Home

Serviços

Política Privacidade

Termos e Condições

​Configurações Avançadas #

​Seleção do Modelo LLM #

​Temperatura do LLM #

Mais Baixo (0,0-0,3) #

Mais Alto (0,7-1,0) #

​Configurações de Duração #

Junte-se a nós para criar algo extraordinário

Empresa

Suporte

Links de navegação

Serviços

Configurações Avançadas #

Seleção do Modelo LLM #

Temperatura do LLM #

Configurações de Duração #