O que é um agente de voz com IA
Um agente de voz com IA é um sistema de software que conduz uma conversa telefônica em tempo real com uma pessoa. Ele usa três componentes costurados juntos: um motor de fala para texto em streaming para ouvir o cliente, um LLM para decidir o que dizer em seguida e um motor de texto para fala neural para falar. A latência de ponta a ponta em 2026 fica entre 600 e 1.200 ms. Perto o suficiente do natural para que a maioria não perceba atraso.
A mudança que define 2023 a 2026: os agentes de voz deixaram de soar robóticos. O TTS neural (Eleven Labs, OpenAI, Cartesia) atingiu a paridade com locutores humanos profissionais e calmos em testes cegos. O diferenciador que resta é o comportamento conversacional. O quão bem o agente lida com interrupções, objeções e contexto. E isso é, em grande parte, trabalho de ajuste do LLM.
Onde a voz com IA ganha
A voz com IA substitui ou complementa três categorias de trabalho:
- Recuperação e reativação outbound. Recuperação de carrinho abandonado, reativação, lembretes de pagamento, NPS pós-compra
- Qualificação e roteamento inbound. Velocidade de resposta ao lead, qualificação de demos, triagem de suporte
- Coordenação de agendamentos. Agendar, confirmar, lembrar, reagendar
Onde a voz com IA (ainda) não ganha
Três categorias onde as pessoas ainda superam a voz com IA em 2026: as conversas de venda empresarial complexas (com várias partes, muito julgamento), o tratamento de reclamações emocionais ou sensíveis (falecimentos, reclamações graves) e o suporte técnico profundo que exige uma expertise de produto que excede qualquer base de conhecimento razoavelmente delimitada.
O padrão certo em 2026 não é "substituir pessoas". É "a IA faz os 80% das ligações que seguem padrões; as pessoas focam nos 20% que precisam de julgamento." O custo por ligação cai; a qualidade na cauda longa sobe.
Modelos de preço
Três formatos de preço dominam:
- Uso por minuto (Bland, alguns hyperscalers). Flexível, escala com o volume, difícil de orçar para times de operações
- Tarifa fixa por ligação (a maioria dos apps de e-commerce). Previsível, muitas vezes assinatura com um pacote de ligações
- Contratos empresariais (Air AI, hyperscalers). Compromissos mínimos anuais, com venda consultiva
Conceitos básicos de conformidade
Três regulações importam em 2026:
TCPA (EUA). Exige consentimento para muitas formas de contato outbound, com exceções para ligações transacionais ou informativas. A recuperação de carrinho costuma se encaixar na exceção transacional; o marketing a frio não.
GDPR (UE). Exige base legal, minimização de dados, contratos de operador (DPA) e o direito de apagamento. Conformidade SaaS padrão, tratada por qualquer fornecedor sério.
Lei de IA da UE (em vigor desde 2025). Exige declarar a IA no início de qualquer interação de voz. As ligações com IA declarada têm desempenho igual ao das não declaradas em testes A/B; isso não é uma preocupação de conversão.
Idiomas e vozes
Os fornecedores maduros de 2026 oferecem mais de 40 idiomas com variantes de voz regionais. Espanhol em 8 dialetos, português em brasileiro e europeu, inglês em US/UK/AU/IE/indiano. O diferenciador é se o roteiro do agente se sustenta nessas regiões, não se o TTS sabe pronunciar as palavras.
As ligações no idioma nativo superam o inglês traduzido em 2 a 3 vezes em conversão na América Latina, no Sudeste Asiático e na maioria dos mercados não anglófonos da UE. Se sua base de clientes é multilíngue, essa é a maior alavanca depois de "a voz existir, para começar."
Como avaliar fornecedores
Faça estas perguntas em qualquer conversa com um fornecedor:
- Qual é a latência de ponta a ponta na ligação? (abaixo de 1.200 ms é o mínimo em 2026)
- Como o agente declara que é IA? (audite o roteiro real)
- Quais integrações são nativas e quais são personalizadas? (Shopify, Klaviyo, HubSpot. Nativas ou faça você mesmo?)
- Qual é a postura de conformidade? (DPA, lista de suboperadores, residência na UE, fluxo de opt-out TCPA)
- Qual é o formato do preço? (por minuto versus assinatura em pacote)
- Você pode falar com um cliente real que faz o que você quer fazer?
A curva de maturidade de 2026
Em 2024, os agentes de voz com IA eram um complemento novidadeiro. Em 2025, eram um canal experimental crível. Em 2026, são a expectativa padrão para qualquer loja de e-commerce que leva a sério a recuperação de carrinho abandonado. A pergunta competitiva não é "usamos um?". É "qual, e o quão bem ajustado?".