17 Anos de Call Centers.
Portados para a IA.
O que acontece quando alguém que gere clusters ViciDial desde 2008 repensa uma arquitetura de telefonia IA a partir do zero? Não obtém mais um produto SaaS. Obtém uma Camada de Controlo de Chamadas que irá mudar fundamentalmente o futuro do trabalho nos call centers.
LiveKit + Agentes IA: Chegámos Antes da OpenAI.
Implementámos o LiveKit e agentes de voz IA em call centers de produção no início de 2024 — meses antes de a OpenAI e o LiveKit anunciarem a sua parceria „Advanced Voice“ em outubro de 2024. O que a OpenAI comercializa hoje como inovador, nós não só implementámos antes, como melhorámos fundamentalmente com a nossa Camada de Controlo de Chamadas autodesenvolvida: a transferência assistida, o isolamento multi-tenant e o TTS de 7 emoções existiam nesta combinação em nenhum outro lugar do mundo — nem mesmo na OpenAI.
O ADN Deste Projeto
A GoFonIA não é uma startup que acabou de «descobrir» a telefonia IA como tendência. É o resultado de 17 anos de experiência operacional em call centers – comprimida numa arquitetura que sabe tudo o que um call center precisa antes de a primeira chamada entrar.
Primeiro Cluster ViciDial
Configuração e operação de instalações ViciDial em produção. Marcação preditiva, scripting de agentes, gestão de campanhas – o espectro completo da tecnologia clássica de call center sobre uma base open-source.
Escalabilidade e Conhecimento Profundo
Operação de configurações multi-operador com SIP trunking via Telekom, Plusnet, dus.net, voip2gsm. Afinação Asterisk ao nível do kernel. Desenvolvimento de ferramentas proprietárias de monitorização e relatórios. O conhecimento de onde a tecnologia de call center atinge os seus limites – e porquê.
O Momento em que a IA se Tornou Real
Primeiras experiências com modelos de linguagem em contextos de telefonia. A constatação: nenhuma framework existente consegue fazer o que um verdadeiro call center precisa. Nem os fornecedores de cloud dos EUA nem as alternativas europeias.
Desenvolvimento da Camada de Controlo de Chamadas
Início do desenvolvimento interno. A questão central: Como construir um controlador de telefonia que não se limite a «atender chamadas e responder», mas que mapeie a lógica completa de um call center – incluindo transferência calorosa, filas de espera, isolamento de inquilinos e orquestração SIP?
GoFonIA: A Arquitetura Matricial
Conclusão da arquitetura de sala única com lógica de transferência de 5 fases, TTS de 7 emoções, encaminhamento DID multi-inquilino e motor watchdog. Implantação em produção com os primeiros clientes.
A Camada de Controlo de Chamadas
O coração da GoFonIA não é um modelo de IA. É uma camada de controlo desenvolvida internamente que opera entre a rede telefónica e a IA – orquestrando toda a lógica da chamada. Esta camada não existe em mais nenhum lugar na região DACH.
Porquê uma Camada de Controlo de Chamadas Personalizada?
Porque as frameworks de telefonia padrão não foram construídas para manter quatro participantes numa sala e alternar streams de áudio entre eles em tempo real. Porque a telefonia IA convencional só conhece «chamada → resposta» – mas não «o agente apresenta, o colega ouve, a música toca, o chamador espera, todos na mesma sala». Porque o isolamento de inquilinos ao nível DID, o registo de ferramentas em tempo real e a orquestração SIP com estratégias de fallback não são fornecidos em nenhum toolkit SaaS no mundo.
A Camada de Controlo opera em cinco níveis simultaneamente:
-
1
Orquestração SIP
Reconhecimento de inquilino baseado em DID durante o handshake SIP. Criação dinâmica de participantes via SIP de saída. Gestão de BYE no fim da ligação.
-
2
Gestão de Sala
Arquitetura de sala única: todos os participantes na mesma sala. A matriz de subscrição controla quem ouve quem. Comutação de áudio controlada por fase sem queda de ligação.
-
3
Lógica de Transferência
Máquina de estados de 5 fases com timeouts e fallbacks. MOH específico por tenant (Music-on-Hold, biblioteca de 8 GB livre de direitos). Briefing do agente para o colega de destino. Retorno em caso de indisponibilidade.
-
4
Isolamento de Inquilinos
Por inquilino: chaves API próprias, prompts, vozes, matriz de emoções, base de conhecimento, ferramentas, credenciais SIP. Motor de sessão baseado em Redis. Zero fugas entre inquilinos.
-
5
Watchdog e Limpeza
Monitorização autónoma de todas as salas ativas. Deteção de timeout, eliminação de sala via API, limpeza de estado Redis, entrega de transcrição por email. Totalmente automatizado em < 2 segundos.
A Matriz em Funcionamento
Cada chamada passa por uma cadeia de decisão em milissegundos, operando em sete níveis independentes em paralelo:
Chamador
Participante SIP na sala
Agente IA
LLM + 7 vozes de emoção
Bot de Música
Fila de espera WebRTC
Colega de Destino
SIP de saída na sala
A Matriz de 7 Emoções
A GoFonIA não usa TTS genérico. Cada inquilino recebe uma matriz de emoções calibrável com sete perfis de voz dimensionais – configuráveis individualmente por inquilino, por campanha, por tipo de chamada. A voz não reage apenas semanticamente – reage paraverbalmente.
Neutro
Linha de base. Factual, denso em informação. Para consultas de estado e comunicação de factos.
Amigável
Caloroso, acessível, aberto. Para saudações, conversa casual, chamadas de serviço.
Empático
Compreensivo, paciente, desescalante. Para reclamações e tópicos sensíveis.
Profissional
Formal, preciso, educadamente distante. Para contexto B2B, banca, seguros, governo.
Dinâmico
Impulsionador, orientado para soluções, enérgico. Para chamadas de vendas e campanhas orientadas à conversão.
Calmante
Tranquilo, profundo, gerador de confiança. Para suporte de primeiro nível, filas de espera, linhas diretas técnicas.
Assertivo
Claro, direto, definidor de limites. Para cobranças, verificações de conformidade, escalação.
A matriz de emoções opera em dois eixos paraverbais: velocidade de fala (0,6×–2,4×) e timbre de voz (shift de frequência ±18%). Mais lógica de pausa dependente do contexto: o agente sabe quando o silêncio é uma ferramenta mais poderosa do que a fala.
Hardware: Multi-Inquilino em Infraestrutura Própria
Sem AWS. Sem Google Cloud. Sem Azure. A GoFonIA funciona em servidores raiz dedicados da Hetzner em Frankfurt am Main e Nuremberga – virtualizados via Proxmox, orquestrados em contentores LXC isolados.
Por inquilino: contentor LXC isolado com o seu próprio armazenamento Redis, chaves API próprias, versões de prompt próprias e registo SIP próprio. Sem memória partilhada. Sem fluxo de dados entre inquilinos. Cada contentor é um sistema de telefonia autónomo que pode ser copiado, migrado e escalado individualmente.
Para setores sensíveis, utilizamos exclusivamente IA europeia — Mistral AI (Paris) e Infomaniak (Suíça) para LLM, TTS e STT. A pedido totalmente on-premise: Todo o nosso stack — LLM, TTS, STT e Call Control Layer — é executado no seu próprio hardware. Concebido para bancos, seguradoras, administração pública, escritórios de advogados e o setor da saúde. A operação é totalmente conforme ao RGPD em servidores da Hetzner Online GmbH com um acordo de processamento de dados nos termos do Art. 28º do RGPD.
Zero Dependências dos EUA. Em Todo o Lado.
Cada byte que a GoFonIA processa permanece em servidores da Hetzner Online GmbH em Frankfurt am Main e Nuremberga. Os modelos de IA utilizados — Mistral AI (Paris) e Infomaniak (Suíça) — têm o seu domicílio legal na União Europeia. Livre dos EUA por padrão. Para setores sensíveis (banca, seguros, administração pública, advocacia, saúde) entregamos todo o stack on-premise em hardware do cliente.
Sem US Cloud Act. Sem transferência para países terceiros. Sem fuga silenciosa de dados. Em conformidade com o §203 StGB. Auditado para RGPD. Único na região DACH.
O Que Isto Significa para o Futuro do Trabalho em Call Centers
A Camada de Controlo de Chamadas da GoFonIA não foi projetada para substituir agentes humanos. Foi projetada para redefinir a divisão de trabalho entre humanos e máquinas.
Chamadas de rotina — agendamento de consultas, consultas de estado, FAQs simples — são tratadas de forma completamente autónoma pelo agente IA. Casos complexos — reclamações, negociações, consultoria — são entregues a um colega humano com contexto completo e briefing estruturado. O colega assume a chamada com zero tempo de adaptação, porque o agente já esclareceu e documentou tudo.
O resultado: os call centers não ficam mais pequenos. Ficam melhores. O trabalho repetitivo desaparece. O trabalho exigente permanece — e é aliviado por uma preparação perfeita. Isto não é automação. Isto é ampliação.
A Filosofia
Não construímos IA que substitui pessoas. Construímos uma camada de controlo que orquestra 17 anos de conhecimento de call center em tempo real — para que as pessoas no call center possam finalmente fazer aquilo para que realmente estão lá: resolver problemas complexos. Não preencher formulários.