Conteúdo detalhado
📥 O que é intent não resolvido
Intent não resolvido é toda interação onde o bot acionou fallback, devolveu "não sei" ou foi escalado para humano. Não é falha — é sinal de mercado puro.
📡 3 tipos de intent não resolvido
Cada tipo aponta para uma ação diferente:
- •Falta de conhecimento — pergunta sobre fato que não está na base. Solução: enriquecer RAG.
- •Falta de capacidade — pediu ação que nenhuma tool faz. Solução: criar tool nova.
- •Falta de clareza — agente entendeu errado. Solução: ajustar prompt ou few-shot.
💡 Quem é dono
Cada categoria tem time diferente como dono: conteúdo → docs/produto. Tool → engenharia. Clareza → quem escreve o prompt. Misturar dono atrasa tudo.
📊 Como capturar
Não dá pra agir sobre o que não se mede. Cada turn precisa virar log estruturado com flag de resolução, intent classificada e a mensagem original (não só o resumo).
{
"session_id": "sess_abc123",
"turn_n": 4,
"timestamp": "2026-05-25T14:32:11Z",
"user_message": "vcs aceitam financiamento da caixa?",
"intent_predicted": "pergunta_financiamento",
"tools_called": [],
"response": "Não tenho essa informação no momento.",
"resolved": false,
"fallback_reason": "no_knowledge",
"escalated": false,
"customer_id": "cust_456"
}
🧩 Clusterizar dúvidas
100 perguntas únicas podem ser 5 temas. Use embeddings para agrupar perguntas semanticamente parecidas e veja o volume por cluster. Aí dá pra priorizar.
1. Extrair últimas N mensagens não resolvidas
Pegue só user_message com resolved=false dos últimos 30 dias.
2. Gerar embedding de cada uma
Mesmo modelo do RAG. Vetor por mensagem.
3. Clustering (HDBSCAN ou k-means)
Agrupa por similaridade semântica. Saída: N clusters com tema.
4. Rotular cluster
Pegue 3 mensagens centrais, peça pro LLM nomear o tema.
5. Volume + impacto
Conte mensagens por cluster. Ranqueie. Top 5 vira backlog.
⚖️ Priorizar
Cluster grande não é automaticamente prioridade. "Qual o CNPJ?" pode ter 200 perguntas/mês e impacto baixo. "Aceita financiamento Caixa?" pode ter 30 e impacto alto. Priorize por valor × volume × esforço.
Reach × Impact × Confidence ÷ Effort. Clássico.
Cluster ligado a conversão (compra, agendamento) vale 3x.
Atualizar FAQ < criar tool nova < integrar nova API.
Pico em data específica? Resolve antes da próxima onda.
🔄 Virar feature
Decidir certo: nova tool (ação) ou enriquecer base (info). Resposta errada duplica trabalho. Pergunta orientadora: o cliente quer saber algo ou fazer algo?
✓ Vira tool quando
- ✓Cliente quer agir (agendar, comprar, cancelar)
- ✓Resposta depende de dado em tempo real
- ✓Há regra de negócio dinâmica
- ✓Precisa autenticação/autorização
- ✓Tem efeito colateral no sistema
✗ Vira conteúdo quando
- ✗Cliente quer entender (política, FAQ)
- ✗Resposta é estável por meses
- ✗Não há ação no final
- ✗Pode ser respondida com 1 parágrafo
- ✗Mesma resposta serve para todo cliente
📉 Medir queda do fallback
Toda feature nova precisa provar que diminuiu o fallback no cluster que motivou. Sem baseline antes e medição depois, não há aprendizado — só sensação.
📊 Métricas para acompanhar por cluster
- Fallback rate antes — % de mensagens do cluster que iam para fallback
- Fallback rate depois — mesmo, 30 dias após o deploy
- Resolution time — turns até resolver caiu?
- CSAT do cluster — satisfação subiu?
- Custo médio — tokens por mensagem do cluster
⚠️ Não confie cegamente em métrica agregada
Cluster pode "sumir" do fallback porque a feature funcionou — ou porque o classificador parou de detectar. Sempre revise amostras manuais junto com a métrica.
📌 Resumo do módulo
Próximo:
3.2 — 💸 Modelos, custo e otimização