Módulo 3.1 — Intents não resolvidos: o roadmap escondido

Conteúdo detalhado

📥 O que é intent não resolvido

Intent não resolvido é toda interação onde o bot acionou fallback, devolveu "não sei" ou foi escalado para humano. Não é falha — é sinal de mercado puro.

📡 3 tipos de intent não resolvido

Cada tipo aponta para uma ação diferente:

•Falta de conhecimento — pergunta sobre fato que não está na base. Solução: enriquecer RAG.
•Falta de capacidade — pediu ação que nenhuma tool faz. Solução: criar tool nova.
•Falta de clareza — agente entendeu errado. Solução: ajustar prompt ou few-shot.

💡 Quem é dono

Cada categoria tem time diferente como dono: conteúdo → docs/produto. Tool → engenharia. Clareza → quem escreve o prompt. Misturar dono atrasa tudo.

📊 Como capturar

Não dá pra agir sobre o que não se mede. Cada turn precisa virar log estruturado com flag de resolução, intent classificada e a mensagem original (não só o resumo).

// Schema mínimo de log

{
  "session_id": "sess_abc123",
  "turn_n": 4,
  "timestamp": "2026-05-25T14:32:11Z",
  "user_message": "vcs aceitam financiamento da caixa?",
  "intent_predicted": "pergunta_financiamento",
  "tools_called": [],
  "response": "Não tenho essa informação no momento.",
  "resolved": false,
  "fallback_reason": "no_knowledge",
  "escalated": false,
  "customer_id": "cust_456"
}

🧩 Clusterizar dúvidas

100 perguntas únicas podem ser 5 temas. Use embeddings para agrupar perguntas semanticamente parecidas e veja o volume por cluster. Aí dá pra priorizar.

1. Extrair últimas N mensagens não resolvidas

Pegue só user_message com resolved=false dos últimos 30 dias.

2. Gerar embedding de cada uma

Mesmo modelo do RAG. Vetor por mensagem.

3. Clustering (HDBSCAN ou k-means)

Agrupa por similaridade semântica. Saída: N clusters com tema.

4. Rotular cluster

Pegue 3 mensagens centrais, peça pro LLM nomear o tema.

5. Volume + impacto

Conte mensagens por cluster. Ranqueie. Top 5 vira backlog.

⚖️ Priorizar

Cluster grande não é automaticamente prioridade. "Qual o CNPJ?" pode ter 200 perguntas/mês e impacto baixo. "Aceita financiamento Caixa?" pode ter 30 e impacto alto. Priorize por valor × volume × esforço.

RICE

Reach × Impact × Confidence ÷ Effort. Clássico.

Conversion link

Cluster ligado a conversão (compra, agendamento) vale 3x.

Esforço

Atualizar FAQ < criar tool nova < integrar nova API.

Sazonalidade

Pico em data específica? Resolve antes da próxima onda.

🔄 Virar feature

Decidir certo: nova tool (ação) ou enriquecer base (info). Resposta errada duplica trabalho. Pergunta orientadora: o cliente quer saber algo ou fazer algo?

✓ Vira tool quando

✓Cliente quer agir (agendar, comprar, cancelar)
✓Resposta depende de dado em tempo real
✓Há regra de negócio dinâmica
✓Precisa autenticação/autorização
✓Tem efeito colateral no sistema

✗ Vira conteúdo quando

✗Cliente quer entender (política, FAQ)
✗Resposta é estável por meses
✗Não há ação no final
✗Pode ser respondida com 1 parágrafo
✗Mesma resposta serve para todo cliente

📉 Medir queda do fallback

Toda feature nova precisa provar que diminuiu o fallback no cluster que motivou. Sem baseline antes e medição depois, não há aprendizado — só sensação.

📊 Métricas para acompanhar por cluster

Fallback rate antes — % de mensagens do cluster que iam para fallback
Fallback rate depois — mesmo, 30 dias após o deploy
Resolution time — turns até resolver caiu?
CSAT do cluster — satisfação subiu?
Custo médio — tokens por mensagem do cluster

⚠️ Não confie cegamente em métrica agregada

Cluster pode "sumir" do fallback porque a feature funcionou — ou porque o classificador parou de detectar. Sempre revise amostras manuais junto com a métrica.

📌 Resumo do módulo

✓

O que é intent não resolvido — fallback é roadmap em estado bruto

✓

Como capturar — log estruturado é a matéria-prima

✓

Clusterizar dúvidas — embedding + cluster transforma ruído em pauta

✓

Priorizar — volume × valor × esforço (não só volume)

✓

Virar feature — ação → tool, info → conteúdo

✓

Medir queda do fallback — baseline + delta = aprendizado real

3.2 — 💸 Modelos, custo e otimização

← Anterior Próximo →

❓ Intents não resolvidos: o roadmap escondido