Mapa da trilha
Conteúdo detalhado
❓ Intents não resolvidos: o roadmap escondido
Toda pergunta que o bot não soube responder é dinheiro deixado na mesa. Capture, agrupe, priorize.
Pergunta onde o bot acionou fallback, encaminhou para humano ou inventou.
É sinal de mercado puro — cliente perguntou e você não atendeu.
Fallback, gap, alucinação, escalation.
Marcar cada turn com flag "resolved/unresolved" e salvar a mensagem original.
Sem dado estruturado, não dá para analisar.
Log schema, tagging, fallback flag.
Usar embeddings para agrupar perguntas semelhantes; ver volume por cluster.
100 perguntas únicas podem virar 5 features.
Clustering, topic modeling, k-means.
Cluster grande + ligado a conversão = prioridade 1.
Não dá para resolver tudo. Comece pelo que paga a próxima feature.
ICE, RICE, frequência, impacto.
Decidir: criar tool nova (ação) ou enriquecer base de conhecimento (info).
Resposta errada (tool vs RAG) duplica trabalho.
Backlog, sprint, owner.
Acompanhar % de fallback por cluster antes e depois da feature nova.
Sem medir, não dá para provar que melhorou.
Baseline, KPI, atribuição.
💸 Modelos, custo e otimização
Quando GPT-4o, quando Claude, quando Gemini Flash. Roteamento por tarefa e otimização sem perder qualidade.
Top tier (GPT-4o, Claude Sonnet) vs custo baixo (Haiku, Flash, GPT-4o-mini).
Cada provedor brilha em algo. Saber o cardápio evita "tudo no mesmo".
Família de modelos, benchmarks, trade-offs.
Cobrança por 1M tokens. Output normalmente 3–5x mais caro que input.
Estimar custo errado quebra a economia do projeto.
Token, $/M, contexto longo, cache.
Triagem leve com modelo barato; raciocínio pesado com modelo top.
Reduz custo 60–80% sem perder qualidade no que importa.
Router, classifier, cascade.
Provedor cacheia parte estática do prompt; cobra muito menos pelo hit.
Pode cortar 70–90% do custo de input em bot conversacional.
Cache hit, TTL, prefix.
Limite de tokens por chamada. Contexto longo custa mais e perde precisão no meio.
Mais contexto nem sempre é melhor. Curato.
Window, truncation, sumarização.
Dashboard com $ por sessão, por intent resolvido, por conversão.
Custo agregado mente; custo unitário guia decisão.
Unit economics, alert, budget cap.
🏠 Caso real: bot imobiliário ponta a ponta
Cliente entra perguntando "imóvel em Mumbai", sai com visita agendada. Cada turno mapeado nos 5 pilares.
Imobiliária com 800 imóveis ativos, atendimento 24/7 no WhatsApp, agenda integrada.
Caso real ancora os conceitos. Sem caso, fica abstrato.
Vertical, canal, integrações.
buscar_imoveis(cidade, faixa, quartos); detalhar_imovel(id); listar_slots(id); agendar_visita(id, slot, pessoas).
É a decomposição correta — uma tool por capacidade atômica.
Atomicidade, schema, side effect.
Pede imóvel → bot lista 3 → pede detalhe → bot dá → propõe visita → mostra slots → confirma.
Ver o loop ReAct em ação consolida tudo da Trilha 1.
Multi-turn, state, confirmação explícita.
"O cliente é {{nome}}, mora em {{cidade}}, lead_score={{lead_score}}". Bot adapta tom e urgência.
Lead quente recebe ligação direta; frio recebe nutrição.
Personalização, segmentação, conditional response.
Sem confirmar # pessoas; agendar fora do horário; mostrar imóvel já vendido; perder histórico.
Errar isso é o que faz cliente desligar o bot na semana 2.
Edge case, validação, sincronização.
Visitas agendadas/mês, custo/visita, taxa de conversão visita→venda, NPS.
É a métrica que justifica renovar o contrato.
North-star metric, ROI, payback.