Mapa da trilha
Conteúdo detalhado
📝 Escrevendo system prompts que funcionam
Persona, regras invioláveis, formato de resposta e exemplos. O que separa prompt de produção de prompt de demo.
Nome, função, tom (formal/informal), nível técnico do vocabulário.
Persona define experiência. Bot sem personalidade soa genérico.
Persona, tone of voice, brand alignment.
"Nunca dê preço sem consultar tool", "nunca prometa prazo", "nunca xingue".
É o que impede crise pública.
Guardrails, refusal, allowed topics.
Tamanho máximo, uso de bullets, emojis, JSON quando aplicável.
UX consistente exige formato consistente.
Output format, structured output, length.
2–5 trocas exemplo no prompt mostrando o comportamento esperado.
Exemplo vale mais que mil instruções abstratas.
Few-shot, in-context learning, demonstração.
Estrutura: missão → regras → ferramentas → formato → exemplos → fallback.
Modelo presta mais atenção no começo e no fim. Organize com isso em mente.
Primacy, recency, lost in the middle.
Pegar conversas reais ruins → identificar regra ausente → adicionar → testar.
Prompt sem ciclo de melhoria envelhece em 2 semanas.
Eval set, A/B, regression test.
🔌 Conectando conhecimento e ferramentas
Carregar FAQs, sites e CSVs como base de conhecimento; declarar tools com schemas que o modelo entende e chama na hora certa.
Estruturado (CSV/SQL) vs não-estruturado (FAQ, página web, PDF).
Cada fonte exige tratamento diferente. Misturar tudo gera ruído.
Crawl, ingestão, parser, fonte de verdade.
Quebrar documentos em pedaços + converter em vetores para busca semântica.
Chunk errado = recall ruim = bot que diz "não sei" sobre coisa que está na base.
Chunk size, overlap, embedding model.
Busca os k pedaços mais relevantes, injeta no prompt, modelo responde com base neles.
É o que dá ao agente acesso a dados sem retreino.
Retrieval, top-k, reranking, citação.
Nome, descrição, parâmetros, tipos. O modelo decide chamar a partir desse contrato.
Descrição ruim = tool ignorada. Schema ruim = parâmetros errados.
JSON schema, description, required fields.
RAG para texto estático. Tool para dado dinâmico ou ação.
Misturar mal aumenta latência e custo sem ganho.
Static vs dynamic, read vs write.
Timeout, 500, parâmetro inválido — devolver erro ao modelo para ele decidir.
Tool que falha silenciosa vira agente que mente.
Retry, fallback, mensagem de erro estruturada.
🎫 Custom fields e contexto do cliente
Injete nome, cidade, lead score e histórico direto no prompt. O agente para de tratar todo mundo igual.
Placeholder no prompt que é preenchido em runtime com dado do CRM/sessão.
Mesmo prompt vira personalizado por cliente sem refatoração.
Template variable, interpolação, runtime injection.
CRM (Hubspot, RD), banco interno, payload do webhook, cookie da sessão.
Dado errado vira resposta errada com cara de certeza.
Source of truth, sync, latência.
nome, plano, ticket_aberto, lead_score, ultima_interacao, idioma.
Cada campo é alavanca de personalização e prioridade.
Atributos do cliente, segmentação.
"Se nome vazio, chame de 'você'." Definir default e regra de uso.
"{{nome}}" cru no chat é o bug que mais viraliza no Twitter.
Default value, null handling, sanitização.
Resumo de conversas anteriores, preferências aprendidas, status do cliente.
Cliente sente quando o agente "lembra" e quando não.
Session memory, profile, sumarização periódica.
Não jogue CPF/cartão no prompt. Mascare. Logue só o necessário.
LGPD multa pesado. Provedor de LLM pode logar prompt.
PII, minimização, mascaramento, retention.