Pular para conteúdo
Termo

RAG

Retrieval-Augmented Generation. Técnica para o modelo responder usando fontes externas (documentos, base de conhecimento, banco de dados) em vez de só “memória do treinamento”.

RAG é um jeito de fazer a IA responder com base em dados seus:

  • documentos
  • páginas internas
  • FAQs
  • registros de clientes
  • histórico resumido

Em vez de “inventar”, o sistema:

  1. busca trechos relevantes (retrieval)
  2. injeta no prompt como contexto
  3. gera a resposta usando esses trechos

Quando RAG vale a pena

  • você tem informação específica (políticas, catálogo, procedimentos)
  • a resposta precisa ser consistente
  • você quer reduzir alucinação

RAG não substitui bom prompt

Mesmo com RAG, você precisa definir:

  • formato de resposta
  • limites (quando escalar para humano)
  • o que fazer quando a base não tem a informação

Veja: Prompt.

Próximo passo

Para começar sem “projeto de engenharia”, use templates que já pedem:

  • “Se não tiver dado suficiente, faça perguntas.”
  • “Não invente; peça confirmação.”

Hubs: