Quando NÃO usar RAG: 4 padrões que parecem RAG mas não são
RAG virou martelo procurando prego em quase toda iniciativa de IA aplicada, e isso custa caro em latência, complexidade e contas mensais que ninguém previu.
- #rag
- #ia-aplicada
- #arquitetura
Notas de campo: arquitetura .NET, IA aplicada, Azure e engenharia de produto.
RAG virou martelo procurando prego em quase toda iniciativa de IA aplicada, e isso custa caro em latência, complexidade e contas mensais que ninguém previu.
OpenTelemetry é operacional, não decorativo. Instrumentar tudo e dashboardar nada é o resultado padrão quando ninguém define o que importa antes de ligar o exportador.
Três opções viáveis na mesma cloud, três perfis de decisão distintos. Escolher errado custa orçamento, latência ou portabilidade que você não recupera depois.
MassTransit com RabbitMQ resolve metade do problema; a outra metade aparece quando a transação do banco e a publicação da mensagem deixam de ser atômicas.
OAuth2 com Entra ID é trivial no monolito e vira pesadelo distribuído quando microsserviços começam a chamar uns aos outros sem padrão definido.
PoC de IA custa quase nada, produção custa muito. Os quatro vetores de custo invisíveis que estouram o orçamento depois do go-live.
O que entrou na biblioteca, o que ficou de fora e por que padronizar segurança elimina retrabalho silencioso entre serviços.
Embeddings envelhecem, índices regridem e o golden set é o único termômetro confiável. Notas de campo de um RAG corporativo.
Logs em tempo real, dashboards por consumidor, auto-block contra anomalia e copiloto que sugere correção de N1. O que muda quando o gateway vira plataforma.