RAG pe documente proprii — ghid pentru companii MD 2026
Cum indexezi proceduri, contracte și manuale interne ca chat-ul intern să răspundă la întrebări cu trimiteri la sursă — în 4-6 săptămâni.
Raspuns scurt
RAG (retrieval-augmented generation) înseamnă să cuplezi un model AI cu propriile tale documente: indexezi PDF-uri, fișiere Word, e-mailuri în embeddings; modelul caută relevant și răspunde la întrebări cu citate. Setup: $50-300/lună pentru 20-100 angajați, ROI imediat din timp economisit la onboarding.
Problema concreta
Documentele interne (proceduri, regulamente, contracte cadru, fișe tehnice) sunt împrăștiate prin SharePoint, e-mail, foldere personale. Angajații noi nu le găsesc, cei vechi pierd 15-30 minute pentru fiecare căutare. Wiki-ul intern e abandonat după prima încercare.
Cum o rezolva Router by MP
Pipeline standard: (1) colectezi documentele, (2) le indexezi cu text-embedding-3-large, (3) le stochezi într-un vector DB (pgvector sau Chroma), (4) la întrebare faci căutare semantică + răspuns GPT-5.5 mini cu citate. Tot setup-ul se face în 4-6 săptămâni cu o echipă tehnică minimă.
Fluxuri uzuale
- Colectare documente interne și permisiuni acces.
- Indexare batch cu cheia 'embeddings-index' și buget controlat.
- Storage în pgvector sau Chroma cu metadata (sursă, secțiune, dată).
- Chat UI care face retrieval + GPT-5.5 mini pentru răspuns cu citate.
| Control | De ce conteaza |
|---|---|
| Citate la sursă | Răspunsurile au trimitere la pagina exactă — verificabilă. |
| Cost mic | Embeddings sunt ieftine ($0.10 per 1M tokens); RAG total $50-300/lună tipic. |
| Onboarding 50% mai rapid | Angajatul nou întreabă chatul, nu colegul. |
Reguli si limite
- Calitate index. Documentele murdare (PDF scanat, formatare slabă) cer pre-procesare manuală.
- Re-indexare. Documentele se schimbă — planifică re-indexare săptămânală sau lunară.
- Confidențialitate. Documente sensibile cer chei separate și control acces granular.
Checklist
- •Lista documente prioritizată
- •Vector DB ales (pgvector / Chroma / Weaviate)
- •Cheie 'embeddings-index' cu buget
- •Cheie 'rag-query' separată pentru runtime
- •Chat UI cu citate vizibile
- •Plan re-indexare automată
Integrare rapida
Foloseste endpointul https://api.megapromoting.com/v1, trimite cheia caAuthorization: Bearer <router_api_key> si verifica pagina/modelsinainte de productie.