Use case
Embeddings si RAG pentru baze de cunostinte
Folosește embeddings prin Router by MP pentru search semantic, memorie operationala si RAG, cand modelele sunt expuse in gateway.
Raspuns scurt
Router by MP poate separa cheile de embeddings de cheile de chat, astfel incat indexarea, cautarea si RAG-ul au cost tracking si limite proprii.
Public tinta
- Echipe care indexeaza documente, CRM, knowledge base, emailuri sau continut intern.
Modele recomandate
text-embedding-3-smalltext-embedding-3-large
Fluxuri uzuale
- Indexare documente pe batch controlat.
- Reranking cu model rapid.
- Chat RAG cu citate si surse interne.
Reguli si limite
- Verifica whitelistul modelului de embedding.
- Limiteaza batch size.
- Pastreaza PII in infrastructura aprobata.
| Control | De ce conteaza |
|---|---|
| Chei dedicate pentru indexing si runtime. | Router by MP leaga controlul de cheia API, buget, model whitelist si usage tracking. |
| Costuri separate pentru embedding vs chat. | Router by MP leaga controlul de cheia API, buget, model whitelist si usage tracking. |
| Modelele de embeddings se valideaza in /models inainte de productie. | Router by MP leaga controlul de cheia API, buget, model whitelist si usage tracking. |
Integrare rapida
Foloseste endpointul https://api.megapromoting.com/v1, trimite cheia caAuthorization: Bearer <router_api_key> si verifica pagina/modelsinainte de productie.