Sari la conținut
Inapoi la use cases

Use case

Embeddings si RAG pentru baze de cunostinte

Folosește embeddings prin Router by MP pentru search semantic, memorie operationala si RAG, cand modelele sunt expuse in gateway.

Raspuns scurt

Router by MP poate separa cheile de embeddings de cheile de chat, astfel incat indexarea, cautarea si RAG-ul au cost tracking si limite proprii.

Public tinta

  • Echipe care indexeaza documente, CRM, knowledge base, emailuri sau continut intern.

Modele recomandate

  • text-embedding-3-small
  • text-embedding-3-large

Fluxuri uzuale

  • Indexare documente pe batch controlat.
  • Reranking cu model rapid.
  • Chat RAG cu citate si surse interne.

Reguli si limite

  • Verifica whitelistul modelului de embedding.
  • Limiteaza batch size.
  • Pastreaza PII in infrastructura aprobata.
ControlDe ce conteaza
Chei dedicate pentru indexing si runtime.Router by MP leaga controlul de cheia API, buget, model whitelist si usage tracking.
Costuri separate pentru embedding vs chat.Router by MP leaga controlul de cheia API, buget, model whitelist si usage tracking.
Modelele de embeddings se valideaza in /models inainte de productie.Router by MP leaga controlul de cheia API, buget, model whitelist si usage tracking.

Integrare rapida

Foloseste endpointul https://api.megapromoting.com/v1, trimite cheia caAuthorization: Bearer <router_api_key> si verifica pagina/modelsinainte de productie.

Embeddings si RAG pentru baze de cunostinte | Router by Mega Promoting