Embeddings API prin Router by MP
Endpoint /v1/embeddings cu text-embedding-3-small și large pentru search semantic și RAG.
Raspuns scurt
Pentru embeddings folosesti /v1/embeddings cu text-embedding-3-small (rapid) sau text-embedding-3-large (calitate); cheia 'embeddings' este logata cu cost per token.
Problema concreta
Echipele care construiesc RAG, search semantic sau recomandari au nevoie de embeddings rapide și ieftine, cu chei separate de runtime chat.
Cum o rezolva Router by MP
Cheie 'embeddings-{proiect}' cu whitelist pe text-embedding-3-small și large. Batch processing pentru indexare initiala; cheia 'runtime' face doar query embeddings.
Fluxuri uzuale
- Indexare batch initial cu cheia 'embeddings-index'.
- Storage in vector DB (Chroma, Weaviate, pgvector).
- Query embeddings cu cheia 'embeddings-query'.
- Re-index periodic pentru documente noi.
Modele recomandate
text-embedding-3-smalltext-embedding-3-large
Disponibilitatea reala se verifica live in /models.
| Control | De ce conteaza |
|---|---|
| Doua chei | Index vs query separate pentru cost vizibil. |
| Cost mic | small este suficient pentru majoritatea cazurilor. |
| Compatibil OpenAI | Functioneaza cu librarii vector standard. |
curl https://api.megapromoting.com/v1/embeddings \
-H "Authorization: Bearer $ROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "text-embedding-3-small",
"input": "Router by MP este AI API gateway pentru Moldova."
}'Reguli si limite
- Batch size. Verifica limit per request (8192 tokens / batch).
- Dimensiuni. small=1536, large=3072; planifica storage.
- Calitate. Pentru limbi mai rare verifica calitatea retrieval-ului.
Integrare rapida
Foloseste endpointul https://api.megapromoting.com/v1, trimite cheia caAuthorization: Bearer <router_api_key> si verifica pagina/modelsinainte de productie.