AI API / deep divesInformational

Embeddings API prin Router by MP

Endpoint /v1/embeddings cu text-embedding-3-small și large pentru search semantic și RAG.

Raspuns scurt

Pentru embeddings folosesti /v1/embeddings cu text-embedding-3-small (rapid) sau text-embedding-3-large (calitate); cheia 'embeddings' este logata cu cost per token.

Problema concreta

Echipele care construiesc RAG, search semantic sau recomandari au nevoie de embeddings rapide și ieftine, cu chei separate de runtime chat.

Cum o rezolva Router by MP

Cheie 'embeddings-{proiect}' cu whitelist pe text-embedding-3-small și large. Batch processing pentru indexare initiala; cheia 'runtime' face doar query embeddings.

Fluxuri uzuale

Indexare batch initial cu cheia 'embeddings-index'.
Storage in vector DB (Chroma, Weaviate, pgvector).
Query embeddings cu cheia 'embeddings-query'.
Re-index periodic pentru documente noi.

Modele recomandate

text-embedding-3-small
text-embedding-3-large

Disponibilitatea reala se verifica live in /models.

Control	De ce conteaza
Doua chei	Index vs query separate pentru cost vizibil.
Cost mic	small este suficient pentru majoritatea cazurilor.
Compatibil OpenAI	Functioneaza cu librarii vector standard.

curl /embeddingsbash

curl https://api.megapromoting.com/v1/embeddings \
  -H "Authorization: Bearer $ROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": "Router by MP este AI API gateway pentru Moldova."
  }'

Reguli si limite

Batch size. Verifica limit per request (8192 tokens / batch).
Dimensiuni. small=1536, large=3072; planifica storage.
Calitate. Pentru limbi mai rare verifica calitatea retrieval-ului.

Integrare rapida

Foloseste endpointul https://api.megapromoting.com/v1, trimite cheia caAuthorization: Bearer <router_api_key> si verifica pagina/modelsinainte de productie.

Mai departe