Sari la conținut
Inapoi la AI API
AI API / deep divesInformational

Embeddings API prin Router by MP

Endpoint /v1/embeddings cu text-embedding-3-small și large pentru search semantic și RAG.

Raspuns scurt

Pentru embeddings folosesti /v1/embeddings cu text-embedding-3-small (rapid) sau text-embedding-3-large (calitate); cheia 'embeddings' este logata cu cost per token.

Problema concreta

Echipele care construiesc RAG, search semantic sau recomandari au nevoie de embeddings rapide și ieftine, cu chei separate de runtime chat.

Cum o rezolva Router by MP

Cheie 'embeddings-{proiect}' cu whitelist pe text-embedding-3-small și large. Batch processing pentru indexare initiala; cheia 'runtime' face doar query embeddings.

Fluxuri uzuale

  • Indexare batch initial cu cheia 'embeddings-index'.
  • Storage in vector DB (Chroma, Weaviate, pgvector).
  • Query embeddings cu cheia 'embeddings-query'.
  • Re-index periodic pentru documente noi.

Modele recomandate

  • text-embedding-3-small
  • text-embedding-3-large

Disponibilitatea reala se verifica live in /models.

ControlDe ce conteaza
Doua cheiIndex vs query separate pentru cost vizibil.
Cost micsmall este suficient pentru majoritatea cazurilor.
Compatibil OpenAIFunctioneaza cu librarii vector standard.
curl /embeddingsbash
curl https://api.megapromoting.com/v1/embeddings \
  -H "Authorization: Bearer $ROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": "Router by MP este AI API gateway pentru Moldova."
  }'

Reguli si limite

  • Batch size. Verifica limit per request (8192 tokens / batch).
  • Dimensiuni. small=1536, large=3072; planifica storage.
  • Calitate. Pentru limbi mai rare verifica calitatea retrieval-ului.

Integrare rapida

Foloseste endpointul https://api.megapromoting.com/v1, trimite cheia caAuthorization: Bearer <router_api_key> si verifica pagina/modelsinainte de productie.

Mai departe

Embeddings API prin Router by MP | Router by Mega Promoting