OpenAI · Embeddings · Vectori pentru căutare semantică

text-embedding-3-small

Vectori accesibili (1536 dimensiuni) — alegerea implicită pentru căutare semantică în propriile documente.

~$0.03 in / $0.00 out · per 1M unități de procesare≈ 0.56 MDLvezi /pricing/models pentru tariful live →

Începe gratis Vezi prețuri per model

8K tokens

Context window

Input modalities

2024-01

Knowledge cut-off

Ce este text-embedding-3-small

text-embedding-3-small este alegerea implicită a echipelor SaaS pentru vectori de căutare semantică. Cu preț extraordinar de mic ($0.02 la 1 milion) și calitate aproape comparabilă cu large pentru majoritatea cazurilor, este modelul cu cel mai bun raport calitate/preț din catalog. Folosit pentru căutare semantică, sortare, recomandări — practic orice scenariu unde ai nevoie de vectori. Disponibil prin Router by Mega Promoting cu facturare în MDL.

Capabilități unice

Ce te diferențiază când folosești text-embedding-3-small

Alegerea implicită — preț extraordinar ($0.02/1M tokens) + calitate foarte bună
1536 dimensiuni — echilibru perfect pentru cele mai multe vector DBs
Suport multilingv inclusiv română
6× mai ieftin decât large cu doar 15% diferență MTEB
Răspuns sub 100ms consistent

Limitări de știut înainte să cumperi

·Precizie ușor sub large pentru căutare foarte specifică
·Maxim 8.192 unități la intrare

Performanță pe benchmark-uri publice

Scoruri verificabile text-embedding-3-small

Doar benchmark-uri cu sursă publică citabilă (model card, blog oficial, leaderboard independent). Click pe card → sursa originală.

MTEB average

62.3 / 100

self-reported, 1536 dims

sursă

MIRACL

44 / 100

self-reported, multilingual retrieval

sursă

Toate scorurile sunt din surse publice (model cards, blog-uri oficiale, leaderboard-uri independente). Click pe card → sursa originală.

Cum funcționează

Cum funcționează text-embedding-3-small pe înțelesul tuturor

Schemă simplificată — fără jargon. Trimiți o cerere, modelul o descompune, calculează răspunsul, ți-l întoarce. Restul e arhitectură internă pe care nu trebuie s-o cunoști pentru a-l folosi.

Text → vector numeric → punct într-un spațiu multidimensional. Textele apropiate ca sens devin puncte apropiate, permițând căutare semantică.

Cazuri reale de utilizare

Cele mai bune scenarii pentru text-embedding-3-small

Pentru fiecare scenariu: industria, volumul tipic, costul estimat, și — dacă e cazul — modelul alternativ recomandat.

RAG · Suport produs

Bot RAG pe FAQ și docs

Default pentru majoritatea RAG pipelines.

Volum tipic100.000 query / lună + 50K docs

Cost estimat~$2-8/lună≈ 35-141 MDL

Embeddings · E-commerce

Search semantic catalog mediu

Magazine cu 10K-100K produse.

Volum tipic50.000 query / lună + 30K produse

Cost estimat~$2-6/lună≈ 35-106 MDL

Date · CRM

Similarity matching lead-uri

Detectare duplicate + clustering automatic.

Volum tipic200.000 comparații / lună

Cost estimat~$3-10/lună≈ 53-176 MDL

Embeddings · Content moderation

Detectare conținut similar (spam)

Identificare mesaje similare pentru filtrare bulk.

Volum tipic500.000 mesaje / lună

Cost estimat~$5-15/lună≈ 88-264 MDL

RAG · Knowledge base intern

Bot pe Confluence/Notion SMB

Cost minim pentru companii medii.

Volum tipic20.000 query / lună + 5K docs

Cost estimat~$1-4/lună≈ 18-70 MDL

Cost lunar estimat

Calculator interactiv pentru text-embedding-3-small

Calculator interactiv

Cât te-ar costa text-embedding-3-small pe lună

Scenariile sunt presetate, dar trage de sliders ca să modelezi propriul tău consum. Calculul folosește tariful Pro tier post-markup — exact ce vezi pe /pricing/models.

Tip caz tipic

Document mediu.

Documente / lună (~500 tokens fiecare)100K

10010.0M

Cost total estimat

$4.80

≈ 84.5 MDL la cursul BNM

/ lună · 100K cereri

Tokens intrare$4.80≈ 84.5 MDL

Per cerere~$0.000≈ 0.00 MDL

Tarif client-facing (Pro tier post-markup). Free/Starter/Business au prețuri diferite — vezi /pricing/models pentru tariful exact al planului tău.

Alege bine

Când să alegi text-embedding-3-small vs alternative

Fără bare arbitrare 92/85. Doar explicații concrete pe baza forțelor reale ale fiecărui model. Pentru toate alternativele ai pagină separată cu același nivel de detaliu.

Alternativă	Alege text-embedding-3-small când…	Mai bine alternativa când…
text-embedding-3-large OpenAI Vezi	95% din cazuri — 6× mai ieftin, calitate suficientă.	Precizie critică (drept, medical, cercetare științifică).

Specificații comparative

Date reale, fără speculații

Tabel cu prețuri client-facing și caracteristici tehnice publice — nu scoruri agregate pe care nu le poți verifica.

Specificație	text-embedding-3-small aici	text-embedding-3-large vezi pagina →	GPT-5.4 mini vezi pagina →	Claude Haiku 4.5 vezi pagina →
Brand	OpenAI	OpenAI	OpenAI	Anthropic
Preț input / 1M tokens	$0.032≈ 0.56 MDL	$0.208≈ 3.7 MDL	$0.800≈ 14.1 MDL	$1.60≈ 28.2 MDL
Preț output / 1M tokens	—	—	$4.80≈ 84.5 MDL	$8.00≈ 141 MDL
Context max	8K tk	8K tk	128K tk	200K tk
Output max	0 tk	0 tk	16K tk	8K tk
Vision	—	—	●	●
Audio (input)	—	—	—	—
Knowledge cut-off	2024-01	2024-01	2026-03	2025-09

Integrare în orice unealtă

O cheie. 26+ unelte. Zero efort de migrare.

Router by MP e compatibil 100% cu API-ul OpenAI. Orice unealtă, framework sau platformă care folosește OpenAI SDK funcționează identic cu cheia ta Router by MP — schimbi o singură linie (baseURL) și gata. Iată cum integrezi text-embedding-3-small în cele mai populare unelte.

Pont text-embedding-3-small: Pentru pipeline RAG nou: începe pe small. Migrare la large doar dacă vezi precizie insuficientă în production — A/B 5-10% trafic 24h e suficient pentru decizie.

Vercel AI SDK · OpenAI SDK · LangChain · LlamaIndex · FastAPI · Next.js

Vercel AI SDK

Streaming React + Next.js. Cel mai folosit framework AI front-end în 2026.

app/api/chat/route.ts

import { streamText } from "ai";
import { createOpenAI } from "@ai-sdk/openai";

const router = createOpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function POST(req: Request) {
  const { messages } = await req.json();
  const result = streamText({
    model: router("text-embedding-3-small"),
    messages,
  });
  return result.toDataStreamResponse();
}

Docs oficiale

OpenAI SDK (Node.js)

Drop-in pentru orice cod scris pentru OpenAI direct. Zero refactor.

client.ts

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",   // <— singura linie diferită
});

const r = await client.chat.completions.create({
  model: "text-embedding-3-small",
  messages: [{ role: "user", content: "Salut!" }],
});
console.log(r.choices[0].message.content);

Docs oficiale

OpenAI SDK (Python)

Cel mai stabil SDK Python pentru orice provider OpenAI-compatible.

client.py

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

r = client.chat.completions.create(
    model="text-embedding-3-small",
    messages=[{"role": "user", "content": "Salut!"}],
)
print(r.choices[0].message.content)

Docs oficiale

LangChain (Python)

RAG, agenți, chain-uri complexe — toate prin Router.

rag.py

from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="text-embedding-3-small",
    openai_api_key=os.environ["ROUTER_API_KEY"],
    openai_api_base="https://api.megapromoting.com/v1",
)

resp = llm.invoke("Răspunde în română.")
print(resp.content)

Docs oficiale

LangChain (JS)

Versiunea JavaScript — același API ca Python.

agent.ts

import { ChatOpenAI } from "@langchain/openai";

const llm = new ChatOpenAI({
  model: "text-embedding-3-small",
  apiKey: process.env.ROUTER_API_KEY,
  configuration: { baseURL: "https://api.megapromoting.com/v1" },
});

const r = await llm.invoke("Răspunde în română.");
console.log(r.content);

Docs oficiale

LlamaIndex

RAG la scară. Indexare semantică + retrieval + LLM, totul prin Router.

rag_index.py

from llama_index.llms.openai import OpenAI

llm = OpenAI(
    model="text-embedding-3-small",
    api_key=os.environ["ROUTER_API_KEY"],
    api_base="https://api.megapromoting.com/v1",
)

print(llm.complete("Generează un titlu pentru articol despre AI în Moldova"))

Docs oficiale

FastAPI proxy

Endpoint back-end care expune Router în propria ta aplicație.

main.py

from fastapi import FastAPI
from openai import AsyncOpenAI

app = FastAPI()
client = AsyncOpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

@app.post("/chat")
async def chat(prompt: str):
    r = await client.chat.completions.create(
        model="text-embedding-3-small",
        messages=[{"role": "user", "content": prompt}],
    )
    return {"text": r.choices[0].message.content}

Docs oficiale

Next.js Server Action

Apel direct din componente React, fără API route separat.

app/actions.ts

"use server";

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function summarize(text: string) {
  const r = await client.chat.completions.create({
    model: "text-embedding-3-small",
    messages: [
      { role: "system", content: "Rezumi text în 3 puncte." },
      { role: "user", content: text },
    ],
  });
  return r.choices[0].message.content;
}

Docs oficiale

Folosești deja OpenAI direct?

Schimbarea către Router by MP înseamnă o singură linie: baseURL = "https://api.megapromoting.com/v1". Toate apelurile existente continuă să funcționeze. Facturarea trece pe MDL prin e-Factura, fără cont OpenAI / Anthropic / Google separat.

Toate integrările

Quickstart

Exemplu de cod canonic pentru text-embedding-3-small

Endpoint OpenAI-compatible. Schimbi doar baseURL și apiKey — restul codului rămâne identic cu provider-ul original.

text-embedding-3-small.ts

typescript

1import OpenAI from "openai";
2 
3// Vectori pentru căutare semantică în propriile documente
4const client = new OpenAI({
5  apiKey: process.env.ROUTER_API_KEY,
6  baseURL: "https://api.megapromoting.com/v1",
7});
8 
9const r = await client.embeddings.create({
10  model: "text-embedding-3-small",
11  input: [
12    "Contractul de prestări servicii încheiat la Chișinău…",
13    "Politica de confidențialitate conform GDPR…",
14  ],
15});
16 
17console.log(r.data[0].embedding.length); // mărimea vectorului — îl salvezi în baza ta

Pont-uri pentru implementare în Moldova

1Alegerea implicită pentru orice proiect SaaS din Moldova care are nevoie de căutare semantică în propriile documente.
2Combină cu Qdrant/Pinecone self-hosted pe serverul OVH .71 pentru cost total minim.
3Pentru chatbot Aichat cu bază de cunoștințe de 1.000 documente, costul indexării e sub $5 total.
4Re-indexează periodic (lunar) când actualizezi baza de cunoștințe.

Întrebări frecvente

FAQ text-embedding-3-small

Suportă limba română?

Da, performanță foarte bună pe română, rusă, engleză. Multilingv nativ.

Cât costă să indexez un site cu 10.000 articole?

Pentru articole medii (1.000 unități), aproximativ $0.20 total. Foarte ieftin.

Pot folosi cu Postgres pgvector?

Da, dimensiunea 1536 este suportată nativ de pgvector. Funcționează cu Supabase self-hosted.

Când să trec la large?

Doar dacă vezi probleme de precizie la căutare (răspunsuri irelevante frecvente). Pentru 95% din cazuri small este suficient.

Continuă explorarea

Modele înrudite

OpenAI

text-embedding-3-large

Vectori de înaltă calitate (3072 dimensiuni) pentru căutare semantică enterprise.

Vezi detalii

OpenAI

GPT-5.4 mini

Cea mai folosită alegere a familiei GPT-5.4 — pentru chatboți și automatizări.

Vezi detalii

Anthropic

Claude Haiku 4.5

Cel mai rapid și ieftin model Anthropic — competitor direct cu GPT-5.4 mini.

Vezi detalii

Activează Router by MP și plătește doar ce consumi cu text-embedding-3-small?

Cheie API în 30 secunde. Facturare locală MDL prin e-Factura. Fără card internațional, fără cont OpenAI/Anthropic/Google separat. Aceeași cheie funcționează cu orice tool OpenAI-compatible.

Începe gratis cu $1 credit Vezi prețuri live per model

e-Factura MoldovaAPI OpenAI-compatibleFără volum minimCost tracking per cheieActivare instant