Sari la conținut
Toate modelele
OpenAI · Embeddings · Vectori pentru căutare semantică

text-embedding-3-small

Vectori accesibili (1536 dimensiuni) — alegerea implicită pentru căutare semantică în propriile documente.

~$0.03 in / $0.00 out · per 1M unități de procesare≈ 0.56 MDLvezi /pricing/models pentru tariful live →
8K tokens
Context window
0
Input modalities
2024-01
Knowledge cut-off

Ce este text-embedding-3-small

text-embedding-3-small este alegerea implicită a echipelor SaaS pentru vectori de căutare semantică. Cu preț extraordinar de mic ($0.02 la 1 milion) și calitate aproape comparabilă cu large pentru majoritatea cazurilor, este modelul cu cel mai bun raport calitate/preț din catalog. Folosit pentru căutare semantică, sortare, recomandări — practic orice scenariu unde ai nevoie de vectori. Disponibil prin Router by Mega Promoting cu facturare în MDL.

Capabilități unice

Ce te diferențiază când folosești text-embedding-3-small

  • Alegerea implicită — preț extraordinar ($0.02/1M tokens) + calitate foarte bună
  • 1536 dimensiuni — echilibru perfect pentru cele mai multe vector DBs
  • Suport multilingv inclusiv română
  • 6× mai ieftin decât large cu doar 15% diferență MTEB
  • Răspuns sub 100ms consistent

Limitări de știut înainte să cumperi

  • ·Precizie ușor sub large pentru căutare foarte specifică
  • ·Maxim 8.192 unități la intrare

Performanță pe benchmark-uri publice

Scoruri verificabile text-embedding-3-small

Doar benchmark-uri cu sursă publică citabilă (model card, blog oficial, leaderboard independent). Click pe card → sursa originală.

Toate scorurile sunt din surse publice (model cards, blog-uri oficiale, leaderboard-uri independente). Click pe card → sursa originală.

Cum funcționează

Cum funcționează text-embedding-3-small pe înțelesul tuturor

Schemă simplificată — fără jargon. Trimiți o cerere, modelul o descompune, calculează răspunsul, ți-l întoarce. Restul e arhitectură internă pe care nu trebuie s-o cunoști pentru a-l folosi.

Text intrare„Contract Chișinău..."[0.21, -0.47, 0.83, ...]spațiu vectorial

Text → vector numeric → punct într-un spațiu multidimensional. Textele apropiate ca sens devin puncte apropiate, permițând căutare semantică.

Cazuri reale de utilizare

Cele mai bune scenarii pentru text-embedding-3-small

Pentru fiecare scenariu: industria, volumul tipic, costul estimat, și — dacă e cazul — modelul alternativ recomandat.

RAG · Suport produs

Bot RAG pe FAQ și docs

Default pentru majoritatea RAG pipelines.

Volum tipic100.000 query / lună + 50K docs
Cost estimat~$2-8/lună≈ 35-141 MDL
Embeddings · E-commerce

Search semantic catalog mediu

Magazine cu 10K-100K produse.

Volum tipic50.000 query / lună + 30K produse
Cost estimat~$2-6/lună≈ 35-106 MDL
Date · CRM

Similarity matching lead-uri

Detectare duplicate + clustering automatic.

Volum tipic200.000 comparații / lună
Cost estimat~$3-10/lună≈ 53-176 MDL
Embeddings · Content moderation

Detectare conținut similar (spam)

Identificare mesaje similare pentru filtrare bulk.

Volum tipic500.000 mesaje / lună
Cost estimat~$5-15/lună≈ 88-264 MDL
RAG · Knowledge base intern

Bot pe Confluence/Notion SMB

Cost minim pentru companii medii.

Volum tipic20.000 query / lună + 5K docs
Cost estimat~$1-4/lună≈ 18-70 MDL

Cost lunar estimat

Calculator interactiv pentru text-embedding-3-small

Calculator interactiv

Cât te-ar costa text-embedding-3-small pe lună

Scenariile sunt presetate, dar trage de sliders ca să modelezi propriul tău consum. Calculul folosește tariful Pro tier post-markup — exact ce vezi pe /pricing/models.

Document mediu.

100K
10010.0M
Cost total estimat
$4.80
≈ 84.5 MDL la cursul BNM
/ lună · 100K cereri
Tokens intrare$4.80≈ 84.5 MDL
Per cerere~$0.000≈ 0.00 MDL
Tarif client-facing (Pro tier post-markup). Free/Starter/Business au prețuri diferite — vezi /pricing/models pentru tariful exact al planului tău.

Alege bine

Când să alegi text-embedding-3-small vs alternative

Fără bare arbitrare 92/85. Doar explicații concrete pe baza forțelor reale ale fiecărui model. Pentru toate alternativele ai pagină separată cu același nivel de detaliu.

AlternativăAlege text-embedding-3-small când…Mai bine alternativa când…
text-embedding-3-large
OpenAI
Vezi
95% din cazuri — 6× mai ieftin, calitate suficientă.
Precizie critică (drept, medical, cercetare științifică).

Specificații comparative

Date reale, fără speculații

Tabel cu prețuri client-facing și caracteristici tehnice publice — nu scoruri agregate pe care nu le poți verifica.

Specificație
text-embedding-3-small
aici
text-embedding-3-large
vezi pagina →
GPT-5.4 mini
vezi pagina →
Claude Haiku 4.5
vezi pagina →
BrandOpenAIOpenAIOpenAIAnthropic
Preț input / 1M tokens$0.032≈ 0.56 MDL$0.208≈ 3.7 MDL$0.800≈ 14.1 MDL$1.60≈ 28.2 MDL
Preț output / 1M tokens$4.80≈ 84.5 MDL$8.00≈ 141 MDL
Context max8K tk8K tk128K tk200K tk
Output max0 tk0 tk16K tk8K tk
Vision
Audio (input)
Knowledge cut-off2024-012024-012026-032025-09
Integrare în orice unealtă

O cheie. 26+ unelte. Zero efort de migrare.

Router by MP e compatibil 100% cu API-ul OpenAI. Orice unealtă, framework sau platformă care folosește OpenAI SDK funcționează identic cu cheia ta Router by MP — schimbi o singură linie (baseURL) și gata. Iată cum integrezi text-embedding-3-small în cele mai populare unelte.

Pont text-embedding-3-small: Pentru pipeline RAG nou: începe pe small. Migrare la large doar dacă vezi precizie insuficientă în production — A/B 5-10% trafic 24h e suficient pentru decizie.

Vercel AI SDK · OpenAI SDK · LangChain · LlamaIndex · FastAPI · Next.js

Vercel AI SDK
Streaming React + Next.js. Cel mai folosit framework AI front-end în 2026.
app/api/chat/route.ts
import { streamText } from "ai";
import { createOpenAI } from "@ai-sdk/openai";

const router = createOpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function POST(req: Request) {
  const { messages } = await req.json();
  const result = streamText({
    model: router("text-embedding-3-small"),
    messages,
  });
  return result.toDataStreamResponse();
}
OpenAI SDK (Node.js)
Drop-in pentru orice cod scris pentru OpenAI direct. Zero refactor.
client.ts
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",   // <— singura linie diferită
});

const r = await client.chat.completions.create({
  model: "text-embedding-3-small",
  messages: [{ role: "user", content: "Salut!" }],
});
console.log(r.choices[0].message.content);
OpenAI SDK (Python)
Cel mai stabil SDK Python pentru orice provider OpenAI-compatible.
client.py
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

r = client.chat.completions.create(
    model="text-embedding-3-small",
    messages=[{"role": "user", "content": "Salut!"}],
)
print(r.choices[0].message.content)
LangChain (Python)
RAG, agenți, chain-uri complexe — toate prin Router.
rag.py
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="text-embedding-3-small",
    openai_api_key=os.environ["ROUTER_API_KEY"],
    openai_api_base="https://api.megapromoting.com/v1",
)

resp = llm.invoke("Răspunde în română.")
print(resp.content)
LangChain (JS)
Versiunea JavaScript — același API ca Python.
agent.ts
import { ChatOpenAI } from "@langchain/openai";

const llm = new ChatOpenAI({
  model: "text-embedding-3-small",
  apiKey: process.env.ROUTER_API_KEY,
  configuration: { baseURL: "https://api.megapromoting.com/v1" },
});

const r = await llm.invoke("Răspunde în română.");
console.log(r.content);
LlamaIndex
RAG la scară. Indexare semantică + retrieval + LLM, totul prin Router.
rag_index.py
from llama_index.llms.openai import OpenAI

llm = OpenAI(
    model="text-embedding-3-small",
    api_key=os.environ["ROUTER_API_KEY"],
    api_base="https://api.megapromoting.com/v1",
)

print(llm.complete("Generează un titlu pentru articol despre AI în Moldova"))
FastAPI proxy
Endpoint back-end care expune Router în propria ta aplicație.
main.py
from fastapi import FastAPI
from openai import AsyncOpenAI

app = FastAPI()
client = AsyncOpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

@app.post("/chat")
async def chat(prompt: str):
    r = await client.chat.completions.create(
        model="text-embedding-3-small",
        messages=[{"role": "user", "content": prompt}],
    )
    return {"text": r.choices[0].message.content}
Next.js Server Action
Apel direct din componente React, fără API route separat.
app/actions.ts
"use server";

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function summarize(text: string) {
  const r = await client.chat.completions.create({
    model: "text-embedding-3-small",
    messages: [
      { role: "system", content: "Rezumi text în 3 puncte." },
      { role: "user", content: text },
    ],
  });
  return r.choices[0].message.content;
}
Folosești deja OpenAI direct?

Schimbarea către Router by MP înseamnă o singură linie: baseURL = "https://api.megapromoting.com/v1". Toate apelurile existente continuă să funcționeze. Facturarea trece pe MDL prin e-Factura, fără cont OpenAI / Anthropic / Google separat.

Toate integrările

Quickstart

Exemplu de cod canonic pentru text-embedding-3-small

Endpoint OpenAI-compatible. Schimbi doar baseURL și apiKey — restul codului rămâne identic cu provider-ul original.

text-embedding-3-small.ts
typescript
1import OpenAI from "openai";
2
3// Vectori pentru căutare semantică în propriile documente
4const client = new OpenAI({
5 apiKey: process.env.ROUTER_API_KEY,
6 baseURL: "https://api.megapromoting.com/v1",
7});
8
9const r = await client.embeddings.create({
10 model: "text-embedding-3-small",
11 input: [
12 "Contractul de prestări servicii încheiat la Chișinău…",
13 "Politica de confidențialitate conform GDPR…",
14 ],
15});
16
17console.log(r.data[0].embedding.length); // mărimea vectorului — îl salvezi în baza ta

Pont-uri pentru implementare în Moldova

  • 1Alegerea implicită pentru orice proiect SaaS din Moldova care are nevoie de căutare semantică în propriile documente.
  • 2Combină cu Qdrant/Pinecone self-hosted pe serverul OVH .71 pentru cost total minim.
  • 3Pentru chatbot Aichat cu bază de cunoștințe de 1.000 documente, costul indexării e sub $5 total.
  • 4Re-indexează periodic (lunar) când actualizezi baza de cunoștințe.

Întrebări frecvente

FAQ text-embedding-3-small

Suportă limba română?
Da, performanță foarte bună pe română, rusă, engleză. Multilingv nativ.
Cât costă să indexez un site cu 10.000 articole?
Pentru articole medii (1.000 unități), aproximativ $0.20 total. Foarte ieftin.
Pot folosi cu Postgres pgvector?
Da, dimensiunea 1536 este suportată nativ de pgvector. Funcționează cu Supabase self-hosted.
Când să trec la large?
Doar dacă vezi probleme de precizie la căutare (răspunsuri irelevante frecvente). Pentru 95% din cazuri small este suficient.

Activează Router by MP și plătește doar ce consumi cu text-embedding-3-small?

Cheie API în 30 secunde. Facturare locală MDL prin e-Factura. Fără card internațional, fără cont OpenAI/Anthropic/Google separat. Aceeași cheie funcționează cu orice tool OpenAI-compatible.

e-Factura MoldovaAPI OpenAI-compatibleFără volum minimCost tracking per cheieActivare instant
text-embedding-3-small — Vectori implicit pentru SaaS | Router by Mega Promoting