text-embedding-3-small
Vectori accesibili (1536 dimensiuni) — alegerea implicită pentru căutare semantică în propriile documente.
Ce este text-embedding-3-small
text-embedding-3-small este alegerea implicită a echipelor SaaS pentru vectori de căutare semantică. Cu preț extraordinar de mic ($0.02 la 1 milion) și calitate aproape comparabilă cu large pentru majoritatea cazurilor, este modelul cu cel mai bun raport calitate/preț din catalog. Folosit pentru căutare semantică, sortare, recomandări — practic orice scenariu unde ai nevoie de vectori. Disponibil prin Router by Mega Promoting cu facturare în MDL.
Capabilități unice
Ce te diferențiază când folosești text-embedding-3-small
- Alegerea implicită — preț extraordinar ($0.02/1M tokens) + calitate foarte bună
- 1536 dimensiuni — echilibru perfect pentru cele mai multe vector DBs
- Suport multilingv inclusiv română
- 6× mai ieftin decât large cu doar 15% diferență MTEB
- Răspuns sub 100ms consistent
Limitări de știut înainte să cumperi
- ·Precizie ușor sub large pentru căutare foarte specifică
- ·Maxim 8.192 unități la intrare
Performanță pe benchmark-uri publice
Scoruri verificabile text-embedding-3-small
Doar benchmark-uri cu sursă publică citabilă (model card, blog oficial, leaderboard independent). Click pe card → sursa originală.
Toate scorurile sunt din surse publice (model cards, blog-uri oficiale, leaderboard-uri independente). Click pe card → sursa originală.
Cum funcționează
Cum funcționează text-embedding-3-small pe înțelesul tuturor
Schemă simplificată — fără jargon. Trimiți o cerere, modelul o descompune, calculează răspunsul, ți-l întoarce. Restul e arhitectură internă pe care nu trebuie s-o cunoști pentru a-l folosi.
Text → vector numeric → punct într-un spațiu multidimensional. Textele apropiate ca sens devin puncte apropiate, permițând căutare semantică.
Cazuri reale de utilizare
Cele mai bune scenarii pentru text-embedding-3-small
Pentru fiecare scenariu: industria, volumul tipic, costul estimat, și — dacă e cazul — modelul alternativ recomandat.
Bot RAG pe FAQ și docs
Default pentru majoritatea RAG pipelines.
Search semantic catalog mediu
Magazine cu 10K-100K produse.
Similarity matching lead-uri
Detectare duplicate + clustering automatic.
Detectare conținut similar (spam)
Identificare mesaje similare pentru filtrare bulk.
Bot pe Confluence/Notion SMB
Cost minim pentru companii medii.
Cost lunar estimat
Calculator interactiv pentru text-embedding-3-small
Cât te-ar costa text-embedding-3-small pe lună
Scenariile sunt presetate, dar trage de sliders ca să modelezi propriul tău consum. Calculul folosește tariful Pro tier post-markup — exact ce vezi pe /pricing/models.
Document mediu.
Alege bine
Când să alegi text-embedding-3-small vs alternative
Fără bare arbitrare 92/85. Doar explicații concrete pe baza forțelor reale ale fiecărui model. Pentru toate alternativele ai pagină separată cu același nivel de detaliu.
| Alternativă | Alege text-embedding-3-small când… | Mai bine alternativa când… |
|---|---|---|
text-embedding-3-large OpenAI Vezi | 95% din cazuri — 6× mai ieftin, calitate suficientă. | Precizie critică (drept, medical, cercetare științifică). |
Specificații comparative
Date reale, fără speculații
Tabel cu prețuri client-facing și caracteristici tehnice publice — nu scoruri agregate pe care nu le poți verifica.
| Specificație | text-embedding-3-small aici | text-embedding-3-large vezi pagina → | GPT-5.4 mini vezi pagina → | Claude Haiku 4.5 vezi pagina → |
|---|---|---|---|---|
| Brand | OpenAI | OpenAI | OpenAI | Anthropic |
| Preț input / 1M tokens | $0.032≈ 0.56 MDL | $0.208≈ 3.7 MDL | $0.800≈ 14.1 MDL | $1.60≈ 28.2 MDL |
| Preț output / 1M tokens | — | — | $4.80≈ 84.5 MDL | $8.00≈ 141 MDL |
| Context max | 8K tk | 8K tk | 128K tk | 200K tk |
| Output max | 0 tk | 0 tk | 16K tk | 8K tk |
| Vision | — | — | ● | ● |
| Audio (input) | — | — | — | — |
| Knowledge cut-off | 2024-01 | 2024-01 | 2026-03 | 2025-09 |
O cheie. 26+ unelte. Zero efort de migrare.
Router by MP e compatibil 100% cu API-ul OpenAI. Orice unealtă, framework sau platformă care folosește OpenAI SDK funcționează identic cu cheia ta Router by MP — schimbi o singură linie (baseURL) și gata. Iată cum integrezi text-embedding-3-small în cele mai populare unelte.
Vercel AI SDK · OpenAI SDK · LangChain · LlamaIndex · FastAPI · Next.js
import { streamText } from "ai";
import { createOpenAI } from "@ai-sdk/openai";
const router = createOpenAI({
apiKey: process.env.ROUTER_API_KEY,
baseURL: "https://api.megapromoting.com/v1",
});
export async function POST(req: Request) {
const { messages } = await req.json();
const result = streamText({
model: router("text-embedding-3-small"),
messages,
});
return result.toDataStreamResponse();
}
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.ROUTER_API_KEY,
baseURL: "https://api.megapromoting.com/v1", // <— singura linie diferită
});
const r = await client.chat.completions.create({
model: "text-embedding-3-small",
messages: [{ role: "user", content: "Salut!" }],
});
console.log(r.choices[0].message.content);
from openai import OpenAI
client = OpenAI(
api_key=os.environ["ROUTER_API_KEY"],
base_url="https://api.megapromoting.com/v1",
)
r = client.chat.completions.create(
model="text-embedding-3-small",
messages=[{"role": "user", "content": "Salut!"}],
)
print(r.choices[0].message.content)
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(
model="text-embedding-3-small",
openai_api_key=os.environ["ROUTER_API_KEY"],
openai_api_base="https://api.megapromoting.com/v1",
)
resp = llm.invoke("Răspunde în română.")
print(resp.content)
import { ChatOpenAI } from "@langchain/openai";
const llm = new ChatOpenAI({
model: "text-embedding-3-small",
apiKey: process.env.ROUTER_API_KEY,
configuration: { baseURL: "https://api.megapromoting.com/v1" },
});
const r = await llm.invoke("Răspunde în română.");
console.log(r.content);
from llama_index.llms.openai import OpenAI
llm = OpenAI(
model="text-embedding-3-small",
api_key=os.environ["ROUTER_API_KEY"],
api_base="https://api.megapromoting.com/v1",
)
print(llm.complete("Generează un titlu pentru articol despre AI în Moldova"))
from fastapi import FastAPI
from openai import AsyncOpenAI
app = FastAPI()
client = AsyncOpenAI(
api_key=os.environ["ROUTER_API_KEY"],
base_url="https://api.megapromoting.com/v1",
)
@app.post("/chat")
async def chat(prompt: str):
r = await client.chat.completions.create(
model="text-embedding-3-small",
messages=[{"role": "user", "content": prompt}],
)
return {"text": r.choices[0].message.content}
"use server";
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.ROUTER_API_KEY,
baseURL: "https://api.megapromoting.com/v1",
});
export async function summarize(text: string) {
const r = await client.chat.completions.create({
model: "text-embedding-3-small",
messages: [
{ role: "system", content: "Rezumi text în 3 puncte." },
{ role: "user", content: text },
],
});
return r.choices[0].message.content;
}
Schimbarea către Router by MP înseamnă o singură linie: baseURL = "https://api.megapromoting.com/v1". Toate apelurile existente continuă să funcționeze. Facturarea trece pe MDL prin e-Factura, fără cont OpenAI / Anthropic / Google separat.
Quickstart
Exemplu de cod canonic pentru text-embedding-3-small
Endpoint OpenAI-compatible. Schimbi doar baseURL și apiKey — restul codului rămâne identic cu provider-ul original.
1import OpenAI from "openai";2 3// Vectori pentru căutare semantică în propriile documente4const client = new OpenAI({5 apiKey: process.env.ROUTER_API_KEY,6 baseURL: "https://api.megapromoting.com/v1",7});8 9const r = await client.embeddings.create({10 model: "text-embedding-3-small",11 input: [12 "Contractul de prestări servicii încheiat la Chișinău…",13 "Politica de confidențialitate conform GDPR…",14 ],15});16 17console.log(r.data[0].embedding.length); // mărimea vectorului — îl salvezi în baza taPont-uri pentru implementare în Moldova
- 1Alegerea implicită pentru orice proiect SaaS din Moldova care are nevoie de căutare semantică în propriile documente.
- 2Combină cu Qdrant/Pinecone self-hosted pe serverul OVH .71 pentru cost total minim.
- 3Pentru chatbot Aichat cu bază de cunoștințe de 1.000 documente, costul indexării e sub $5 total.
- 4Re-indexează periodic (lunar) când actualizezi baza de cunoștințe.
Întrebări frecvente
FAQ text-embedding-3-small
Suportă limba română?
Cât costă să indexez un site cu 10.000 articole?
Pot folosi cu Postgres pgvector?
Când să trec la large?
Continuă explorarea
Modele înrudite
Vectori de înaltă calitate (3072 dimensiuni) pentru căutare semantică enterprise.
Vezi detaliiCea mai folosită alegere a familiei GPT-5.4 — pentru chatboți și automatizări.
Vezi detaliiCel mai rapid și ieftin model Anthropic — competitor direct cu GPT-5.4 mini.
Vezi detaliiActivează Router by MP și plătește doar ce consumi cu text-embedding-3-small?
Cheie API în 30 secunde. Facturare locală MDL prin e-Factura. Fără card internațional, fără cont OpenAI/Anthropic/Google separat. Aceeași cheie funcționează cu orice tool OpenAI-compatible.