OpenAI · Embeddings · Vectori pentru căutare semantică

text-embedding-3-large

Vectori de înaltă calitate (3072 dimensiuni) pentru căutare semantică enterprise.

~$0.21 in / $0.00 out · per 1M unități de procesare≈ 3.7 MDLvezi /pricing/models pentru tariful live →

Începe gratis Vezi prețuri per model

8K tokens

Context window

Input modalities

2024-01

Knowledge cut-off

Ce este text-embedding-3-large

text-embedding-3-large este modelul OpenAI de top pentru vectori de căutare semantică. Produce vectori densi de 3072 dimensiuni (configurabili la 1536 sau 256 pentru economie de stocare), cu calitate semnificativ mai bună decât modelele anterioare (ada-002). Folosit pentru căutare semantică enterprise unde precizia contează, sortare semantică, recomandări de produse, detecție duplicate. Disponibil prin Router by Mega Promoting cu facturare în MDL.

Capabilități unice

Ce te diferențiază când folosești text-embedding-3-large

Cel mai precis embedding OpenAI — 3072 dimensiuni
Dimensiuni configurabile (3072, 1536, 256) — trade-off precizie/stocare
Suport multilingv inclusiv română cu calitate ridicată
MTEB benchmark top-tier
Context 8192 tokens per fragment

Limitări de știut înainte să cumperi

·Preț de 6 ori față de small — folosește selectiv
·Cost stocare mai mare în baza de date vectorială
·Maxim 8.192 unități la intrare

Performanță pe benchmark-uri publice

Scoruri verificabile text-embedding-3-large

Doar benchmark-uri cu sursă publică citabilă (model card, blog oficial, leaderboard independent). Click pe card → sursa originală.

MTEB average

64.6 / 100

self-reported, 3072 dims

sursă

MIRACL

54.9 / 100

self-reported, multilingual retrieval

sursă

Toate scorurile sunt din surse publice (model cards, blog-uri oficiale, leaderboard-uri independente). Click pe card → sursa originală.

Cum funcționează

Cum funcționează text-embedding-3-large pe înțelesul tuturor

Schemă simplificată — fără jargon. Trimiți o cerere, modelul o descompune, calculează răspunsul, ți-l întoarce. Restul e arhitectură internă pe care nu trebuie s-o cunoști pentru a-l folosi.

Text → vector numeric → punct într-un spațiu multidimensional. Textele apropiate ca sens devin puncte apropiate, permițând căutare semantică.

Cazuri reale de utilizare

Cele mai bune scenarii pentru text-embedding-3-large

Pentru fiecare scenariu: industria, volumul tipic, costul estimat, și — dacă e cazul — modelul alternativ recomandat.

RAG · Drept

RAG juridic cu precizie maximă

Căutare semantică precisă pe Cod Civil RM + jurisprudență.

Volum tipic5.000 query / lună + 50K docs index

Cost estimat~$10-30/lună (query) + index one-time≈ 176-528 MDL

Embeddings · Suport tehnic

Search semantic pe documentație produs

Q&A bot pe baza propriilor docs cu retrieval precis.

Volum tipic20.000 query / lună + 10K docs

Cost estimat~$5-15/lună≈ 88-264 MDL

RAG · Cercetare

Sinteză literatură științifică

Indexare papers + retrieval pentru sinteze multi-articol.

Volum tipic10.000 query / lună + 100K papers

Cost estimat~$15-40/lună≈ 264-704 MDL

Embeddings · E-commerce

Search produse cu intent matching

Recomandări produse bazate pe semantica query-ului.

Volum tipic100.000 query / lună + 50K produse

Cost estimat~$15-50/lună≈ 264-880 MDL

Date · Deduplication

Detectare duplicate semantice (CRM)

Identificare lead-uri duplicate care diferă lexical dar nu semantic.

Volum tipic50.000 comparații / lună

Cost estimat~$5-15/lună≈ 88-264 MDL

Cost lunar estimat

Calculator interactiv pentru text-embedding-3-large

Calculator interactiv

Cât te-ar costa text-embedding-3-large pe lună

Scenariile sunt presetate, dar trage de sliders ca să modelezi propriul tău consum. Calculul folosește tariful Pro tier post-markup — exact ce vezi pe /pricing/models.

Tip caz tipic

Document mediu (3 paragrafe).

Documente / lună (~500 tokens fiecare)100K

10010.0M

Cost total estimat

$31.2

≈ 549 MDL la cursul BNM

/ lună · 100K cereri

Tokens intrare$31.2≈ 549 MDL

Per cerere~$0.000≈ 0.01 MDL

Tarif client-facing (Pro tier post-markup). Free/Starter/Business au prețuri diferite — vezi /pricing/models pentru tariful exact al planului tău.

Alege bine

Când să alegi text-embedding-3-large vs alternative

Fără bare arbitrare 92/85. Doar explicații concrete pe baza forțelor reale ale fiecărui model. Pentru toate alternativele ai pagină separată cu același nivel de detaliu.

Alternativă	Alege text-embedding-3-large când…	Mai bine alternativa când…
text-embedding-3-small OpenAI Vezi	Precizie critică (drept, medical, cercetare) — 15% mai bun pe MTEB.	95% din cazuri — small e 6× mai ieftin cu calitate suficientă.

Specificații comparative

Date reale, fără speculații

Tabel cu prețuri client-facing și caracteristici tehnice publice — nu scoruri agregate pe care nu le poți verifica.

Specificație	text-embedding-3-large aici	text-embedding-3-small vezi pagina →	GPT-5.4 mini vezi pagina →	Claude Sonnet 4.6 vezi pagina →
Brand	OpenAI	OpenAI	OpenAI	Anthropic
Preț input / 1M tokens	$0.208≈ 3.7 MDL	$0.032≈ 0.56 MDL	$0.800≈ 14.1 MDL	$4.80≈ 84.5 MDL
Preț output / 1M tokens	—	—	$4.80≈ 84.5 MDL	$24.00≈ 423 MDL
Context max	8K tk	8K tk	128K tk	200K tk
Output max	0 tk	0 tk	16K tk	16K tk
Vision	—	—	●	●
Audio (input)	—	—	—	—
Knowledge cut-off	2024-01	2024-01	2026-03	2026-01

Integrare în orice unealtă

O cheie. 26+ unelte. Zero efort de migrare.

Router by MP e compatibil 100% cu API-ul OpenAI. Orice unealtă, framework sau platformă care folosește OpenAI SDK funcționează identic cu cheia ta Router by MP — schimbi o singură linie (baseURL) și gata. Iată cum integrezi text-embedding-3-large în cele mai populare unelte.

Pont text-embedding-3-large: Pentru economie stocare, folosește dimension=1536 (jumătate spațiu vector DB) cu pierdere minimă de calitate (~2-3%). Dimension=256 pentru cazuri cu sute de milioane vectori unde stocarea contează mai mult ca precizia.

Vercel AI SDK · OpenAI SDK · LangChain · LlamaIndex · FastAPI · Next.js

Vercel AI SDK

Streaming React + Next.js. Cel mai folosit framework AI front-end în 2026.

app/api/chat/route.ts

import { streamText } from "ai";
import { createOpenAI } from "@ai-sdk/openai";

const router = createOpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function POST(req: Request) {
  const { messages } = await req.json();
  const result = streamText({
    model: router("text-embedding-3-large"),
    messages,
  });
  return result.toDataStreamResponse();
}

Docs oficiale

OpenAI SDK (Node.js)

Drop-in pentru orice cod scris pentru OpenAI direct. Zero refactor.

client.ts

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",   // <— singura linie diferită
});

const r = await client.chat.completions.create({
  model: "text-embedding-3-large",
  messages: [{ role: "user", content: "Salut!" }],
});
console.log(r.choices[0].message.content);

Docs oficiale

OpenAI SDK (Python)

Cel mai stabil SDK Python pentru orice provider OpenAI-compatible.

client.py

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

r = client.chat.completions.create(
    model="text-embedding-3-large",
    messages=[{"role": "user", "content": "Salut!"}],
)
print(r.choices[0].message.content)

Docs oficiale

LangChain (Python)

RAG, agenți, chain-uri complexe — toate prin Router.

rag.py

from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="text-embedding-3-large",
    openai_api_key=os.environ["ROUTER_API_KEY"],
    openai_api_base="https://api.megapromoting.com/v1",
)

resp = llm.invoke("Răspunde în română.")
print(resp.content)

Docs oficiale

LangChain (JS)

Versiunea JavaScript — același API ca Python.

agent.ts

import { ChatOpenAI } from "@langchain/openai";

const llm = new ChatOpenAI({
  model: "text-embedding-3-large",
  apiKey: process.env.ROUTER_API_KEY,
  configuration: { baseURL: "https://api.megapromoting.com/v1" },
});

const r = await llm.invoke("Răspunde în română.");
console.log(r.content);

Docs oficiale

LlamaIndex

RAG la scară. Indexare semantică + retrieval + LLM, totul prin Router.

rag_index.py

from llama_index.llms.openai import OpenAI

llm = OpenAI(
    model="text-embedding-3-large",
    api_key=os.environ["ROUTER_API_KEY"],
    api_base="https://api.megapromoting.com/v1",
)

print(llm.complete("Generează un titlu pentru articol despre AI în Moldova"))

Docs oficiale

FastAPI proxy

Endpoint back-end care expune Router în propria ta aplicație.

main.py

from fastapi import FastAPI
from openai import AsyncOpenAI

app = FastAPI()
client = AsyncOpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

@app.post("/chat")
async def chat(prompt: str):
    r = await client.chat.completions.create(
        model="text-embedding-3-large",
        messages=[{"role": "user", "content": prompt}],
    )
    return {"text": r.choices[0].message.content}

Docs oficiale

Next.js Server Action

Apel direct din componente React, fără API route separat.

app/actions.ts

"use server";

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function summarize(text: string) {
  const r = await client.chat.completions.create({
    model: "text-embedding-3-large",
    messages: [
      { role: "system", content: "Rezumi text în 3 puncte." },
      { role: "user", content: text },
    ],
  });
  return r.choices[0].message.content;
}

Docs oficiale

Folosești deja OpenAI direct?

Schimbarea către Router by MP înseamnă o singură linie: baseURL = "https://api.megapromoting.com/v1". Toate apelurile existente continuă să funcționeze. Facturarea trece pe MDL prin e-Factura, fără cont OpenAI / Anthropic / Google separat.

Toate integrările

Quickstart

Exemplu de cod canonic pentru text-embedding-3-large

Endpoint OpenAI-compatible. Schimbi doar baseURL și apiKey — restul codului rămâne identic cu provider-ul original.

text-embedding-3-large.ts

typescript

1import OpenAI from "openai";
2 
3// Vectori pentru căutare semantică în propriile documente
4const client = new OpenAI({
5  apiKey: process.env.ROUTER_API_KEY,
6  baseURL: "https://api.megapromoting.com/v1",
7});
8 
9const r = await client.embeddings.create({
10  model: "text-embedding-3-large",
11  input: [
12    "Contractul de prestări servicii încheiat la Chișinău…",
13    "Politica de confidențialitate conform GDPR…",
14  ],
15});
16 
17console.log(r.data[0].embedding.length); // mărimea vectorului — îl salvezi în baza ta

Pont-uri pentru implementare în Moldova

1Folosește pentru căutare semantică enterprise unde precizia chiar contează (chatbot suport tehnic, asistent juridic).
2Pentru chatbot magazin online standard, varianta small este suficientă — economisești 80% din costuri pentru stocare și apeluri.
3Reduce dimensiunile la 1536 pentru a economisi stocare în Pinecone/Qdrant cu pierdere mică de precizie.

Întrebări frecvente

FAQ text-embedding-3-large

Cum aleg între large și small?

Începe cu small. Migrezi la large doar dacă vezi probleme de precizie la căutare (răspunsuri irelevante).

Suportă limba română?

Da, calitate foarte bună pe română, rusă, engleză. Modelul este multilingv nativ.

Pot reduce dimensiunile?

Da, parametrul `dimensions` permite valori 256, 1024, 1536 sau 3072. Pierderea de precizie la 1536 este sub 3%.

Cât costă să indexez 1 milion de documente?

Depinde de lungime. Pentru documente de 500 unități: aproximativ $65 indexare totală cu large, $13 cu small.

Continuă explorarea

Modele înrudite

OpenAI

text-embedding-3-small

Vectori accesibili (1536 dimensiuni) — alegerea implicită pentru căutare semantică în propriile documente.

Vezi detalii

OpenAI

GPT-5.4 mini

Cea mai folosită alegere a familiei GPT-5.4 — pentru chatboți și automatizări.

Vezi detalii

Anthropic

Claude Sonnet 4.6

Cea mai bună alegere echilibrată din familia Claude — calitate excelentă, preț rezonabil.

Vezi detalii

Activează Router by MP și plătește doar ce consumi cu text-embedding-3-large?

Cheie API în 30 secunde. Facturare locală MDL prin e-Factura. Fără card internațional, fără cont OpenAI/Anthropic/Google separat. Aceeași cheie funcționează cu orice tool OpenAI-compatible.

Începe gratis cu $1 credit Vezi prețuri live per model

e-Factura MoldovaAPI OpenAI-compatibleFără volum minimCost tracking per cheieActivare instant