Whisper
Transcriere audio în text — română, rusă, engleză cu calitate excelentă.
Ce este Whisper
Whisper este modelul OpenAI dedicat transcrierii audio. Suportă peste 90 de limbi, inclusiv română, rusă și engleză cu calitate ridicată. Folosit pentru transcrierea apelurilor telefonice (PBX, call-center), dictare, transcriere video pentru subtitrări, asistenți voce. Output text cu punctuație și capitalizare automate. Preț $0.006 pe minut audio — foarte accesibil. Disponibil prin Router by Mega Promoting cu facturare în MDL.
Capabilități unice
Ce te diferențiază când folosești Whisper
- Cel mai bun model open-source pentru transcriere română (cu diacritice corecte)
- Suport 99 limbi, calitate top-tier pe RO/RU/EN/UA
- Diarizare opțională (separare voci diferite)
- Verbal timestamps pentru subtitrări precise
- Format de ieșire flexibil: text, JSON, SRT, VTT
Limitări de știut înainte să cumperi
- ·Doar transcriere — nu separă vorbitorii automat
- ·Pentru fișiere peste 25MB trebuie să le tai manual în bucăți
- ·Nu este în timp real — pentru live folosește gpt-realtime
Performanță pe benchmark-uri publice
Scoruri verificabile Whisper
Doar benchmark-uri cu sursă publică citabilă (model card, blog oficial, leaderboard independent). Click pe card → sursa originală.
Toate scorurile sunt din surse publice (model cards, blog-uri oficiale, leaderboard-uri independente). Click pe card → sursa originală.
Cum funcționează
Cum funcționează Whisper pe înțelesul tuturor
Schemă simplificată — fără jargon. Trimiți o cerere, modelul o descompune, calculează răspunsul, ți-l întoarce. Restul e arhitectură internă pe care nu trebuie s-o cunoști pentru a-l folosi.
Audio (vorbire, muzică, zgomot) → unde de presiune analizate de model → transcriere text sau voce sintetizată în direcția inversă.
Cazuri reale de utilizare
Cele mai bune scenarii pentru Whisper
Pentru fiecare scenariu: industria, volumul tipic, costul estimat, și — dacă e cazul — modelul alternativ recomandat.
Transcriere apeluri call-center retail / HoReCa
Post-call summary + extragere acțiuni + QA automat.
Subtitrări automate cursuri video
Generare SRT/VTT pentru platforme e-learning Moodle.
Transcriere podcast-uri și emisiuni
Conversie audio → text căutabil pentru SEO și accesibilitate.
ASR într-un pipeline voice agent
Whisper → LLM → TTS pentru asistenți telefonici.
Transcriere ședințe instanță și depoziții
Documentație juridică din audio cu timestamps.
Transcriere interviuri calitative pentru sociologi
USM, ASEM, ONG-uri — interviuri în RO/RU cu diacritice.
Cost lunar estimat
Calculator interactiv pentru Whisper
Cât te-ar costa Whisper pe lună
Scenariile sunt presetate, dar trage de sliders ca să modelezi propriul tău consum. Calculul folosește tariful Pro tier post-markup — exact ce vezi pe /pricing/models.
60 min / lună notițe meetings.
Alege bine
Când să alegi Whisper vs alternative
Fără bare arbitrare 92/85. Doar explicații concrete pe baza forțelor reale ale fiecărui model. Pentru toate alternativele ai pagină separată cu același nivel de detaliu.
| Alternativă | Alege Whisper când… | Mai bine alternativa când… |
|---|---|---|
Deepgram Nova 2 Deepgram Vezi | Calitate diacritice RO, cost mic, batch processing. | Streaming live cu latență sub 300ms (Whisper standard nu suportă streaming nativ). |
AssemblyAI Whisper AssemblyAI Vezi | Cost mic și calitate transcripție. | Ai nevoie de diarizare avansată, sentiment, capitole automate native. |
Specificații comparative
Date reale, fără speculații
Tabel cu prețuri client-facing și caracteristici tehnice publice — nu scoruri agregate pe care nu le poți verifica.
| Specificație | Whisper aici | gpt-realtime-1.5 vezi pagina → | TTS-1 vezi pagina → | TTS-1 vezi pagina → |
|---|---|---|---|---|
| Brand | OpenAI | OpenAI | OpenAI | OpenAI |
| Preț input / 1M tokens | — | $8.00≈ 141 MDL | — | — |
| Preț output / 1M tokens | — | $32.00≈ 563 MDL | — | — |
| Context max | 0 tk | 128K tk | 4K tk | 4K tk |
| Output max | 0 tk | 8K tk | 0 tk | 0 tk |
| Vision | — | — | — | — |
| Audio (input) | ● | ● | — | — |
| Knowledge cut-off | — | — | — | — |
O cheie. 26+ unelte. Zero efort de migrare.
Router by MP e compatibil 100% cu API-ul OpenAI. Orice unealtă, framework sau platformă care folosește OpenAI SDK funcționează identic cu cheia ta Router by MP — schimbi o singură linie (baseURL) și gata. Iată cum integrezi Whisper în cele mai populare unelte.
Vercel AI SDK · OpenAI SDK · LangChain · LlamaIndex · FastAPI · Next.js
import { streamText } from "ai";
import { createOpenAI } from "@ai-sdk/openai";
const router = createOpenAI({
apiKey: process.env.ROUTER_API_KEY,
baseURL: "https://api.megapromoting.com/v1",
});
export async function POST(req: Request) {
const { messages } = await req.json();
const result = streamText({
model: router("whisper"),
messages,
});
return result.toDataStreamResponse();
}
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.ROUTER_API_KEY,
baseURL: "https://api.megapromoting.com/v1", // <— singura linie diferită
});
const r = await client.chat.completions.create({
model: "whisper",
messages: [{ role: "user", content: "Salut!" }],
});
console.log(r.choices[0].message.content);
from openai import OpenAI
client = OpenAI(
api_key=os.environ["ROUTER_API_KEY"],
base_url="https://api.megapromoting.com/v1",
)
r = client.chat.completions.create(
model="whisper",
messages=[{"role": "user", "content": "Salut!"}],
)
print(r.choices[0].message.content)
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(
model="whisper",
openai_api_key=os.environ["ROUTER_API_KEY"],
openai_api_base="https://api.megapromoting.com/v1",
)
resp = llm.invoke("Răspunde în română.")
print(resp.content)
import { ChatOpenAI } from "@langchain/openai";
const llm = new ChatOpenAI({
model: "whisper",
apiKey: process.env.ROUTER_API_KEY,
configuration: { baseURL: "https://api.megapromoting.com/v1" },
});
const r = await llm.invoke("Răspunde în română.");
console.log(r.content);
from llama_index.llms.openai import OpenAI
llm = OpenAI(
model="whisper",
api_key=os.environ["ROUTER_API_KEY"],
api_base="https://api.megapromoting.com/v1",
)
print(llm.complete("Generează un titlu pentru articol despre AI în Moldova"))
from fastapi import FastAPI
from openai import AsyncOpenAI
app = FastAPI()
client = AsyncOpenAI(
api_key=os.environ["ROUTER_API_KEY"],
base_url="https://api.megapromoting.com/v1",
)
@app.post("/chat")
async def chat(prompt: str):
r = await client.chat.completions.create(
model="whisper",
messages=[{"role": "user", "content": prompt}],
)
return {"text": r.choices[0].message.content}
"use server";
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.ROUTER_API_KEY,
baseURL: "https://api.megapromoting.com/v1",
});
export async function summarize(text: string) {
const r = await client.chat.completions.create({
model: "whisper",
messages: [
{ role: "system", content: "Rezumi text în 3 puncte." },
{ role: "user", content: text },
],
});
return r.choices[0].message.content;
}
Schimbarea către Router by MP înseamnă o singură linie: baseURL = "https://api.megapromoting.com/v1". Toate apelurile existente continuă să funcționeze. Facturarea trece pe MDL prin e-Factura, fără cont OpenAI / Anthropic / Google separat.
Quickstart
Exemplu de cod canonic pentru Whisper
Endpoint OpenAI-compatible. Schimbi doar baseURL și apiKey — restul codului rămâne identic cu provider-ul original.
1import OpenAI from "openai";2import fs from "node:fs";3 4// Transformi un fișier audio în text — apeluri, ședințe, dictare5const client = new OpenAI({6 apiKey: process.env.ROUTER_API_KEY,7 baseURL: "https://api.megapromoting.com/v1",8});9 10const transcript = await client.audio.transcriptions.create({11 model: "whisper",12 file: fs.createReadStream("apel-client.ogg"),13 language: "ro",14});15 16console.log(transcript.text);Pont-uri pentru implementare în Moldova
- 1Pentru transcriere ședințe CDPA / hot-line cetățeni: Whisper costă $0.30/oră audio.
- 2Pentru limba română, calitatea este excelentă — folosește `language: 'ro'` pentru rezultate optime.
- 3Combină cu gpt-5.4-mini pentru rezumat automat după transcriere — flux complet apel → text → informații.
- 4Pentru apeluri lungi (peste 25MB), tai în bucăți de 20 de minute și concatenezi rezultatele.
Întrebări frecvente
FAQ Whisper
Suportă limba română?
Poate identifica vorbitori diferiți?
Ce formate sunt suportate?
Cât costă să transcriu o oră audio?
Continuă explorarea
Modele înrudite
Conversație voce în timp real, în ambele sensuri — pentru asistenți telefonici și PBX.
Vezi detaliiTransformare text în voce, rapidă, pentru asistenți vocali și anunțuri PBX.
Vezi detaliiTransformare text în voce, rapidă, pentru asistenți vocali și anunțuri PBX.
Vezi detaliiActivează Router by MP și plătește doar ce consumi cu Whisper?
Cheie API în 30 secunde. Facturare locală MDL prin e-Factura. Fără card internațional, fără cont OpenAI/Anthropic/Google separat. Aceeași cheie funcționează cu orice tool OpenAI-compatible.