OpenAI · Whisper · Audio

Whisper

Transcriere audio în text — română, rusă, engleză cu calitate excelentă.

~$0.010 · per minut audio≈ 0.17 MDLvezi /pricing/models pentru tariful live →

Input modalities

per minut audio

Unitate facturare

Ce este Whisper

Whisper este modelul OpenAI dedicat transcrierii audio. Suportă peste 90 de limbi, inclusiv română, rusă și engleză cu calitate ridicată. Folosit pentru transcrierea apelurilor telefonice (PBX, call-center), dictare, transcriere video pentru subtitrări, asistenți voce. Output text cu punctuație și capitalizare automate. Preț $0.006 pe minut audio — foarte accesibil. Disponibil prin Router by Mega Promoting cu facturare în MDL.

Capabilități unice

Ce te diferențiază când folosești Whisper

Cel mai bun model open-source pentru transcriere română (cu diacritice corecte)
Suport 99 limbi, calitate top-tier pe RO/RU/EN/UA
Diarizare opțională (separare voci diferite)
Verbal timestamps pentru subtitrări precise
Format de ieșire flexibil: text, JSON, SRT, VTT

Limitări de știut înainte să cumperi

·Doar transcriere — nu separă vorbitorii automat
·Pentru fișiere peste 25MB trebuie să le tai manual în bucăți
·Nu este în timp real — pentru live folosește gpt-realtime

Performanță pe benchmark-uri publice

Scoruri verificabile Whisper

Doar benchmark-uri cu sursă publică citabilă (model card, blog oficial, leaderboard independent). Click pe card → sursa originală.

WER (RO librivox)

8 / 100

Word Error Rate — mai mic = mai bun, ~8% pentru Whisper Large

sursă

WER (RU)

12 / 100

Word Error Rate, large-v2

sursă

Toate scorurile sunt din surse publice (model cards, blog-uri oficiale, leaderboard-uri independente). Click pe card → sursa originală.

Cum funcționează

Cum funcționează Whisper pe înțelesul tuturor

Schemă simplificată — fără jargon. Trimiți o cerere, modelul o descompune, calculează răspunsul, ți-l întoarce. Restul e arhitectură internă pe care nu trebuie s-o cunoști pentru a-l folosi.

Audio (vorbire, muzică, zgomot) → unde de presiune analizate de model → transcriere text sau voce sintetizată în direcția inversă.

Cazuri reale de utilizare

Cele mai bune scenarii pentru Whisper

Pentru fiecare scenariu: industria, volumul tipic, costul estimat, și — dacă e cazul — modelul alternativ recomandat.

Audio · Call center MD

Transcriere apeluri call-center retail / HoReCa

Post-call summary + extragere acțiuni + QA automat.

Volum tipic6.000 minute / lună

Cost estimat~$36/lună (la $0.006/min)≈ 634 MDL

Audio · Educație

Subtitrări automate cursuri video

Generare SRT/VTT pentru platforme e-learning Moodle.

Volum tipic500 ore / lună

Cost estimat~$180/lună≈ 3170 MDL

Audio · Media

Transcriere podcast-uri și emisiuni

Conversie audio → text căutabil pentru SEO și accesibilitate.

Volum tipic100 ore / lună

Cost estimat~$36/lună≈ 634 MDL

Voce · Voice agents

ASR într-un pipeline voice agent

Whisper → LLM → TTS pentru asistenți telefonici.

Volum tipic10.000 minute / lună

Cost estimat~$60/lună≈ 1057 MDL

Audio · Legal

Transcriere ședințe instanță și depoziții

Documentație juridică din audio cu timestamps.

Volum tipic200 ore / lună

Cost estimat~$72/lună≈ 1268 MDL

Audio · Cercetare

Transcriere interviuri calitative pentru sociologi

USM, ASEM, ONG-uri — interviuri în RO/RU cu diacritice.

Volum tipic100 ore / lună

Cost estimat~$36/lună≈ 634 MDL

Cost lunar estimat

Calculator interactiv pentru Whisper

Calculator interactiv

Cât te-ar costa Whisper pe lună

Scenariile sunt presetate, dar trage de sliders ca să modelezi propriul tău consum. Calculul folosește tariful Pro tier post-markup — exact ce vezi pe /pricing/models.

Tip caz tipic

60 min / lună notițe meetings.

Minute audio / lună60

10100K

Cost total estimat

$0.576

≈ 10.1 MDL la cursul BNM

/ lună · 60 minute

60 min × $0.010$0.576≈ 10.1 MDL

Tarif client-facing (Pro tier post-markup). Free/Starter/Business au prețuri diferite — vezi /pricing/models pentru tariful exact al planului tău.

Alege bine

Când să alegi Whisper vs alternative

Fără bare arbitrare 92/85. Doar explicații concrete pe baza forțelor reale ale fiecărui model. Pentru toate alternativele ai pagină separată cu același nivel de detaliu.

Alternativă	Alege Whisper când…	Mai bine alternativa când…
Deepgram Nova 2 Deepgram Vezi	Calitate diacritice RO, cost mic, batch processing.	Streaming live cu latență sub 300ms (Whisper standard nu suportă streaming nativ).
AssemblyAI Whisper AssemblyAI Vezi	Cost mic și calitate transcripție.	Ai nevoie de diarizare avansată, sentiment, capitole automate native.

Specificații comparative

Date reale, fără speculații

Tabel cu prețuri client-facing și caracteristici tehnice publice — nu scoruri agregate pe care nu le poți verifica.

Specificație	Whisper aici	gpt-realtime-1.5 vezi pagina →	TTS-1 vezi pagina →	TTS-1 vezi pagina →
Brand	OpenAI	OpenAI	OpenAI	OpenAI
Preț input / 1M tokens	—	$8.00≈ 141 MDL	—	—
Preț output / 1M tokens	—	$32.00≈ 563 MDL	—	—
Context max	0 tk	128K tk	4K tk	4K tk
Output max	0 tk	8K tk	0 tk	0 tk
Vision	—	—	—	—
Audio (input)	●	●	—	—
Knowledge cut-off	—	—	—	—

Integrare în orice unealtă

O cheie. 26+ unelte. Zero efort de migrare.

Router by MP e compatibil 100% cu API-ul OpenAI. Orice unealtă, framework sau platformă care folosește OpenAI SDK funcționează identic cu cheia ta Router by MP — schimbi o singură linie (baseURL) și gata. Iată cum integrezi Whisper în cele mai populare unelte.

Pont Whisper: Whisper standard NU suportă streaming live nativ — pentru voice agents cu latență mică combini Whisper batch (chunks de 1-3s) sau folosești Deepgram. Pentru transcriere post-call, Whisper rămâne ales №1 pe română.

Vercel AI SDK · OpenAI SDK · LangChain · LlamaIndex · FastAPI · Next.js

Vercel AI SDK

Streaming React + Next.js. Cel mai folosit framework AI front-end în 2026.

app/api/chat/route.ts

import { streamText } from "ai";
import { createOpenAI } from "@ai-sdk/openai";

const router = createOpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function POST(req: Request) {
  const { messages } = await req.json();
  const result = streamText({
    model: router("whisper"),
    messages,
  });
  return result.toDataStreamResponse();
}

Docs oficiale

OpenAI SDK (Node.js)

Drop-in pentru orice cod scris pentru OpenAI direct. Zero refactor.

client.ts

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",   // <— singura linie diferită
});

const r = await client.chat.completions.create({
  model: "whisper",
  messages: [{ role: "user", content: "Salut!" }],
});
console.log(r.choices[0].message.content);

Docs oficiale

OpenAI SDK (Python)

Cel mai stabil SDK Python pentru orice provider OpenAI-compatible.

client.py

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

r = client.chat.completions.create(
    model="whisper",
    messages=[{"role": "user", "content": "Salut!"}],
)
print(r.choices[0].message.content)

Docs oficiale

LangChain (Python)

RAG, agenți, chain-uri complexe — toate prin Router.

rag.py

from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="whisper",
    openai_api_key=os.environ["ROUTER_API_KEY"],
    openai_api_base="https://api.megapromoting.com/v1",
)

resp = llm.invoke("Răspunde în română.")
print(resp.content)

Docs oficiale

LangChain (JS)

Versiunea JavaScript — același API ca Python.

agent.ts

import { ChatOpenAI } from "@langchain/openai";

const llm = new ChatOpenAI({
  model: "whisper",
  apiKey: process.env.ROUTER_API_KEY,
  configuration: { baseURL: "https://api.megapromoting.com/v1" },
});

const r = await llm.invoke("Răspunde în română.");
console.log(r.content);

Docs oficiale

LlamaIndex

RAG la scară. Indexare semantică + retrieval + LLM, totul prin Router.

rag_index.py

from llama_index.llms.openai import OpenAI

llm = OpenAI(
    model="whisper",
    api_key=os.environ["ROUTER_API_KEY"],
    api_base="https://api.megapromoting.com/v1",
)

print(llm.complete("Generează un titlu pentru articol despre AI în Moldova"))

Docs oficiale

FastAPI proxy

Endpoint back-end care expune Router în propria ta aplicație.

main.py

from fastapi import FastAPI
from openai import AsyncOpenAI

app = FastAPI()
client = AsyncOpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

@app.post("/chat")
async def chat(prompt: str):
    r = await client.chat.completions.create(
        model="whisper",
        messages=[{"role": "user", "content": prompt}],
    )
    return {"text": r.choices[0].message.content}

Docs oficiale

Next.js Server Action

Apel direct din componente React, fără API route separat.

app/actions.ts

"use server";

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function summarize(text: string) {
  const r = await client.chat.completions.create({
    model: "whisper",
    messages: [
      { role: "system", content: "Rezumi text în 3 puncte." },
      { role: "user", content: text },
    ],
  });
  return r.choices[0].message.content;
}

Docs oficiale

Folosești deja OpenAI direct?

Schimbarea către Router by MP înseamnă o singură linie: baseURL = "https://api.megapromoting.com/v1". Toate apelurile existente continuă să funcționeze. Facturarea trece pe MDL prin e-Factura, fără cont OpenAI / Anthropic / Google separat.

Toate integrările

Quickstart

Exemplu de cod canonic pentru Whisper

Endpoint OpenAI-compatible. Schimbi doar baseURL și apiKey — restul codului rămâne identic cu provider-ul original.

whisper.ts

typescript

1import OpenAI from "openai";
2import fs from "node:fs";
3 
4// Transformi un fișier audio în text — apeluri, ședințe, dictare
5const client = new OpenAI({
6  apiKey: process.env.ROUTER_API_KEY,
7  baseURL: "https://api.megapromoting.com/v1",
8});
9 
10const transcript = await client.audio.transcriptions.create({
11  model: "whisper",
12  file: fs.createReadStream("apel-client.ogg"),
13  language: "ro",
14});
15 
16console.log(transcript.text);

Pont-uri pentru implementare în Moldova

1Pentru transcriere ședințe CDPA / hot-line cetățeni: Whisper costă $0.30/oră audio.
2Pentru limba română, calitatea este excelentă — folosește `language: 'ro'` pentru rezultate optime.
3Combină cu gpt-5.4-mini pentru rezumat automat după transcriere — flux complet apel → text → informații.
4Pentru apeluri lungi (peste 25MB), tai în bucăți de 20 de minute și concatenezi rezultatele.

Întrebări frecvente

FAQ Whisper

Suportă limba română?

Da, calitate foarte bună. Folosește parametrul `language: 'ro'` pentru rezultate optime.

Poate identifica vorbitori diferiți?

Nu nativ. Pentru separarea vorbitorilor combini cu un model dedicat (pyannote) sau Whisper-X.

Ce formate sunt suportate?

mp3, mp4, wav, ogg, m4a, flac, webm. Maxim 25MB per fișier direct.

Cât costă să transcriu o oră audio?

$0.36 pe oră. Foarte accesibil pentru orice volum normal.

Continuă explorarea

Modele înrudite

OpenAI

gpt-realtime-1.5

Conversație voce în timp real, în ambele sensuri — pentru asistenți telefonici și PBX.

Vezi detalii

OpenAI

TTS-1

Transformare text în voce, rapidă, pentru asistenți vocali și anunțuri PBX.

Vezi detalii

OpenAI

TTS-1

Transformare text în voce, rapidă, pentru asistenți vocali și anunțuri PBX.

Vezi detalii

Activează Router by MP și plătește doar ce consumi cu Whisper?

Cheie API în 30 secunde. Facturare locală MDL prin e-Factura. Fără card internațional, fără cont OpenAI/Anthropic/Google separat. Aceeași cheie funcționează cu orice tool OpenAI-compatible.

Începe gratis cu $1 credit Vezi prețuri live per model

e-Factura MoldovaAPI OpenAI-compatibleFără volum minimCost tracking per cheieActivare instant