OpenAI · Realtime · Voce în timp real

gpt-realtime-1.5

Conversație voce în timp real, în ambele sensuri — pentru asistenți telefonici și PBX.

~$8.00 in / $32.00 out · per 1M unități (sunet și text combinate)≈ 141 MDLvezi /pricing/models pentru tariful live →

Începe gratis Vezi prețuri per model

128K tokens

Context window

8K tokens

Max output

Input modalities

per 1M unități (sunet și text combinate)

Unitate facturare

Ce este gpt-realtime-1.5

gpt-realtime este modelul OpenAI dedicat conversației voce live, în ambele sensuri, cu timp de răspuns apropiat de conversația umană naturală (sub 500ms). Folosit pentru asistenți telefonici complet automați (voice agents enterprise și roboți HoReCa pentru confirmare comenzi), agenți voce PBX cu transfer la operator, robot taxi/livrare cu voce. Suportă streaming audio PCM16 în ambele sensuri prin WebSocket. Mai multe voci disponibile, inclusiv 'marin' care funcționează bine pentru limba română. Preț pe unitate (sunet + text combinate). Disponibil prin Router by Mega Promoting cu facturare în MDL.

Capabilități unice

Ce te diferențiază când folosești gpt-realtime-1.5

Conversație voce bidirecțională sub 500ms latență
Audio in + audio out nativ — fără pipeline ASR + LLM + TTS separat
Apelare automată funcții externe în timpul conversației
Voci variate (alloy, echo, marin, shimmer)
Întreruperea naturală — utilizatorul poate să taie modelul în mijlocul răspunsului

Limitări de știut înainte să cumperi

·Preț mai mare pe minut conversație față de Whisper + TTS separat
·Implementare WebSocket — mai complexă decât REST
·Pentru voce 100% personalizată (clonare), folosește ElevenLabs Realtime
·Unii roboți HoReCa de confirmare comenzi rulează ElevenLabs, NU OpenAI Realtime — diferență arhitecturală importantă

Cum funcționează

Cum funcționează gpt-realtime-1.5 pe înțelesul tuturor

Schemă simplificată — fără jargon. Trimiți o cerere, modelul o descompune, calculează răspunsul, ți-l întoarce. Restul e arhitectură internă pe care nu trebuie s-o cunoști pentru a-l folosi.

Conversație voce bidirecțională în timp real: clientul vorbește, modelul ascultă continuu, răspunde vorbit fără pauze între tură.

Cazuri reale de utilizare

Cele mai bune scenarii pentru gpt-realtime-1.5

Pentru fiecare scenariu: industria, volumul tipic, costul estimat, și — dacă e cazul — modelul alternativ recomandat.

Voce · Voice agents premium

Bot vocal pentru clienți premium MD

Operatori call center cu nevoie de upgrade pentru conversații naturale low-latency.

Volum tipic5.000-20.000 minute / lună

Cost estimat~$300-1.500/lună≈ 5283-26 MDL

Voce · Confirmare comenzi voce

Robot confirmare comenzi (HoReCa tier premium)

Conversație naturală cu întreruperi pentru confirmare detalii.

Volum tipic3.000 minute / lună

Cost estimat~$200-500/lună≈ 3522-8805 MDL

Pentru cost mai mic, ElevenLabs + GPT-5.4-mini text pipeline.

Voce · IVR inteligent

Înlocuiește IVR DTMF cu conversație

Utilizatorii vorbesc natural în loc să apese taste.

Volum tipic10.000 minute / lună

Cost estimat~$500-1.200/lună≈ 8805-21 MDL

Voce · Asistent personal

Voice assistant pentru manageri MD

Sumarizare email-uri, calendar, taskuri prin voce.

Volum tipic2.000 minute / lună

Cost estimat~$100-300/lună≈ 1761-5283 MDL

Voce · Educație

Tutor conversational pentru limbi străine

Practică conversație EN/FR/DE cu corectare în timp real.

Volum tipic5.000 minute / lună

Cost estimat~$300-800/lună≈ 5283-14.1K MDL

Cost lunar estimat

Calculator interactiv pentru gpt-realtime-1.5

Calculator interactiv

Cât te-ar costa gpt-realtime-1.5 pe lună

Scenariile sunt presetate, dar trage de sliders ca să modelezi propriul tău consum. Calculul folosește tariful Pro tier post-markup — exact ce vezi pe /pricing/models.

Tip caz tipic

10.000 minute conversație / lună.

Minute audio / lună10K

10100K

Cost total estimat

$0.000

/ lună · 10K minute

Tarif client-facing (Pro tier post-markup). Free/Starter/Business au prețuri diferite — vezi /pricing/models pentru tariful exact al planului tău.

Alege bine

Când să alegi gpt-realtime-1.5 vs alternative

Fără bare arbitrare 92/85. Doar explicații concrete pe baza forțelor reale ale fiecărui model. Pentru toate alternativele ai pagină separată cu același nivel de detaliu.

Alternativă	Alege gpt-realtime-1.5 când…	Mai bine alternativa când…
Whisper OpenAI Vezi	Conversație bidirecțională live (Whisper = doar transcriere).	Pipeline batch post-call sau cost minim pentru transcriere pură.
TTS-1 OpenAI Vezi	Conversație în ambele sensuri integrată (TTS = doar text→voce).	Calitate voce RO net superioară + control fin pe ton/voce.
Deepgram Nova 2 Deepgram Vezi	Pipeline complet integrat (Deepgram = doar ASR).	Cost mult mai mic dacă construiești pipeline custom Deepgram+LLM+TTS.

Specificații comparative

Date reale, fără speculații

Tabel cu prețuri client-facing și caracteristici tehnice publice — nu scoruri agregate pe care nu le poți verifica.

Specificație	gpt-realtime-1.5 aici	Whisper vezi pagina →	TTS-1 vezi pagina →
Brand	OpenAI	OpenAI	OpenAI
Preț input / 1M tokens	$8.00≈ 141 MDL	—	—
Preț output / 1M tokens	$32.00≈ 563 MDL	—	—
Context max	128K tk	0 tk	4K tk
Output max	8K tk	0 tk	0 tk
Vision	—	—	—
Audio (input)	●	●	—
Knowledge cut-off	—	—	—

Integrare în orice unealtă

O cheie. 26+ unelte. Zero efort de migrare.

Router by MP e compatibil 100% cu API-ul OpenAI. Orice unealtă, framework sau platformă care folosește OpenAI SDK funcționează identic cu cheia ta Router by MP — schimbi o singură linie (baseURL) și gata. Iată cum integrezi gpt-realtime-1.5 în cele mai populare unelte.

Pont gpt-realtime-1.5: Realtime e scump per minut comparativ cu pipeline custom (Deepgram + GPT-5.4-mini + ElevenLabs). Folosește-l unde latența ultra-mică justifică costul (premium UX) sau prototyping rapid — pentru volum mare la cost optim, construiește pipeline custom.

Vercel AI SDK · OpenAI SDK · LangChain · LlamaIndex · FastAPI · Next.js

Vercel AI SDK

Streaming React + Next.js. Cel mai folosit framework AI front-end în 2026.

app/api/chat/route.ts

import { streamText } from "ai";
import { createOpenAI } from "@ai-sdk/openai";

const router = createOpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function POST(req: Request) {
  const { messages } = await req.json();
  const result = streamText({
    model: router("gpt-realtime-1.5"),
    messages,
  });
  return result.toDataStreamResponse();
}

Docs oficiale

OpenAI SDK (Node.js)

Drop-in pentru orice cod scris pentru OpenAI direct. Zero refactor.

client.ts

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",   // <— singura linie diferită
});

const r = await client.chat.completions.create({
  model: "gpt-realtime-1.5",
  messages: [{ role: "user", content: "Salut!" }],
});
console.log(r.choices[0].message.content);

Docs oficiale

OpenAI SDK (Python)

Cel mai stabil SDK Python pentru orice provider OpenAI-compatible.

client.py

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

r = client.chat.completions.create(
    model="gpt-realtime-1.5",
    messages=[{"role": "user", "content": "Salut!"}],
)
print(r.choices[0].message.content)

Docs oficiale

LangChain (Python)

RAG, agenți, chain-uri complexe — toate prin Router.

rag.py

from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="gpt-realtime-1.5",
    openai_api_key=os.environ["ROUTER_API_KEY"],
    openai_api_base="https://api.megapromoting.com/v1",
)

resp = llm.invoke("Răspunde în română.")
print(resp.content)

Docs oficiale

LangChain (JS)

Versiunea JavaScript — același API ca Python.

agent.ts

import { ChatOpenAI } from "@langchain/openai";

const llm = new ChatOpenAI({
  model: "gpt-realtime-1.5",
  apiKey: process.env.ROUTER_API_KEY,
  configuration: { baseURL: "https://api.megapromoting.com/v1" },
});

const r = await llm.invoke("Răspunde în română.");
console.log(r.content);

Docs oficiale

LlamaIndex

RAG la scară. Indexare semantică + retrieval + LLM, totul prin Router.

rag_index.py

from llama_index.llms.openai import OpenAI

llm = OpenAI(
    model="gpt-realtime-1.5",
    api_key=os.environ["ROUTER_API_KEY"],
    api_base="https://api.megapromoting.com/v1",
)

print(llm.complete("Generează un titlu pentru articol despre AI în Moldova"))

Docs oficiale

FastAPI proxy

Endpoint back-end care expune Router în propria ta aplicație.

main.py

from fastapi import FastAPI
from openai import AsyncOpenAI

app = FastAPI()
client = AsyncOpenAI(
    api_key=os.environ["ROUTER_API_KEY"],
    base_url="https://api.megapromoting.com/v1",
)

@app.post("/chat")
async def chat(prompt: str):
    r = await client.chat.completions.create(
        model="gpt-realtime-1.5",
        messages=[{"role": "user", "content": prompt}],
    )
    return {"text": r.choices[0].message.content}

Docs oficiale

Next.js Server Action

Apel direct din componente React, fără API route separat.

app/actions.ts

"use server";

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ROUTER_API_KEY,
  baseURL: "https://api.megapromoting.com/v1",
});

export async function summarize(text: string) {
  const r = await client.chat.completions.create({
    model: "gpt-realtime-1.5",
    messages: [
      { role: "system", content: "Rezumi text în 3 puncte." },
      { role: "user", content: text },
    ],
  });
  return r.choices[0].message.content;
}

Docs oficiale

Folosești deja OpenAI direct?

Schimbarea către Router by MP înseamnă o singură linie: baseURL = "https://api.megapromoting.com/v1". Toate apelurile existente continuă să funcționeze. Facturarea trece pe MDL prin e-Factura, fără cont OpenAI / Anthropic / Google separat.

Toate integrările

Quickstart

Exemplu de cod canonic pentru gpt-realtime-1.5

Endpoint OpenAI-compatible. Schimbi doar baseURL și apiKey — restul codului rămâne identic cu provider-ul original.

gpt-realtime-1.5.ts

typescript

1import WebSocket from "ws";
2 
3// Conversație voce în timp real — pentru agenți telefonici și asistenți vocali
4const ws = new WebSocket(
5  "wss://api.megapromoting.com/v1/realtime?model=gpt-realtime-1.5",
6  { headers: { Authorization: `Bearer ${process.env.ROUTER_API_KEY}` } },
7);
8 
9ws.on("open", () => {
10  ws.send(JSON.stringify({
11    type: "session.update",
12    session: {
13      modalities: ["audio", "text"],
14      instructions: "Răspunzi cu voce caldă, în limba română.",
15      voice: "marin",
16    },
17  }));
18});
19 
20ws.on("message", (data) => {
21  const event = JSON.parse(data.toString());
22  if (event.type === "response.audio.delta") {
23    // trimiți audio mai departe către clientul telefonic (Asterisk / Twilio)
24  }
25});

Pont-uri pentru implementare în Moldova

1Folosit în producție pe voice agents enterprise integrați cu Orange PBX middleware — apeluri inbound 100% automate.
2La unii operatori HoReCa, robotul de confirmare rulează ElevenLabs (voce clonată), NU gpt-realtime. Nu amesteca.
3Combină cu detecție automată de oprire pe 'la revedere' / 'poftă bună' pentru închidere automată.
4Stream PCM16 la 24kHz prin bridge AudioSocket pentru integrare cu Asterisk.

Întrebări frecvente

FAQ gpt-realtime-1.5

Cât costă un apel de 5 minute?

Aproximativ $0.50-$1.50, depinde de cât vorbește botul față de client. Vezi /pricing/models pentru tariful exact.

Pot folosi o voce personalizată?

Nu cu gpt-realtime. Pentru voce personalizată (clonare), folosește ElevenLabs Realtime separat.

Funcționează cu Asterisk PBX?

Da, prin bridge AudioSocket cu conversie PCM16 ↔ slin16. Vezi implementarea pe voice agents enterprise ca referință.

Apelează funcții externe în timpul apelului?

Da — botul poate apela API-uri externe în timpul conversației (verificare stoc, status comandă etc.).

Continuă explorarea

Modele înrudite

OpenAI

gpt-realtime-1.5

Conversație voce în timp real, în ambele sensuri — pentru asistenți telefonici și PBX.

Vezi detalii

OpenAI

Whisper

Transcriere audio în text — română, rusă, engleză cu calitate excelentă.

Vezi detalii

OpenAI

TTS-1

Transformare text în voce, rapidă, pentru asistenți vocali și anunțuri PBX.

Vezi detalii

Activează Router by MP și plătește doar ce consumi cu gpt-realtime-1.5?

Cheie API în 30 secunde. Facturare locală MDL prin e-Factura. Fără card internațional, fără cont OpenAI/Anthropic/Google separat. Aceeași cheie funcționează cu orice tool OpenAI-compatible.

Începe gratis cu $1 credit Vezi prețuri live per model

e-Factura MoldovaAPI OpenAI-compatibleFără volum minimCost tracking per cheieActivare instant