gpt-realtime-1.5
Conversație voce în timp real, în ambele sensuri — pentru asistenți telefonici și PBX.
Ce este gpt-realtime-1.5
gpt-realtime este modelul OpenAI dedicat conversației voce live, în ambele sensuri, cu timp de răspuns apropiat de conversația umană naturală (sub 500ms). Folosit pentru asistenți telefonici complet automați (voice agents enterprise și roboți HoReCa pentru confirmare comenzi), agenți voce PBX cu transfer la operator, robot taxi/livrare cu voce. Suportă streaming audio PCM16 în ambele sensuri prin WebSocket. Mai multe voci disponibile, inclusiv 'marin' care funcționează bine pentru limba română. Preț pe unitate (sunet + text combinate). Disponibil prin Router by Mega Promoting cu facturare în MDL.
Capabilități unice
Ce te diferențiază când folosești gpt-realtime-1.5
- Conversație voce bidirecțională sub 500ms latență
- Audio in + audio out nativ — fără pipeline ASR + LLM + TTS separat
- Apelare automată funcții externe în timpul conversației
- Voci variate (alloy, echo, marin, shimmer)
- Întreruperea naturală — utilizatorul poate să taie modelul în mijlocul răspunsului
Limitări de știut înainte să cumperi
- ·Preț mai mare pe minut conversație față de Whisper + TTS separat
- ·Implementare WebSocket — mai complexă decât REST
- ·Pentru voce 100% personalizată (clonare), folosește ElevenLabs Realtime
- ·Unii roboți HoReCa de confirmare comenzi rulează ElevenLabs, NU OpenAI Realtime — diferență arhitecturală importantă
Cum funcționează
Cum funcționează gpt-realtime-1.5 pe înțelesul tuturor
Schemă simplificată — fără jargon. Trimiți o cerere, modelul o descompune, calculează răspunsul, ți-l întoarce. Restul e arhitectură internă pe care nu trebuie s-o cunoști pentru a-l folosi.
Conversație voce bidirecțională în timp real: clientul vorbește, modelul ascultă continuu, răspunde vorbit fără pauze între tură.
Cazuri reale de utilizare
Cele mai bune scenarii pentru gpt-realtime-1.5
Pentru fiecare scenariu: industria, volumul tipic, costul estimat, și — dacă e cazul — modelul alternativ recomandat.
Bot vocal pentru clienți premium MD
Operatori call center cu nevoie de upgrade pentru conversații naturale low-latency.
Robot confirmare comenzi (HoReCa tier premium)
Conversație naturală cu întreruperi pentru confirmare detalii.
Înlocuiește IVR DTMF cu conversație
Utilizatorii vorbesc natural în loc să apese taste.
Voice assistant pentru manageri MD
Sumarizare email-uri, calendar, taskuri prin voce.
Tutor conversational pentru limbi străine
Practică conversație EN/FR/DE cu corectare în timp real.
Cost lunar estimat
Calculator interactiv pentru gpt-realtime-1.5
Cât te-ar costa gpt-realtime-1.5 pe lună
Scenariile sunt presetate, dar trage de sliders ca să modelezi propriul tău consum. Calculul folosește tariful Pro tier post-markup — exact ce vezi pe /pricing/models.
10.000 minute conversație / lună.
Alege bine
Când să alegi gpt-realtime-1.5 vs alternative
Fără bare arbitrare 92/85. Doar explicații concrete pe baza forțelor reale ale fiecărui model. Pentru toate alternativele ai pagină separată cu același nivel de detaliu.
| Alternativă | Alege gpt-realtime-1.5 când… | Mai bine alternativa când… |
|---|---|---|
Whisper OpenAI Vezi | Conversație bidirecțională live (Whisper = doar transcriere). | Pipeline batch post-call sau cost minim pentru transcriere pură. |
TTS-1 OpenAI Vezi | Conversație în ambele sensuri integrată (TTS = doar text→voce). | Calitate voce RO net superioară + control fin pe ton/voce. |
Deepgram Nova 2 Deepgram Vezi | Pipeline complet integrat (Deepgram = doar ASR). | Cost mult mai mic dacă construiești pipeline custom Deepgram+LLM+TTS. |
Specificații comparative
Date reale, fără speculații
Tabel cu prețuri client-facing și caracteristici tehnice publice — nu scoruri agregate pe care nu le poți verifica.
| Specificație | gpt-realtime-1.5 aici | Whisper vezi pagina → | TTS-1 vezi pagina → |
|---|---|---|---|
| Brand | OpenAI | OpenAI | OpenAI |
| Preț input / 1M tokens | $8.00≈ 141 MDL | — | — |
| Preț output / 1M tokens | $32.00≈ 563 MDL | — | — |
| Context max | 128K tk | 0 tk | 4K tk |
| Output max | 8K tk | 0 tk | 0 tk |
| Vision | — | — | — |
| Audio (input) | ● | ● | — |
| Knowledge cut-off | — | — | — |
O cheie. 26+ unelte. Zero efort de migrare.
Router by MP e compatibil 100% cu API-ul OpenAI. Orice unealtă, framework sau platformă care folosește OpenAI SDK funcționează identic cu cheia ta Router by MP — schimbi o singură linie (baseURL) și gata. Iată cum integrezi gpt-realtime-1.5 în cele mai populare unelte.
Vercel AI SDK · OpenAI SDK · LangChain · LlamaIndex · FastAPI · Next.js
import { streamText } from "ai";
import { createOpenAI } from "@ai-sdk/openai";
const router = createOpenAI({
apiKey: process.env.ROUTER_API_KEY,
baseURL: "https://api.megapromoting.com/v1",
});
export async function POST(req: Request) {
const { messages } = await req.json();
const result = streamText({
model: router("gpt-realtime-1.5"),
messages,
});
return result.toDataStreamResponse();
}
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.ROUTER_API_KEY,
baseURL: "https://api.megapromoting.com/v1", // <— singura linie diferită
});
const r = await client.chat.completions.create({
model: "gpt-realtime-1.5",
messages: [{ role: "user", content: "Salut!" }],
});
console.log(r.choices[0].message.content);
from openai import OpenAI
client = OpenAI(
api_key=os.environ["ROUTER_API_KEY"],
base_url="https://api.megapromoting.com/v1",
)
r = client.chat.completions.create(
model="gpt-realtime-1.5",
messages=[{"role": "user", "content": "Salut!"}],
)
print(r.choices[0].message.content)
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(
model="gpt-realtime-1.5",
openai_api_key=os.environ["ROUTER_API_KEY"],
openai_api_base="https://api.megapromoting.com/v1",
)
resp = llm.invoke("Răspunde în română.")
print(resp.content)
import { ChatOpenAI } from "@langchain/openai";
const llm = new ChatOpenAI({
model: "gpt-realtime-1.5",
apiKey: process.env.ROUTER_API_KEY,
configuration: { baseURL: "https://api.megapromoting.com/v1" },
});
const r = await llm.invoke("Răspunde în română.");
console.log(r.content);
from llama_index.llms.openai import OpenAI
llm = OpenAI(
model="gpt-realtime-1.5",
api_key=os.environ["ROUTER_API_KEY"],
api_base="https://api.megapromoting.com/v1",
)
print(llm.complete("Generează un titlu pentru articol despre AI în Moldova"))
from fastapi import FastAPI
from openai import AsyncOpenAI
app = FastAPI()
client = AsyncOpenAI(
api_key=os.environ["ROUTER_API_KEY"],
base_url="https://api.megapromoting.com/v1",
)
@app.post("/chat")
async def chat(prompt: str):
r = await client.chat.completions.create(
model="gpt-realtime-1.5",
messages=[{"role": "user", "content": prompt}],
)
return {"text": r.choices[0].message.content}
"use server";
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.ROUTER_API_KEY,
baseURL: "https://api.megapromoting.com/v1",
});
export async function summarize(text: string) {
const r = await client.chat.completions.create({
model: "gpt-realtime-1.5",
messages: [
{ role: "system", content: "Rezumi text în 3 puncte." },
{ role: "user", content: text },
],
});
return r.choices[0].message.content;
}
Schimbarea către Router by MP înseamnă o singură linie: baseURL = "https://api.megapromoting.com/v1". Toate apelurile existente continuă să funcționeze. Facturarea trece pe MDL prin e-Factura, fără cont OpenAI / Anthropic / Google separat.
Quickstart
Exemplu de cod canonic pentru gpt-realtime-1.5
Endpoint OpenAI-compatible. Schimbi doar baseURL și apiKey — restul codului rămâne identic cu provider-ul original.
1import WebSocket from "ws";2 3// Conversație voce în timp real — pentru agenți telefonici și asistenți vocali4const ws = new WebSocket(5 "wss://api.megapromoting.com/v1/realtime?model=gpt-realtime-1.5",6 { headers: { Authorization: `Bearer ${process.env.ROUTER_API_KEY}` } },7);8 9ws.on("open", () => {10 ws.send(JSON.stringify({11 type: "session.update",12 session: {13 modalities: ["audio", "text"],14 instructions: "Răspunzi cu voce caldă, în limba română.",15 voice: "marin",16 },17 }));18});19 20ws.on("message", (data) => {21 const event = JSON.parse(data.toString());22 if (event.type === "response.audio.delta") {23 // trimiți audio mai departe către clientul telefonic (Asterisk / Twilio)24 }25});Pont-uri pentru implementare în Moldova
- 1Folosit în producție pe voice agents enterprise integrați cu Orange PBX middleware — apeluri inbound 100% automate.
- 2La unii operatori HoReCa, robotul de confirmare rulează ElevenLabs (voce clonată), NU gpt-realtime. Nu amesteca.
- 3Combină cu detecție automată de oprire pe 'la revedere' / 'poftă bună' pentru închidere automată.
- 4Stream PCM16 la 24kHz prin bridge AudioSocket pentru integrare cu Asterisk.
Întrebări frecvente
FAQ gpt-realtime-1.5
Cât costă un apel de 5 minute?
Pot folosi o voce personalizată?
Funcționează cu Asterisk PBX?
Apelează funcții externe în timpul apelului?
Continuă explorarea
Modele înrudite
Conversație voce în timp real, în ambele sensuri — pentru asistenți telefonici și PBX.
Vezi detaliiTranscriere audio în text — română, rusă, engleză cu calitate excelentă.
Vezi detaliiTransformare text în voce, rapidă, pentru asistenți vocali și anunțuri PBX.
Vezi detaliiActivează Router by MP și plătește doar ce consumi cu gpt-realtime-1.5?
Cheie API în 30 secunde. Facturare locală MDL prin e-Factura. Fără card internațional, fără cont OpenAI/Anthropic/Google separat. Aceeași cheie funcționează cu orice tool OpenAI-compatible.