Sari la conținut
Inapoi la Arena
Arena / model comparisonInformational

Arena: realtime models prin Router by MP

Când alegi un model realtime pentru voce: timp de răspuns, cost per minut, calitate.

Raspuns scurt

Modele realtime (gpt-realtime, gpt-realtime-mini, gpt-realtime-1.5) cer cheie dedicata cu buget lunar; alegerea depinde de cost per minut audio și timp de răspuns E2E in regiunea ta.

Problema concreta

Voice realtime are cost mai mare decat chat clasic și timp de răspuns variabil. Lansare in productie fără pilot E2E aduce surprize.

Cum o rezolva Router by MP

Cheie 'voice-{proiect}' cu whitelist realtime. Pilot 24-48h pe trafic real, masura timp de răspuns pe end-to-end și cost per minut. Fallback automat la model stabil când un model nou nu trece pilotul.

Fluxuri uzuale

  • Cheie voice cu cap zilnic.
  • Pilot 24-48h pe trafic real.
  • Masuri timp de răspuns E2E și cost per minut.
  • Promotie la productie doar după pilot OK.

Modele recomandate

  • gpt-realtime
  • gpt-realtime-mini
  • gpt-realtime-1.5

Disponibilitatea reala se verifica live in /models.

ControlDe ce conteaza
Cheie izolataWhitelist voice; nu acceseaza modele text scumpe.
Audit per sesiuneVezi cost și timp de răspuns pe fiecare conversatie.
Fallback documentatComutare automata la model stabil când pilotul esueaza.

Reguli si limite

  • Disponibilitate. Verifica /models inainte de a promite voice realtime.
  • Cost. Realtime costa per minut audio; cap zilnic obligatoriu.
  • Latency regiune. Testeaza E2E pe regiunea ta inainte de productie.

Integrare rapida

Foloseste endpointul https://api.megapromoting.com/v1, trimite cheia caAuthorization: Bearer <router_api_key> si verifica pagina/modelsinainte de productie.

Mai departe

Arena: realtime models prin Router by MP | Router by Mega Promoting