Arena: realtime models prin Router by MP
Când alegi un model realtime pentru voce: timp de răspuns, cost per minut, calitate.
Raspuns scurt
Modele realtime (gpt-realtime, gpt-realtime-mini, gpt-realtime-1.5) cer cheie dedicata cu buget lunar; alegerea depinde de cost per minut audio și timp de răspuns E2E in regiunea ta.
Problema concreta
Voice realtime are cost mai mare decat chat clasic și timp de răspuns variabil. Lansare in productie fără pilot E2E aduce surprize.
Cum o rezolva Router by MP
Cheie 'voice-{proiect}' cu whitelist realtime. Pilot 24-48h pe trafic real, masura timp de răspuns pe end-to-end și cost per minut. Fallback automat la model stabil când un model nou nu trece pilotul.
Fluxuri uzuale
- Cheie voice cu cap zilnic.
- Pilot 24-48h pe trafic real.
- Masuri timp de răspuns E2E și cost per minut.
- Promotie la productie doar după pilot OK.
Modele recomandate
gpt-realtimegpt-realtime-minigpt-realtime-1.5
Disponibilitatea reala se verifica live in /models.
| Control | De ce conteaza |
|---|---|
| Cheie izolata | Whitelist voice; nu acceseaza modele text scumpe. |
| Audit per sesiune | Vezi cost și timp de răspuns pe fiecare conversatie. |
| Fallback documentat | Comutare automata la model stabil când pilotul esueaza. |
Reguli si limite
- Disponibilitate. Verifica /models inainte de a promite voice realtime.
- Cost. Realtime costa per minut audio; cap zilnic obligatoriu.
- Latency regiune. Testeaza E2E pe regiunea ta inainte de productie.
Integrare rapida
Foloseste endpointul https://api.megapromoting.com/v1, trimite cheia caAuthorization: Bearer <router_api_key> si verifica pagina/modelsinainte de productie.