Arena: text models prin Router by MP
Când alegi un model text mic vs mediu vs pro: cost, timp de răspuns, reasoning, productie.
Raspuns scurt
Modele text pe Router by MP se grupează in trei tiers: nano (rapid și ieftin), mini (default), pro (reasoning sau editare ambigua). Cheia este sa alegi tier per task, nu per cont.
Problema concreta
Folosirea modelului `pro` peste tot crește cost de 5-10x fără creștere de calitate pentru taskuri rutiniere (rescriere, sumarizare).
Cum o rezolva Router by MP
Decizie pe trei intrebari: este iesirea repetabila? Are nevoie de reasoning multi-pas? Are nevoie de output structurat cu schema complexa? Nano pentru repetitive, mini pentru default, pro doar pentru reasoning.
Fluxuri uzuale
- Cheie 'text-nano' pentru extragere, scoring, scoring rapid.
- Cheie 'text-mini' pentru chat, rescriere, sumarizare.
- Cheie 'text-pro' rezervata pentru reasoning ambigue și analize legale/financiare.
- Audit lunar pe distribution use vs cost.
| Control | De ce conteaza |
|---|---|
| Tier per cheie | Whitelist pe cheie te forteaza la disciplina. |
| Cost vizibil | Vezi cat consumi pe fiecare tier in cabinet. |
| Fallback explicit | Dacă mini esueaza, escaladezi controlat la pro. |
Reguli si limite
- Benchmark public pending. Nu publicam scoruri până avem testele noastre regional.
- Capability change. Capabilitatile tier-ului variaza la fiecare release; recitim /models lunar.
- Context window. Modele rapide pot avea window mai mic; verifica inainte de batch lung.
Integrare rapida
Foloseste endpointul https://api.megapromoting.com/v1, trimite cheia caAuthorization: Bearer <router_api_key> si verifica pagina/modelsinainte de productie.