AI API / deep divesInformational
Batch processing pentru joburi mari
Strategie pentru a rula joburi batch (catalog, indexing, scoring) cu buget controlat.
Raspuns scurt
Pentru joburi batch folosește o cheie dedicata cu cap zilnic, paralelism controlat și rezumate intermediare; opreste jobul la spike alert.
Problema concreta
Catalog ecommerce, indexing legal, scoring lead-uri pot genera mii de cereri. Fără cap, un bug poate cheltui sute de dolari intr-un loop.
Cum o rezolva Router by MP
Cheie 'batch-{job}' cu max_budget_usd lunar și daily cap. Paralelism cu retry exponential. Persistenta progresului pentru reia in caz de cadere.
Fluxuri uzuale
- Cheie 'batch' cu cap zilnic.
- Lista de joburi in coada (BullMQ, Celery).
- Worker cu retry și dedup.
- Spike alert + auto-stop.
Modele recomandate
gpt-5.4-minigpt-5.4-nanotext-embedding-3-small
Disponibilitatea reala se verifica live in /models.
| Control | De ce conteaza |
|---|---|
| Cap zilnic | Ce nu se intampla intr-o zi, nu costa. |
| Retry controlat | Exponential backoff te protejeaza de 429. |
| Persistenta | Reia jobul de la ultima procesare. |
Reguli si limite
- Rate limit. Verifica rate-limit-ul cheii in cabinet.
- Spike alert. Configureaza alerta la 80% buget.
- Idempotenta. Jobul trebuie sa fie idempotent pentru retry sigur.
Integrare rapida
Foloseste endpointul https://api.megapromoting.com/v1, trimite cheia caAuthorization: Bearer <router_api_key> si verifica pagina/modelsinainte de productie.