Pricing per model — defalcare completă
Prețuri detaliate per tip de token
Aici vezi exact ce tarif aplicăm pentru fiecare tip de utilizare: text introdus, text generat, context reutilizat din cache, raționament intern al modelului, audio, imagini. Plătești exact ce vezi — $X în portofel îți acoperă $X de utilizare AI. Niciun cost ascuns.
Cum să citești tabelul
Input
Cât plătești pentru textul pe care îl trimiți modelului (întrebare, context, instrucțiuni). Standard, fără reducere.
Cache citit
Când refolosești același context (ex: system prompt repetat), modelul îl citește din cache și plătești ~10% din tariful standard (reducere 90%).
Cache scris 5min / 1h
Doar la Anthropic Claude. Prima oară când scrii ceva în cache, plătești cu puțin mai mult (1.25× pentru 5min, 2× pentru 1h). În schimb, fiecare citire ulterioară e la 10%.
Output
Cât plătești pentru textul generat de model (răspunsul efectiv). De obicei de 3-5× mai scump decât input.
Raționament
Tokenii „de gândire" pe care modelul îi generează intern dar nu îi vezi în răspuns. Facturați la tariful output. Apar la modele tip o-series, GPT-5.5, Claude Opus.
Audio in / out
Pentru modele vocale (gpt-audio, realtime). Audio se contorizează separat de text și e ~×4 mai scump.
Se încarcă tarifele live…