Pricing per model — defalcare completă

Prețuri detaliate per tip de token

Aici vezi exact ce tarif aplicăm pentru fiecare tip de utilizare: text introdus, text generat, context reutilizat din cache, raționament intern al modelului, audio, imagini. Plătești exact ce vezi — $X în portofel îți acoperă $X de utilizare AI. Niciun cost ascuns.

Cum să citești tabelul

Input

Cât plătești pentru textul pe care îl trimiți modelului (întrebare, context, instrucțiuni). Standard, fără reducere.

Cache citit

Când refolosești același context (ex: system prompt repetat), modelul îl citește din cache și plătești ~10% din tariful standard (reducere 90%).

Cache scris 5min / 1h

Doar la Anthropic Claude. Prima oară când scrii ceva în cache, plătești cu puțin mai mult (1.25× pentru 5min, 2× pentru 1h). În schimb, fiecare citire ulterioară e la 10%.

Output

Cât plătești pentru textul generat de model (răspunsul efectiv). De obicei de 3-5× mai scump decât input.

Raționament

Tokenii „de gândire" pe care modelul îi generează intern dar nu îi vezi în răspuns. Facturați la tariful output. Apar la modele tip o-series, GPT-5.5, Claude Opus.

Audio in / out

Pentru modele vocale (gpt-audio, realtime). Audio se contorizează separat de text și e ~×4 mai scump.

Se încarcă tarifele live…