Extragere date din documente financiare
Extrage campuri structurate din documente (facturi, contracte, extras de cont) cu validare schema.
Raspuns scurt
Router by MP poate extrage campuri structurate din PDF-uri financiare folosind un model rapid și un prompt cu schema fixa, cu log pentru fiecare extragere.
Problema concreta
Extragerea manuala a datelor din facturi, extrase de cont și contracte consuma ore. Vendor-ii OCR clasici dau erori și nu inteleg context.
Cum o rezolva Router by MP
Pipeline care primeste documentul (text extras prin OCR vendor) și returneaza schema JSON cu campuri (suma, parti, data, IBAN). Validare schema obligatorie inainte de salvare.
Fluxuri uzuale
- OCR cu vendor extern (Tesseract, AWS Textract).
- Prompt cu schema JSON stricta.
- Validare campuri (regex IBAN, format data).
- Salvare in ERP/contabilitate.
Modele recomandate
gpt-5.4-minigpt-5.4-pro
Disponibilitatea reala se verifica live in /models.
| Control | De ce conteaza |
|---|---|
| Schema stricta | Output JSON validat inainte de save. |
| Reduce eroare | Detecteaza inconsistente (suma vs total). |
| Audit | Toate extragerile au trace. |
Reguli si limite
- Calitate OCR. Modelul nu corecteaza OCR slab; alege vendor bun.
- Documente complexe. Tabele complicate necesita post-processing dedicat.
- Conformitate. Verifica retentia datelor in ciclul AI.
Integrare rapida
Foloseste endpointul https://api.megapromoting.com/v1, trimite cheia caAuthorization: Bearer <router_api_key> si verifica pagina/modelsinainte de productie.