Az OCR (Optical Character Recognition) és AI-alapú dokumentumfeldolgozás az a folyamat, amelynek során a beérkező papír- vagy PDF-dokumentumokat (számla, szerződés, önéletrajz, KYC-űrlap) automatikusan strukturált adattá alakítjuk. A klasszikus OCR „csak” szöveggé alakítja a képet; a modern AI-alapú feldolgozás ezen felül érti, mit jelent a szöveg — kiveszi a tételeket, validál, kategorizál, és strukturált JSON-ként továbbadja a célrendszereknek. Egy 200 számlás hónap manuális feldolgozása 8-10 óra; AI-jal 30 perc + emberi review.
Így is ismerheted
Magyarul OCR (optikai karakterfelismerés), dokumentum-digitalizálás, szövegkinyerés dokumentumból, AI-alapú adatkinyerés. Angolul OCR, document AI, intelligent document processing (IDP), text extraction. A modern megnevezés sokszor document AI vagy document understanding — utalva arra, hogy nemcsak szöveggé, hanem strukturált adattá alakítjuk.
Mire jó cégeknek?
Néhány tipikus felhasználási mód:
Számla-feldolgozás: beérkező PDF-számla → kinyert tételek (cég, dátum, áfa, összeg) → könyvelő-rendszerbe. Klasszikus magyar középvállalati eset.
Szerződés-elemzés: hosszú PDF-szerződésből kivonatolás (felek, kezdő dátum, érték, fizetési határidő). Jogi csapat időmegtakarítása.
Önéletrajz-szűrés: beérkező CV-k strukturált adattá alakítása (név, oktatás, tapasztalat, készségek). HR-előszűrés.
Vállalati KYC: új partner azonosítása — cégkivonat, adószám, tulajdonosi lánc kinyerés.
Reklamáció / panasz-kezelés: érkező levél / e-mail attachment feldolgozása, kategorizálás.
Médiaarchívum-digitalizálás: régi papír-dokumentumok beolvasása, kereshetővé tétele.
Hogyan néz ki a modern OCR + AI folyamat?
A klasszikus 4 lépés:
- OCR (szöveggé alakítás): a PDF / kép pixel-szintű feldolgozása, szöveg-kinyerés. Eszközök: Tesseract (open-source), Google Cloud Vision, AWS Textract, Azure Document Intelligence.
- Layout-elemzés: a dokumentum struktúrájának megértése — fejléc, törzs, táblázat, lábléc. Speciálisan számla / szerződés-sablonokra optimalizált.
- AI-strukturálás: az OpenAI API vagy hasonló LLM olvassa a szöveget, és JSON-be ír (a kívánt mezőkkel).
- Validáció + emberi review: a kinyert adatokat ellenőrzöm — áfa-számítás stimmel? Kötelező mezők meg vannak? Human-in-the-loop kritikus eseteknél.
Eszközök
A 2026-os piac:
- Tesseract — open-source OCR. Ingyenes, önhostolható. Egyszerű szövegekre jó, komplex layout-okra gyengébb.
- Google Cloud Vision — robosztus OCR, kéziras-kezelés, számla-specifikus modul. $1.50/1000 oldal.
- AWS Textract — táblázat és form-kinyerésre erős. $1.50/1000 oldal.
- Azure Document Intelligence — előtrénelt számla / szerződés-modellek. Magyar nyelven is jól dolgozik.
- Mindee, Klippa, Rossum — speciális számla-feldolgozó SaaS-megoldások.
- Custom OCR + LLM — Tesseract + GPT-4o kombináció. Önhostolt megoldás, GDPR-barát.
Példa: számla-feldolgozás
Klasszikus magyar számla:
- PDF érkezik e-mailben → e-mail-trigger.
- OCR (Azure Document Intelligence vagy Tesseract) → nyers szöveg.
- LLM-prompt: „Kinyerd a következő mezőket: szállító neve, adószáma, számla-szám, dátum, tételek (név, mennyiség, ár, ÁFA-kulcs), bruttó összeg.”
- JSON-válasz.
- Validáció: az áfa-számítás stimmel?
- Beírás a könyvelő-rendszerbe (vagy Számlázz.hu-ba, vagy custom DB-be).
Egy ilyen workflow n8n + Azure + OpenAI kombinációval 1-2 hét alatt összerakható.
Mibe kerül?
Egy átlagos magyar középvállalati dokumentumfeldolgozó projekt:
- Fejlesztés: 500 ezer-3 millió forint (függ a dokumentum-típusoktól, integrációktól).
- OCR-szolgáltatás: havi $30-300 (forgalom-függő).
- LLM-token: havi $30-200.
- Üzemeltetés: havi 50-150 ezer forint.
Egy 200 számlás hónap manuális kezelése 8-10 óra × ~6000 Ft = 50-60 ezer Ft. Évi 600-720 ezer Ft. AI-jal 1-2 órányi review marad, ~12-24 ezer Ft havonta. Megtérülés 6-12 hónap.
Mire figyelj?
Az első tipp: magyar nyelv-támogatás. Sok OCR-tool angolra optimalizált. Magyaron tesztelj saját adaton.
A második: kézírás vs. nyomtatott. A kézírás kezelése jóval nehezebb. Egyszerű kézírás → Google Vision / Azure jól; bonyolult kézírás → emberi review.
A harmadik: táblázat-feldolgozás. A számla-tételek táblázatos formában — speciális modulok kellenek (Azure Document Intelligence prebuilt számla-modellje vagy AWS Textract Table). Klasszikus OCR nehézkesen kezeli.
A negyedik: hallucinációs kockázat. Az LLM néha kitalál adatot, ha a forrás-szöveg nem tartalmazza. Validáció + ember review. Részletesen az AI hallucination cikkben.
Az ötödik: GDPR. A dokumentumok érzékeny adatot tartalmaznak (név, cím, adószám). Európai régió, audit-naplók, jogosultság-szabályozás. Részletesen az AI adatbiztonság cikkben.
A hatodik: monitorozás. Heti random átnézés: a kinyert adatok pontosak? Hol bukik a rendszer? Folyamatos finomítás.
Ha cégednél OCR + AI dokumentumfeldolgozást szeretnél bevezetni — számla, szerződés, CV, KYC —, az AI és automatizáció szolgáltatásunkból induljunk: dokumentum-feltárás, technológia-választás, integráció. Kapcsolódó: Számlázz.hu integráció, n8n.