OCR és AI dokumentumfeldolgozás jelentése

Az OCR (Optical Character Recognition) és AI-alapú dokumentumfeldolgozás az a folyamat, amelynek során a beérkező papír- vagy PDF-dokumentumokat (számla, szerződés, önéletrajz, KYC-űrlap) automatikusan strukturált adattá alakítjuk. A klasszikus OCR „csak” szöveggé alakítja a képet; a modern AI-alapú feldolgozás ezen felül érti, mit jelent a szöveg — kiveszi a tételeket, validál, kategorizál, és strukturált JSON-ként továbbadja a célrendszereknek. Egy 200 számlás hónap manuális feldolgozása 8-10 óra; AI-jal 30 perc + emberi review.

Így is ismerheted

Magyarul OCR (optikai karakterfelismerés), dokumentum-digitalizálás, szövegkinyerés dokumentumból, AI-alapú adatkinyerés. Angolul OCR, document AI, intelligent document processing (IDP), text extraction. A modern megnevezés sokszor document AI vagy document understanding — utalva arra, hogy nemcsak szöveggé, hanem strukturált adattá alakítjuk.

Mire jó cégeknek?

Néhány tipikus felhasználási mód:

Számla-feldolgozás: beérkező PDF-számla → kinyert tételek (cég, dátum, áfa, összeg) → könyvelő-rendszerbe. Klasszikus magyar középvállalati eset.

Szerződés-elemzés: hosszú PDF-szerződésből kivonatolás (felek, kezdő dátum, érték, fizetési határidő). Jogi csapat időmegtakarítása.

Önéletrajz-szűrés: beérkező CV-k strukturált adattá alakítása (név, oktatás, tapasztalat, készségek). HR-előszűrés.

Vállalati KYC: új partner azonosítása — cégkivonat, adószám, tulajdonosi lánc kinyerés.

Reklamáció / panasz-kezelés: érkező levél / e-mail attachment feldolgozása, kategorizálás.

Médiaarchívum-digitalizálás: régi papír-dokumentumok beolvasása, kereshetővé tétele.

Hogyan néz ki a modern OCR + AI folyamat?

A klasszikus 4 lépés:

OCR (szöveggé alakítás): a PDF / kép pixel-szintű feldolgozása, szöveg-kinyerés. Eszközök: Tesseract (open-source), Google Cloud Vision, AWS Textract, Azure Document Intelligence.
Layout-elemzés: a dokumentum struktúrájának megértése — fejléc, törzs, táblázat, lábléc. Speciálisan számla / szerződés-sablonokra optimalizált.
AI-strukturálás: az OpenAI API vagy hasonló LLM olvassa a szöveget, és JSON-be ír (a kívánt mezőkkel).
Validáció + emberi review: a kinyert adatokat ellenőrzöm — áfa-számítás stimmel? Kötelező mezők meg vannak? Human-in-the-loop kritikus eseteknél.

Eszközök

A 2026-os piac:

Tesseract — open-source OCR. Ingyenes, önhostolható. Egyszerű szövegekre jó, komplex layout-okra gyengébb.
Google Cloud Vision — robosztus OCR, kéziras-kezelés, számla-specifikus modul. $1.50/1000 oldal.
AWS Textract — táblázat és form-kinyerésre erős. $1.50/1000 oldal.
Azure Document Intelligence — előtrénelt számla / szerződés-modellek. Magyar nyelven is jól dolgozik.
Mindee, Klippa, Rossum — speciális számla-feldolgozó SaaS-megoldások.
Custom OCR + LLM — Tesseract + GPT-4o kombináció. Önhostolt megoldás, GDPR-barát.

Példa: számla-feldolgozás

Klasszikus magyar számla:

PDF érkezik e-mailben → e-mail-trigger.
OCR (Azure Document Intelligence vagy Tesseract) → nyers szöveg.
LLM-prompt: „Kinyerd a következő mezőket: szállító neve, adószáma, számla-szám, dátum, tételek (név, mennyiség, ár, ÁFA-kulcs), bruttó összeg.”
JSON-válasz.
Validáció: az áfa-számítás stimmel?
Beírás a könyvelő-rendszerbe (vagy Számlázz.hu-ba, vagy custom DB-be).

Egy ilyen workflow n8n + Azure + OpenAI kombinációval 1-2 hét alatt összerakható.

Mibe kerül?

Egy átlagos magyar középvállalati dokumentumfeldolgozó projekt:

Fejlesztés: 500 ezer-3 millió forint (függ a dokumentum-típusoktól, integrációktól).
OCR-szolgáltatás: havi $30-300 (forgalom-függő).
LLM-token: havi $30-200.
Üzemeltetés: havi 50-150 ezer forint.

Egy 200 számlás hónap manuális kezelése 8-10 óra × ~6000 Ft = 50-60 ezer Ft. Évi 600-720 ezer Ft. AI-jal 1-2 órányi review marad, ~12-24 ezer Ft havonta. Megtérülés 6-12 hónap.

Mire figyelj?

Az első tipp: magyar nyelv-támogatás. Sok OCR-tool angolra optimalizált. Magyaron tesztelj saját adaton.

A második: kézírás vs. nyomtatott. A kézírás kezelése jóval nehezebb. Egyszerű kézírás → Google Vision / Azure jól; bonyolult kézírás → emberi review.

A harmadik: táblázat-feldolgozás. A számla-tételek táblázatos formában — speciális modulok kellenek (Azure Document Intelligence prebuilt számla-modellje vagy AWS Textract Table). Klasszikus OCR nehézkesen kezeli.

A negyedik: hallucinációs kockázat. Az LLM néha kitalál adatot, ha a forrás-szöveg nem tartalmazza. Validáció + ember review. Részletesen az AI hallucination cikkben.

Az ötödik: GDPR. A dokumentumok érzékeny adatot tartalmaznak (név, cím, adószám). Európai régió, audit-naplók, jogosultság-szabályozás. Részletesen az AI adatbiztonság cikkben.

A hatodik: monitorozás. Heti random átnézés: a kinyert adatok pontosak? Hol bukik a rendszer? Folyamatos finomítás.

Ha cégednél OCR + AI dokumentumfeldolgozást szeretnél bevezetni — számla, szerződés, CV, KYC —, az AI és automatizáció szolgáltatásunkból induljunk: dokumentum-feltárás, technológia-választás, integráció. Kapcsolódó: Számlázz.hu integráció, n8n.

OCR és AI dokumentumfeldolgozás