A gépi tanulás (machine learning, ML) a mesterséges intelligencia legelterjedtebb megközelítése: a rendszer adatokból tanul, nem kódba írt szabályokból. A klasszikus szoftver-fejlesztésben egy programozó megírja a logikát („ha ez a feltétel, akkor ezt csináld”); a gépi tanulásnál ehelyett megadsz egy nagy mennyiségű adatot, és a modell megtanulja a mintázatokat, amiből aztán új helyzetekben is döntéseket hoz. Egy spam-szűrő pl. 100 ezer spam és 100 ezer rendes e-mail példájából tanulja meg, hogyan különbözteti meg őket — anélkül, hogy bárki konkrétan kódolta volna a szabályokat.
Így is ismerheted
Magyarul ML (machine learning rövidítése), néha gépi tanítás vagy algoritmikus tanulás. Angolul a klasszikus machine learning, vagy specifikusan a típus szerint: supervised learning (felügyelt), unsupervised learning (felügyelet nélküli), reinforcement learning (megerősítéses). A mélytanulás (deep learning) a gépi tanulás egy alfaja, ami neurális hálókat használ. A „gépi tanulás” és a „mesterséges intelligencia” sokszor egymás szinonimájaként szerepel, de pontosabban: az MI a tágabb cél, az ML az egyik eszköz hozzá.
Milyen üzleti problémákra használható?
A gépi tanulás ott jelenik meg, ahol mintázat-felismerés vagy adat-alapú döntés kell. Néhány klasszikus cégen belüli felhasználási terület:
- Spam- és csalás-szűrés — beérkező üzenetek között veszélyes / nem-veszélyes különválasztása.
- Ajánlórendszer — webshopban a vásárlónak releváns termékeket javaslunk a múltbeli vásárlások alapján.
- Lead scoring — a beérkező leadek automatikus minősítése a korábbi konverzió-mintázatok alapján.
- Anomália-detekció — szokatlan eseményeket észlel (pl. hirtelen forgalom-csökkenés, hamis tranzakció).
- Készlet-előrejelzés — gyártócégnek megjósolja, mennyi alapanyag kell a következő hónapban.
- Karakter- és képfelismerés — pl. egy számla PDF-ből kinyerni a tételeket.
Hogyan tanul egy ML-modell?
A három klasszikus tanulási mód:
A felügyelt tanulás (supervised learning) esetén címkézett adatot adsz — pl. 10 ezer e-mailt, mindegyik mellett a címke „spam” vagy „nem spam”. A modell megtanulja a kapcsolatot az e-mail tartalma és a címke között, és új e-mailre is megmondja a címkét. Ez a leggyakoribb üzleti felhasználás.
A felügyelet nélküli tanulás (unsupervised learning) esetén nincs címke — csak adat. A modell maga rajzolja meg a csoportokat, mintázatokat. Pl. 10 ezer ügyfél-adatra a modell maga találja meg, milyen csoportok rajzolódnak ki (klaszterezés).
A megerősítéses tanulás (reinforcement learning) esetén a modell egy környezetben próbálkozik, és visszajelzést kap („jó döntés volt” / „rossz döntés volt”). Az iteratív próbálkozásból tanulja meg, mi a jó stratégia. A sakk-, go-, és videójáték-AI-k ezt használják; a klasszikus üzleti felhasználása ritkább.
Mi a különbség gépi tanulás és klasszikus szoftver között?
Egy klasszikus szoftverben a programozó megírja a logikát kódba. „Ha az e-mail tartalmazza a ‘NYERTÉL’ szót, az spam.” A logika átlátható, ellenőrizhető, és pontosan megjósolható, mikor mit fog tenni. Ez jól működik, ha a probléma egyszerű és jól definiálható.
A gépi tanulásnál a programozó nem írja meg a logikát — csak az algoritmust, ami megtanulja a mintázatokat. Az átláthatóság rosszabb („miért éppen ezt mondja a modell?”), de cserébe a modell olyan komplex mintázatokat is meg tud tanulni, amiket emberi szempontból lehetetlen lenne kódba írni (pl. „ez a kép kutya vagy macska?”).
Praktikusan: ha a probléma 10-20 explicit szabállyal leírható, klasszikus kód jobb. Ha a probléma „felismerés”-jellegű, és a szabályok bonyolult mintázatokba ágyazódnak, a gépi tanulás megoldja, amit kód nem.
Milyen ML-eszközöket használjon egy cég?
A 2026-os helyzetben két fő irány közül választhatsz. Az első a kész ML-szolgáltatás használata: Google Cloud Vertex AI, AWS SageMaker, Azure Machine Learning, vagy speciális eszközök (pl. Hugging Face). Ezek olyan tool-okat adnak, ahol kis-közepes ML-projekteket egy fejlesztő vagy adatelemző elvégezhet komoly ML-tudás nélkül.
A második a nyelvi modellek (LLM) megkerülő megoldása. Sok feladatra, amire korábban speciális ML-modellt kellett trénelni, ma egy nagy nyelvi modell egy jól megírt promppal helyettesítő megoldást ad. „Osztályozd ezt az e-mailt panaszra, kérdésre, vagy elismerésre” — ezt egy GPT-4o pillanatok alatt megcsinálja, anélkül, hogy bárki adatot címkézett vagy modellt trénelt volna. Sok 2024 előtti ML-projekt ma egyszerűsíthető LLM-promppal.
Hagyományos custom ML akkor kell, ha (a) van legalább 10 ezer címkézett adatod, (b) speciális iparági feladat, ahol az LLM nem dolgozik jól, (c) költség-kritikus (egy specializált modell hívásonként sokkal olcsóbb lehet, mint egy LLM API-hívás).
Mire figyelj a gépi tanulás bevezetésénél?
Az első tipp: az adat minősége többet ér, mint a modell ügyessége. Egy „okos” modell rossz adaton rosszul teljesít, egy egyszerű modell jó adaton jól. Az ML-projektek 60-70%-a az adat-előkészítésre megy el — címkézés, tisztítás, normalizálás.
A második: tesztelj reális adaton. Sok modell „túl jól” teljesít a tréning-adaton, és új, friss adaton összeomlik (overfitting). Mindig használj külön teszt-halmazt, és validációs adatot, hogy lásd a valós teljesítményt.
A harmadik: magyarázhatóság. Ha a modell üzleti döntéseket befolyásol (hitelbírálat, HR-szűrés, ár-meghatározás), érdemes „explainable AI” eszközöket használni, amik megmondják, miért hozott a modell egy adott döntést. Az EU AI Act egyes esetekben jogilag is megköveteli.
A negyedik: monitoring. A modellek „elöregednek” — a valóság változik, és a múltbeli adatra trénelt modell egyre kevésbé lesz pontos. Heti / havi mérés és időszakos újratrénírás kell.
Ha cégednél gépi tanulást szeretnél bevezetni — akár klasszikus ML-modellel, akár LLM-alapú gyors megoldással —, az AI és automatizáció szolgáltatásunkból induljunk: probléma-feltárás, eszköz-választás, prototípus, élesítés. Sok 2024 előtti ML-projekt ma egyszerűen LLM-megoldássá fejlődik — érdemes ezt először végiggondolni.