Az AI modell egy konkrét, már trénelt mesterséges intelligencia rendszer — egy fájl- vagy szolgáltatás-csomag, amit megadott bemenetre adott kimenetet ad vissza. Példák: GPT-4o (OpenAI), Claude Sonnet (Anthropic), Llama 3 (Meta), Gemini Pro (Google). A „modell” itt nem csak a matematikai szerkezet (pl. egy 70 milliárd paraméteres neurális háló), hanem a tréningből kapott súly-értékek összessége is — ezek tárolják, mit „tud” a rendszer.
Így is ismerheted
Magyarul AI modell, mesterséges intelligencia modell, néha gépi tanulási modell vagy ML modell. Angolul AI model, machine learning model, foundation model (a tág, általános-célú modellekre), vagy fine-tuned model (egy speciális feladatra finomhangolt változatra). A specifikus alfajok: LLM (nagy nyelvi modell), vision model (kép), multimodal model (több modalitást egyben kezelő).
Mire jó cégeknek, hogy AI modellt használj?
A „modell” gondolkodási egység üzleti szempontból két okból fontos. Először: a modell-választás a legfontosabb döntés egy AI-projektben — ez határozza meg a minőséget, a költséget, a sebességet, és a GDPR-megfelelőséget. Másodszor: az „AI modell” egy cserélhető komponens — egy jól tervezett rendszerben holnap másik modellt is be tudsz tenni, ha az olcsóbb vagy pontosabb. Ezt nevezzük model-agnosticnak.
Néhány tipikus üzleti alkalmazás, ahol „modell” kulcskifejezés:
- Egy AI chatbot a háttérben egy LLM modellt használ. Holnap egy olcsóbb modellre vált a fejlesztő, ha az is megfelelő minőségű.
- Egy képosztályozó (gyártócégnél hibás termék detekció) egy CNN-modellt használ. A saját adatodon finomhangolod, és ez lesz a saját modelled.
- Egy beszéd-átirat szolgáltatás (call center) a Whisper modellt használja a háttérben.
Hogyan különböztetjük meg az AI modelleket?
Több szempontból oszthatjuk őket:
Modalitás szerint: mit kezel a bemenet/kimenet?
- Szöveg-modell (LLM): bemenet és kimenet szöveg. GPT, Claude, Gemini.
- Kép-modell: kép-felismerésre vagy -generálásra. CLIP, DALL-E, Midjourney.
- Hang-modell: hang-átirat vagy hang-generálás. Whisper, ElevenLabs.
- Multimodális modell: több modalitás egyben — szöveget és képet együtt érti. GPT-4o, Gemini Ultra.
Cél szerint: mit csinál?
- Generatív: új tartalmat hoz létre (szöveg, kép). Lásd generatív AI.
- Diszkriminatív: osztályoz, döntést hoz. Spam-szűrő, képosztályozó.
- Reprezentációs: a bemenetből számokká alakítja a jelentést. Embedding-modellek.
Méret szerint: hány paraméter?
- Kis modellek (1B alatt): gyors, olcsó, korlátozott képesség. Pl. Llama 3.2 1B, sok specializált modell.
- Közepes (1B–70B): jó ár-érték arány. Llama 3 70B, GPT-4o-mini.
- Nagy / frontier (70B+): a legintelligensebb modellek. GPT-4o, Claude Opus, Gemini Ultra. Drágák.
Elérhetőség szerint: hogyan használhatod?
- API-n keresztül (closed-source): OpenAI, Anthropic, Google — fizetsz hívásonként, ők futtatják.
- Open-weight: letöltheted a modell-fájlokat és saját gépen futtathatod. Llama, Mistral, Qwen.
- Open-source (teljes): a modell + a tréning-kód is nyilvános. Ritkább, mert a tréning-adat sokszor jogi védelem alatt áll.
Hogyan válassz modellt egy üzleti projekthez?
Négy szempontot mérlegelj:
Minőség: mennyire jól oldja meg a konkrét feladatot? Ezt csak teszteléssel tudod megállapítani — kis tesztelést mindenképpen csinálj, mielőtt nagyba lépsz. A „benchmark” (MMLU, HumanEval, GSM8K) számok jelzések, de a saját feladatodon ettől eltérhet a teljesítmény.
Költség: token-alapú API-modellnél a hívásonkénti ár; önhostolt modellnél a hardver és energia. A GPT-4o-mini sokszor 10-20x olcsóbb a GPT-4o-nál — érdemes ezzel kezdeni, és csak akkor lépni feljebb, ha bukik.
Latencia: milyen gyorsan válaszol? Egy chatbotnál fontos (max 2-3 másodperc); egy batch dokumentum-feldolgozásnál nem annyira (10 másodperc is OK).
GDPR-megfelelőség: hova kerül az adat? USA-régiós OpenAI lehet probléma; Azure OpenAI EU-régió, vagy önhostolt Llama megoldás. Részletesebben a GDPR és AI cikkben.
Saját modell trénírása vagy előtrénelt használata?
Egy magyar középvállalatnál 2026-ban szinte sosem éri meg saját modellt trénelni nulláról. A milliárd-dolláros frontier modellekkel nem versenyezhetsz: a tréning hónapokba kerül, hatalmas adat- és számítási költséggel. Helyette két jó stratégia:
A fine-tuning: veszel egy nyitott alapmodellt (pl. Llama 3 70B), és a saját adatodon (1000-10000 példán) finomhangolod a konkrét feladatra. Ez nagyságrendekkel olcsóbb és gyorsabb. Egy közepes fine-tuning $100-5000 költségre tehető.
A prompt-engineering + RAG: használsz egy közös API-modellt (GPT-4o, Claude), és a saját adatodat prompt-on át, vagy RAG-architektúrán keresztül adod hozzá. Költség: csak az API-hívás (havi $30-300). Ezt érdemes mindig először megpróbálni.
Mire figyelj a modell-választásnál?
Az első tipp: tesztelj, mielőtt elköteleződsz. Készíts egy 10-20 elemes „benchmark” adathalmazt a saját feladatodra, és próbáld ki 2-3 modellt. A különbség sokszor látványos.
A második: tervezz cserélhetőségre. A kódod ne legyen szorosan kötve egy konkrét modellhez. Egy „model abstraction” réteg lehetővé teszi, hogy holnap másik modellre váltsd, ha az olcsóbb / pontosabb.
A harmadik: verziókövetés. Az API-modellek néha frissülnek (új verzió jön ki), és a viselkedésük megváltozhat. Ha a kódod hard-coded „gpt-4o-2024-05-13″-ra hivatkozik, az egy idő után deprekálódhat. Tervezz erre.
A negyedik: monitorozz. A modell teljesítménye idővel változhat (a felhasználói minták változnak, a modell-szolgáltató frissít). Heti random ellenőrzés, és visszajelzés-mechanizmus a felhasználóktól.
Ha AI-megoldást építesz a cégednek, és nem vagy biztos, melyik modellt válaszd, az AI és automatizáció szolgáltatásunkban segítünk a választásban: feladat-elemzés, benchmark-tesztelés, modell-választás, integráció. Egy ügyféloldali AI-megjelenéshez (chatbot) a chatbot fejlesztés a relevánsabb induló pont.