LLM (nagy nyelvi modell) jelentése

LLM (nagy nyelvi modell)

Az LLM (large language model, magyarul nagy nyelvi modell) olyan mesterséges intelligencia, amit hatalmas szövegmennyiségen (több milliárd-trillió szó internetes szövegen, könyveken, kódbázisokon) tanítottak, és képes szöveg-bemenetre szöveg-kimenetet generálni. A ChatGPT (OpenAI), a Claude (Anthropic), a Gemini (Google), a Llama (Meta) — mind LLM-ek. Ezek a modellek képesek szöveget értelmezni, kérdést megválaszolni, dokumentumot összefoglalni, fordítani, kódot írni, és számos más nyelvi feladatot ellátni — anélkül, hogy konkrétan ezekre a feladatokra kellett volna őket trénelni.

Így is ismerheted

Magyarul nagy nyelvi modell, nyelvi modell (a „nagy” jelző csak a 2018 utáni, milliárdos paraméterszámú változatokra utal). Angolul a klasszikus large language model (LLM), foundation model, vagy frontier model a legújabb, legintelligensebb változatokra. A „GPT”, „Claude”, „Gemini” stb. mind LLM — csak a gyártó és a konkrét modell-családból. A generatív AI tágabb fogalom, ami szöveg, kép, hang, videó-generálást is magába foglal; az LLM specifikusan a szöveggel dolgozó alfaja.

Mire jó cégeknek?

Az LLM-ek azzal különböztetik meg magukat a régebbi AI-rendszerektől, hogy általános célúak. Egy klasszikus AI-modell egy konkrét feladatra trénelve (pl. spam-szűrés) jól végzi azt, de mást nem tud. Egy LLM ugyanazzal a modellel megírni egy hírlevelet, kategorizálni egy e-mailt, ki tudni a szerződésből a fontos adatokat, és válaszolni egy ügyfél kérdésére. Ez az alap-rugalmasság teszi annyira elterjedtté.

Néhány tipikus üzleti felhasználási terület:

  • ÜgyfélkommunikációAI chatbot, e-mail-asszisztens, sales-supportoló asszisztens.
  • Dokumentum-feldolgozás — PDF-számlák, szerződések, önéletrajzok strukturált adat-kinyerése.
  • Tartalom-előkészítés — blog-vázlat, hírlevél-draft, social poszt, termékleírás.
  • Belső asszisztens — a kollégák HR-, IT-, ügyfélszolgálati kérdéseire válaszol a céges tudásbázis alapján.
  • Adat-elemzés — strukturálatlan szövegekben mintázat-keresés, hangulat-elemzés, kategorizálás.

Hogyan működik egy LLM?

A háttérben egy hatalmas neurális háló dolgozik — a 2024-es GPT-4 becsült mérete 1-1,7 trillió paraméter. A tréning során a modell egyszerű feladatot kapott: „adott egy szövegrész, mi a legvalószínűbb folytatása?”. Több milliárd ilyen mini-feladaton tanítva a modell „megtanulta” a nyelvet, a logikát, a tényeket, a stílust — anélkül, hogy bárki konkrétan kódolta volna őket.

Praktikusan a felhasználó egy prompt-ot ír — utasítás vagy kérdés szövegesen —, és a modell egy szöveges választ generál. A háttérben minden egyes válasz „token-ról-tokenre” (~3-4 karakter egységekre bontva) készül, és minden tokent statisztikailag a legvalószínűbbként választ ki a kontextus alapján. Ez magyarázza, miért képes magabiztos, nyelvtanilag jó szöveget produkálni, és miért hibázik (hallucinál) néha — nincs „tudás-adatbázisa”, csak statisztikai mintázatai.

Milyen LLM-ek vannak 2026-ban?

A piac fő modelljei:

  • OpenAI GPT-4o / GPT-4o-mini — az ipari sztenderd, jó ár-érték arány. A „mini” 90%-os feladatra is elég, 10-20x olcsóbban.
  • Anthropic Claude (Opus, Sonnet, Haiku) — kifejezetten kreatív és kódoló feladatokra erős, sokszor jobb a magyar nyelvi minőség.
  • Google Gemini (Ultra, Pro, Flash) — Google-stackbe (Workspace, Cloud) jól integrál.
  • Meta Llama 3 (8B, 70B, 405B) — open-source, önhostolható. GDPR-érzékeny cégeknek európai opció.
  • Mistral (Large, Medium, 7B) — francia cég, open-weight, önhostolható.
  • Aleph Alpha — német európai opció, kifejezetten kutatás-fókuszú.

A választás-szempont: minőség (mennyire okos), nyelvi támogatás (magyar!), ár (input/output token-ár), latencia (mennyi alatt válaszol), és GDPR-kompatibilitás (USA-régió vs. EU-régió vs. önhostolt).

Mibe kerül egy LLM használata?

A költséget tokenben mérik (1 token ~ 3-4 karakter). Egy átlagos chat-üzenet 200-500 token, egy hosszabb prompt 1000-5000. Tipikus árak:

  • GPT-4o-mini: ~$0.15/$0.60 per millió input/output token. Egy klasszikus chatbot-üzenet (200 input + 200 output) tehát ~$0.00015 = 0,005 forint.
  • GPT-4o: ~$2.50/$10 per millió. Ugyanaz az üzenet ~$0.0025 = 0,08 forint.
  • Claude Sonnet: ~$3/$15 per millió, hasonló nagyságrend mint GPT-4o.
  • Llama 3 önhostolva: a hardver/cloud-szervera ára $200-1000/hó kis-közepes forgalomra.

Egy átlagos magyar középvállalatnál, ami napi 1000-5000 LLM-hívást indít, a havi költség $30-300 nagyságrendben mozog. Ezt minden megspórolt humán óra simán visszahozza.

Mit NEM tud egy LLM?

Fontos megérteni a korlátokat is. Az LLM nem tud:

  • Friss eseményt — a tréning-adat egy adott időpontig tart („knowledge cutoff”). Friss hírekről, 2026-os új termékekről nem tud.
  • Saját adataidat — a céges szabályzataidat, ügyfél-adatait nem ismeri. Ezt RAG architektúrával kell „beépíteni”.
  • Megbízhatóan számolni — egyszerűbb matematikai feladatokat ront, mert nem „számol”, hanem statisztikailag generál.
  • Tovább-tanulni a beszélgetésből — minden új beszélgetést „tabula rasa”-ról kezd. A memóriát promptba kell betenni minden alkalommal.
  • Internetet böngészni — alapból nem, csak ha külön „tool use” funkciót adsz hozzá.

Az LLM-eket ezekre a korlátokra is figyelve kell beépíteni a rendszerekbe: RAG a friss adathoz, kalkulátor-tool a számoláshoz, kontextus-megőrzés a beszélgetéshez, és emberi felülvizsgálat a kritikus döntésekhez.

Mire figyelj LLM-bevezetésnél?

Az első: modell-választás. Ne ugorj automatikusan a legdrágább/legokosabb modellre. Sok feladatra a GPT-4o-mini, Claude Haiku is elég, 10-20x kisebb költségen.

A második: prompt-tervezés. Egy jól megírt prompt 3-5x pontosabb választ ad. Tervezz be időt a prompt-finomhangolásra, és tartsd verziókövetésben a fontos promptokat. Részletesen a prompt engineering cikkben.

A harmadik: kimenet-validáció. Az LLM kimenetét ne fogadd el nyersen — különösen, ha külső kommunikációba (ügyfél-e-mail, weboldal) kerül. Strukturált formátumot kérj (JSON), és ellenőrizd a mezőket.

A negyedik: GDPR és adatvédelem. Az LLM-be küldött adat sokszor harmadik fél szerverére kerül. Európai régió, zero-retention beállítás, anonimizálás — ezek mind fontosak. Részletesen a GDPR és AI cikkben.

Ha LLM-alapú megoldást szeretnél a cégednek — chatbot, asszisztens, automatizáció —, az AI és automatizáció szolgáltatásunkból induljunk: modell-választás, integráció, prompt-tervezés, élesítés. Egy ügyfél-oldali AI-megjelenéshez a chatbot fejlesztés az induló pont.

Beszéljünk a Projektedről

Minden jó projekt egy üzenettel kezdődik. Ha van egy ötleted, egy kérdésed, vagy csak kíváncsi vagy mibe kerülne — írj bátran. Minden megkeresésre személyesen válaszolunk.

Create your account
Ajánlatkérés