RAG chatbot jelentése — eClick Tudástár

A RAG chatbot egy olyan AI-asszisztens, amely a Retrieval Augmented Generation (RAG) architektúrát használja: minden válasz előtt megkeresi a céged saját dokumentum-adatbázisában a releváns szakaszokat, és csak utána generálja a választ. Ez két fontos dolgot ad: pontosságot (a céged adatára építve nem hallucinál annyira), és idézhetőséget (a forrás-dokumentum megnevezhető a válaszban). A 2026-os állapotban szinte minden komoly belső chatbot, ügyfélszolgálati asszisztens és tudásbázis-rendszer RAG-architektúrára épül.

Így is ismerheted

Magyarul tudásbázis-alapú chatbot, RAG-alapú AI asszisztens, visszakereséssel kiegészített chatbot. Angolul RAG chatbot, knowledge-grounded chatbot, retrieval-augmented chatbot. A RAG önmagában egy architektúra; a „RAG chatbot” annak egy konkrét felhasználása beszélgető felülettel.

Miért jobb mint egy „sima” LLM-chatbot?

Egy sima ChatGPT-szerű chatbot három problémával küzd:

Nem tudja a saját adataidat — a céges szabályzatok, termék-katalógus, GYIK nem szerepelnek a tréning-adatában.
Hallucinál — magabiztosan ad ki rossz választ, ha „nem biztos” benne.
Friss adat hiánya — a tréning-adat egy adott időpontig tart, a friss eseményeket / termékeket nem ismeri.

A RAG-architektúra mindhárom problémát megoldja: a chatbot a saját dokumentum-tárból válaszol, forrás-megjelöléssel, és a tudásbázis frissítésével naprakész marad.

Mire jó a gyakorlatban?

Néhány tipikus felhasználási területe:

Belső kollégai asszisztens — HR-, IT-, ügyfélszolgálati kérdések a saját szabályzatokból.
Ügyfélszolgálati chatbot — vásárlói kérdések a saját termékportfólióból.
Sales-asszisztens — sales-csapat a saját versenytárs-elemzésekből, esettanulmányokból dolgozik.
Jogi / megfelelőségi asszisztens — szerződés-elemzés a saját szabályzatok alapján.
Fejlesztői dokumentum-asszisztens — a régi projekt-doksikból, architektúra-leírásokból válaszol.
Oktatási asszisztens — kurzus-anyagok kereshetőek természetes nyelven.

Hogyan néz ki a felépítés?

A klasszikus RAG-chatbot 6 lépésből áll:

Dokumentum-betöltés — Google Drive, SharePoint, Notion, Confluence, PDF-ek, e-mailek.
Felbontás chunkokra — ~300-500 szavas darabokra, 20-50 szavas átfedéssel.
Embedding-generálás — minden chunk egy vektort kap (embedding-modell, pl. OpenAI text-embedding-3-small).
Vektoradatbázis-tárolás — Qdrant, Pinecone, pgvector (lásd vektoradatbázis).
Felhasználói kérdés — szintén embedding-be alakítva, a vektoradatbázisban a legközelebbi 5-10 chunk kerül elő.
LLM-válasz — a kérdés + a talált chunk-ok bekerülnek egy promptba, és az LLM ezekből generálja a választ, forrás-megjelöléssel.

Hozzáférés-szabályozás

A RAG chatbotnál a jogosultság-szabályozás kulcsfontosságú. Egy gyakornok ne tudja megkérdezni a vezetők fizetését — még ha a fizetési táblázat valahol a forrás-anyagban szerepel is. A megoldás: a chatbot azonosítja a felhasználót (SSO), és a vektoradatbázisban csak azokra a chunk-okra keres, amelyekhez az adott felhasználónak jogosultsága van (role-based access control, RBAC).

Részletesen az AI adatbiztonság cikkben.

Milyen szolgáltatókra építsd?

A 2026-os stack:

Embedding-modell: OpenAI text-embedding-3-small (olcsó, gyors, jó magyar), vagy Sentence Transformers (önhostolt, GDPR-barát).
Vektoradatbázis: Qdrant (önhostolható), Pinecone (felhős), pgvector (PostgreSQL bővítmény).
LLM: OpenAI API (GPT-4o, GPT-4o-mini), Anthropic Claude, vagy önhostolt Llama 3.
Framework: LangChain, LlamaIndex (Python) — gyorsítják a fejlesztést.
UI: weboldali chat (Typebot, custom React), Slack/Teams bot, vagy mobil-alkalmazás.

Mibe kerül?

Egy átlagos magyar középvállalat RAG chatbot projektje:

Bevezetés: 1-5 millió forint (függ a dokumentum-mennyiségtől, integrációktól, UI-tól).
Havi üzemeltetés: 50-300 ezer forint (LLM-tokenek, vektoradatbázis-hosting, monitoring).
Folyamatos karbantartás: havi 8-16 óra (új doksik betöltése, prompt-finomítás).

A megtérülés 3-12 hónap, attól függően mekkora a kollégai / ügyfél-tehermentesítés.

Mire figyelj?

Az első tipp: dokumentum-minőség kritikus. A RAG „garbage in, garbage out” módon működik. Bevezetés előtt 1-2 hetet érdemes szánni az átnézésre, frissítésre, duplikációk kiszedésére.

A második: chunk-stratégia. Túl rövid (50-100 szó): elveszik a kontextus. Túl hosszú (2000+): elhomályosul a jelentés. Klasszikus ajánlás: 300-500 szó, 20-50 szavas overlap.

A harmadik: frissítés-folyamat. Új doksi a Drive-on → automatikusan kerüljön a tudásbázisba (incremental ingest). Heti / napi batch-szel.

A negyedik: jogosultság-szabályozás kezdetektől. Ne tervezz „mindenki lát mindent” rendszert, és aztán korlátozz utólag.

Az ötödik: forrás-megjelölés. Minden válaszhoz forrás-link vagy idézet. „Ez a válasz a HR-szabályzat 3.2-es szakaszán alapul.”

A hatodik: hallucinációs védelem. A prompt szóljon az LLM-nek, hogy ha nem talál releváns chunk-ot, ne találgasson — mondja meg, hogy nincs adat. Részletesen az AI hallucination cikkben.

A hetedik: monitorozás. Heti random átnézés: melyik kérdéseknél bukik a rendszer, milyen mintázatokat ad rossz választ. Iteratív finomítás.

Ha cégednél RAG chatbot bevezetését tervezed, az AI és automatizáció szolgáltatásunk pont erre épül: dokumentum-feltárás, RAG-architektúra, integráció, élesítés. Egy ügyfél-felé néző RAG chatbothez a chatbot fejlesztés kapcsolódik. Részletesebben az AI tudásbázis cikkben.

RAG chatbot