A RAG chatbot egy olyan AI-asszisztens, amely a Retrieval Augmented Generation (RAG) architektúrát használja: minden válasz előtt megkeresi a céged saját dokumentum-adatbázisában a releváns szakaszokat, és csak utána generálja a választ. Ez két fontos dolgot ad: pontosságot (a céged adatára építve nem hallucinál annyira), és idézhetőséget (a forrás-dokumentum megnevezhető a válaszban). A 2026-os állapotban szinte minden komoly belső chatbot, ügyfélszolgálati asszisztens és tudásbázis-rendszer RAG-architektúrára épül.
Így is ismerheted
Magyarul tudásbázis-alapú chatbot, RAG-alapú AI asszisztens, visszakereséssel kiegészített chatbot. Angolul RAG chatbot, knowledge-grounded chatbot, retrieval-augmented chatbot. A RAG önmagában egy architektúra; a „RAG chatbot” annak egy konkrét felhasználása beszélgető felülettel.
Miért jobb mint egy „sima” LLM-chatbot?
Egy sima ChatGPT-szerű chatbot három problémával küzd:
- Nem tudja a saját adataidat — a céges szabályzatok, termék-katalógus, GYIK nem szerepelnek a tréning-adatában.
- Hallucinál — magabiztosan ad ki rossz választ, ha „nem biztos” benne.
- Friss adat hiánya — a tréning-adat egy adott időpontig tart, a friss eseményeket / termékeket nem ismeri.
A RAG-architektúra mindhárom problémát megoldja: a chatbot a saját dokumentum-tárból válaszol, forrás-megjelöléssel, és a tudásbázis frissítésével naprakész marad.
Mire jó a gyakorlatban?
Néhány tipikus felhasználási területe:
- Belső kollégai asszisztens — HR-, IT-, ügyfélszolgálati kérdések a saját szabályzatokból.
- Ügyfélszolgálati chatbot — vásárlói kérdések a saját termékportfólióból.
- Sales-asszisztens — sales-csapat a saját versenytárs-elemzésekből, esettanulmányokból dolgozik.
- Jogi / megfelelőségi asszisztens — szerződés-elemzés a saját szabályzatok alapján.
- Fejlesztői dokumentum-asszisztens — a régi projekt-doksikból, architektúra-leírásokból válaszol.
- Oktatási asszisztens — kurzus-anyagok kereshetőek természetes nyelven.
Hogyan néz ki a felépítés?
A klasszikus RAG-chatbot 6 lépésből áll:
- Dokumentum-betöltés — Google Drive, SharePoint, Notion, Confluence, PDF-ek, e-mailek.
- Felbontás chunkokra — ~300-500 szavas darabokra, 20-50 szavas átfedéssel.
- Embedding-generálás — minden chunk egy vektort kap (embedding-modell, pl. OpenAI text-embedding-3-small).
- Vektoradatbázis-tárolás — Qdrant, Pinecone, pgvector (lásd vektoradatbázis).
- Felhasználói kérdés — szintén embedding-be alakítva, a vektoradatbázisban a legközelebbi 5-10 chunk kerül elő.
- LLM-válasz — a kérdés + a talált chunk-ok bekerülnek egy promptba, és az LLM ezekből generálja a választ, forrás-megjelöléssel.
Hozzáférés-szabályozás
A RAG chatbotnál a jogosultság-szabályozás kulcsfontosságú. Egy gyakornok ne tudja megkérdezni a vezetők fizetését — még ha a fizetési táblázat valahol a forrás-anyagban szerepel is. A megoldás: a chatbot azonosítja a felhasználót (SSO), és a vektoradatbázisban csak azokra a chunk-okra keres, amelyekhez az adott felhasználónak jogosultsága van (role-based access control, RBAC).
Részletesen az AI adatbiztonság cikkben.
Milyen szolgáltatókra építsd?
A 2026-os stack:
- Embedding-modell: OpenAI text-embedding-3-small (olcsó, gyors, jó magyar), vagy Sentence Transformers (önhostolt, GDPR-barát).
- Vektoradatbázis: Qdrant (önhostolható), Pinecone (felhős), pgvector (PostgreSQL bővítmény).
- LLM: OpenAI API (GPT-4o, GPT-4o-mini), Anthropic Claude, vagy önhostolt Llama 3.
- Framework: LangChain, LlamaIndex (Python) — gyorsítják a fejlesztést.
- UI: weboldali chat (Typebot, custom React), Slack/Teams bot, vagy mobil-alkalmazás.
Mibe kerül?
Egy átlagos magyar középvállalat RAG chatbot projektje:
- Bevezetés: 1-5 millió forint (függ a dokumentum-mennyiségtől, integrációktól, UI-tól).
- Havi üzemeltetés: 50-300 ezer forint (LLM-tokenek, vektoradatbázis-hosting, monitoring).
- Folyamatos karbantartás: havi 8-16 óra (új doksik betöltése, prompt-finomítás).
A megtérülés 3-12 hónap, attól függően mekkora a kollégai / ügyfél-tehermentesítés.
Mire figyelj?
Az első tipp: dokumentum-minőség kritikus. A RAG „garbage in, garbage out” módon működik. Bevezetés előtt 1-2 hetet érdemes szánni az átnézésre, frissítésre, duplikációk kiszedésére.
A második: chunk-stratégia. Túl rövid (50-100 szó): elveszik a kontextus. Túl hosszú (2000+): elhomályosul a jelentés. Klasszikus ajánlás: 300-500 szó, 20-50 szavas overlap.
A harmadik: frissítés-folyamat. Új doksi a Drive-on → automatikusan kerüljön a tudásbázisba (incremental ingest). Heti / napi batch-szel.
A negyedik: jogosultság-szabályozás kezdetektől. Ne tervezz „mindenki lát mindent” rendszert, és aztán korlátozz utólag.
Az ötödik: forrás-megjelölés. Minden válaszhoz forrás-link vagy idézet. „Ez a válasz a HR-szabályzat 3.2-es szakaszán alapul.”
A hatodik: hallucinációs védelem. A prompt szóljon az LLM-nek, hogy ha nem talál releváns chunk-ot, ne találgasson — mondja meg, hogy nincs adat. Részletesen az AI hallucination cikkben.
A hetedik: monitorozás. Heti random átnézés: melyik kérdéseknél bukik a rendszer, milyen mintázatokat ad rossz választ. Iteratív finomítás.
Ha cégednél RAG chatbot bevezetését tervezed, az AI és automatizáció szolgáltatásunk pont erre épül: dokumentum-feltárás, RAG-architektúra, integráció, élesítés. Egy ügyfél-felé néző RAG chatbothez a chatbot fejlesztés kapcsolódik. Részletesebben az AI tudásbázis cikkben.