A RAG (Retrieval Augmented Generation) egy AI-architektúra, ahol a nyelvi modell (LLM, mint a GPT-4 vagy Claude) a saját általános tudásán kívül egy konkrét, általad megadott adatforrásra is támaszkodik a válaszadáshoz. A klasszikus folyamat: a felhasználó kérdez, a rendszer megkeresi a céges dokumentumokban a leg-relevánsabb szakaszokat, odaadja ezeket a nyelvi modellnek a kérdéssel együtt, és a modell ezekből építi össze a választ. Az eredmény: a chatbot vagy asszisztens a céged saját adataival, naprakészen, idézhetően válaszol — nem általánosan a webről.
Így is ismerheted
A betűszó feloldva: Retrieval Augmented Generation, magyarul visszakereséssel kiegészített generálás. A szakmában szinte mindig RAG-ként emlegetik. Rokon fogalmak: grounded generation (alapozott generálás), knowledge-augmented LLM (tudás-kiegészített nyelvi modell), és a gyakorlati megnevezés: AI tudásbázis. Az eredetileg ezt a fogalmat bevezető Facebook-kutatócikk (2020) hozta a köznyelvbe; ma az LLM-alkalmazások 80%-a RAG-ra épül.
Mire jó cégeknek a RAG?
A klasszikus probléma: a ChatGPT általános tudással rendelkezik, de nem tudja, mi van a céged saját szabályzataiban, GYIK-ében, termékdokumentumaiban. Ha megkérdezed, „mi a szabadság-igénylési folyamat a cégünknél?”, csak találgatni tud. Egy RAG-rendszer viszont előbb megkeresi a céges szabályzatban, és onnan válaszol. Ez két dolgot ad: pontosságot (a saját adataidra építve nem hallucinál annyira) és idézhetőséget (a forrás-doksi megnevezhető a válaszban).
Néhány tipikus alkalmazási terület:
- Belső asszisztens — kollégák a HR-szabályzatra, IT-irányelvekre, projekt-doksikra kérdezhetnek.
- Ügyfélszolgálati chatbot — a saját termékportfólióból ad pontos válaszokat ügyfélnek.
- Sales-asszisztens — az értékesítő gyorsan megkapja a versenytárs-elemzéseket, esettanulmányokat, ajánlat-sablonokat.
- Jogi / megfelelőségi asszisztens — szerződés-elemzés, szabályozási kérdések kezelése a saját jogi anyagok alapján.
- Fejlesztői asszisztens — a régi projekt-doksikból, architektúra-leírásokból válaszol.
Hogyan néz ki egy RAG-architektúra?
A folyamat öt lépésből áll. Először az indexálási fázisban összegyűjtöd a forrásdokumentumokat (Google Drive, SharePoint, Notion, PDF-ek), feldarabolod őket ~300-500 szavas szeletekre (chunk), és minden szeletre generálsz egy embedding-vektort (egy számokból álló reprezentáció a jelentésről). Ezeket eltárolod egy vektoradatbázisban (Pinecone, Qdrant, Weaviate).
A lekérdezési fázis akkor indul, ha valaki kérdést tesz fel. A kérdést is embedding-be alakítjuk, és a vektoradatbázisban megkeressük a legközelebbi 5-10 szelet-vektort — ezek a valószínűleg releváns dokumentum-darabok. Ezeket a szövegeket plus az eredeti kérdést odaadjuk a nyelvi modellnek egy prompt-ban, valami ilyesmivel: „A következő dokumentum-szeletek alapján válaszolj a kérdésre. Ha nem találod a választ a szeletekben, mondd meg. [szeletek] [kérdés]”. A modell ebből a kontextusból generálja a választ.
Végül a kimenet rendszerint a generált választ tartalmazza plus a forrás-megjelölést („Ez a válasz a HR-szabályzat 3.2-es szakaszán alapul”), amit a felhasználó utólag is ellenőrizhet.
Mikor érdemes belevágni egy RAG-projektbe?
A RAG ott éri meg, ahol:
- Sok forrásdokumentum van — 100+ oldal, vagy 50+ különböző fájl.
- A dokumentumok rendszeresen frissülnek — különben egy jól megírt FAQ + klasszikus kereső is jó.
- Sokan kérdezik ezeket az adatokat — heti 20-50 ismétlődő lekérdezés egy területen.
- A pontosság kritikus — egy általános ChatGPT-válasz túl kockázatos lenne (pl. jogi, pénzügyi, egészségügyi kontextusban).
Egy kis cégnél (10-20 fő) sokszor egy jól megírt belső wiki + ChatGPT-előfizetés is elég; egy közepes / nagy cégnél (50+ fő, 1000+ dokumentum) a RAG látványosan megéri.
Milyen tool-okra építsd?
A klasszikus RAG-stack 2026-ban:
- Dokumentum-betöltés: LangChain vagy LlamaIndex (Python keretrendszerek), vagy egyedi parser-script.
- Embedding-modell: OpenAI text-embedding-3-small (~$0.02 / millió token), vagy Sentence Transformers (önhostolt, GDPR-barát).
- Vektoradatbázis: Pinecone (felhős, gyors), Qdrant vagy Weaviate (önhostolható).
- LLM: OpenAI API (GPT-4o-mini olcsóbb, GPT-4o pontosabb), Anthropic Claude, vagy önhostolt Llama 3.
- Felhasználói felület: weboldali chatbot (Typebot, custom React), Slack/Teams bot, vagy belső asszisztens.
Egy átlagos magyar középvállalat RAG-bevezetésének költsége 500 ezer-2 millió forint körüli (architektúra, indexálási folyamat, integráció, UI), és havi 30-150 ezer forint üzemeltetés (API-tokenek, hosting).
Mire figyelj a bevezetésnél?
A legnagyobb buktató a dokumentum-minőség. A RAG „garbage in, garbage out” módon működik — ha elavult, ellentmondásos, vagy hiányos dokumentumokon dolgozik, téves választ ad. Bevezetés előtt 1-2 hetet érdemes szánni a forrásdokumentumok átnézésére, frissítésére, duplikációk kiszedésére.
A második a chunk-stratégia. Túl rövid darabok (50-100 szó) elveszítik a kontextust; túl hosszúak (2000+ szó) elhomályosítják a jelentést. Klasszikus ajánlás: 300-500 szó, 20-50 szavas overlap-pel (átfedéssel) a darabok között.
A harmadik a frissítés-folyamat. Ha új doksi kerül a Drive-ra, automatikusan kerüljön be a tudásbázisba (incremental ingest). Heti vagy napi batch-szel. Különben a rendszer pár hónap után elavul.
A negyedik a GDPR és hozzáférés-szabályozás. A vektoradatbázis sokszor érzékeny adatokat tárol. A keresés ne lépje át a felhasználói jogosultságokat — egy gyakornok ne kérdezhesse meg, mennyit keres a CEO, akkor sem, ha a fizetési táblázat valahol a forrásban van. Részletesebben az AI adatbiztonság és a GDPR és AI cikkekben.
Az ötödik a monitoring. Heti random átnézés: néhány AI-válasz tényleg pontos volt-e, melyik kérdéseknél bukik a rendszer. Ezek a minták alapján finomítsd a promptot vagy a chunk-stratégiát.
Ha egy RAG-alapú AI-tudásbázist szeretnél bevezetni a cégedben — belső asszisztens, ügyfélszolgálati chatbot, sales-segéd —, az AI és automatizáció szolgáltatásunkból induljunk ki: dokumentum-feltárás, technológia-választás, élesítés. Egy ügyféloldali változatra (chatbothez kötve) a chatbot fejlesztés az induló pont. A klasszikus RAG-cikk (Facebook AI Research, 2020): arxiv.org/abs/2005.11401.