Az AI tudásbázis egy olyan rendszer, ami a céged saját dokumentumait — szabályzatokat, kézikönyveket, GYIK-et, e-mail-történetet, technikai doksikat — természetes nyelven kérdezhetővé teszi. Beírod, hogy „mi a szabadság-igénylési folyamat?”, és kapsz egy konkrét választ a céges szabályzatból, idézve, melyik dokumentumból, hányadik bekezdésből. A „klasszikus” céges keresőtől (a Google Drive vagy SharePoint kereső) abban különbözik, hogy nem kulcsszó-egyezést keres, hanem a szöveg jelentését érti — így akkor is talál, ha másképp fogalmazol, mint ami a dokumentumban szerepel.
Így is ismerheted
Magyarul céges AI-kereső, vállalati tudásbázis, belső dokumentum-kereső AI-jal. Angolul AI knowledge base, enterprise search with AI, vagy a leggyakoribb technikai megnevezés: RAG-alapú asszisztens (lásd RAG). A klasszikus tudásbázis (Confluence, Notion, SharePoint) önmagában nem AI — csak akkor lesz az, ha keresőként egy nyelvi modellt kötsz hozzá.
Mire jó a céged számára?
A leggyakoribb helyzetek, ahol egy AI tudásbázis konkrét értéket termel:
Egy HR-szempontból: a kollégák 100-szor kérdeznek a szabadság-szabályzatról, otthoni-munka-szabályzatról, juttatásokról. Egy jól trainelt AI-asszisztens a kérdést értelmezi és pontos választ ad a saját szabályzatodból — a HR-csapat kapacitása felszabadul. Egy ügyfélszolgálatosi szempontból: az új kollégának 2-3 hónap, mire elsajátítja a termékportfólió mély ismeretét. Egy jó AI tudásbázissal az első hetétől profi választ tud adni, mert a háttérben az asszisztens odaadja neki a pontos választ.
Egy fejlesztői csapat: a régi projekt-doksikat, architektúra-leírásokat, post-mortem-eket csapatban senki nem olvassa végig. Egy AI-asszisztens egy másodperc alatt válaszol: „hogyan kötöttük be a Stripe-ot 2024-ben? Mi volt a kihívás?”
Egy sales-csapat: a versenytárs-elemzéseket, esettanulmányokat, ajánlat-sablonokat egy helyen találja, akkor is, ha a tudás 30 különböző doksiban van szétszórva.
Hogyan épül fel egy AI tudásbázis?
A klasszikus architektúra (RAG — Retrieval Augmented Generation) öt rétegből áll. Először a forrásdokumentumokat összegyűjtöd — Google Drive-ról, SharePoint-ról, Notion-ből, e-mail-ből, PDF-ekből. Másodszor feldarabolod őket kisebb, ~500 szavas szeletekre (chunk-okra), hogy a kereső pontosabban tudjon dolgozni. Harmadszor minden szelet egy embedding-vektort kap egy AI-modelltől — ez egy matematikai reprezentáció a szöveg jelentéséről. Negyedszer ezek a vektorok egy vektoradatbázisba kerülnek (Pinecone, Weaviate, Qdrant). Ötödször, ha valaki kérdez, a kérdést is embedding-be alakítjuk, megkeressük a legközelebb eső szelet-vektorokat, és odaadjuk őket a nyelvi modellnek (GPT-4, Claude), aki ezekből és a kérdésből megfogalmaz egy emberi nyelvű választ.
Praktikusan a felhasználó csak annyit lát, hogy beír egy kérdést, és 2-3 másodperc alatt kap egy választ. Hátra a forrás-megjelölés, hogy az eredeti dokumentumot is megnyithassa.
Milyen tool-okból állítsd össze?
Két fő irány van. Az első a kész SaaS-megoldás: GPT-szerű felhasználói felülettel, néhány kattintással integrálható. Ilyen pl. a Glean, a Coveo, a Mendable, a HubSpot Service Hub AI-modulja. Előny: gyorsan élesedik (1-2 hét). Hátrány: kevésbé testreszabható, és általában havi 30-200 USD/user.
A második a custom építés: a saját stack-edre. Tipikus stack ma:
- Dokumentum-betöltés: LangChain vagy LlamaIndex (Python keretrendszerek), vagy egyedi script.
- Embedding-modell: OpenAI text-embedding-3-small (~$0.02 / millió token), vagy Sentence Transformers (önhostolt).
- Vektoradatbázis: Pinecone (felhős, gyors), Qdrant vagy Weaviate (önhostolható, GDPR-barát).
- LLM a válaszadáshoz: OpenAI API, Anthropic Claude, vagy önhostolt Llama 3.
- Felhasználói felület: egy webes chatbot (Typebot, custom React), vagy Slack/Teams bot.
A custom stack indító költsége 500 ezer-2 millió forint körüli, és havi 30-150 ezer forint üzemeltetés (API-tokenek, hosting). Cserébe maximális testreszabhatóságot kapsz.
Mikor érdemes egyáltalán belevágni?
Az AI tudásbázis ott éri meg, ahol:
- Sok dokumentum van — 100+ oldal, vagy 50+ különböző fájl.
- Ezek heti-havi szinten frissülnek — különben egy jól megírt FAQ + Confluence elég.
- Sokan kérdezik — heti 20-50 ismétlődő kérdés egy területen.
- A válasz idő-érzékeny — nem akarsz 24-48 órát várni egy belső kollégai válaszra.
Egy 10 fős cégnél a klasszikus tudásbázis sokszor elég; egy 50-200 fős cégnél már látványosan megéri AI-t építeni rá.
Mire figyelj a bevezetésnél?
A legnagyobb buktató a dokumentum-minőség. „Garbage in, garbage out” — ha az AI elavult, ellentmondásos, vagy hiányos dokumentumokon dolgozik, akkor téves válaszokat fog adni. A bevezetés előtt érdemes 1-2 hetet szánni a dokumentumok átnézésére, frissítésére, és duplikációk kiszedésére.
A második a frissítés-folyamat: ha új doksi kerül a Google Drive-ra, vagy frissül egy szabályzat, ez automatikusan kerüljön be a tudásbázisba (incremental ingest). Különben a rendszer pár hónap után „elavult” lesz, és senki nem fogja használni.
A harmadik a GDPR és hozzáférés-szabályozás: nem mindenki láthat mindent. Egy üzleti titok-szintű dokumentumhoz csak a felsővezetés férjen hozzá; a HR-szabályzat mindenkinek. Az AI tudásbázisnak támogatnia kell a permission-szinteket — a kérdező identitása alapján szűrjön a tudásbázisban. Részletesebben a AI adatbiztonság cikkben.
A negyedik a hallucinációs hibák — bár az AI tudásbázis pont arra való, hogy a saját adatodra szorítsa a választ, a modell néha mégis kitalál dolgokat. Erre a védvonal: minden válaszhoz forrás-megjelölés (melyik dokumentumból), és a felhasználó tudja, hogy „ez a válasz a [X] szabályzat 3.2-es szakaszából”.
Ha céges AI tudásbázist szeretnél építeni — akár belső kollégáknak, akár ügyfélszolgálati támogatásra, akár sales-asszisztensként —, az AI és automatizáció szolgáltatásunkból induljunk ki: dokumentum-feltárás, technológia-választás, élesítés. Egy ügyfél-oldali változat (chatbothez kötve) a chatbot fejlesztés szolgáltatás keretein belül indul.