A fine-tuning (magyarul finomhangolás vagy modell-finomhangolás) egy meglévő AI-modell „továbbtanítása” a saját, specifikus adataidon. Veszel egy nagyon nagy alapmodellt (GPT-4o-mini, Llama 3, Mistral) — amit milliárdok-trilliós tokeneken trénítettek —, és néhány száz-néhány ezer példádon „finomhangolod” konkrét feladatra. A különbség a klasszikus tréninggel szemben: a fine-tuning gyorsabb (órák-napok, nem hónapok), olcsóbb ($100-5000 vs. milliók), és nem kell a teljes modellt újratréneni.
Így is ismerheted
Magyarul finomhangolás, modell-finomhangolás, modell-tanítás. Angolul a klasszikus fine-tuning. Modern alfajai: LoRA (Low-Rank Adaptation), QLoRA, PEFT (Parameter Efficient Fine-Tuning).
Mikor érdemes fine-tuningolni?
A fine-tuning ott jön elő, ahol a prompt-engineering és a RAG nem elég:
Speciális stílus / formátum: a kimenetnek pontosan a céged hangnemét, struktúráját kell követnie.
Domain-szókincs: orvosi, jogi, ipari szakszavak, amik a tréning-adatban ritkák.
Költség-skálázás: egy fine-tunelt kisebb modell sokszor olcsóbb / gyorsabb mint egy nagy modell sok few-shot példával.
Konzisztens output: a fine-tunelt modell „megtanult” egy adott választ generálni egy adott bemeneti mintára.
Klasszikus klasszifikációs feladatok: spam-szűrés, sentiment-elemzés, intent-classification.
Mikor NE fine-tuningolj?
- Friss adat fontos — a fine-tunelt modell egy adott időpontig „tudja” a dolgokat. RAG jobban kezeli a friss adatot.
- Általános feladat — egy jó prompt + GPT-4o-val 90%-os esetre elég.
- Kevés példa — 100 alatt fine-tuning rossz eredményt ad. Few-shot prompt jobb.
- Adat-szivárgás kockázat — a fine-tuning során a modellbe „beleköltöznek” a tréning-adatok.
Hogyan néz ki a folyamat?
A klasszikus fine-tuning 5 lépésből áll:
- Adat-gyűjtés — 100-10000 példa-pár: input-szöveg → ideális kimenet.
- Adat-formázás — a szolgáltató konkrét formátumába (OpenAI JSON-L, Anthropic, HuggingFace).
- Validáció — kis tisztítás, duplikáció kiszedés.
- Tréning futtatása — OpenAI Fine-tuning API, Anthropic Custom Models, vagy önhostolt környezet.
- Értékelés — a kapott modell összevetése az alapmodellel egy benchmark-halmazon.
Költségek
Néhány tipikus ár (2026):
- OpenAI GPT-4o-mini fine-tuning: $3 per millió tréning-token + emelt használati ár.
- OpenAI GPT-4o fine-tuning: $25 per millió tréning-token.
- Llama 3 LoRA (önhostolt): GPU-óra-költség, ~$10-200 attól függően mekkora modell.
Egy átlagos magyar középvállalat fine-tuning-projektje: $100-2000 egyszeri költség, plus a használati ár.
LoRA és QLoRA
A klasszikus „full fine-tuning” módosítja az összes modell-paramétert — drága, lassú. A modern LoRA (Low-Rank Adaptation) csak egy kicsi „adapter”-réteget tanít, ami az eredeti modell felett dolgozik. Sokkal olcsóbb (10-100x), és a minőség is sokszor jobb.
A QLoRA ehhez kvantizálást ad — a modell-súlyokat 4-bites pontossággal tárolja. Egy 70B paraméteres Llama-modell QLoRA-val egy egyszerű 24GB-os GPU-n is fine-tuneható.
Mire figyelj?
Az első tipp: előbb prompt-engineering, csak utána fine-tuning. A 80%-os feladatra egy jól megírt prompt elég.
A második: adat-minőség kritikus. 100 jó példa többet ér 1000 mediokris-nál.
A harmadik: validációs halmaz. Tarts külön 10-20% adatot validációra.
A negyedik: GDPR és adat-szivárgás. A fine-tuning során a tréning-adat „beépül” a modellbe. Részletesen az AI adatbiztonság cikkben.
Az ötödik: monitorozz utána. A fine-tunelt modell-minőség idővel romolhat (drift). Heti / havi tesztelés.
Ha cégednél fine-tuning projektre gondolsz, az AI és automatizáció szolgáltatásunkba beépítve segítünk eldönteni, valóban kell-e (sokszor RAG vagy prompt-engineering jobb), és ha igen, kivitelezni. Kapcsolódó: AI modell, RAG, prompt engineering.