Fine-tuning jelentése — eClick Tudástár

A fine-tuning (magyarul finomhangolás vagy modell-finomhangolás) egy meglévő AI-modell „továbbtanítása” a saját, specifikus adataidon. Veszel egy nagyon nagy alapmodellt (GPT-4o-mini, Llama 3, Mistral) — amit milliárdok-trilliós tokeneken trénítettek —, és néhány száz-néhány ezer példádon „finomhangolod” konkrét feladatra. A különbség a klasszikus tréninggel szemben: a fine-tuning gyorsabb (órák-napok, nem hónapok), olcsóbb ($100-5000 vs. milliók), és nem kell a teljes modellt újratréneni.

Így is ismerheted

Magyarul finomhangolás, modell-finomhangolás, modell-tanítás. Angolul a klasszikus fine-tuning. Modern alfajai: LoRA (Low-Rank Adaptation), QLoRA, PEFT (Parameter Efficient Fine-Tuning).

Mikor érdemes fine-tuningolni?

A fine-tuning ott jön elő, ahol a prompt-engineering és a RAG nem elég:

Speciális stílus / formátum: a kimenetnek pontosan a céged hangnemét, struktúráját kell követnie.

Domain-szókincs: orvosi, jogi, ipari szakszavak, amik a tréning-adatban ritkák.

Költség-skálázás: egy fine-tunelt kisebb modell sokszor olcsóbb / gyorsabb mint egy nagy modell sok few-shot példával.

Konzisztens output: a fine-tunelt modell „megtanult” egy adott választ generálni egy adott bemeneti mintára.

Klasszikus klasszifikációs feladatok: spam-szűrés, sentiment-elemzés, intent-classification.

Mikor NE fine-tuningolj?

Friss adat fontos — a fine-tunelt modell egy adott időpontig „tudja” a dolgokat. RAG jobban kezeli a friss adatot.
Általános feladat — egy jó prompt + GPT-4o-val 90%-os esetre elég.
Kevés példa — 100 alatt fine-tuning rossz eredményt ad. Few-shot prompt jobb.
Adat-szivárgás kockázat — a fine-tuning során a modellbe „beleköltöznek” a tréning-adatok.

Hogyan néz ki a folyamat?

A klasszikus fine-tuning 5 lépésből áll:

Adat-gyűjtés — 100-10000 példa-pár: input-szöveg → ideális kimenet.
Adat-formázás — a szolgáltató konkrét formátumába (OpenAI JSON-L, Anthropic, HuggingFace).
Validáció — kis tisztítás, duplikáció kiszedés.
Tréning futtatása — OpenAI Fine-tuning API, Anthropic Custom Models, vagy önhostolt környezet.
Értékelés — a kapott modell összevetése az alapmodellel egy benchmark-halmazon.

Költségek

Néhány tipikus ár (2026):

OpenAI GPT-4o-mini fine-tuning: $3 per millió tréning-token + emelt használati ár.
OpenAI GPT-4o fine-tuning: $25 per millió tréning-token.
Llama 3 LoRA (önhostolt): GPU-óra-költség, ~$10-200 attól függően mekkora modell.

Egy átlagos magyar középvállalat fine-tuning-projektje: $100-2000 egyszeri költség, plus a használati ár.

LoRA és QLoRA

A klasszikus „full fine-tuning” módosítja az összes modell-paramétert — drága, lassú. A modern LoRA (Low-Rank Adaptation) csak egy kicsi „adapter”-réteget tanít, ami az eredeti modell felett dolgozik. Sokkal olcsóbb (10-100x), és a minőség is sokszor jobb.

A QLoRA ehhez kvantizálást ad — a modell-súlyokat 4-bites pontossággal tárolja. Egy 70B paraméteres Llama-modell QLoRA-val egy egyszerű 24GB-os GPU-n is fine-tuneható.

Mire figyelj?

Az első tipp: előbb prompt-engineering, csak utána fine-tuning. A 80%-os feladatra egy jól megírt prompt elég.

A második: adat-minőség kritikus. 100 jó példa többet ér 1000 mediokris-nál.

A harmadik: validációs halmaz. Tarts külön 10-20% adatot validációra.

A negyedik: GDPR és adat-szivárgás. A fine-tuning során a tréning-adat „beépül” a modellbe. Részletesen az AI adatbiztonság cikkben.

Az ötödik: monitorozz utána. A fine-tunelt modell-minőség idővel romolhat (drift). Heti / havi tesztelés.

Ha cégednél fine-tuning projektre gondolsz, az AI és automatizáció szolgáltatásunkba beépítve segítünk eldönteni, valóban kell-e (sokszor RAG vagy prompt-engineering jobb), és ha igen, kivitelezni. Kapcsolódó: AI modell, RAG, prompt engineering.

Fine-tuning