A temperature és top-p a két legfontosabb paraméter, amivel egy nyelvi modell (LLM) kimenetének „kreativitását” vagy „véletlenszerűségét” szabályozhatod. Egyszerűsítve: a temperature azt szabályozza, mennyire kalandos választ generál a modell (0-tól ~2-ig terjedő skála; 0 = mindig ugyanazt választja, 2 = vad / kiszámíthatatlan); a top-p (vagy „nucleus sampling”) azt szabályozza, hány „jelölt” szóból választ a modell (0.1 = nagyon szűk, csak a legvalószínűbb 10%; 1.0 = az összes lehetőség). Üzleti AI-rendszerekben ezek a paraméterek drasztikusan befolyásolják a kimenet konzisztenciáját, és érdemes tudatosan beállítani őket.
Így is ismerheted
Magyarul hőmérséklet (temperature), top-p paraméter. Angolul ugyanígy: temperature, top-p, nucleus sampling. Rokon paraméterek: top-k sampling (még szűkebb), frequency penalty, presence penalty. A temperature és top-p a két legalapvetőbb, ezekkel kezdj.
Mit csinál a temperature?
A temperature egy szám 0 és ~2 között (modelltől függően), és azt szabályozza, mennyire „kalandos” válaszokat ad a modell.
Temperature = 0: a modell mindig a leg-valószínűbb tokent választja. Determinisztikus. Ugyanaz a prompt mindig ugyanazt a választ adja. Ideális kategorizálásra, kód-generálásra, strukturált kimenetre.
Temperature = 0.3-0.5: kicsit változatos, de még nem kreatív. Klasszikus üzleti chatbot-választás.
Temperature = 0.7-1.0: kreatív, de még értelmes. Tartalom-generálásra, ötlet-böngészésre, marketing-szövegre jó.
Temperature = 1.5-2.0: vad, kiszámíthatatlan. Production rendszerekben ritkán.
Mit csinál a top-p?
A top-p (0 és 1 között) azt mondja meg, hogy a modell csak a leg-valószínűbb tokenek mekkora hányadából választhat.
Top-p = 0.1: csak a legvalószínűbb 10% válaszható. Konzervatív, fókuszált.
Top-p = 0.5: a leg-valószínűbb 50%. Klasszikus üzleti beállítás.
Top-p = 0.9-1.0: minden lehetőség jelen. Kreatív, kalandos.
A top-p és a temperature gyakran együtt használva állnak — például temperature=0.7 + top-p=0.9 a kreatív tartalom-generálás klasszikus kombinációja.
Üzleti felhasználási területek
Néhány klasszikus beállítás:
- Strukturált adat-kinyerés (PDF-feldolgozás, JSON-kimenet) — temperature 0, top-p 1.0. Determinisztikus, megbízható.
- Kategorizálás (e-mail, lead-osztály) — temperature 0-0.2. Konzisztens.
- Ügyfélszolgálati válasz — temperature 0.3-0.5. Kicsit változatos, de pontos.
- Sales-szövegek — temperature 0.5-0.7. Kreatív, de még szakmai.
- Blog-vázlat, marketing-szöveg — temperature 0.7-1.0. Kreatív.
- Brainstorming — temperature 1.0-1.5. Vadabb ötletek.
- Kód-generálás — temperature 0-0.2. Pontos szintaxis fontos.
Hogyan állítsd be?
Példa az OpenAI API hívásában:
const response = await openai.chat.completions.create({
model: "gpt-4o-mini",
messages: [...],
temperature: 0.3,
top_p: 1.0,
max_tokens: 500,
});
Általában javasolt: VAGY a temperature-t állítod (0-1), VAGY a top-p-t (0-1) — nem mindkettőt egyszerre.
Mikor melyiket?
A klasszikus tanács: kezdj a temperature-rel. A top-p inkább „finomhangolás” — a temperature általában elegendő irányítás.
Mire figyelj?
Az első tipp: a determinizmus nem jelent ugyanazt a választ. Temperature 0-val sem teljesen reprodukálható az AI-kimenet — a numerikus precízió eltérései néha eltérő tokeneket adnak. Ha pontos reprodukálhatóság kell, használj „seed” paramétert is (ahol támogatott).
A második: tesztelj saját feladaton. A „javasolt” temperature-érték kiindulópont — minden feladat más. Készíts kis benchmark-halmazt, és próbálj 3-5 temperature-értéket.
A harmadik: strukturált kimenetnél temperature 0. Ha JSON-választ vársz, ne hagyj kreativitásnak teret.
A negyedik: hallucinációs hatás. Magasabb temperature → több hallucináció. Ha tényeknek kell pontosaknak lenniük, alacsony temperature. Részletesen az AI hallucination cikkben.
Ha cégednél AI-rendszert vezetsz be és a kimenet finomítását tervezed, az AI és automatizáció szolgáltatásunkban segítünk a paraméterek tesztelésében. Kapcsolódó: prompt engineering, strukturált AI válasz.