Ana içeriğe geç

Çıkarım Parametreleri

LLM Inference Parameters yapısı modelin nasıl yüklendiğini ve metin oluşturduğunu kontrol eder. Bu parametreleri bir model yüklerken iletirsiniz. Bu sayfa her bir parametreyi ve etkisini açıklar.

Parametre Referansı

ParametreTürVarsayılanAralıkAçıklama
Maksimum Tokenint325121–8192Tek bir yanıtta oluşturulacak maksimum token sayısı
Sıcaklıkfloat0.70.0–2.0Rastgeleliği kontrol eder. 0.0 = deterministik. Daha yüksek değerler = daha yaratıcı çıktı
Üst Pfloat0.90.0–1.0Nucleus örnekleme. Yalnızca kümülatif olasılığı bu değeri aşan tokenlar dikkate alınır
Üst Kint32400–200Seçimi en olası ilk K tokene sınırlar. 0 = devre dışı
Tekrar Cezasıfloat1.10.0–3.0Çıktıda zaten görünen tokenları cezalandırır. 1.0 = ceza yok
GPU Katman Sayısıint32-1-1–200GPU'ya yüklenecek model katmanları. -1 = otomatik. 0 = yalnızca CPU
Bağlam Boyutuint322048128–131072Token cinsinden maksimum bağlam penceresi. Daha büyük değerler daha fazla bellek kullanır
Sistem KomutuFString"You are a helpful assistant."Modelin davranışını şekillendiren sistem talimatı
Tohumint32-1-1+Tekrarlanabilir çıktı için rastgele tohum. -1 = rastgele
İş Parçacığı Sayısıint3200–128Üretim için CPU iş parçacıkları. 0 = otomatik

Kullanım

Çıkarım parametreleri, yükleme ve asenkron düğümlerinde bir yapı pini olarak görünür. Tek tek değerleri ayarlamak için yapıyı kırın:

Blueprint'te Çıkarım Parametreleri

Başlangıç noktası olarak varsayılan bir parametre seti elde etmek için Get Default Inference Params kullanın:

Get Default Inference Params

Platform Önerileri

Mobil / VR (Android, iOS, Meta Quest)

  • Bağlam Boyutu: 1024–2048
  • GPU Katmanı Sayısı: 0 (yalnızca CPU) cihazda GPU hesaplama desteği olduğu doğrulanmadıkça
  • Maksimum Token: Duyarlı etkileşimler için 256'nın altında
  • İş Parçacığı Sayısı: 2–4 cihaza bağlı olarak

Masaüstü (Windows, Mac, Linux)

  • Bağlam Boyutu: 2048–8192 çoğu konuşma için
  • GPU Katmanı Sayısı: -1 (otomatik) mevcut olduğunda GPU hızlandırmasından yararlanmak için
  • İş Parçacığı Sayısı: 0 (otomatik)
  • Maksimum Token: 512–2048 daha uzun yanıtlar için