Ana içeriğe geç

Eklenti Nasıl Kullanılır

Bu kılavuz, tüm çalışma zamanı API'sini kapsar: LLM örneği oluşturma, modelleri yükleme, mesaj gönderme, çalışma zamanında modelleri indirme, durum yönetimi ve yardımcı işlevler.

Bir LLM Örneği Oluşturun

Bir Runtime Local LLM nesnesi oluşturarak başlayın. Erken çöp toplama işlemine takılmasını önlemek için ona bir referans tutun (örneğin, Blueprint'lerde bir değişken veya C++'da bir UPROPERTY olarak).

Runtime Local LLM Oluştur

Bir Model Yükle

Mesajları göndermeden önce bir model yüklemeniz gerekir. Eklenti, iş akışınıza bağlı olarak çeşitli yükleme yöntemleri sunar.

İsme Göre Yükle

Modelleri düzenleyici ayarları paneli aracılığıyla yönetiyorsanız, Load Model (By Name) kullanın.

UE 5.4 ve sonrasında, Load Model (By Name) diskteki tüm modellerin bir açılır menüsünü sunar - yüklemek istediğiniz modeli seçmeniz yeterlidir.

Load Model By Name UE 5.4+

Dosya Yolundan Yükle

Bir modeli doğrudan bir .gguf dosyasının mutlak dosya yolundan yükleyin:

Modeli Dosyadan Yükle

Eşzamansız Yükleme (Blueprint)

Çıktı pin'leri aracılığıyla yükleme tamamlanma ve hataları, delegate'leri manuel olarak bağlamak yerine ele almak için iki eşzamansız düğüm mevcuttur.

Load Model By Name (Async), Load Model (By Name) yöntemini yansıtır - UE 5.4+ sürümünde diskteki tüm modellerin bir açılır listesini sunar:

Load Model By Name Async UE 5.4+

Load Model From File (Async) bunun yerine mutlak bir dosya yolu alır:

Load Model From File Async

Olaylara Bağlanma

Geri çağrıları almak için LLM örneğinin delegate'lerine bağlanın. Tüm geri çağrılar oyun iş parçacığında tetiklenir.

Bind Events

Kullanılabilir delegate'ler:

  • On Token Generated: Her çıkış belirteci için tetiklenir
  • On Generation Complete: Tam yanıt hazır olduğunda, süre, belirteç sayısı ve saniyede belirteç ile tetiklenir
  • On Prompt Processed: Giriş istemi işlendikten sonra, üretim başlamadan önce tetiklenir
  • On Error: Herhangi bir işlem sırasında hata oluşursa tetiklenir
  • On Model Loaded: Bir model yüklemeyi tamamladığında tetiklenir
  • On Model Unloaded: Model bellekten kaldırıldığında tetiklenir
  • On Download Progress: Bir model indirme sırasında periyodik olarak tetiklenir (ilerleme oranı, alınan bayt, toplam bayt)
  • On Model Downloaded: Yalnızca indirme işlemi tamamlandığında tetiklenir

Mesaj Gönder

Bir model yüklendiğinde, yanıt oluşturmak için bir kullanıcı mesajı gönderin:

Send Message

Belirli bir mesaj için sistem istemini geçersiz kılmak için Send Message With System Prompt kullanın:

Send Message With System Prompt

Tokenler üretildikçe OnTokenGenerated üzerinden akar. Üretim tamamlandığında, OnGenerationComplete tüm yanıt, süre, token sayısı ve saniye başına token bilgisiyle tetiklenir.

Asenkron Mesaj Gönderme (Blueprint)

Send LLM Message (Async) düğümü, tokenler, tamamlanma ve hatalar için özel çıkış pinleri sağlar:

Asenkron Mesaj Gönderme

Çalışma Zamanında Modelleri İndir

Yukarıda açıklanan indir ve yükle akışına ek olarak, bir modeli yüklemeden diske indirebilirsiniz. Bu, bir yükleme ekranında veya ayarlar menüsünde modelleri ön belleğe almak için kullanışlıdır.

Modeli İndir

Yalnızca URL ile çalışan bir varyant da mevcuttur:

URL'den Model İndir

Download LLM Model (Async) ve Download LLM Model From URL (Async) düğümleri, ilerleme, tamamlanma ve hatalar için çıkış pinleri sağlar:

Asenkron Model İndirme

OnDownloadProgress delegesi indirme sırasında ilerlemeyi bildirir. OnModelDownloaded, dosya diske kaydedildiğinde tetiklenir.

Devam eden bir indirmeyi iptal etmek için:

İndirmeyi İptal Et

Eklenti, aynı model için bir indirme zaten devam ediyorsa, sonraki çağrıları yok sayarak, yinelenen indirmeleri otomatik olarak önler.

Oluşturmayı Durdur

Devam eden bir oluşturmayı yarıda kesmek için:

Oluşturmayı Durdur

Konuşma Bağlamını Sıfırla

Yeni bir konuşma başlatmak için konuşma geçmişini temizleyin:

Bağlamı Sıfırla

Bir Modeli Kaldırma

Bir model artık gerekmediğinde kaynakları serbest bırakın:

Bir Modeli Kaldır

Sorgulama Durumu

LLM örneğinin mevcut durumunu kontrol edin:

Sorgulama Durumu

  • Is Model Loaded: Bir model çıkarım için hazırsa True
  • Is Generating: Oluşturma işlemi devam ediyorsa True
  • Is Busy: Herhangi bir işlem (yükleme, oluşturma, indirme) etkinse True
  • Is Downloading: Bir model indirme işlemi devam ediyorsa True
  • Get Loaded Model Metadata: Mevcut modelin meta verilerini döndürür
  • Get Applied Inference Params: Yükleme sırasında uygulanan parametreleri döndürür

Model Kütüphanesi İşlevleri

Diskteki model dosyalarını yönetmek için bir dizi statik yardımcı işlev sağlanır. Bunlar, model seçim kullanıcı arayüzü oluşturmak veya çalışma zamanında model kullanılabilirliğini kontrol etmek için kullanışlıdır.

Get Downloaded Model Names / Metadata

Get Downloaded Model Names

Get All Downloaded Model Metadata

Disk Üzerindeki Bir Modeli Kontrol Et

Model Disk Üzerinde Mi

Model Dosya Yolunu Al

Model Dosya Yolunu Al

Model Dosyalarını Sil

Model Dosyalarını Sil

Önceden Tanımlanmış ve Mevcut Modelleri Al

Önceden Tanımlanmış Modelleri Al

Tüm Mevcut Modelleri Al

Bir URL'den Meta Veri Oluşturma

Ham bir URL'den bir model meta verisi oluşturma (alanlar dosya adından türetilir):

Make Metadata From URL

Yardımcı Fonksiyonlar

Biçimlendirme ve hata gösterimi için bir dizi yardımcı fonksiyon sunulmaktadır.

Baytları Okunabilir Dizeye Dönüştür

Bayt sayısını insan tarafından okunabilir bir dizeye dönüştürür (örn. "4.07 GB"). Model boyutlarını kullanıcı arayüzünde görüntülemek için kullanışlıdır.

Baytları Okunabilir Dizeye Dönüştür

İndirme İlerlemesini Biçimlendir

İndirme ilerlemesini "1.23 GB / 4.07 GB (%30.2)" gibi bir dize olarak biçimlendirir. Toplam boyut bilinmiyorsa yalnızca alınan miktarı döndürür.

İndirme İlerlemesini Biçimlendir

Hata Açıklaması Al / Hata Kodu Dizesi

Get LLM Error Description bir hata kodu için insan tarafından okunabilir bir metin açıklaması döndürür. Get LLM Error Code String enum değer adını bir dize olarak döndürür (günlük kaydı için kullanışlıdır).

Hata Açıklaması Al

Hata Kodları Referansı

KodDeğerAçıklama
Unknown0Belirtilmemiş bir hata
ModelLoadFailed10GGUF dosyası yüklenemedi (bozuk dosya, uyumsuz format vb.)
ContextCreateFailed11Çıkarım bağlamı oluşturulamadı
ModelNotLoaded20Yüklü bir model olmadan çıkarım denendi
ChatTemplateFailed21Modelin sohbet şablonu uygulanamadı
TokenizationFailed22Giriş metni tokenleştirilemedi
ContextOverflow23İstem + bağlam yapılandırılan bağlam boyutunu aşıyor
PromptDecodeFailed24İstem tokenleri çözülemedi
ContextTooFullToGenerate25Çıktı üretmek için yeterli bağlam alanı kalmadı
GenerationDecodeFailed30Oluşturma sırasında bir token çözülemedi
GenerationTruncated31Maksimum token sınırına ulaşıldığı için oluşturma durduruldu
LLMInstanceNull40LLM örneği null veya geçersiz
ModelNotFoundOnDisk41Model dosyası beklenen yolda mevcut değil
ModelURLEmpty42Boş bir URL ile indirme talep edildi
ModelDownloadCancelled43İndirme iptal edildi
ModelDownloadEmptyData44İndirme tamamlandı ancak yanıt gövdesi boştu
ModelDownloadSaveFailed45İndirme tamamlandı ancak dosya diske kaydedilemedi