Chuyển tới nội dung chính

Tham số suy luận

Cấu trúc Tham số Suy luận LLM kiểm soát cách mô hình tải và sinh văn bản. Bạn truyền các tham số này khi tải một mô hình. Trang này mô tả từng tham số và tác dụng của nó.

Tham chiếu Tham số

Tham sốKiểuMặc địnhPhạm viMô tả
Max Tokensint325121–8192Số lượng token tối đa được sinh trong một phản hồi duy nhất
Temperaturefloat0.70.0–2.0Kiểm soát tính ngẫu nhiên. 0.0 = xác định. Giá trị cao hơn = đầu ra sáng tạo hơn
Top Pfloat0.90.0–1.0Lấy mẫu hạt nhân. Chỉ những token có xác suất tích lũy vượt quá giá trị này mới được xem xét
Top Kint32400–200Giới hạn lựa chọn trong số K token có xác suất cao nhất. 0 = tắt
Repeat Penaltyfloat1.10.0–3.0Phạt các token đã xuất hiện trong đầu ra. 1.0 = không phạt
Num GPU Layersint32-1-1–200Các lớp mô hình để chuyển sang GPU. -1 = tự động. 0 = chỉ CPU
Context Sizeint322048128–131072Kích thước cửa sổ ngữ cảnh tối đa tính bằng token. Giá trị lớn hơn sử dụng nhiều bộ nhớ hơn
System PromptFString"You are a helpful assistant."Hướng dẫn hệ thống định hình hành vi của mô hình
Seedint32-1-1+Hạt giống ngẫu nhiên cho đầu ra có thể tái tạo. -1 = ngẫu nhiên
Num Threadsint3200–128Luồng CPU cho quá trình sinh. 0 = tự động

Cách sử dụng

Các tham số suy luận xuất hiện dưới dạng một chân struct trên các node tải và async. Phá vỡ struct để đặt các giá trị riêng lẻ:

Inference Parameters in Blueprint

Để lấy một bộ tham số mặc định làm điểm bắt đầu, hãy sử dụng Get Default Inference Params:

Get Default Inference Params

Đề xuất Nền tảng

Thiết bị Di động / VR (Android, iOS, Meta Quest)

  • Kích thước Ngữ cảnh: 1024–2048
  • Số Lớp GPU: 0 (chỉ CPU) trừ khi thiết bị đã được xác nhận hỗ trợ tính toán GPU
  • Token Tối đa: Dưới 256 để có tương tác phản hồi nhanh
  • Số Luồng: 2–4 tùy thuộc vào thiết bị

Máy tính để bàn (Windows, Mac, Linux)

  • Kích thước Ngữ cảnh: 2048–8192 cho hầu hết các cuộc hội thoại
  • Số Lớp GPU: -1 (tự động) để tận dụng khả năng tăng tốc GPU khi có sẵn
  • Số Luồng: 0 (tự động)
  • Token Tối đa: 512–2048 cho các phản hồi dài hơn