Перейти к основному содержимому

Runtime Local LLM

Документация для плагина Runtime Local LLM.

Join our Discord
online · support

📄️Параметры инференса

Подробный справочник по всем параметрам инференса LLM, включая температуру, top-p, top-k, штраф за повторение, выгрузку слоев на GPU, размер контекста, сид и количество потоков, с рекомендациями для конкретных платформ, мобильных устройств, VR и настольных компьютеров.