Chuyển tới nội dung chính

Tổng quan

Tài liệu Runtime AI Chatbot Integrator

Runtime AI Chatbot Integrator là một plugin Unreal Engine đa nền tảng cho phép tích hợp liền mạch các chatbot AI và dịch vụ chuyển văn bản thành giọng nói trực tiếp vào dự án của bạn. Plugin hỗ trợ nhiều nhà cung cấp AI hàng đầu và cung cấp các tương tác trò chuyện linh hoạt với cả chế độ phản hồi streaming và không streaming, cũng như chuyển đổi văn bản thành giọng nói chất lượng cao với khả năng streaming.

Các Tính năng Được Hỗ trợ

Trò chuyện Văn bản-Với-Văn bản

Tích hợp khả năng đàm thoại do AI hỗ trợ với nhiều nhà cung cấp hàng đầu.

OpenAI

  • GPT-5.5
  • GPT-5.4
  • GPT-5.4 Mini
  • GPT-5.4 Nano
  • GPT-5.3
  • GPT-5.2
  • GPT-5.1
  • GPT-5
  • GPT-5 Mini
  • GPT-5 Nano
  • GPT-4-1
  • GPT-4-1 Mini
  • GPT-4-1 Nano
  • GPT-4o
  • GPT-4o Mini
  • GPT-4
  • GPT-4 Turbo
  • GPT-4-32k
  • GPT-3.5 Turbo
  • GPT-3.5 Turbo 16k
  • ChatGPT-4o Mới nhất
  • O1
  • O1 Pro
  • O3
  • O3 Mini
  • O4 Mini

Claude (Anthropic)

  • Claude 4.8 Opus
  • Claude 4.7 Opus
  • Claude 4.6 Opus
  • Claude 4.6 Sonnet
  • Claude 4.5 Haiku
  • Claude 4.5 Sonnet
  • Claude 4.5 Opus
  • Claude 4.1 Opus
  • Claude 4 Sonnet
  • Claude 4.0 Opus
  • Claude 3.7 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Opus

DeepSeek

  • DeepSeek V4 Pro
  • DeepSeek V4 Flash
  • DeepSeek Chat
  • DeepSeek Reasoner (với đầu ra suy luận chuyên dụng)

Gemini (Google)

  • Gemini 3.1 Pro
  • Gemini 3.1 Flash Light
  • Gemini 3.5 Flash
  • Gemini 2.5 Pro
  • Gemini Flash Mới nhất
  • Gemini Flash Lite Mới nhất
  • Gemini 2.5 Flash
  • Gemini 2.5 Flash Lite
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash Lite

Grok (xAI)

  • Grok 4.3
  • Grok 4.1 Fast Reasoning
  • Grok 4.1 Fast Non-Reasoning
  • Grok 4 Fast Reasoning
  • Grok 4 Fast Non-Reasoning
  • Grok Code Fast 1
  • Grok 4 0709
  • Grok 3
  • Grok 3 Mini
  • Grok 2 Vision 1212

Ollama

Chạy các mô hình AI cục bộ với quyền riêng tư hoàn toàn và không cần khóa API:

  • Bất kỳ mô hình nào có sẵn trong thư viện Ollama (ví dụ: Llama 3, Mistral, Gemma, Phi, Qwen, và nhiều hơn nữa)
  • Các mô hình tùy chỉnh và tinh chỉnh được lưu trữ cục bộ

Chuyển văn bản thành giọng nói (TTS)

Chuyển đổi văn bản thành giọng nói tự nhiên bằng cách sử dụng các nhà cung cấp TTS hàng đầu, với cả tùy chọn tiêu chuẩn và streaming.

OpenAI TTS

Nhiều tùy chọn giọng nói với hỗ trợ thông thường và streaming:

  • Alloy
  • Ash
  • Ballad
  • Coral
  • Echo
  • Fable
  • Onyx
  • Nova
  • Sage
  • Shimmer
  • Verse

Các mô hình:

  • TTS-1
  • TTS-1-HD
  • GPT-4o Mini TTS

ElevenLabs TTS

Nhiều mô hình với hỗ trợ thông thường và streaming:

  • Eleven V3 (Mô hình mới nhất với khả năng tạo giọng nói giống người và biểu cảm, hỗ trợ 70+ ngôn ngữ)
  • Eleven TTV V3 (Mô hình Text to Voice design với giọng nói giống người và biểu cảm, hỗ trợ 70+ ngôn ngữ)
  • Eleven Multilingual V2 (Mô hình sống động nhất với biểu cảm cảm xúc phong phú)
  • Eleven Turbo V2 (Mô hình chất lượng cao, độ trễ thấp được tối ưu hóa cho tiếng Anh)
  • Eleven Turbo V2.5 (Mô hình chất lượng cao, độ trễ thấp với hỗ trợ đa ngôn ngữ)
  • Eleven Flash V2 (Mô hình siêu nhanh được tối ưu hóa cho sử dụng thời gian thực bằng tiếng Anh)
  • Eleven Flash V2.5 (Mô hình siêu nhanh được tối ưu hóa cho sử dụng thời gian thực với hỗ trợ đa ngôn ngữ)
  • Eleven Monolingual V1

Google Cloud TTS

Giọng nói neural chất lượng cao với hỗ trợ ngôn ngữ rộng rãi:

  • Giọng nói Neural2
  • Giọng nói Studio
  • Giọng nói Wavenet
  • Giọng nói Chuẩn
  • Hỗ trợ Giọng nói Tùy chỉnh
  • Nhiều ngôn ngữ và ngữ vực
  • Hỗ trợ SSML để kiểm soát chi tiết

Azure TTS

Dịch vụ giọng nói nhận thức của Microsoft với nhiều tùy chọn giọng nói:

  • Giọng nói neural trên nhiều ngôn ngữ
  • Phong cách giọng nói và cảm xúc
  • Hỗ trợ giọng nói tùy chỉnh
  • Hỗ trợ đánh dấu SSML

Các Tính năng Chính

  • Khả năng tương thích đa nền tảng (Windows, Mac, Android, iOS, Linux, Meta Quest, và nhiều hơn nữa)
  • Hỗ trợ nhiều nhà cung cấp AI và TTS
  • Hỗ trợ mô hình cục bộ qua Ollama (không cần khóa API, quyền riêng tư hoàn toàn)
  • Phản hồi trò chuyện streaming và không streaming
  • TTS streaming để tổng hợp và xử lý âm thanh thời gian thực
  • Hỗ trợ mô hình suy luận với đầu ra suy luận và nội dung riêng biệt (DeepSeek, Grok)
  • Tổng hợp giọng nói chất lượng cao với độ trễ tối thiểu
  • Tích hợp dễ dàng với Blueprints và C++ của Unreal Engine
  • Tùy chọn cấu hình linh hoạt
  • Hỗ trợ 70+ ngôn ngữ với các mô hình ElevenLabs V3
  • Khám phá và liệt kê giọng nói cho Google Cloud và Azure TTS

Điều kiện Tiên quyết

Để sử dụng plugin, bạn cần có thông tin xác thực truy cập API từ một trong các nhà cung cấp được hỗ trợ:

Để xử lý âm thanh, bạn có thể tự triển khai giải pháp của mình hoặc sử dụng plugin Runtime Audio Importer, plugin này có thể nhập dữ liệu âm thanh ở nhiều định dạng khác nhau (MP3, WAV, FLAC, OGG VORBIS, OGG OPUS, BINK, RAW (PCM)). Để biết thêm thông tin, hãy xem tại đây.

Tài nguyên Bổ sung

Join our Discord
online · support