Chuyển tới nội dung chính

Nhà cung cấp Dịch thuật

AI Localization Automator hỗ trợ năm nhà cung cấp AI khác nhau, mỗi nhà cung cấp có thế mạnh và tùy chọn cấu hình riêng. Hãy chọn nhà cung cấp phù hợp nhất với nhu cầu, ngân sách và yêu cầu chất lượng của dự án.

Ollama (AI Cục bộ)

Phù hợp nhất cho: Các dự án nhạy cảm về quyền riêng tư, dịch thuật ngoại tuyến, sử dụng không giới hạn

Ollama chạy các mô hình AI cục bộ trên máy của bạn, cung cấp quyền riêng tư và kiểm soát hoàn toàn mà không có chi phí API hoặc yêu cầu kết nối internet.

  • translategemma:12b (Mô hình dịch thuật chuyên biệt dựa trên Gemma 3)
  • llama3.2 (Khuyến nghị đa năng)
  • mistral (Giải pháp thay thế hiệu quả)
  • codellama (Dịch thuật nhận biết mã nguồn)
  • Và nhiều mô hình cộng đồng khác

Tùy chọn Cấu hình

  • Base URL: Máy chủ Ollama cục bộ (mặc định: http://localhost:11434)
  • Model: Tên của mô hình đã cài đặt cục bộ (bắt buộc)
  • Use Chat API: Bật để xử lý hội thoại tốt hơn
  • Temperature: 0.0-2.0 (khuyến nghị 0.3)
  • Max Tokens: 1-8.192 token
  • Context Size: 512-32.768 token
  • Request Timeout: 10-300 giây (mô hình cục bộ có thể chậm hơn)
  • Enable Streaming: Để xử lý phản hồi theo thời gian thực

Điểm Mạnh

  • ✅ Quyền riêng tư hoàn toàn (không có dữ liệu rời khỏi máy của bạn)
  • ✅ Không có chi phí API hoặc giới hạn sử dụng
  • ✅ Hoạt động ngoại tuyến
  • ✅ Kiểm soát hoàn toàn các tham số mô hình
  • ✅ Nhiều loại mô hình cộng đồng
  • ✅ Không bị phụ thuộc vào nhà cung cấp

Cân nhắc

  • 💻 Yêu cầu thiết lập cục bộ và phần cứng có khả năng đáp ứng
  • ⚡ Nhìn chung chậm hơn các nhà cung cấp đám mây
  • 🔧 Yêu cầu thiết lập kỹ thuật nhiều hơn
  • 📊 Chất lượng dịch thuật thay đổi đáng kể tùy theo mô hình (một số có thể vượt quá các nhà cung cấp đám mây)
  • 💾 Yêu cầu dung lượng lưu trữ lớn cho các mô hình

Thiết lập Ollama

  1. Cài đặt Ollama: Tải xuống từ ollama.ai và cài đặt trên hệ thống của bạn
  2. Tải xuống Mô hình: Sử dụng ollama pull translategemma:12b để tải xuống mô hình bạn đã chọn
  3. Khởi động Máy chủ: Ollama chạy tự động hoặc khởi động bằng ollama serve
  4. Cấu hình Plugin: Đặt base URL và tên mô hình trong cài đặt plugin
  5. Kiểm tra Kết nối: Plugin sẽ xác minh kết nối khi bạn áp dụng cấu hình

OpenAI

Phù hợp nhất cho: Chất lượng dịch thuật tổng thể cao nhất, lựa chọn mô hình phong phú

OpenAI cung cấp các mô hình ngôn ngữ hàng đầu trong ngành thông qua Chat Completions API, bao gồm các mô hình GPT mới nhất, mô hình suy luận và mô hình hỗ trợ tìm kiếm web.

Các Mô hình Khả dụng

Dòng GPT-5 (Mô hình chủ lực)

  • gpt-5, gpt-5-mini, gpt-5-nano
  • gpt-5.1, gpt-5.2, gpt-5.3-chat-latest
  • gpt-5.4, gpt-5.4-mini, gpt-5.4-nano

Dòng GPT-4.1 (Hiệu suất cao)

  • gpt-4.1, gpt-4.1-mini, gpt-4.1-nano

Dòng GPT-4o (Đa phương thức)

  • gpt-4o, gpt-4o-mini, chatgpt-4o-latest

Dòng O-Series (Mô hình suy luận — không hỗ trợ temperature/top_p)

  • o1, o1-pro, o3, o3-mini, o4-mini

Mô hình Tìm kiếm Web (Không hỗ trợ Temperature/top_p)

  • gpt-5-search-api, gpt-4o-search-preview, gpt-4o-mini-search-preview

Kế thừa / Xem trước

  • gpt-4.5-preview, gpt-4, gpt-4-32k, gpt-4-turbo, gpt-3.5-turbo, gpt-3.5-turbo-16k

Tùy chọn Cấu hình

  • API Key: Khóa API OpenAI của bạn (bắt buộc)
  • Base URL: Điểm cuối API (mặc định: https://api.openai.com/v1/chat/completions)
  • Model: Chọn từ các mô hình khả dụng được liệt kê ở trên
  • Use Temperature: Bật/tắt tham số temperature (tự động bỏ qua đối với mô hình suy luận dòng o-series và tìm kiếm web)
  • Temperature: 0.0–2.0 (khuyến nghị 0.3 cho tính nhất quán dịch thuật)
  • Top P: Tham số lấy mẫu hạt nhân 0.0–1.0 (bỏ qua đối với mô hình suy luận dòng o-series và tìm kiếm web)
  • Max Completion Tokens: 1–128.000 token (bao gồm cả token đầu ra và token suy luận)
  • Request Timeout: 5–300 giây

Điểm Mạnh

  • ✅ Chất lượng dịch thuật cao nhất quán
  • ✅ Hiểu ngữ cảnh xuất sắc
  • ✅ Giữ nguyên định dạng mạnh mẽ
  • ✅ Hỗ trợ nhiều ngôn ngữ
  • ✅ Thời gian hoạt động API đáng tin cậy

Cân nhắc

  • 💰 Chi phí cao hơn cho mỗi yêu cầu
  • 🌐 Yêu cầu kết nối internet
  • ⏱️ Giới hạn sử dụng dựa trên cấp độ

Anthropic Claude

Phù hợp nhất cho: Dịch thuật tinh tế, nội dung sáng tạo, ứng dụng tập trung vào an toàn

Các mô hình Claude vượt trội trong việc hiểu ngữ cảnh và sắc thái, khiến chúng trở nên lý tưởng cho các trò chơi có cốt truyện nặng và các tình huống bản địa hóa phức tạp.

Các Mô hình Khả dụng

Dòng Claude 4.6 (Mới nhất)

  • claude-opus-4-6, claude-sonnet-4-6

Dòng Claude 4.5

  • claude-haiku-4-5 (Nhanh và hiệu quả)
  • claude-sonnet-4-5, claude-opus-4-5

Dòng Claude 4.x

  • claude-sonnet-4-0, claude-opus-4-1, claude-opus-4-0

Dòng Claude 3.x (Kế thừa)

  • claude-3-7-sonnet-latest, claude-3-5-haiku-latest, claude-3-opus-latest

Tùy chọn Cấu hình

  • API Key: Khóa API Anthropic của bạn (bắt buộc)
  • Base URL: Điểm cuối API Claude
  • Model: Chọn từ dòng mô hình Claude
  • Temperature: 0.0–1.0 (khuyến nghị 0.3)
  • Top K: Tham số lấy mẫu Top-K (0 = không được đặt)
  • Max Tokens: 1–64.000 token
  • Request Timeout: 5–300 giây
  • Anthropic Version: Tiêu đề phiên bản API

Điểm Mạnh

  • ✅ Nhận thức ngữ cảnh đặc biệt
  • ✅ Tuyệt vời cho nội dung sáng tạo/cốt truyện
  • ✅ Tính năng an toàn mạnh mẽ
  • ✅ Khả năng suy luận chi tiết (suy nghĩ mở rộng trên các mô hình 3.7+)
  • ✅ Tuân thủ hướng dẫn xuất sắc

Cân nhắc

  • 💰 Mô hình định giá cao cấp
  • 🌐 Yêu cầu kết nối internet
  • 📏 Giới hạn token thay đổi theo mô hình

DeepSeek

Phù hợp nhất cho: Dịch thuật tiết kiệm chi phí, thông lượng cao, các dự án có ngân sách hạn chế

DeepSeek cung cấp chất lượng dịch thuật cạnh tranh với chi phí chỉ bằng một phần nhỏ so với các nhà cung cấp khác, lý tưởng cho các dự án bản địa hóa quy mô lớn.

Các Mô hình Khả dụng

  • deepseek-chat (Đa năng, khuyến nghị)
  • deepseek-reasoner (Khả năng suy luận nâng cao)

Tùy chọn Cấu hình

  • API Key: Khóa API DeepSeek của bạn (bắt buộc)
  • Base URL: Điểm cuối API DeepSeek
  • Model: Chọn giữa mô hình chat và reasoner
  • Temperature: 0.0-2.0 (khuyến nghị 0.3)
  • Max Tokens: 1-8.192 token
  • Request Timeout: 5-300 giây

Điểm Mạnh

  • ✅ Rất tiết kiệm chi phí
  • ✅ Chất lượng dịch thuật tốt
  • ✅ Thời gian phản hồi nhanh
  • ✅ Cấu hình đơn giản
  • ✅ Giới hạn tốc độ cao

Cân nhắc

  • 📏 Giới hạn token thấp hơn
  • 🆕 Nhà cung cấp mới hơn (ít thành tích hơn)
  • 🌐 Yêu cầu kết nối internet

Google Gemini

Phù hợp nhất cho: Các dự án đa ngôn ngữ, dịch thuật tiết kiệm chi phí, tích hợp hệ sinh thái Google

Các mô hình Gemini cung cấp khả năng đa ngôn ngữ mạnh mẽ với giá cả cạnh tranh và các tính năng độc đáo như chế độ suy nghĩ để tăng cường suy luận.

Các Mô hình Khả dụng

Dòng Gemini 3.x (Xem trước)

  • gemini-3.1-pro-preview, gemini-3-pro-preview, gemini-3-flash-preview

Dòng Gemini 2.5 (Hỗ trợ suy nghĩ)

  • gemini-2.5-pro (Chủ lực với suy nghĩ)
  • gemini-2.5-flash (Nhanh, hỗ trợ suy nghĩ)
  • gemini-2.5-flash-lite (Biến thể nhẹ)

Dòng Gemini 2.0

  • gemini-2.0-flash, gemini-2.0-flash-lite

Bí danh Mới nhất

  • gemini-flash-latest, gemini-flash-lite-latest

Tùy chọn Cấu hình

  • API Key: Khóa API Google AI của bạn (bắt buộc)
  • Base URL: Điểm cuối API Gemini
  • Model: Chọn từ dòng mô hình Gemini
  • Temperature: 0.0–2.0 (khuyến nghị 0.3)
  • Max Output Tokens: 1–8.192 token
  • Request Timeout: 5–300 giây
  • Enable Thinking: Kích hoạt suy luận nâng cao cho các mô hình 2.5+
  • Thinking Budget: Kiểm soát phân bổ token suy nghĩ (0 = không suy nghĩ)

Điểm Mạnh

  • ✅ Hỗ trợ đa ngôn ngữ mạnh mẽ
  • ✅ Giá cả cạnh tranh
  • ✅ Suy luận nâng cao (chế độ suy nghĩ)
  • ✅ Tích hợp hệ sinh thái Google
  • ✅ Cập nhật mô hình thường xuyên với quyền truy cập xem trước các mô hình mới nhất

Cân nhắc

  • 🧠 Chế độ suy nghĩ làm tăng mức sử dụng token
  • 📏 Giới hạn token thay đổi theo mô hình
  • 🌐 Yêu cầu kết nối internet

Chọn Nhà cung cấp Phù hợp

Nhà cung cấpPhù hợp nhất choChất lượngChi phíThiết lậpQuyền riêng tư
OllamaQuyền riêng tư/ngoại tuyếnThay đổi*Miễn phíNâng caoCục bộ
OpenAIChất lượng cao nhất⭐⭐⭐⭐⭐💰💰💰Dễ dàngĐám mây
ClaudeNội dung sáng tạo⭐⭐⭐⭐⭐💰💰💰💰Dễ dàngĐám mây
DeepSeekDự án ngân sách⭐⭐⭐⭐💰Dễ dàngĐám mây
GeminiĐa ngôn ngữ⭐⭐⭐⭐💰Dễ dàngĐám mây

*Chất lượng cho Ollama thay đổi đáng kể dựa trên mô hình cục bộ được sử dụng - một số mô hình cục bộ hiện đại có thể sánh ngang hoặc vượt quá các nhà cung cấp đám mây.

Mẹo Cấu hình Nhà cung cấp

Đối với Tất cả Nhà cung cấp Đám mây:

  • Lưu trữ khóa API một cách an toàn và không commit chúng vào hệ thống kiểm soát phiên bản
  • Bắt đầu với cài đặt temperature thận trọng (0.3) để có bản dịch nhất quán
  • Theo dõi mức sử dụng và chi phí API của bạn
  • Kiểm tra với các lô nhỏ trước khi chạy dịch thuật lớn

Đối với Ollama:

  • Đảm bảo RAM đầy đủ (khuyến nghị 8GB+ cho các mô hình lớn hơn)
  • Sử dụng bộ nhớ SSD để tải mô hình tốt hơn
  • Cân nhắc tăng tốc GPU để suy luận nhanh hơn
  • Kiểm tra cục bộ trước khi dựa vào nó cho các bản dịch sản xuất