Nhà cung cấp Dịch thuật
AI Localization Automator hỗ trợ năm nhà cung cấp AI khác nhau, mỗi nhà cung cấp có thế mạnh và tùy chọn cấu hình riêng. Hãy chọn nhà cung cấp phù hợp nhất với nhu cầu, ngân sách và yêu cầu chất lượng của dự án.
Ollama (AI Cục bộ)
Phù hợp nhất cho: Các dự án nhạy cảm về quyền riêng tư, dịch thuật ngoại tuyến, sử dụng không giới hạn
Ollama chạy các mô hình AI cục bộ trên máy của bạn, cung cấp quyền riêng tư và kiểm soát hoàn toàn mà không có chi phí API hoặc yêu cầu kết nối internet.
Các Mô hình Phổ biến
- translategemma:12b (Mô hình dịch thuật chuyên biệt dựa trên Gemma 3)
- llama3.2 (Khuyến nghị đa năng)
- mistral (Giải pháp thay thế hiệu quả)
- codellama (Dịch thuật nhận biết mã nguồn)
- Và nhiều mô hình cộng đồng khác

Tùy chọn Cấu hình
- Base URL: Máy chủ Ollama cục bộ (mặc định:
http://localhost:11434) - Model: Tên của mô hình đã cài đặt cục bộ (bắt buộc)
- Use Chat API: Bật để xử lý hội thoại tốt hơn
- Temperature: 0.0-2.0 (khuyến nghị 0.3)
- Max Tokens: 1-8.192 token
- Context Size: 512-32.768 token
- Request Timeout: 10-300 giây (mô hình cục bộ có thể chậm hơn)
- Enable Streaming: Để xử lý phản hồi theo thời gian thực
Điểm Mạnh
- ✅ Quyền riêng tư hoàn toàn (không có dữ liệu rời khỏi máy của bạn)
- ✅ Không có chi phí API hoặc giới hạn sử dụng
- ✅ Hoạt động ngoại tuyến
- ✅ Kiểm soát hoàn toàn các tham số mô hình
- ✅ Nhiều loại mô hình cộng đồng
- ✅ Không bị phụ thuộc vào nhà cung cấp
Cân nhắc
- 💻 Yêu cầu thiết lập cục bộ và phần cứng có khả năng đáp ứng
- ⚡ Nhìn chung chậm hơn các nhà cung cấp đám mây
- 🔧 Yêu cầu thiết lập kỹ thuật nhiều hơn
- 📊 Chất lượng dịch thuật thay đổi đáng kể tùy theo mô hình (một số có thể vượt quá các nhà cung cấp đám mây)
- 💾 Yêu cầu dung lượng lưu trữ lớn cho các mô hình
Thiết lập Ollama
- Cài đặt Ollama: Tải xuống từ ollama.ai và cài đặt trên hệ thống của bạn
- Tải xuống Mô hình: Sử dụng
ollama pull translategemma:12bđể tải xuống mô hình bạn đã chọn - Khởi động Máy chủ: Ollama chạy tự động hoặc khởi động bằng
ollama serve - Cấu hình Plugin: Đặt base URL và tên mô hình trong cài đặt plugin
- Kiểm tra Kết nối: Plugin sẽ xác minh kết nối khi bạn áp dụng cấu hình
OpenAI
Phù hợp nhất cho: Chất lượng dịch thuật tổng thể cao nhất, lựa chọn mô hình phong phú
OpenAI cung cấp các mô hình ngôn ngữ hàng đầu trong ngành thông qua Chat Completions API, bao gồm các mô hình GPT mới nhất, mô hình suy luận và mô hình hỗ trợ tìm kiếm web.
Các Mô hình Khả dụng
Dòng GPT-5 (Mô hình chủ lực)
- gpt-5, gpt-5-mini, gpt-5-nano
- gpt-5.1, gpt-5.2, gpt-5.3-chat-latest
- gpt-5.4, gpt-5.4-mini, gpt-5.4-nano
Dòng GPT-4.1 (Hiệu suất cao)
- gpt-4.1, gpt-4.1-mini, gpt-4.1-nano
Dòng GPT-4o (Đa phương thức)
- gpt-4o, gpt-4o-mini, chatgpt-4o-latest
Dòng O-Series (Mô hình suy luận — không hỗ trợ temperature/top_p)
- o1, o1-pro, o3, o3-mini, o4-mini
Mô hình Tìm kiếm Web (Không hỗ trợ Temperature/top_p)
- gpt-5-search-api, gpt-4o-search-preview, gpt-4o-mini-search-preview
Kế thừa / Xem trước
- gpt-4.5-preview, gpt-4, gpt-4-32k, gpt-4-turbo, gpt-3.5-turbo, gpt-3.5-turbo-16k

Tùy chọn Cấu hình
- API Key: Khóa API OpenAI của bạn (bắt buộc)
- Base URL: Điểm cuối API (mặc định:
https://api.openai.com/v1/chat/completions) - Model: Chọn từ các mô hình khả dụng được liệt kê ở trên
- Use Temperature: Bật/tắt tham số temperature (tự động bỏ qua đối với mô hình suy luận dòng o-series và tìm kiếm web)
- Temperature: 0.0–2.0 (khuyến nghị 0.3 cho tính nhất quán dịch thuật)
- Top P: Tham số lấy mẫu hạt nhân 0.0–1.0 (bỏ qua đối với mô hình suy luận dòng o-series và tìm kiếm web)
- Max Completion Tokens: 1–128.000 token (bao gồm cả token đầu ra và token suy luận)
- Request Timeout: 5–300 giây
Điểm Mạnh
- ✅ Chất lượng dịch thuật cao nhất quán
- ✅ Hiểu ngữ cảnh xuất sắc
- ✅ Giữ nguyên định dạng mạnh mẽ
- ✅ Hỗ trợ nhiều ngôn ngữ
- ✅ Thời gian hoạt động API đáng tin cậy
Cân nhắc
- 💰 Chi phí cao hơn cho mỗi yêu cầu
- 🌐 Yêu cầu kết nối internet
- ⏱️ Giới hạn sử dụng dựa trên cấp độ
Anthropic Claude
Phù hợp nhất cho: Dịch thuật tinh tế, nội dung sáng tạo, ứng dụng tập trung vào an toàn
Các mô hình Claude vượt trội trong việc hiểu ngữ cảnh và sắc thái, khiến chúng trở nên lý tưởng cho các trò chơi có cốt truyện nặng và các tình huống bản địa hóa phức tạp.
Các Mô hình Khả dụng
Dòng Claude 4.6 (Mới nhất)
- claude-opus-4-6, claude-sonnet-4-6
Dòng Claude 4.5
- claude-haiku-4-5 (Nhanh và hiệu quả)
- claude-sonnet-4-5, claude-opus-4-5
Dòng Claude 4.x
- claude-sonnet-4-0, claude-opus-4-1, claude-opus-4-0
Dòng Claude 3.x (Kế thừa)
- claude-3-7-sonnet-latest, claude-3-5-haiku-latest, claude-3-opus-latest

Tùy chọn Cấu hình
- API Key: Khóa API Anthropic của bạn (bắt buộc)
- Base URL: Điểm cuối API Claude
- Model: Chọn từ dòng mô hình Claude
- Temperature: 0.0–1.0 (khuyến nghị 0.3)
- Top K: Tham số lấy mẫu Top-K (0 = không được đặt)
- Max Tokens: 1–64.000 token
- Request Timeout: 5–300 giây
- Anthropic Version: Tiêu đề phiên bản API
Điểm Mạnh
- ✅ Nhận thức ngữ cảnh đặc biệt
- ✅ Tuyệt vời cho nội dung sáng tạo/cốt truyện
- ✅ Tính năng an toàn mạnh mẽ
- ✅ Khả năng suy luận chi tiết (suy nghĩ mở rộng trên các mô hình 3.7+)
- ✅ Tuân thủ hướng dẫn xuất sắc
Cân nhắc
- 💰 Mô hình định giá cao cấp
- 🌐 Yêu cầu kết nối internet
- 📏 Giới hạn token thay đổi theo mô hình
DeepSeek
Phù hợp nhất cho: Dịch thuật tiết kiệm chi phí, thông lượng cao, các dự án có ngân sách hạn chế
DeepSeek cung cấp chất lượng dịch thuật cạnh tranh với chi phí chỉ bằng một phần nhỏ so với các nhà cung cấp khác, lý tưởng cho các dự án bản địa hóa quy mô lớn.
Các Mô hình Khả dụng
- deepseek-chat (Đa năng, khuyến nghị)
- deepseek-reasoner (Khả năng suy luận nâng cao)

Tùy chọn Cấu hình
- API Key: Khóa API DeepSeek của bạn (bắt buộc)
- Base URL: Điểm cuối API DeepSeek
- Model: Chọn giữa mô hình chat và reasoner
- Temperature: 0.0-2.0 (khuyến nghị 0.3)
- Max Tokens: 1-8.192 token
- Request Timeout: 5-300 giây
Điểm Mạnh
- ✅ Rất tiết kiệm chi phí
- ✅ Chất lượng dịch thuật tốt
- ✅ Thời gian phản hồi nhanh
- ✅ Cấu hình đơn giản
- ✅ Giới hạn tốc độ cao
Cân nhắc
- 📏 Giới hạn token thấp hơn
- 🆕 Nhà cung cấp mới hơn (ít thành tích hơn)
- 🌐 Yêu cầu kết nối internet
Google Gemini
Phù hợp nhất cho: Các dự án đa ngôn ngữ, dịch thuật tiết kiệm chi phí, tích hợp hệ sinh thái Google
Các mô hình Gemini cung cấp khả năng đa ngôn ngữ mạnh mẽ với giá cả cạnh tranh và các tính năng độc đáo như chế độ suy nghĩ để tăng cường suy luận.
Các Mô hình Khả dụng
Dòng Gemini 3.x (Xem trước)
- gemini-3.1-pro-preview, gemini-3-pro-preview, gemini-3-flash-preview
Dòng Gemini 2.5 (Hỗ trợ suy nghĩ)
- gemini-2.5-pro (Chủ lực với suy nghĩ)
- gemini-2.5-flash (Nhanh, hỗ trợ suy nghĩ)
- gemini-2.5-flash-lite (Biến thể nhẹ)
Dòng Gemini 2.0
- gemini-2.0-flash, gemini-2.0-flash-lite
Bí danh Mới nhất
- gemini-flash-latest, gemini-flash-lite-latest

Tùy chọn Cấu hình
- API Key: Khóa API Google AI của bạn (bắt buộc)
- Base URL: Điểm cuối API Gemini
- Model: Chọn từ dòng mô hình Gemini
- Temperature: 0.0–2.0 (khuyến nghị 0.3)
- Max Output Tokens: 1–8.192 token
- Request Timeout: 5–300 giây
- Enable Thinking: Kích hoạt suy luận nâng cao cho các mô hình 2.5+
- Thinking Budget: Kiểm soát phân bổ token suy nghĩ (0 = không suy nghĩ)
Điểm Mạnh
- ✅ Hỗ trợ đa ngôn ngữ mạnh mẽ
- ✅ Giá cả cạnh tranh
- ✅ Suy luận nâng cao (chế độ suy nghĩ)
- ✅ Tích hợp hệ sinh thái Google
- ✅ Cập nhật mô hình thường xuyên với quyền truy cập xem trước các mô hình mới nhất
Cân nhắc
- 🧠 Chế độ suy nghĩ làm tăng mức sử dụng token
- 📏 Giới hạn token thay đổi theo mô hình
- 🌐 Yêu cầu kết nối internet
Chọn Nhà cung cấp Phù hợp
| Nhà cung cấp | Phù hợp nhất cho | Chất lượng | Chi phí | Thiết lập | Quyền riêng tư |
|---|---|---|---|---|---|
| Ollama | Quyền riêng tư/ngoại tuyến | Thay đổi* | Miễn phí | Nâng cao | Cục bộ |
| OpenAI | Chất lượng cao nhất | ⭐⭐⭐⭐⭐ | 💰💰💰 | Dễ dàng | Đám mây |
| Claude | Nội dung sáng tạo | ⭐⭐⭐⭐⭐ | 💰💰💰💰 | Dễ dàng | Đám mây |
| DeepSeek | Dự án ngân sách | ⭐⭐⭐⭐ | 💰 | Dễ dàng | Đám mây |
| Gemini | Đa ngôn ngữ | ⭐⭐⭐⭐ | 💰 | Dễ dàng | Đám mây |
*Chất lượng cho Ollama thay đổi đáng kể dựa trên mô hình cục bộ được sử dụng - một số mô hình cục bộ hiện đại có thể sánh ngang hoặc vượt quá các nhà cung cấp đám mây.
Mẹo Cấu hình Nhà cung cấp
Đối với Tất cả Nhà cung cấp Đám mây:
- Lưu trữ khóa API một cách an toàn và không commit chúng vào hệ thống kiểm soát phiên bản
- Bắt đầu với cài đặt temperature thận trọng (0.3) để có bản dịch nhất quán
- Theo dõi mức sử dụng và chi phí API của bạn
- Kiểm tra với các lô nhỏ trước khi chạy dịch thuật lớn
Đối với Ollama:
- Đảm bảo RAM đầy đủ (khuyến nghị 8GB+ cho các mô hình lớn hơn)
- Sử dụng bộ nhớ SSD để tải mô hình tốt hơn
- Cân nhắc tăng tốc GPU để suy luận nhanh hơn
- Kiểm tra cục bộ trước khi dựa vào nó cho các bản dịch sản xuất