음성 모델 사용 방법
모델 선택, 다운로드 및 패키징
이 플러그인은 여러 언어, 음성 및 품질을 지원합니다. 에디터 내 플러그인 설정을 통해 필요한 음성 모델을 쉽게 다운로드하고 관리할 수 있습니다. 음성 모델을 선택, 다운로드 및 준비하려면 다음 단계를 따르세요:
- 에디터에서 프로젝트 설정을 열고 Plugins -> Runtime Text To Speech로 이동합니다.
- Available Voice Models to Download 목록에서 다운로드할 음성 모델 옆의 Download 버튼을 클릭합니다. 여러 음성 모델을 동시에 다운로드할 수 있습니다.
- 다운로드가 완료되면 모델은 목록 상단의 Downloaded Voice Models 섹션에 나타나며 프로젝트에서 사용할 수 있게 됩니다.
- 선택적으로, 다운로드한 음성 모델을 텍스트 필드에 텍스트를 입력하고 Play 버튼을 클릭하여 미리 들어볼 수 있습니다. 이 기능은 선택한 음성 모델로 텍스트를 합성하여 재생하므로, 에디터 내에서 음성 모델이 예상대로 들리는지 테스트하는 데 유용합니다.
다운로드한 음성 모델을 삭제하려면 삭제할 모델 옆의 Delete 버튼을 클릭하세요.
모든 다운로드된 음성 모델은 프로젝트와 함께 패키징되므로, 프로젝트 크기를 줄이려면 더 이상 필요하지 않은 음성 모델을 삭제하세요.
커스텀 음성 모델 임포트
사전 구성된 음성 모델 외에도 자신만의 커스텀 음성 모델을 임포트할 수 있습니다. 이 플러그인은 Piper와 Kokoro 음성 모델 형식을 모두 지원합니다:
- 플러그인 설정에서 화면 상단의 Import Custom Voice Model 버튼을 클릭합니다.
- 나타나는 대화 상자에서 모델 유형(Piper 또는 Kokoro)을 선택합니다.
- 모델 파일을 찾아 선택합니다:
- Piper: ONNX 형식 모델 파일(*.onnx) 선택
- Kokoro: BIN 형식 스타일 파일(*.bin) 선택
- 해당 구성 파일(*.json)을 찾아 선택합니다:
- Piper: 샘플 속도, 음소 매핑 및 추론 매개변수와 같은 설정 포함
- Kokoro: 토크나이저 구성 포함
- Kokoro 모델의 경우 언어 코드(예: en-us, en-gb-x-rp, fr, es 등)를 지정합니다.
- Import를 클릭하여 커스텀 음성 모델을 프로젝트에 추가합니다.
커스텀 음성 모델 참고 사항
-
Piper 모델: 커스텀으로 훈련된 Piper 음성 모델을 사용할 수 있으며, 이는 자신만의 음성을 훈련했거나 사전 구성 목록에 없는 특정 음성이 필요한 경우에 특히 유용합니다. ONNX 모델과 JSON 구성 파일은 Piper 형식과 호환되어야 합니다.
-
Kokoro 모델: 이러한 모델은 두 부분으로 구성된 시스템을 사용합니다: 스타일 파일(BIN 형식)과 공유 ONNX 모델. Kokoro 스타일 파일을 처음 임포트할 때 플러그인은 필요한 ONNX 모델을 자동으로 다운로드하도록 제안합니다.
-
언어 코드: Kokoro 모델의 경우 음소 변환을 위해 언어 코드가 중요합니다. 일반적인 코드는 다음과 같습니다:
- 영어(미국):
en-us
- 영어(영국):
en-gb-x-rp
- 스페인어:
es
- 프랑스어:
fr
- 이탈리아어:
it
- 포르투갈어(브라질):
pt-br
- 중국어(만다린):
cmn
- 힌디어:
hi
- 독일어:
de
- 영어(미국):
커스텀 음성 모델은 다운로드한 모델과 동일하게 처리되며 프로젝트와 함께 패키징됩니다.