음성 모델 사용 방법

모델 선택, 다운로드 및 패키징

이 플러그인은 여러 언어, 음성, 품질을 지원합니다. 에디터의 플러그인 설정을 통해 필요한 음성 모델을 쉽게 다운로드하고 관리할 수 있습니다. 음성 모델을 선택, 다운로드 및 스테이징하려면 다음 단계를 따르세요.

에디터에서 프로젝트 설정을 열고 플러그인 -> Runtime Text To Speech로 이동합니다.
다운로드 가능한 음성 모델 목록에서, 다운로드하려는 음성 모델 옆의 다운로드 버튼을 클릭합니다. 여러 음성 모델을 동시에 다운로드할 수 있습니다.
다운로드가 완료되면 모델이 목록 상단의 다운로드된 음성 모델 섹션에 나타나며, 프로젝트에서 사용할 수 있게 됩니다.
선택적으로, 텍스트 필드에 텍스트를 입력하고 재생 버튼을 클릭하여 다운로드된 음성 모델을 미리 들어볼 수 있습니다. 그러면 선택한 음성 모델을 사용해 텍스트가 합성되어 재생됩니다. 이 기능은 에디터 내에서 음성 모델이 기대한 대로 들리는지 테스트하는 데 유용합니다.

다운로드한 음성 모델을 삭제하려면, 제거할 모델 옆의 Delete 버튼을 클릭하세요.

다운로드된 모든 음성 모델은 프로젝트와 함께 패키징되므로, 프로젝트 크기를 줄이려면 더 이상 필요하지 않은 음성 모델을 삭제하세요.

사전에 포함된 모델과 함께 제공되는 모든 언어 목록은 지원되는 언어를 참조하세요.

사용자 정의 음성 모델 가져오기

사전 구성된 음성 모델 외에도 자신만의 사용자 지정 음성 모델을 가져올 수 있습니다. 이는 사전 구성 목록에 없는 음성을 사용하거나, 기본 제공되지 않는 언어에 대한 지원을 추가하려는 경우 유용합니다(기본 음소 변환기에서 지원하는 추가 언어 목록을 보려면 추가 지원 언어 목록을 참조하세요).

플러그인은 Piper와 Kokoro 음성 모델 형식을 모두 지원합니다:

플러그인 설정에서 화면 상단의 사용자 정의 음성 모델 가져오기 버튼을 클릭합니다.
나타나는 대화 상자에서 모델 유형(Piper 또는 Kokoro)을 선택합니다.
모델 파일을 찾아 선택합니다:
- Piper의 경우: ONNX 형식 모델 파일(*.onnx) 선택
- Kokoro의 경우: BIN 형식 스타일 파일(*.bin) 선택
해당 설정 파일(*.json) 탐색 및 선택:
- Piper의 경우: 여기에는 샘플 속도, 음소 매핑, 추론 매개변수와 같은 설정이 포함됩니다.
- Kokoro의 경우: 여기에는 토크나이저 구성이 포함됩니다.
Kokoro 모델의 경우, 언어 코드(예: en-us, en-gb-x-rp, fr, es 등)를 지정하세요.
Import를 클릭하여 사용자 지정 음성 모델을 프로젝트에 추가하세요.

커스텀 음성 모델 참고 사항

Piper 모델: Piper 호환 ONNX 모델을 해당 JSON 구성 파일과 함께 사용할 수 있습니다. 이는 사전 구성된 목록에 없는 음성이나 사용자 지정 훈련 음성에 유용합니다. Hugging Face에서 커뮤니티가 훈련한 Piper 모델을 찾거나 이 가이드를 사용하여 직접 훈련할 수 있습니다.
Kokoro 모델: 이 모델들은 두 부분으로 구성된 시스템을 사용합니다: 스타일 파일(BIN 형식)과 공유 ONNX 모델입니다. Kokoro 스타일 파일을 처음 가져올 때, 플러그인은 필요한 ONNX 모델을 자동으로 다운로드하도록 제안합니다.
언어 코드: Kokoro 모델의 경우, 올바른 음소 변환을 위해 언어 코드가 중요합니다. 일반 코드에는 다음이 포함됩니다:
- 영어 (미국): en-us
- 영어 (영국): en-gb-x-rp
- 스페인어: es
- 프랑스어: fr
- 이탈리아어: it
- 포르투갈어 (브라질): pt-br
- 중국어 (만다린): cmn
- 힌디어: hi
- 독일어: de

사용자 정의 음성 모델은 다운로드된 모델과 동일하게 취급되며 프로젝트와 함께 패키징됩니다.

모델 선택, 다운로드 및 패키징​

사용자 정의 음성 모델 가져오기​

커스텀 음성 모델 참고 사항​

모델 선택, 다운로드 및 패키징

사용자 정의 음성 모델 가져오기

커스텀 음성 모델 참고 사항