Voice Core에 기여하기

Voice Core에 기여하기

기여자는 다음 두 가지 방법으로 Voice Core를 강화할 수 있습니다.

  • TTS 모델 개선

  • 새로운 음성 데이터 제공

STT 모델은 현재 Azure 서비스를 활용하므로 이에 대한 기여는 필요하지 않습니다. 정확도는 이미 최적이며 추가 개선이 필요하지 않습니다.

TTS 모델 개선

모델과 관련된 모든 파일을 제출해야 합니다. 에코시스템에서 지원하는 여러 서비스 제공업체가 있습니다. 다음은 그 목록과 요구 사항입니다.

  • sovits.pth: 기본 모델 파일입니다. 지정된 대로 이름이 “sovits.pth”인지 확인합니다.

  • reference1.wav: .wav 형식의 참조 오디오 파일입니다. 파일 이름이 “config.json” 파일의 참조와 일치하는지 확인합니다.

  • gpt.ckpt: 모델의 체크포인트 파일입니다. 이름이 “gpt.ckpt”인지 확인합니다.

  • config.json: 모델의 구성 파일입니다. 이름은 “config.json”로 지정해야 합니다.

다음은 전체 모델의 샘플 폴더 제출을 위한 구조입니다.

AudioModelSubmission/
├── sovits.pth                # The main model file
├── reference1.wav            # Reference audio file (name as per config.json)     
├── gpt.ckpt                  # Checkpoint file for the model
└── config.json               # Configuration file for the model

config.json 파일의 예는 다음과 같습니다.

{
    "refFile": "Olyn.wav",
    "refText": "yet still, I stand, a testiment to the resilience of human spirit"
}

Voice 모델을 제출하려면 Voice Core를 선택합니다

그런 다음 “음성 모델을 얻었습니다”라고 말하고 위에 제공된 지침에 따라 모델 파일을 업로드합니다.

새로운 음성 데이터 기여 (New Voice Data Contribution)

  • 제출된 음성 데이터는 공유할 권리가 있는 합법적으로 취득해야 합니다.

  • 수집된 음성 데이터는 신뢰할 수 있는 소스에서 획득해야 합니다.

  • 음성 데이터, 데이터는 배경 소음이 없어야 하며 학습할 음성만 오디오에 보관됩니다.

  • 음성 데이터는 .wav 형식으로 생성되어야 합니다.

Last updated