STT 모델은 현재 Azure 서비스를 활용하므로 이에 대한 기여는 필요하지 않습니다. 정확도는 이미 최적이며 추가 개선이 필요하지 않습니다.
TTS 모델 개선
모델과 관련된 모든 파일을 제출해야 합니다. 에코시스템에서 지원하는 여러 서비스 제공업체가 있습니다. 다음은 그 목록과 요구 사항입니다.
sovits.pth: 기본 모델 파일입니다. 지정된 대로 이름이 “sovits.pth”인지 확인합니다.
reference1.wav: .wav 형식의 참조 오디오 파일입니다. 파일 이름이 “config.json” 파일의 참조와 일치하는지 확인합니다.
gpt.ckpt: 모델의 체크포인트 파일입니다. 이름이 “gpt.ckpt”인지 확인합니다.
config.json: 모델의 구성 파일입니다. 이름은 “config.json”로 지정해야 합니다.
다음은 전체 모델의 샘플 폴더 제출을 위한 구조입니다.
AudioModelSubmission/
├── sovits.pth # The main model file
├── reference1.wav # Reference audio file (name as per config.json)
├── gpt.ckpt # Checkpoint file for the model
└── config.json # Configuration file for the model
config.json 파일의 예는 다음과 같습니다.
{"refFile":"Olyn.wav","refText":"yet still, I stand, a testiment to the resilience of human spirit"}
model.pth: 기본 모델 파일입니다. 이름은 “model.pth”로 지정해야 합니다.
audio.wav: .wav 형식의 참조 오디오 파일입니다. 이름이 “audio.wav”인지 확인합니다.
vocab.json: 이 JSON 파일에는 TTS 시스템에서 사용하는 어휘가 포함되어 있습니다. 이름은 “vocab.json”로 지정해야 합니다.
config.json: 모델의 구성 파일입니다. 이름은 “config.json”로 지정해야 합니다.
다음은 전체 모델의 샘플 폴더 제출을 위한 구조입니다.
AudioModelProject/
├── model.pth # The main model file
├── audio.wav # Reference audio file
├── vocab.json # Vocabulary file for the TTS system
└── config.json # Configuration file for the model