贡献到语音核心

贡献到语音核心

贡献者可以通过两种方式增强语音核心:

  • 改进 TTS 模型

  • 贡献新的语音数据

circle-check

对 TTS 模型的改进

与模型相关的所有文件 必须 被提交。生态系统支持多个服务提供商。以下是它们及其要求的列表:

  • sovits.pth:这是您的主模型文件。确保按照说明将其命名为 "sovits.pth"。

  • reference1.wav:参考音频文件,格式为 .wav。确保文件名与 "config.json" 文件中的引用匹配。

  • gpt.ckpt:模型的检查点文件。确认其命名为 "gpt.ckpt"。

  • config.json:您的模型的配置文件。必须命名为 "config.json"。

下面是完整模型文件夹提交的示例结构。

AudioModelSubmission/
├── sovits.pth                # 主模型文件
├── reference1.wav            # 参考音频文件(名称按 config.json)     
├── gpt.ckpt                  # 模型的检查点文件
└── config.json               # 模型的配置文件

下面是一个示例 config.json 文件。

{
    "refFile": "Olyn.wav",
    "refText": "yet still, I stand, a testiment to the resilience of human spirit"
}

要提交语音模型,请选择语音核心

然后选择 “我有语音模型” 并按照上述指南上传模型文件。

新的语音数据贡献

  • 提交的语音数据必须是合法获取并有权共享的。

  • 获取的语音数据必须来自真实来源。

  • 语音数据应无背景噪音,音频中只保留用于训练的人声。

  • 语音数据必须以 .wav 格式生成。

最后更新于