补充预处理文档

This commit is contained in:
babysor00 2021-10-12 09:22:10 +08:00
parent 81befb91b0
commit a824b54122

View File

@ -34,8 +34,10 @@
#### 2.1 使用数据集自己训练合成器模型与2.2二选一) #### 2.1 使用数据集自己训练合成器模型与2.2二选一)
* 下载 数据集并解压:确保您可以访问 *train* 文件夹中的所有音频文件(如.wav * 下载 数据集并解压:确保您可以访问 *train* 文件夹中的所有音频文件(如.wav
* 进行音频和梅尔频谱图预处理: * 进行音频和梅尔频谱图预处理:
`python pre.py <datasets_root>` `python pre.py <datasets_root> -d {dataset} -n {number}`
可以传入参数 --dataset `{dataset}` 支持 aidatatang_200zh, magicdata, aishell3 可传入参数:
* -d`{dataset}` 指定数据集,支持 aidatatang_200zh, magicdata, aishell3, 不传默认为aidatatang_200zh
* -n `{number}` 指定并行数CPU 11770k + 32GB实测10没有问题
> 假如你下载的 `aidatatang_200zh`文件放在D盘`train`文件路径为 `D:\data\aidatatang_200zh\corpus\train` , 你的`datasets_root`就是 `D:\data\` > 假如你下载的 `aidatatang_200zh`文件放在D盘`train`文件路径为 `D:\data\aidatatang_200zh\corpus\train` , 你的`datasets_root`就是 `D:\data\`
* 训练合成器: * 训练合成器: