AI变声器RVC学习资料（可配合数字人系统使用）

Master123 · 发布于 2023-12-10 18:20:15

一.安装包选择
RVC是个开源软件，我把它放在百度网盘，请自行下载！
点击下载 RVC变声器

2023-12-10 18:19 上传
文件大小: 未知
下载次数: 3
提取码: zero
RVC变声器

提取码：zero
实时变声下载体积最小的版本FasterRVC-RealTime-fix_v1.7z【2.31gb】
需要注意的是：fasterrvc版本目前处于内测，内置可软kiki音频工作室的三款开源模型（可软kiki和关关，分别对应暖，细腻，夹三种特质）。

二.配置参考
推荐配置：
cpu 13600kf
32gb 的内存
4070ti 的显卡
声卡 icon micu 五代
麦克风 babybootle-u87.
这套配置除了麦克风，都属于高端性价比款，质量不错但不那么贵的选择~扣紧每一个钢镚！
如果需要高强度炼丹，建议直接拉满或者直接云端炼丹~

目前这个软件，需要至少>=4核CPU，>=GTX1060的N卡
通常情况下，实时变声的效果好坏主要取决于CPU的性能，和显卡无关。
显卡的品质决定炼丹（训练模型）的速度而已。

10代以上的I5便可流畅运行RVC+CPU占用不高的。
影响延迟的硬件：CPU
影响音质的硬件：麦克风，声卡以及你的收音环境
独立声卡和麦克风，能够较好的控制底噪杂音。收音比较好的耳麦效果也是不错的，可以先用虚拟声卡测试下，在考虑升级硬件。

三.安装及设置
下载最新的rvc后解压到本地，不包含中文的路径中。
寻找目录中的“go-realtime-gui”图标，打开后是如下这个界面：
微信截图_20231210182735.jpg

还会跳出一个黑色的命令行窗口，请无视它，但是不要关闭，最小化就行了。

上图中需要填写如下几个：
1.pth文件，软件包内自带3个模型，任选一个即可，选择对应的pth和index
2.index同上，index也是声音模型文件，相对来说不太重要，在视频教程中我会具体说一下它的作用。

四.参数面板设置

1.响应阈值

尽量拉满-60，如果有比较大的环境噪音，
可以通过nvidia broadcast的ai降噪处理噪音，
独立声卡可以接入机架的降噪插件，
但是要注意如果在输入端进行降噪，
可能会出现吞字（也就是声音无法很好的识别），
一般建议输入端稍微加点降噪，根据实际效果自己试验一下，一般不要-60到-50之间
输出端也稍微加点降噪，这样实际效果会好点。
请不要使用RVC软件自带的输入降噪和输出降噪，那个一刀切的比较厉害。
如果打游戏同时开英伟达降噪，游戏对显存要求比较高的话，尽量8gb以上，不然打游戏都会卡的。
需要注意的是：开了nvidia broadcast后，音色会发闷些，无法达到完美的效果。

2.音调设置

数值代表的意义：越高越女性化，越低越男性化。

男转女一般在10~12，在这附近左右调整，分别可以变粗或变细，选好之后就不要动了。

女转男一般在-12~-10左右。

男转男，女转女设置成0即可。

3.index rate

index=0可以大幅度降低CPU占用率，和index比例无关0.01和1的占用率是一样的。
左边是接近底模的音色，右边是接近模型的音色。如果调高不影响口齿，可以略微调高，一般0.2-0.5都是可以的。
如果电脑配置不太好，直接拉到0，可以更流畅。
如果没有要求必须和模型音色有多像，则调0；
调高可以拉进和模型目标音色的相似度，但CPU占用和延迟会略微增加一点。

4.音高算法

不好的音高算法会经常出现哑声的情况 pm对应0416版本。
延迟最低CPU占用最小。
理论上唱歌效果可以，
但说话效果对嘈杂环境不太好；
harvest：最好的音高算法，CPU占用较大，通过调高右侧"harvest进程数"降低延迟；
crepe：效果接近harvest的音高算法，稍吃GPU。

5**.采样长度（决定变声延迟）**

尽量调低一些，只要不卡，但是需要注意如果调太低，cpu占用会很高，如果再打游戏啥的，cpu可能会吃不消。
调得越高，变声结果距离录音时间点越远；
调得太低，假如最下面推理时间经常大于变声延迟，会造成"机关枪"卡顿情况，应调整其他参数降低延迟或调高该参数。

6.harvest进程数（核心内容）
进程数会音响音质，如果对音质有要求，进程数不建议大于4。
如果index=0，进程数不会太影响CPU占用率。
如果index不等于0，则CPU占用率会随着进程数几何倍数增加。
以13700K为例，index=0，8进程，0.12采样，低延迟CPU占用不到30%，但是音质会略微有嘶哑感
index=0.01，0.12采样，8进程 cpu占用100% ，4进程占用50%。

决定音高算法最高占用多少系统线程（最多吃多少比例CPU）如果有其他任务也要吃CPU，会影响你的工作（比如打游戏），则不宜拉太高；
调低了推理延迟会增大，如果推理延迟不能满足需求则应拉高采样长度，或者更换音高算法；
如果推理延迟已经能满足变声延迟的需求，则建议该选项进行微调，越低越好。

7**.淡入淡出长度**

这个参数拉多拉少影响不大，可以根据感觉来。

8**.额外推理时长**

如硬件条件允许建议拉满，建议至少要留1s，效果越长越好，调高了咬字识别更好。会影响延迟。

9**.推荐设置**

比较适中选择可以根据下图设置，再微调indexrate和采样长度。参数设置不唯一，在使用模型的过程中可以不断微调。

微信截图_20231210190557.jpg