0 评论

0 收藏

分享

AI变声器RVC学习资料(可配合数字人系统使用)

一.安装包选择
RVC是个开源软件,我把它放在百度网盘,请自行下载!
点击下载 RVC变声器       提取码:zero
实时变声下载体积最小的版本FasterRVC-RealTime-fix_v1.7z【2.31gb】
需要注意的是:fasterrvc版本目前处于内测,内置可软kiki音频工作室的三款开源模型(可软kiki和关关,分别对应暖,细腻,夹三种特质)。

二.配置参考
推荐配置:
cpu 13600kf  
32gb 的内存
4070ti 的显卡
声卡 icon micu 五代
麦克风 babybootle-u87.
这套配置除了麦克风,都属于高端性价比款,质量不错但不那么贵的选择~扣紧每一个钢镚!
如果需要高强度炼丹,建议直接拉满或者直接云端炼丹~

目前这个软件,需要至少>=4核CPU,>=GTX1060的N卡
通常情况下,实时变声的效果好坏主要取决于CPU的性能,和显卡无关。
显卡的品质决定炼丹(训练模型)的速度而已。

10代以上的I5便可流畅运行RVC+CPU占用不高的。
影响延迟的硬件:CPU
影响音质的硬件:麦克风,声卡以及你的收音环境
独立声卡和麦克风,能够较好的控制底噪杂音。 收音比较好的耳麦效果也是不错的,可以先用虚拟声卡测试下,在考虑升级硬件。

三.安装及设置
下载最新的rvc后解压到本地,不包含中文的路径中。
寻找目录中的“go-realtime-gui”图标,打开后是如下这个界面:
微信截图_20231210182735.jpg



微信截图_20231210182758.jpg

还会跳出一个黑色的命令行窗口,请无视它,但是不要关闭,最小化就行了。

上图中需要填写如下几个:
1.pth文件,软件包内自带3个模型,任选一个即可,选择对应的pth和index
2.index同上,index也是声音模型文件,相对来说不太重要,在视频教程中我会具体说一下它的作用。




四.参数面板设置

1.响应阈值


尽量拉满-60,如果有比较大的环境噪音,
可以通过nvidia broadcast的ai降噪处理噪音,
独立声卡可以接入机架的降噪插件,
但是要注意如果在输入端进行降噪,
可能会出现吞字(也就是声音无法很好的识别),
一般建议输入端稍微加点降噪,根据实际效果自己试验一下,一般不要-60到-50之间
输出端也稍微加点降噪,这样实际效果会好点。
请不要使用RVC软件自带的输入降噪和输出降噪,那个一刀切的比较厉害。
如果打游戏同时开英伟达降噪,游戏对显存要求比较高的话,尽量8gb以上,不然打游戏都会卡的。
需要注意的是:开了nvidia broadcast后,音色会发闷些,无法达到完美的效果。


2.音调设置


数值代表的意义:越高越女性化,越低越男性化。


男转女一般在10~12,在这附近左右调整,分别可以变粗或变细,选好之后就不要动了。


女转男一般在-12~-10左右。


男转男,女转女设置成0即可。


3.index rate


index=0可以大幅度降低CPU占用率,和index比例无关0.01和1的占用率是一样的。
左边是接近底模的音色,右边是接近模型的音色。如果调高不影响口齿,可以略微调高,一般0.2-0.5都是可以的。
如果电脑配置不太好,直接拉到0,可以更流畅。
如果没有要求必须和模型音色有多像,则调0;
调高可以拉进和模型目标音色的相似度,但CPU占用和延迟会略微增加一点。


4.音高算法


不好的音高算法会经常出现哑声的情况 pm对应0416版本。
延迟最低CPU占用最小。
理论上唱歌效果可以,
但说话效果对嘈杂环境不太好;
harvest:最好的音高算法,CPU占用较大,通过调高右侧"harvest进程数"降低延迟;
crepe:效果接近harvest的音高算法,稍吃GPU。


5**.采样长度(决定变声延迟)**


尽量调低一些,只要不卡,但是需要注意如果调太低,cpu占用会很高,如果再打游戏啥的,cpu可能会吃不消。
调得越高,变声结果距离录音时间点越远;
调得太低,假如最下面推理时间经常大于变声延迟,会造成"机关枪"卡顿情况,应调整其他参数降低延迟或调高该参数。


6.harvest进程数(核心内容)
进程数会音响音质,如果对音质有要求,进程数不建议大于4。
如果index=0,进程数不会太影响CPU占用率。
如果index不等于0,则CPU占用率会随着进程数几何倍数增加。
以13700K为例,index=0,8进程,0.12采样,低延迟CPU占用不到30%,但是音质会略微有嘶哑感
index=0.01,0.12采样,8进程 cpu占用100% ,4进程占用50%。


决定音高算法最高占用多少系统线程(最多吃多少比例CPU) 如果有其他任务也要吃CPU,会影响你的工作(比如打游戏),则不宜拉太高;
调低了推理延迟会增大,如果推理延迟不能满足需求则应拉高采样长度,或者更换音高算法;
如果推理延迟已经能满足变声延迟的需求,则建议该选项进行微调,越低越好。


7**.淡入淡出长度**


这个参数拉多拉少影响不大,可以根据感觉来。


8**.额外推理时长**


如硬件条件允许建议拉满,建议至少要留1s,效果越长越好,调高了咬字识别更好。会影响延迟。


9**.推荐设置**


比较适中选择可以根据下图设置,再微调indexrate和采样长度。 参数设置不唯一,在使用模型的过程中可以不断微调。


微信截图_20231210190557.jpg

@版权声明

1、本网站文章、帖子等仅代表作者本人的观点,与本站立场无关。
2、转载或引用本网版权所有之内容须注明“转自(或引自)网”字样,并标明本网网址。
3、本站所有图片和资源来源于用户上传和网络,仅用作展示,如有侵权请联系站长!QQ: 949567133。

回复

举报 使用道具

全部回复
暂无回帖,快来参与回复吧
Master
发表主题 13

自定义网站简介,尾部导航栏链接、文字、图片支持自定义,详细修改方法参考模版安装页下载的教程

Copyright © 2001-2020, Tencent Cloud. Powered by Discuz! X3.4

Archiver|手机版|小黑屋|Zerogofa 泽洛工坊