手機(jī)版 | 網(wǎng)站導(dǎo)航
觀察家網(wǎng) > 消費(fèi) >

RVC小白教程-風(fēng)媽胎教版

嗶哩嗶哩 | 2023-07-08 01:18:36

風(fēng)媽的效果展示:

第一期展示:【交作業(yè)】巨贊的RVC人聲模型效果,煉丹2個(gè)月成品展示?。。嗶哩嗶哩_bilibili


(資料圖片)

第二期展示:【交作業(yè)】挑花眼的RVC女聲模型庫,時(shí)隔一個(gè)月模型大更新??!

第三期展示:【RVC甜妹模型展示】糖果vs布甜?誰是你心中最甜的萌妹音?(直播回放無修音)

第四期展示:【交作業(yè)】7月RVC模型庫,三款模型已開源,十四款上架模型大換血~!_嗶哩嗶哩_bilibili

Notion完整版圖文更全看這里 ,更新更頻繁:

/rvc-ai-9dada6c1293145079166f2601431fe90?pvs=4

一.安裝包選擇

RVC是個(gè)開源軟件,咸魚和淘寶直接賣軟件的都是坑貨,開發(fā)者B站up:花兒不哭,實(shí)時(shí)更新的:

1.風(fēng)仔把官方完整的包上傳到百度網(wǎng)盤啦~大家自?。?/p>

百度網(wǎng)盤鏈接: /s/1dN_gYZaB-5oBKdI1_MQa2w?pwd=5hnw 提取碼: 5hnw夸克網(wǎng)盤鏈接:/s/408171a23723 無需提取碼

實(shí)時(shí)變聲下載體積最小的版本FasterRVC-RealTime-fix_【】

需要注意的是:fasterrvc版本目前處于內(nèi)測,內(nèi)置可軟kiki音頻工作室的三款開源模型(可軟kiki和關(guān)關(guān),分別對應(yīng)暖,細(xì)膩,夾三種特質(zhì)。

2.入夢大大的一鍵包,非常適合萌新快速跳線使用,也是跟隨花兒不哭原版的版本迭代的。

資源站鏈接:/archives/2476/b站教程鏈接:/video/BV1vh4y1X7gH/

二.配置參考

cpu 13600kf ?32gb 的內(nèi)存+4070ti 的顯卡,聲卡 icon micu 五代,麥克風(fēng) babybootle-u87.這套配置除了麥克風(fēng),都屬于高端性價(jià)比款,質(zhì)量不錯(cuò)但不那么貴的選擇~扣緊每一個(gè)鋼镚!

如果需要高強(qiáng)度煉丹,建議直接拉滿或者直接云端煉丹~

麥克風(fēng)的話,風(fēng)仔用的比較貴哈。

目前這個(gè)軟件,需要至少>=4核CPU,>=GTX1060的N卡

通常情況下,實(shí)時(shí)變聲的效果好壞主要取決于CPU的性能,和顯卡無關(guān)。顯卡的品質(zhì)決定煉丹(訓(xùn)練模型)的速度而已。

10代以上的I5便可流暢運(yùn)行RVC+CPU占用不高的。

影響延遲的硬件:CPU

影響音質(zhì)的硬件:麥克風(fēng),聲卡以及你的收音環(huán)境

獨(dú)立聲卡和麥克風(fēng),能夠較好的控制底噪雜音。收音比較好的耳麥效果也是不錯(cuò)的,可以先用虛擬聲卡測試下,在考慮升級硬件。

三.安裝及設(shè)置

下載最新的fastrvc后解壓到本地,不包含中文的路徑中。

鏈接: /s/1dN_gYZaB-5oBKdI1_MQa2w?pwd=5hnw 提取碼: 5hnw

也可以使用入夢大大的安裝包,可以快速設(shè)置輸入輸出通道。

尋找目錄中的“go-realtime-gui”圖標(biāo),打開后是如下這個(gè)界面:

還會跳出一個(gè)黑色的命令行窗口,請無視它。

上圖中需要填寫如下幾個(gè):

文件,軟件包內(nèi)自帶3個(gè)模型,任選一個(gè)即可,選擇對于的pth和index

同上;

四.輸入輸出通道設(shè)置(請對號入座)

1.虛擬聲卡,不走機(jī)架的安裝使用方法:voicemeeter安裝包鏈接:

鏈接: /s/1qcpyw0xo7zkX7_ILqfzM7g?pwd=d9ee 提取碼: d9ee

2.如果是獨(dú)立聲卡,走機(jī)架進(jìn)行設(shè)置:

這個(gè)調(diào)試略復(fù)雜,也是目前阻礙大部分小白們成功搞事情的關(guān)鍵點(diǎn),up也是在大佬的幫助下搞定的,如果自己實(shí)在搞不定,可以有償找高手調(diào)下哈~

五.參數(shù)面板設(shè)置

1.響應(yīng)閾值

盡量拉滿-60,如果有比較大的環(huán)境噪音,可以通過nvidia broadcast的ai降噪處理噪音,獨(dú)立聲卡可以接入機(jī)架的降噪插件,但是要注意如果在輸入端進(jìn)行降噪,可能會出現(xiàn)吞字(也就是聲音無法很好的識別),一般建議輸入端稍微加點(diǎn)降噪,輸出端也稍微加點(diǎn)降噪,這樣實(shí)際效果會好點(diǎn)。請不要使用RVC軟件自帶的輸入降噪和輸出降噪,那個(gè)一刀切的比較厲害。

如果打游戲同時(shí)開英偉達(dá)降噪,游戲?qū)︼@存要求比較高的話,盡量8gb以上,不然打游戲都會卡的。需要注意的是:開了nvidia broadcast后,音色會發(fā)悶些,無法達(dá)到完美的效果。

2.音調(diào)設(shè)置

數(shù)值代表的意義:越高越女性化,越低越男性化。

男轉(zhuǎn)女一般在10~12,在這附近左右調(diào)整,分別可以變粗或變細(xì),選好之后就不要?jiǎng)恿恕?/p>

女轉(zhuǎn)男一般在-12~-10左右。

rate

index=0可以大幅度降低CPU占用率,和index比例無關(guān)和1的占用率是一樣的。

左邊是接近底模的音色,右邊是接近模型的音色。如果調(diào)高不影響口齒,可以略微調(diào)高,一般都是可以的。如果電腦配置不太好,直接拉到0,可以更流暢。如果沒有要求必須和模型音色有多像,則調(diào)0;調(diào)高可以拉進(jìn)和模型目標(biāo)音色的相似度,但CPU占用和延遲會略微增加一點(diǎn)。

4.音高算法

不好的音高算法會經(jīng)常出現(xiàn)啞聲的情況pm對應(yīng)0416版本。延遲最低CPU占用最小。理論上唱歌效果可以,但說話效果對嘈雜環(huán)境不太好;harvest:最好的音高算法,CPU占用較大,通過調(diào)高右側(cè)"harvest進(jìn)程數(shù)"降低延遲;crepe:效果接近harvest的音高算法,稍吃GPU。

5**.采樣長度(決定變聲延遲)**

盡量調(diào)低一些,只要不卡,但是需要注意如果調(diào)太低,cpu占用會很高,如果再打游戲啥的,cpu可能會吃不消。調(diào)得越高,變聲結(jié)果距離錄音時(shí)間點(diǎn)越遠(yuǎn);調(diào)得太低,假如最下面推理時(shí)間經(jīng)常大于變聲延遲,會造成"機(jī)關(guān)槍"卡頓情況,應(yīng)調(diào)整其他參數(shù)降低延遲或調(diào)高該參數(shù)。

進(jìn)程數(shù)(核心內(nèi)容)

進(jìn)程數(shù)會音響音質(zhì),如果對音質(zhì)有要求,進(jìn)程數(shù)不建議大于4。

如果index=0,進(jìn)程數(shù)不會太影響CPU占用率。

如果index不等于0,則CPU占用率會隨著進(jìn)程數(shù)幾何倍數(shù)增加。

以13700K為例,index=0,8進(jìn)程,采樣,低延遲CPU占用不到30%,但是音質(zhì)會略微有嘶啞感

index=,采樣,8進(jìn)程 cpu占用100% ,4進(jìn)程占用50%。

決定音高算法最高占用多少系統(tǒng)線程(最多吃多少比例CPU)如果有其他任務(wù)也要吃CPU,會影響你的工作(比如打游戲),則不宜拉太高;調(diào)低了推理延遲會增大,如果推理延遲不能滿足需求則應(yīng)拉高采樣長度,或者更換音高算法;如果推理延遲已經(jīng)能滿足變聲延遲的需求,則建議該選項(xiàng)進(jìn)行微調(diào),越低越好。

7**.淡入淡出長度**

這個(gè)參數(shù)拉多拉少影響不大,可以根據(jù)感覺來。

8**.額外推理時(shí)長**

如硬件條件允許建議拉滿,建議至少要留1s,效果越長越好,調(diào)高了咬字識別更好。會影響延遲。

9**.推薦設(shè)置**

比較適中選擇可以根據(jù)下圖設(shè)置,再微調(diào)indexrate和采樣長度。參數(shù)設(shè)置不唯一,在使用模型的過程中可以不斷微調(diào),這也是種樂趣~(? ?_?)?

六.煉丹步驟詳解

第一步:打開(在實(shí)時(shí)變聲旁邊)進(jìn)入煉丹爐;

第二步:等待網(wǎng)頁自動(dòng)打開后點(diǎn)擊“訓(xùn)練

第三步:填寫紅框框中的內(nèi)容

紅框框圖

1.實(shí)驗(yàn)名:注意英文格式喲~比如這里填寫:”superkeruan“,煉一個(gè)超級可軟模型~2.輸入文件夾路徑:注意要把文件夾放在桌面上,且保持純英文路徑,如果不在桌面,非常容易無法讀取并報(bào)錯(cuò)?。?!

素材長度建議:至少30分鐘,無底噪的無損音頻(wav后綴)文件,且你用來干啥的,就用干啥的素材,比如我要用來唱歌,那么素材盡量都是唱歌的素材,這樣契合度更高~

風(fēng)仔建議這個(gè)文件夾里的文件提前用“格式工廠”進(jìn)行切片處理,切成10秒一段,并且是wav的無損音頻格式,這樣方便比讓rvc自己切跑得更快速~

格式工廠切片步驟圖

3.依次點(diǎn)擊處理數(shù)據(jù),特征提取后設(shè)置step3的紅框部分。

4.第三步中的參數(shù)說明~

保存頻率:建議拉滿50(拉太低硬盤不夠用喲~如果拉很低,煉1個(gè)丹就需要幾十上百gb的容量存放)

總訓(xùn)練輪數(shù):200-500輪,低于100輪效果一般不太行,除非是v2底模,超過500輪如果素材數(shù)量不夠多,往往白費(fèi)力氣~

每張顯卡的bitch-size:這個(gè)根據(jù)顯卡的顯存設(shè)置,風(fēng)仔12gb顯存,煉丹只敢開9gb,不然啥都干不了,一旦爆顯存,丹就白煉了~

最后點(diǎn)擊:一件訓(xùn)練,當(dāng)個(gè)甩手掌柜吧~

第四步:驗(yàn)收環(huán)節(jié):

最終成品包含3個(gè)文件,分別是pth文件,index文件,npy文件。pth文件仔根目錄下的weights中,index和npy文件則在根目錄的logs—supersoft(實(shí)驗(yàn)名文件夾)下。

(? ?_?)?好好保存,每一個(gè)成品都是顯卡努力的結(jié)晶~文件請保持英文目錄~方便每次使用~

七.融丹步驟

1.為什么需要融丹?

本質(zhì)上,rvc比sovits的優(yōu)越點(diǎn),就在于底模和自煉模型的融合,在較低成本(素材和輪數(shù))上保持一個(gè)較好的效果。

融丹一方面可以讓模型的聲音的音域更加的寬廣,比如一個(gè)偏低沉的模型和一個(gè)偏嘹亮的模型,融合后就能生成一個(gè)兩邊都能get到的模型。另一方面,也可以讓音色具有多重屬性,比如可軟的暖和元?dú)鈱傩裕约発iki的細(xì)膩和委婉。融合后,會同時(shí)感覺到這些特質(zhì),可能有些比較木耳的同學(xué),不能一下子聽出來,但是當(dāng)同時(shí)聽到這些聲音的時(shí)候,就會產(chǎn)生比較明顯的對比。

演示視頻:【頂級RVC實(shí)時(shí)變聲模型展示】最暖亮和最細(xì)柔的少御音,可軟和KiKi的不同配方展示~_嗶哩嗶哩_bilibili

需要注意的是,融丹不是百分之百會提升,經(jīng)常會出現(xiàn)古神低語的現(xiàn)象,或者融合后反而音色模糊的情況,需要多次抽卡嘗試~

2.融丹步驟肢解版(? ?_?)?

打開煉丹爐(根目錄下的),點(diǎn)擊ckpt處理,填寫如圖內(nèi)容。

a.填寫標(biāo)號1和2處的文件路徑,請注意,包含文件名稱和后綴,且不能包含中文,否則會報(bào)錯(cuò);

b.在標(biāo)號3處選擇配方,從1:9到9:1,想怎么參和都行~后續(xù)需要在推理界面,一個(gè)一個(gè)試聽;

c.填寫標(biāo)號4處保存模型名稱,注意不帶后綴!

d.點(diǎn)擊標(biāo)號5處的融合按鈕。

最終標(biāo)號6處,輸出結(jié)果為成功(? ?_?)?,文件自動(dòng)生成在weights目錄內(nèi),刷新推理頁面的音色,即可在下拉頁面中查看這個(gè)模型,請嚴(yán)格按照以上步驟,基本不會報(bào)錯(cuò)~

八.常見問題Q&A

1.為什么模型在跑了發(fā)不出聲、有回音、復(fù)讀機(jī)、或者自己能聽到變聲其他人聽不見?

基本都是跳線問題,按照輸入輸出通道設(shè)置重新檢查一遍,或?qū)で蟠罄袔椭?/p>

2.說話好卡,是不是模型有問題?

實(shí)時(shí)卡的原因一般有幾種:

模型問題(素材太少缺字缺音色)

響應(yīng)閾值太高(輕的聲音進(jìn)不來)建議都拉滿-60

麥克風(fēng)輸入音量太小(設(shè)備輸入音量盡量拉到最大,如果覺得吵可以調(diào)小輸出)。

模型問題可以用推理來排除,如果推理效果正常即可排除。

3.qq說話音條帶電,怎么回事?

QQ音條老問題,推薦解決方式:

·虛擬聲卡重啟后再試;

·其他建議同時(shí)打開常見語音軟件(YY,TT等)頻道自由麥;

4.同樣的模型其他人很好聽,我就很奇怪?

變聲除了音色以外,語氣和流暢度也是很重要的。因?yàn)楸O(jiān)聽有延遲,剛使用可能會有點(diǎn)不適應(yīng),可以調(diào)小監(jiān)聽提升流暢度。語氣問題emm…..(大老粗語氣變軟妹還是有點(diǎn)難度

5.煉丹后沒有index文件怎么辦?

首先重新填寫之前煉丹時(shí)相同的數(shù)據(jù)地址,然后依次操作

①點(diǎn)擊處理數(shù)據(jù)

②點(diǎn)擊特征提取

③點(diǎn)擊訓(xùn)練特征索引

這是就會很快的提取出來一份index文件,出現(xiàn)在你的logs文件夾下的對應(yīng)實(shí)驗(yàn)名下。

九.待更新列表

已經(jīng)攢錢買到生產(chǎn)力顯卡了,感謝各位大佬的支持~

想入手一個(gè)精品模型和代煉丹的大佬,可以聯(lián)系qq501212576,本up在線接單喲~

標(biāo)簽:

  • 標(biāo)簽:中國觀察家網(wǎng),商業(yè)門戶網(wǎng)站,新聞,專題,財(cái)經(jīng),新媒體,焦點(diǎn),排行,教育,熱點(diǎn),行業(yè),消費(fèi),互聯(lián)網(wǎng),科技,國際,文化,時(shí)事,社會,國內(nèi),健康,產(chǎn)業(yè)資訊,房產(chǎn),體育。

相關(guān)推薦