RVCのページです。とりあえず、読めばRVCでボーカルと音楽の分離とボイスチェンジができるようになれると思います。インテルのCPUのみで動きますのでご安心を。
推奨スペック:Windows10以降メモリー16GB以上、SSD空き容量100GB以上それ以下だとほぼ動きません。Pythonを入れておいて下さい。ちょっと古いバージョンでやらないと動かないかもです。この通りやれば動くと思います。
RVCのページです。とりあえず、読めばRVCでボーカルと音楽の分離とボイスチェンジができるようになれると思います。インテルのCPUのみで動きますのでご安心を。
推奨スペック:Windows10以降メモリー16GB以上、SSD空き容量100GB以上それ以下だとほぼ動きません。Pythonを入れておいて下さい。ちょっと古いバージョンでやらないと動かないかもです。この通りやれば動くと思います。
まずはdownloadしましょう。Releases · RVC-Project/Retrieval-based-Voice-Conversion-WebUI URLに飛びましょうね。で、一番上のバージョンのIntelGPUusersをダウンロードします。これがCPU向けのやつです。
圧縮率の高い7zipで圧縮されていても結構容量ありますし、時間かかりますからティータイムがてら、プロジェクトXオウムvs科捜研でも見ましょう。7zipはなぜかWindows標準の展開じゃ開けませんでした。7zip-Download ここら辺を使ってください。64bitのやつを選んでください。あとはパス指定で展開できると思います。Cドライブ直下に設置し、フォルダー名には半角英数字のみを使用して下さい。動かなくなります。これはどんなAIも共通の基本です。
展開するとこんな感じなので、go-wab.batを実行しましょう。
開きましたね。
じゃあ、こっからはモデル制作です。好きな女優でもいいので、mp3とかwavで15秒くらいの音声を20個くらい用意してRVCフォルダー下に新しくフォルダーを作って格納、フォルダーのパスを取っておいてください。
以下の通りに捜査して下さい。
モデル名適当、40k、true、v2、CPUスレッドは11から14推奨、さっきコピーしたパスを米須玄氏の代わりに入れましょう。データ処理ボタンを押す。all-doneとか出るまで待ちます。特徴抽出ボタンを押す。
エポック頻度は途中で止まってもデータが定期的に保存されるよってやつだけど、それは考え方であって、途中でタブを閉じたりすると修復不可能になるんで、50にしておきましょう。そうエポック数は300以上を推奨するけど、CPUだと10時間くらいかかります。テストなら20でOK。GPUバッチサイズはCPUなら1にしないと死にます。あとはそのまま、ワンクリックトレーニングボタンを押しましょう。全行程完了と出たら終了です。
ちゃっちゃと行きましょう。次は音声分離です。伴奏ボーカル分離のタブを開いて画像の左下のファイル選択から変換したい音源を選択しましょう。このファイルもC直下半角英数字名ですよ。(これって、誰かに歌ってみたをさせたいときとかに変換後の音声が音楽だったら声だけを使うからやるんだからね。説明下手ですいません。まあ、わからないんじゃやっても意味ないかぁ。)モデルはHP2 を選択しましょう。結局これが一番性能よかった。エコー削除の奴はダメすぎた。変換ボタンをおして、下にログが出るまで待ちましょう。
RVC/OPTのフォルダにあるvocal-----みたいなファイルのパスをコピーしておいてください。
最終工程、モデル推論タブです。
音源推論はモデルを作ったときにモデル名を指定したと思うので、それを選択して下さい。あれ、自分で作ったのじゃないのもあるぞ、、、。元々誰かの声のモデルがあったのね。
ピッチ変更は変換前後で性別が変わるなら操作します。男→女12、その逆なら-12にします。
さっきコピーしたvocalのパスをペースト、その下のインデックスパスは空で、さらに下のドロップダウンで推論音源のところで選んだモデルと同じ名前のインデックスファイルを選びましょう。
他はいじらずに変換ボタンを押します。3分の曲だとCPUなら10分で変換が終わります。
mp3で出力されるのでダウンロードして下さい。自動では保存されないです。
これにてRVC完璧です。
あと、ネットからモデルをダウンロードしたときは、indexファイルは/logs/モデル名のフォルダ/に、phtファイルは/assets/weights/のところに入れましょう。そうすると普通に推論タブのところで選択できます。