Common Voiceのデータセット の一部を使ってトレーニングした RVC (Retrieval-based-Voice-Conversion) 用 PyTorch モデルデータ(5種)
Retrieval-based-Voice-Conversion-WebUI や VC Client を使用して声質変換ができます。
次元数:256次元
サンプリングレート:40k
音高ガイド:有
MIT License
common-voice_001.pth : 女性風①
common-voice_002.pth : 女性風②
common-voice_003.pth : 男性風①
common-voice_004.pth : 男性風②
common-voice_005.pth : 子供風?
rinna社が公開した日本語の音声に特化した事前学習モデルを使用したウェイトです
次元数:256次元
サンプリングレート:48k
音高ガイド:有
MIT License
common-voice_006[rinna][48k].pth : 女性風
common-voice_007[rinna][48k].pth : 男性風
入力1の変換例 : pitch+0
入力2の変換例 : pitch+12
入力1の変換例 : pitch+0
入力2の変換例 : pitch+12
入力1の変換例 : pitch-12
入力2の変換例 : pitch+0
入力1の変換例 : pitch-12
入力2の変換例 : pitch+0
入力1の変換例 : pitch+5
入力2の変換例 : pitch+15
MIT License
2023/04/22 : 公開しました
2023/05/13 : 日本語HuBERT(rinna/japanese-hubert-base) 版 2種を追加
2024/05/07 : ページ内の音声ファイル埋め込み方法をiframeに変更