VIST_fast_fine_tuning
clone人聲的部分,因為在colab上執行要花很久的時間,會強烈建議就分段執行,參考最下那那個說明影片。
另外因為第五個步驟已經失效,所以會建議直接在windows中使用inference最新的版本(約1.2G)來做測試與輸出。
VITS-fast-fine-tuning https://github.com/Plachtaa/VITS-fast-fine-tuning
inference webui https://github.com/Plachtaa/VITS-fast-fine-tuning/releases/tag/webui-v1.1
模型下載 G_latest.pth 與 finetune_speaker.json,放到inference的資料夾跟目錄內
這個教學講得更清楚