Formosa Speech Recognition Challenge 2025 - Hakka ASR II
以實驗室的 2080Ti 跑台語 LLaMA3.1 8B q4_k_m or Gemma3 Q8量化版
目前是用 IMA語料跟教典例句,使用 LoRA 訓練,看起來是已經有樣子了。但因為訓練語料太少,當然還有很多問題跟限制。例如,它其實還沒有太多台灣的知識。
也先跟大家說一下,請不要直接拿他跟ChatGPT比,然後就覺得很失望。這只是我趁春假寫程式,用一張電玩卡(4090),訓練一天做出來的小模型。
台語大語言模型,還需要大家幫忙蒐集更多台語語料,希望能改善到真的可以實際應用。例如做成『AI輔助母語學習工具』。
(beta version)
(alpha version) not yet usable