課程教案:Python 微調大語言模型
課程教案:Python 微調大語言模型
學會使用 Unsloth 快速微調 Gemma 3 4B 模型。
掌握從 JSON 資料集到 Hugging Face Dataset 的轉換與格式化。
理解 LoRA 參數優化與 4bit 量化降低記憶體使用。
能將微調模型轉為 GGUF 格式並上傳至 Google Drive。
教學步驟
安裝 Unsloth 與相關套件。
連接 Google Drive,並載入 JSON 訓練資料。
轉換訓練資料為 Hugging Face Dataset,並切分訓練和驗證資料集。
使用 FastModel 載入 4bit Gemma-3-4B 模型。
設定 LoRA 參數。
套用 Gemma-3 聊天模板做格式化的提示。
使用 SFTTrainer 訓練模型。
儲存 LoRA 模型並合併權重,再轉譯成 GGUF 格式。
上傳已訓練的模型至 Google Drive。
延伸應用
語言文化的教育應用:利用模型的多國語言能力,可以延伸至翻譯、語言教材輔助或跨文化的教學平台。
知識庫的客服助理:可使用特定的資料集進行微調,建立專屬的客服模型,協助自動回覆常見問題、提供某個領域的知識提供或建議。
教學資源:(含簡報與範例檔)