建議年級: 初中至高中
是甚麼?
人工智能是模擬人類智能的科技,能以人類語言進行溝通、形成概念、自我學習及自我提升,並模擬人類邏輯以解決問題。
懂幹甚麼?
不如我們先觀看連結中的影片吧:
影片一: Figure Status Update - OpenAI Speech-to-Speech Reasoning
影片二: GPT-4o (Omni) math tutoring demo on Khan Academy
人工智能能幫助我們將某些工作自動化,以節省人手,並提高生產力及準確度。現時的人工智能可以完成許多任務,如下棋、製作新聞報導、預測客戶需求、處理人類語言、創作詩歌等。
不懂幹甚麼?
然而,我們需要理解人工智能的能力和限制。它仍無法作出道德判斷、擁有同理心、感受情緒,或行使自由意志。
人工智能的發展歷程
人工智能科技自1950年代起源,經過數十年的進化,並在大數據的推動、強大的運算能力、互聯網的普及以及深度學習等機器學習演算法的發展下,其發展突飛猛進。
人工智能技術的發展得益於大數據、強大的運算能力和電腦程式演算法的進步,使得機器學習系統能夠自動執行複雜的程序。這些進步不僅支援人工智能進行預測和決策,還廣泛應用於電腦視覺、電腦語音、機器推理等領域。
機器學習和深度學習都是人工智能的子領域,機械學習指機械能從數據中自動「學習」 模型,而深度學習是機器學習的分支領域,使用名為「人工神經網絡」的演算法,從數據中「學習」模型。
機器學習的過程包括使用大量數據樣本訓練模型,當中每個樣本都包含一個輸入及其針對特定任務的參考標籤,並通過比較輸出標籤和參考標籤來判斷模型的準確性,並在有錯誤時更新模型以減少錯誤,直至獲得最佳模型。然後,我們可以使用這個經訓練的模型處理新的輸入數據。
甚麼是電腦視覺 (Computer Vision, CV)
電腦視覺(CV)是人工智能其中一個領域,能使電腦系統從數碼圖像、影片和其他視覺輸入中,獲取有意義的資訊,並根據這些資訊來採取行動或做出決定。
活動一 - 電腦視覺與塗鴉
請利用超連結 https://quickdraw.withgoogle.com/?locale=zh_HK# 參與遊戲,完成後回答以下問題。
在遊戲中,一名學生嘗試畫一個「水槽」。但是,電腦視覺系統並未將其識別為「水槽」。相反,在電腦視覺系統的「眼睛」中,它看起來更像是一個「烤麵包機」、「煮食爐」或「焗爐」。
(a) 學生畫出的作品
(b) 電腦視覺將物件識別為「多士爐」、「煮食爐」或「焗爐」
(c) 電腦視覺識別為「水槽」的畫作
圖(C)是能被電腦視覺識別為「水槽」的畫作,透過比較圖(a)與(c)回答以下問題。
根據問題1、2及3的回答,並結合你個人的見解與對人工智能的認識,回答以下問題。
模型訓練
機器學習是人工智能的子領域,能自動從數據學習並模仿人類智能。圖中展示以狗和貓的圖像為訓練數據,訓練模型分辨狗和貓。每幅圖像都有標籤作為參考輸出。訓練過程中,演算法更新模型參數,找出最佳模型。未經訓練的模型稱為初始模型M0 ,訓練後的模型稱為已受訓練模型M*。
模型測試
圖中顯示的是模型測試的過程。已受訓練模型 (M*) 應能分辨狗和貓的圖像。而用於測試的圖像,必須為模型從未見過的圖像。如果模型的訓練完善,生成輸出應可給予正確的標籤。
活動二 - 齊來訓練屬於自己的AI模型
模型訓練與測試
前往網站 https://teachablemachine.withgoogle.com ,按 get started ,選 Image Project,再選Standard image model後,便會進入以下畫面。
分別在 Class 1 及 Class 2 輸入 Cat 及 Dog,然後可從網上搜集不同種類的貓及狗的相片各20張作為訓練數據,並利用upload 按鈕上載圖片至對應的分類中。注意圖片的大小不用太大,並盡量找正方形的相片。如需要可使用已預先準備好的訓練及測試數據。最後按Train Model,並等待系統完成訓練。模型訓練完成後便可進行測試。
訓練數據中的問題
在機器學習中,模型需從數據中學習,訓練數據因而對於模型的質素很重要。訓練數據的多個因素,都會為模型產生影響。
以少量數據集來訓練的影響
接著我們重新訓練模型,但這次我們分別各使用1張圖片進行訓練,如下圖。
以不均稱的數據集來訓練的影響
這次我們分別用1張貓圖片及10張狗圖片進行訓練 ,如下圖,並再次測試模型的效果。
「貪食蛇」遊戲
「貪食蛇」遊戲是一種經典的電腦遊戲,最早於1976年在街機平台上推出。在這個遊戲中,玩家將控制一條長度不斷增長的蛇,目標是吃掉屏幕上出現的食物。然而,蛇不能撞到自己的身體,否則遊戲就會結束。隨著蛇的長度增加,遊戲的難度也會相應提高。這款遊戲以其簡單的規則和具有挑戰性的遊戲性而受到廣大玩家的喜愛。
下方是一個利用 p5.js 的 Javascript library 寫成的網頁版貪吃蛇遊戲。先用滑鼠點擊畫面中灰色的地方,然後便可利用鍵盤的上、下、左、右鍵來開始遊戲了。
「貪食蛇」⨉ 電腦視覺
接下來我們會嘗試利用上一個活動的模型訓練網站,訓練一個模型以不同的動作來代替鍵盤的上、下、左、右鍵來玩遊戲。有關訓練模型的詳細方法,可以參看下方連結中的影片。
https://www.youtube.com/watch?v=UPgxnGC8oBU (請觀看 1:07 到 2:30 的片段)
然後,利用連接 ( https://editor.p5js.org/hshkch/full/vpcF0hzlY ) 中已經寫好的改良版 「貪食蛇」遊戲,利用右上角的 </> 按鈕進入編輯介面,把
let imageModelURL = "https://teachablemachine.withgoogle.com/models/fPXHq6Bwq/";
的程式碼中的連結換成你剛訓練好的模型,你就可以利用你選定的手勢來玩你的遊戲了。
節錄及整理自 EDB 初中人工智能課程單元教材 及 Youtube 頻道 「The Coding Train」