講者:董立大教授
地點:國立臺灣大學 理學院思亮館1樓
內容摘要:
AI 是數學的延伸,也是現實的挑戰
董立大老師從數學出發,帶領我們重新認識人工智慧的本質。他指出,AI 並非神秘的黑盒子,而是建立在函數、參數、向量等數學概念之上。數學不只用來求「正確答案」,更能幫助我們在不確定的世界中找到「可以接受的解」。
模型如何修,才真正有「智慧」?
演講深入探討從資料收集、模型修正到跨域合作的實務歷程,並以醫學上的腎臟功能預測為例,展現數學與專業知識如何攜手打造非侵入式的長期監測系統。AI 不是一次到位的萬能工具,而是透過不斷試誤與數學思辨,逐步逼近真實。
數學人的優勢:不是會解題,而是會思考
從圖靈的理論、神經網絡的誕生,到深度學習的狂潮,老師帶我們橫跨歷史與應用,回到一個關鍵提醒:「知道為什麼成功,比成功更重要。」對數理背景的學生來說,這場講座是一場深度提問:我們所學的數學,該如何回應這個時代?
【演講內容全文】
人工智慧實務:真實與想像
智慧核心股份有限公司負責人/中山大學精準醫學研究所教授 董立大
「我們學過的數學,真的可以用在現實世界嗎?」這或許是許多學生在大學某個階段會浮現的疑問。而在這場臺大數學沙龍講座中,董立大教授以其豐富的跨領域實務經驗,帶領學生從數學的本質出發,穿越AI的發展歷史與理論建構,最終回到一個重要提醒:「數學不只是為了解題而存在,也是與世界溝通的一種方式。」演講中他強調,人工智慧並非單純的程式語言,其實是一場將現實世界抽象為數學模型,再透過邏輯推演與資料驗證的思維演練,AI的核心,其實仍是數學。
從抽象到真實:以數學為基礎的AI運作
在演講一開始,董立大教授指出,數學訓練常讓我們習慣於在「想像」與「理解」之間進行抽象思考,但若能將其結合真實問題,則能讓思維更具體,也更能掌握現實挑戰,進而產生成就感。他回顧了從早期電腦與網路發展到今日人工智慧的演進,強調這些科技已不再只是高端研究者的工具,而是滲透日常生活的重要基礎,並透過物聯網(IoT)與各種應用成為解決問題與獲取知識的途徑。
董教授強調,人工智慧的核心其實源於數學模型,它是以數學為基礎,用以解決真實問題的方法。雖然數學家樂於進行天馬行空的抽象推演,但現今更重要的是如何讓數學方法與現實問題相結合,並在兩者之間找到平衡。他以「黑盒子」的概念解釋人工智慧的運作:在輸入資料後,經由函數或模型的轉換,輸出近似解答,雖然這些解答未必完全精確,但在醫學與產業實務中,能提供可接受且具參考價值的結果,這種「近似而可行」的結果正是AI應用的重要精神。
數學、統計方法與模型修正——記憶方法、類神經網路
董教授進一步指出,資料的收集與誤差不可避免,而數學與統計方法的任務,正是協助理解並處理這些誤差。隨著研究與實驗不斷累積,原本單一的參數可能逐漸顯示出多維度的結構,帶來更深層的洞見。他以醫學為例,說明初期僅運用少數參數便能在初階目標中,達到高精準度,但隨著更多變項的納入,AI的判斷能力也隨之提升,顯示人工智慧在不同領域逐步發展與進化的過程。
他說明,人工智慧的「記憶方法」其實是一個反覆調整的過程,起初,研究者可能無法掌握所有細微參數,只能依靠經驗法則挑選部分參數並建立複合型函數進行判斷。但當適用範圍擴大、結果與預期產生落差時,就必須重新調整參數,甚至需要更進一步的解釋,數學訓練在此提供了良好的基礎,讓人能敏銳察覺哪些地方可修正,以及如何進行調整。董教授說,統計方法如線性回歸,能幫助分析資料的變化,並作為引導,而早在七十年前出現的類神經網路,則提供了另一種思考途徑。透過程式語言(如Python)進行向量與內積運算,便能建立模型的雛型並逐步擴展,基本原理並不困難,本質上仍是線性代數的基礎運算,但在實務中,研究者需要將數學模型與真實問題相結合,才能解釋資料背後的特殊性質與現象。
董教授補充說明,這些調整過程正是所謂「學習概念」或「記憶學習」,舉例而言,修正權重(w1、w2)即可讓函數更貼近資料分布,並逐漸形成合適的判斷邏輯。這類演算法看似簡單,但實際操作時,類神經網路的方法已多達數十種,每一種都有其應用情形與特殊性。數學訓練使我們能做出一套機器學習,讓它反覆運作,並在資料累積與調整中逐步收斂到可接受的結果。
然而,他也提醒,收斂速度在實務中至關重要,對數學研究者而言,最終能否收斂即可,可是在產業應用上,運算時間的差異可能影響實際可行性,因此,如何讓模型更快接近解答,是數學專業能發揮作用之處。至於深度學習受到重視的原因,則在於函數的持續推進有機會逼近最佳答案,雖然不保證每次都能找到,但理論上確實存在可能性。教授強調,在數學的觀點下,只要設定好空間,就能測量最終答案是否接近目標。
數學與 AI 之間具有連結
以上說法似乎會讓人以為學數學就得什麼都學,但其實我們多數人都受過紮實的數學訓練,只是過去較少去想要把這些知識用在何處,在學的時候,我們學數學,多半只是為了通過考試,然而數學與 AI 之間存在實實在在的連結,AI的發展也對數學很有啟發性,因為許多做法都有其理由,並促使我們更深入思考「為什麼要這麼做」。研究者常沉浸在自己的問題裡,很少主動把成果落成程式,但從長遠看,這一步是重要的。
AI發展歷史脈絡與技術里程碑
一、將想像化為現實
董立大教授接著以歷史脈絡為主軸說明AI的發展。早期關於機器人的想像很早就出現在《列子》〈湯問〉中,這些想像提供了初步概念與動力,讓後人嘗試把它變成現實。他指出,近代 AI的論文,尤其大型科技公司發表的作品,常只描述「做到什麼」與大致時間,方法細節未必公開,因此研究者往往需要依線索推測其路徑,並用自己的數學手法去複現與超越。
關於「機器人/Robot」的稱呼在二十世紀初誕生,學界也出現以函數的線性迴歸結構為核心的早期類神經模型,透過資料反覆更新參數、權重,讓模型逐步具備分辨能力,雖然當時的計算資源有限,但這些構想已延伸出今日機器學習「讓資料自動學習、反覆修正」的基本精神。另方面,二十世紀中葉以降,演算法與可計算性、複雜度等觀念逐步成形,提供了用機械與程序來解決問題的框架,與此同時,「機器(電腦)是否具備智慧」的想法也逐漸被提出。
1969年第一代機器人問世,與我們現在看到的機器人相當不同,但已能進行平面刻劃的運作。Apple 2出現之後不久的八〇年代,日本投入了約十兆日圓,期待以程式加速運算並落地應用,儘管未全面成功,但催生了專家系統等重要發展,也在大眾文化中留下許多科幻作品,顯示各國對此領域的重視與持續投入。其間亦有研究者把這些方法應用到繪畫創作中,作品不易被辨識為電腦生成,甚至具備相當高的市場價值。
二、AI技術的進步
董教授續說,九〇年代因處理器速度提升(如 Pentium 系列)與資料探勘(data mining)興起,各式技術逐步延伸,讓大眾看見 AI 在實務上可達成的表現,不再只是實驗室或高科技圈的玩具,電腦遊戲的普及也讓人們願意投入大量時間與心力,間接推動技術成熟。此後,團隊將目標轉向圍棋,歷經多年研發,終於在對弈領域擊敗西洋棋頂尖選手,這段歷程累積出處理 AI 程式的經驗,並推動強化學習(reinforcement learning)等方法:從既有程序出發,反覆修正模型,以逐步改善表現。他強調,傳統監督式學習仰賴「有標準答案」的資料,但在許多情境沒有明確答案時,仍須有辦法度量「更好」或「更差」,如同下棋般透過回饋逼近理想策略。
三、知其然,知其所以然
自2000年前後起,帶有視覺與表情等能力的服務型機器人陸續出現,對應到機器學習中類神經網路由單層走向多層,用數學語言來看,這是以多層函數在空間中重整(retract),最終追求正確辨識目標。他也點出一個困擾,模型疊到數百層時,往往「不知道為什麼成功」,對重視理論的研究者而言,理解其成功機制十分關鍵,因為這能回過頭改善學習流程,使之更準確、更快速,過去十年間,雖有眾多團隊以工程實作先求「做得成」,但後續要不要、能不能改進整體的記憶與學習結構,仍值得考慮、檢驗。
四、AI在實務中的重要性
2012到2022年間,隨著資料規模、big data、語言應用與 IoT/AIoT 的擴展,電腦與網路協助我們取得更多資訊、預測與新嘗試,這正是 AI 之所以受到重視的原因之一,董教授補充,在產業面,「工業 4.0」等潮流反映了 AI 對研發時程與效率的加速效果。
數學訓練向來強調以結構化方式理解資料,類似AI領域「資料清洗」一詞,重視判斷哪些資料「有意義且可用」,並具備主動尋找正確資料的能力。而有時「小數據(small data)」更關鍵,若已能判斷答案的形式,例如推估答案是十一次的多項式,就可用線性代數工具求得對應係數,但前提是資料要足夠可靠,並需以專業知識嚴謹驗證,這類工作仰賴數學與領域專家的合作。
董立大教授指出,AI能帶來製程優化與產品改善,研發時間也因此縮短,只要方向正確且合作開放透明,短時間內便可能突破既有技術水位,更重要的是,若程式為團隊自研,便能針對內部變數提出各種追問與調整,而非僅看最終輸出,進而協助修正製程或開發新製程。
通用模型的限制與跨域合作
董教授提醒,期待以單一「通用模組」解決所有問題並不切實際,因此直接套用他人模型的失敗率很高,能夠自行組建機器學習、AI演算法、用數學觀點拆解問題十分重要。而跨域合作難免反覆來回,一開始合作夥伴未必能把需求一次講清楚,需在持續試作與驗證中逐步補足條件與了解特殊情境,研究者要有耐心、善於提問,並在程式評估、檢驗上納入對方的專業知識,當結果不符預期時,也要判斷究竟是模型問題,或情境本身已與假設不同。
給數學人的未來視野
最後,董立大教授總結,雖然早期進展看似緩慢,但就研發成效回推,時間確實大幅節省。AI整體效益包括:提升生產效率與節能、以數學結構回饋 AI 模型設計、優化產線流程並推動未知理論的探索,跨域合作帶來的實務回饋,也能反向刺激我們調整模型路徑與收斂策略,深化對自然與工程問題的理解。
「故善人者,不善人之師;不善人者,善人之資。 不貴其師,不愛其資,雖智大迷。 是謂要妙。」董老師援引老子的智慧作結,數學人不僅要尋求正確答案,更要從錯誤與異常中發現意義,真正地了解理論。