- 凌網科技(Co-PI:蔡明誠、林巾力、廖元甫)承接數發部『台灣主權AI訓練語料平台』服務案
問題
現有主流AI模型無法真正理解台灣語言與文化的複雜脈絡,例如:中研院TaiwanVQA評測試實驗:GPT-4O 辨識任務平均73.6%,推理任務平均49.8%
策略
有意識地收錄大量源自台灣的高品質本土語言內容
針對對台灣社會文化&AI應用服務需求,建立台灣主權 AI 評測集
實現AI模型與台灣語言,歷史與文化的深度對齊
目標
台灣政府開放資料,國家語言官方資源,公共媒體與在地內容
Formosa Speech Recognition Challenge 2025 - Hakka ASR II
問題
現有主流AI模型無法真正理解台灣語言與文化的複雜脈絡,例如:中研院TaiwanVQA評測試實驗:GPT-4O 辨識任務平均73.6%,推理任務平均49.8%
策略
有意識地收錄大量源自台灣的高品質本土語言內容
針對對台灣社會文化&AI應用服務需求,建立台灣主權 AI 評測集
實現AI模型與台灣語言,歷史與文化的深度對齊
目標
台灣政府開放資料,國家語言官方資源,公共媒體與在地內容
https://www.ima.org.tw/News/News?id=120 IMA 資訊經理人協會以 COSCUP 年會黃金級贊助身分支持開源社群,並於 2025 COSCUP 主議程分享「Taiwan Tongues-台灣通用語料集計畫」的推動進展與應用案例。COSCUP(Conference for Open Source Coders, Users and Promoters)是亞洲最具影響力的開源年會之一,聚集全球的開源開發者、使用者與推廣者。IMA 以黃金級贊助身分參與,不僅展現對開源精神的高度認同,也將台灣在地語言資源議題帶上國際舞台。本次由 IMA 胡長松主委、陽明交通大學廖元甫教授,以及群聯電子Kled經理 共同發表,並與現場開源社群熱烈交流。... 從語料到應用的技術實踐 廖元甫教授展示了以 600 萬字台語語料訓練的大語言模型應用原型,使用者可透過華語或台語自然描述,查詢對應的台語詞彙,並結合辭典與影音資料輔助學習與保存台語用法。此互動化工具突破了傳統辭典檢索的限制,對語言復興具有重要意義。
https://today.line.me/tw/v3/article/kEJD0E0【NOW健康 林郁敏/台北報導】為回應健保制度調整與智慧醫療應用趨勢,台北榮民總醫院7月25日舉辦「健保改革暨智慧醫療研討會」,作為2025年度醫療機構永續發展中高階主管研習班第一梯次課程。... 中央健康保險署署長石崇良在會中簡報「健康台灣健保改革」,說明健保制度最新改革方向;陽明交通大學智能所所長廖元甫則以「大型語言模型LLM在醫療領域的應用」為題,解析AI語言模型如何協助臨床決策與提升醫療效率;衛福部資訊處處長李建璋分享「建立韌性智慧的醫院資訊系統」,探討資安與彈性系統架構的重要性。
https://n.yam.com/Article/20250802700354 【 大成報記者吳非羽/臺中報導 】國軍退除役官兵輔導委員會8/1於臺中榮總,舉辦114年度醫療機構永續發展中高階主管研習班「智慧醫療研討會」,... 這次研習班學員,包括各榮總院長、副院長、各分院院長、副院長及各部科室主管,以及輔導會各處會醫療業務相關人員;課程邀請中央健康保險署副署長龐一鳴、資訊處處長李建璋,與國立陽明交通大學產學創新研究學院所長廖元甫,分別講授「健保數位改革」、「建立韌性智慧的醫院資訊系統」及「大型語言模型LLM在醫療領域的應用」等主題。
公視台語台新聞 2025年7月4日 AI嘛會曉講臺灣的本土語言,台語、客語、原住民語攏會通!目前當咧流行的AI語言模型攏是以外國話為主,國內有民間科技協會推出Taiwan Tongues臺灣通用語料庫計畫,希望建立屬於臺灣本土語言的語料庫,今仔也對外展示。
最近咧網路頂,袂少人加入訓練ChatGPT學會曉臺灣語氣、用詞的開講計畫,嘛有台語文學作家-胡長松,招各界做伙來參與建立「Taiwan Tongues」台語語料庫的計畫,目前已經超過10人授權台語文學作品,上無累積300萬字,希望招各界做伙來達成1千萬字的目標,來實現予AI寫台文、協助台語教學。
首播日期:2025年2月5日
➊較緊較俗?徛佇巨人肩胛頭!DeepSeek已經出師?
➋輝達股價落!晶片愈用愈少?美出口管制有空縫?
➌敏感的無欲應!審查有資安疑慮?咱愛家己發展?
➍中限制濟縛跤縛手!AI競爭終其尾是美國較占贏?
👤邀訪來賓:
廖元甫(陽明交通大學智能系統研究所所長)
張勤煜(資深科技顧問)
林修民(科技新報專欄作家)
許建榮(澳洲蒙納許大學兼任研究員)
歡迎收聽「這馬講台語」,「阿土伯來開講」,真歡喜邀請著阿土伯,也就是洪惟仁老師來為咱主講。
我們已進入AI的時代,而台語必須把握這個時機,確實搭上這一列高速的列車,成為符合時代所需的文化工具。台語AI化與方言地圖GIS是本集挑選的重點議題,請聽AI時代的台語新面貌。
https://hakkanews.tw/2024/10/12/ai-hakka-voice-broadcast-automatic-generation-system/
59廣播金鐘|創新研發應用獎:財團法人客家公共傳播基金會/AI 客語語音廣播自動生成系統 https://youtu.be/HpG-toBhfSM?si=bQzf8E7gGbR_7mtz
這是語音AI技術第二次拿到廣播金鐘獎 之「創新研發應用獎」(第一次是第52屆):https://zh.wikipedia.org/zh-tw/%E9%87%91%E9%90%98%E7%8D%8E%E5%89%B5%E6%96%B0%E7%A0%94%E7%99%BC%E6%87%89%E7%94%A8%E7%8D%8E
廖元甫,陽明交通大學/產學創新研究學院/人工智慧語音研發中心:大型多模態自監督學習生成式模型,第2梯次審查通過(Rank #2),唯一學校主導入選團隊。
A+企業創新研發淬鍊計畫-最新消息-「NVIDIA TAIPEI-1算力申請」113年第一次徵案徵選結果 (moea.gov.tw)
廖元甫,陽明交通大學/產學創新研究學院/人工智慧語音研發中心:大型多模態自監督學習生成式模型,第1梯次審查結果在全部41團隊中排名第5,但在學校團隊中排名第1,將繼續申請第2梯次。
2024年6月25日 #COMPUTEX2024 #AI #acceleratedcomputing
Discover how NVIDIA and our partner ecosystem took center stage at #COMPUTEX2024. Together, we're ushering the next Industrial revolution through the power of #AI and #acceleratedcomputing, with partners such as Supermicro, QCT, Ingrasys, Inventec, Gigabyte, ASUS, ASRockRackm Pegatron, Wistron, Wiwynn, and more. https://www.nvidia.com/en-us/events/c...
生成式AI爆紅,全世界進入AI人才搶奪戰!包括電子資訊、軟體、半導體,以及製造業,這兩個產業目前對AI人才需求占比較高,但批發、零售;法律、會計、設計;以及金融業,AI人才需求也在逐步增長,也就是說,百工百業,沒有人會是AI世代的局外人! 與AI相關的職缺不僅越來越多、也越來越有價值! 而校園就成為爭搶AI人才的前哨戰戰場,大學AI相關科系,變得搶手。
甚至有小學老師超前部署,教五、六年級學生用AI學習批判性思考、還學會寫遊戲程式;而出社會後,更不能停下學習腳步,與AI相關的工作坊,幾乎場場爆滿,因為不懂AI,就有可能被淘汰!
#李怡志 #群閎科技 #台灣人工智慧學校 #六大營造 #百工百業 #蔡明順 #宜蘭中山國小 #林穎俊 #AI #ChatGpt #Gemini #陽明交大智能所 #廖元甫 #群聯電子 #國家太空中心 #北科大資財系 #生成式AI #鍾建屏 #鴻海教育基金會 #汪用和 #AI人才
教育部於2019年委託國立臺北科技大學(計畫主持人:廖元甫教授)辦理「教育部閩南語語音語料庫建置計畫」,建置以臺灣台語語音辨識、分析為目的之語音語料庫,已於2022年5月完成約208小時的語音檔案以及語料標注等內容,並製作語音辨識、語音合成等工具軟體。]
為維護此語音語料庫成果並擴充其應用層面至語文教育,教育部委託國家教育研究院執行「教育部閩南語語音語料庫維護暨輔助教材資源建置計畫」,建立具有長期發展及擴充空間之臺灣台語語料庫,並據以進行相關研究,再依據成果建置包含詞彙、語法、語用三大應用方向之「臺灣台語語料庫應用檢索系統」,以供國民中小學課程綱要、課程設計、教學與評量之所需,亦可供社會大眾或研究者使用。
檢索系統包含三子系統:「教科書詞彙檢索系統」可查詢在各版本閩南語教科書中出現的詞彙及其相關資訊;「語法點檢索系統」可查詢台語語法點及其說明與例句;「語料檢索系統」可查詢語料內容並且提供檢索詞彙之搭配詞、關聯詞和語音檔。
2024年6月15日 #COMPUTEX2024 #AI #AIsummit
We had an incredible week in Taiwan at #COMPUTEX2024, Asia's most important trade technology show, and the NVIDIA #AIsummit.
From our CEO Jensen Huang's sold-out keynote covering what's next for #AI to the bustling crowds of the COMPUTEX show floor with all of our partners to over 1,000 developers, researchers, and business leaders coming together at the AI Summit, it has truly been a memorable experience.
Enjoy the recap. https://www.nvidia.com/en-us/events/c...
藝人包小柏的獨生女,兩年前因罕病離世,包小柏用AI重建女兒的聲音。這個做出來的「AI女兒」如今能和他通電話、傳訊息。
GenAI應用研究9》台客語GenAI大語言模型 陽明交大智能系統研究所教授暨所長廖元甫分享台客語大語言模型的發展歷程及未來展望。在學校與公部門經費支持下,廖元甫從2023年就開始投入蒐集華台客語的語音語料,目前已建置全台最大華台客語音語料庫,並公開釋出供外界授權使用,同時也以這些語料為基礎發展大語言模型。
全球唯一每日AI即時生成客語新聞上線!《客新聞》於4月起每日推出的新聞報導中,都會有一段AI生成的客語語音報導,這也是繼「講客廣播電臺」推出每日七節的「三分鐘客語新聞」後,進一步提升客家族群的媒體近用權。而《客新聞》AI客語語音新聞的生成程式,其實是應用客家委員會歷時3年多建置的「臺灣客語語音資料庫」,每則新聞「只要20秒即可產生語音檔」,因準確率高達9成以上,AI生成的客語新聞一上線就獲得網友及鄉親肯定。(陽明交大支援語料與技術)
國科會主委吳政忠15日宣布釋出 TAIDE-LX-7B模型,這是一款結合臺灣文化的大型語言模型,透過此次模型釋出,將能更進一步協助我國政府在生成式AI模型發展路上,提供更多元與多樣化的服務,幫助產學研快速導入生成式AI。
透過大量的語料蒐集、資料整理,再讓人工智慧「AI」進行學習,以太魯閣族語講述並翻譯而成的童話故事「小紅帽」,就這樣誕生了。
為了復振族語,國科會近年展開「以包容為導向之科技計畫」,其中在「原住民族語言人工智慧科技平台研發與教育應用」子計畫中,整合了國網中心、高師大、陽明交大、原語會以及相關語言學會,合作進行開發。
滿拓與群聯於3月15舉辦的AI前瞻論壇: GenAI時代的應用與落地策略,廣邀學校教授及學生參與 AI 落地應用訓練及團隊成果發表,包含國立陽明交通大學電機學院的王蒞君院長、國立陽明交通大學智能系統研究所所長廖元甫教授等AI團隊,持續擴大展開AI產學合作。
群聯的「aiDAPTIV+」方案不僅已在全球首款整合SSD協同運算的量產AOI光學檢測系統中展現其工業應用價值,更已協助國立陽明交通大學廖元甫教授的客台語AI提升辨識準確度。與聯發科「MediaTek DaVinci」的結合,將進一步拓展「aiDAPTIV+」技術的應用範疇,為AI服務市場注入新動力,不僅將為用戶帶來更優質的體驗,也將為開發者開闢更廣闊的創新空間。
群聯電子從創業至今,市值超過一百億新台幣!從最初的usb控制晶片,到今天跨入AI產業,究竟如何辦到,最新aiDAPTIV,要怎麼協助台灣企業打國際盃?今天專訪創辦人潘健成董事長,十九歲隻身來台唸書,在半工半讀的情況下畢業,一起來看看他的創業歷程!
全球唯一「客語AI主播」一次4位上線!客家委員會所屬的「哈客網路學院」團隊,運用目前已完成的客語合成語音資料(四縣、海陸腔),結合AI技術,成功生成出4位客語AI主播「阿哥Argo」、「Angel恁靚」、「Simon承蒙」、「Patty派頭」,並於今(8)日一早在客委會,由客委會副主任委員周江杰,隆重地向大家介紹這4位客語AI主播,現場更由帥氣的AI男主播Argo打頭陣,專業播報今年的桐花祭新聞。(陽明交大支援語料與技術)
陽明交大智能系統研究所教授廖元甫正在進行的台語、客語大語言模型研究,已導入群聯、滿拓的方案。他指出,過去需要購買大量的輝達H100、DGX伺服器才能訓練大語言模型,價格動輒千萬元起跳,遠超過學校財力,現在只需利用四張輝達高階電競級繪圖卡4090,加上SSD,就能跑得動Llama 2 70B模型。
https://www.businesstoday.com.tw/article/category/183015/post/202403060027/
客委會110年啟動「臺灣客語語音資料庫」建置計畫,目前已經初步完成,四縣腔及海陸腔的語音辨識及合成資料,並且開放民眾授權申請,而語音資料庫是連接數位科技的重要基礎,搭配語音技術的發展,未來將應用在客語教學以及醫療長照領域,健全客語友善環境。
AI快速發展,資訊科技欲按怎幫助臺語傳承?國立陽明交通大學教授-廖元甫的團隊,進前也參與META英語臺語翻譯計畫,團隊也開發出華語翻譯做臺語的系統,閣通分析臺語語句的結構、詞性、聲調等等,希望幫助本土語言的復興。
當卡通裡的道具來到了真實世界:語音辨識結合生成式AI,有了它讓不會台、客語也可以溝通
族群文化的傳遞與接收需透過載體與媒介讓不同族群相互認同與肯定,然而隨著少數語言的使用比例逐年下降,科技浪潮是否能帶來創造性的解決方案?
本單元邀請國內外專家學者,分享利用現有的創造力和技術可能性,突破障礙,創作出適合不同語言族群的內容,尋找族群文化傳播的未來機會。
主持人:
徐毓良|資策會數位轉型研究院副主任
主講人與與談人:
陳邦畛( 陳板)|客家公共傳播基金會董事長
廖元甫|陽明交通大學智能系統研究所教授
Monica C. F alao P ettersen|挪威薩米電視台主編
梁哲瑋|集仕多股份有限公司創辦人
❶AI應用範圍闊.版本一直換新!對咱生活會產生威脅?
❷AI愛收集資料毋過刑事樣態少!被告權利欠保障?
❸公務員.司法院會當用AI!人袂當完全信猶原愛審查?
👤邀訪來賓:
吳景欽(真理大學法律學系教授)
崔家瑋(中研院法律所研究助理)
江雅綺(台灣法律科技協會理事長)
廖元甫(陽明交大智能系統研究所教授)
「客語語音辨認競賽」競爭激烈 最終結果揭曉_生活 | 壹新聞 (nexttv.com.tw) 2023-10-21 20:14
執政七年重新定義台灣讓世界重新看見台灣記者會https://www.youtube.com/live/lIm7faMXA0
公視台語台新聞:ChatGPT教臺語? 學者當咧開發AI程式拚傳承 [YouTube]
換日線Crossing:國際趨勢/科技/阿善 Café 的世界分館 2023/05/05:【台大演講筆記】ChatGPT 會說台語?──台灣團隊研究 AI,為本土語言復振努力|換日線 Crossing
Target: 5 dialects
each dialect will collect 150 speakers, 300 hours speech for ASR, 2 speakers, 60 hours speech for TTS
Status
Sixian finish
Hailu ongoing
Meta發表AI翻譯 廖元甫教授團隊幕後功臣【客家新聞20221022】 [Youtube (in Hakka)]
3C裝置講客聽得懂 產官學共建客語語音庫【客家新聞20220221】 [Youtube (Hakka)]