深度強化學習技術的運用很廣,因應未來機器人、無人載具與智慧工廠需求,考慮行動性是機器人和無人載具成功的重要關鍵之一。我們並以之為主題,申請國科會射月計畫,針對無人載具的自動導航和控制進行研究,採AI深度強化學習技術,根據障礙物之類別導入不同之社會強度,訓練一自適應式的智能模型,期能達成自適應式服務導式的自動導航和駕駛控制等目的,提升載具的安全和環境友善度,部分研究成果已於國際會議IEEE MDM2022發表。而應用深度強化學習技術於機械手臂之移動軌跡自動排程問題,相關成果正準備發表中,與廠商之產學合作亦在洽談中。
目前應用深度強化學習於解決導航或機械手臂控制等問題依然面臨許多瓶頸,特別是學習效率不佳的問題。我們針對如何有效建立深度強化學習模型,提出階層式強化學習的技術、時空多粒度漸進式學習等技術,相關成果正準備發表中。
深度強化學習技術的運用很廣,常見運用於各種決策控制機制的設計和優化,如股票操作等。針對廣告行銷活動,以無模型強化學習方法於學習即時競標策略,期獲得最佳勝率,相關成果已發表於國際期刊IEEE ACCESS。
機車駕駛行為分析是交通監督管理和提升行車安全重要關鍵之一,透過安全駕駛評估與輔助系統可用於長期評估駕駛人的騎乘行為,有助於維持駕駛人優良駕車習慣,亦可應用於即時提出預警降低意外和車禍發生的機率,有助於國內智慧車輛和智慧交通等應用之發展。我們從機車駕駛行為辨識的角度出發,整合智慧手機三軸感測數據與機車機電ECU 數據於機車異常診斷,研發AI駕駛行為辨識和即時偵測技術,相關研究正在進行中。
異常辨識和預判是IoT智慧工廠和工業4.0的重要研究課題之一,針對太陽能原料Wafer製程中的洗淨製程進行數據分析,我們提出的Early Detection with Accumulated Information (EDAI)集成份類器,即時進行異常辨識,針對缺陷進行進行重工或報廢等處理,根據初步估算,此方法能夠提升55%的洗淨製程良率。相關研究成果準備投稿中。
應用感測裝置達成人流計數的技術是許多應用共同的基礎運算,可運用於銀髮族安全照護、社區安全監控、活動或展場人流控制等。目前多數的人流計數技術是使用影像處理方式估算人數,準確性較高但成本較昂貴,且架設攝影機來達到人流計數在許多場合並不適合。而被動人體紅外線感測器(PIR)可感測接近人體體溫的紅外線,可以靠溫度之變化來偵測待測物之移動,且成本較低, 架設場域不受限,可以避免個人安全和隱私的問題,適合用來做為偵測人體移動和發展人流計數的技術。故我們提出即時人流計數的系統,利用應用深度學習CNN來訓練PIR感測器輸出的類比訊號以建立人流計數辨識模型,實驗的結果顯示我們所提出的方法在辨識多人多種進出行為模式都有不錯的準確度,因而能達到較高準確性的人流計數,此研究成果,已於國際會議IEEE MDM2020發表。
於三維空間中偵測目標物的傾斜角度和傾斜方向有很多應用。例如:偵測支架、柱子、橋墩、交通號誌告示牌、路燈等的傾斜角度,以便及時警示,校正或維護。針對目標物異常傾斜角的偵測,先前技術多半仰賴在目標裝置上裝置感測器,成本較很高。因此我們提出一個相對簡單、有彈性、非接觸式的傾斜角量測技術,利用Fast RCNN深度學習鎖定目標物,並根據偵測裝置的三軸感測資料擷取目標物的投影傾斜角,最後透過多個投影傾斜角進行refine,推估目標物真實的傾斜角,相關研究成果投稿中。