最近對岸有個火紅的開源專案「小智ai」,就是讓ESP32-S3板子搭配麥克風和小喇叭,背後連結LLM就可以對話了,重點是開發者「蝦哥」把專案都放上了GitHub,一時之間風靡了起來,聽說讓s3的板子銷量大增,一些套件都缺貨了,這個專案陸續產生了許多不同板子的版本,剛好M5 STACK也有出S3的系列, 一開始跟著玩麵包板版本的套件,這二天突然有個想法:用ATOM S3可以做個AI小寵物
先瞧瞧效果怎樣?就是桌上放一個小物會鬼扯…這算是前端(ESP32-S3+小智AI程式),它的後端就是連上了大語言模型(當然不是OpenAI的也不是Google的,而是對岸阿里云的),透過內建的麥克風及小喇叭,我們講話它即時分析,傳到LLM回答,它再講給我們聽,反正它的設定就是跟用戶閒聊的臺灣女友
這個部份也沒什麼好動手的,就是去買ATOM S3(或S3R)和搭配的Echo Base(這塊是外掛的意思,就是麥克風及小喇叭的模組),這二樣接在一起就成了,用這個來玩好處就是模組化好了,也不用在哪兒插線看pin的
ESP32本身就是有WIFI及藍芽,之前在玩的時候,就常用WifiManger的程式來管理,通常在沒法連線的狀況下,ESP32就啟動AP模式,這時可以用電腦或手機連它,然後開啟192.168.4.1就可以設定它的WIFI連線資訊囉!而且它還會記住曾經連過的SSID
這個部份很簡單好用,進到192.168.4.1後,晶片會掃描附近的AP列在下面,你只需點選一個,然後輸入密碼按接連,晶片便記下這個SSID的連線資訊了,ESP32-S3就會重新啟動,這時它已經可以上網了,但還要做連接後端的設定,啟動後ESP32會顯示並唸一串連接數碼,是要用在後台登記的
第一次登入後台→新建知能體(隨便取名),新增裝置就把您的晶片的數字代碼輸進去,這裝置就納管了
可以按進「配置角色」去做一些AI助理的細節設定,比如聲音、個性及自我介紹時的簡介,還可以選擇使用的LLM,預設是使用Qwen回應比較快,也可DeepSeek可以選(都是對岸發展的就是了!)
這個部份免不了要測量一下M5ATOM+ECHO Base的大小,剛好是個方體很容易的,就想到可以把它和之前網路上分享的類capoo模型做一番整合,嵌入capoo的肚子部份;然後我還想到供電的部份,原則上是插入TypeC就可以了,不過是向下,所以我就設計一個底座盒子,目的在於轉換到後方水平…
底座電源盒的設計很單純,用上TypeC公母端子各一,目的是轉換插座的方向及位置
就也順道弄了一個可以直接用鋰電池供電的底座,這個就要有開關的設計了,鋰電池接上一塊升壓及充電的模組就行了
原則上這就是製作介紹,在玩這個的時候,偶爾會有一些卡卡的現象,主要是與後端伺服器的連線穩定度有關,有時會出現像當掉了的狀態,沒關係,只要重新上電就可以了…
是一款基於ESP32-S3 主控的高度整合的物聯網可程式控制器。內部整合了ESP32-S3-PICO-1-N8R8主控、集成Wi-Fi 功能、8 MB 片上FLASH和8 MB PSRAM,與先前的產品相比,AtomS3R的3D 天線經過增強,提供了更好的性能和更高的穩定性,總之它是AtomS3的升級版,運行小智ai的程式時,就可以使用語音喚醒,喚醒詞預設是:「你好,小智」
AtomS3R的外形大小與AtomS3完全一樣,只是包裝上多了一個R,晶片外殼由白色變成淺灰
3D件印出來後,免不了就是進行一番打磨使其光滑,在顏色的方面就比較美工了,我個人會用一下噴漆和丙烯馬克筆上色的方式