AI Robot的發展與臺灣的競爭力(上)
工研院產業科技國際策略發展所 黃仲宏經理
一、AI Robot與構成要素
近年人工智慧技術發展突飛猛進,許多足式步行機器人應運而生,我們根據現今歐美中的機器人產品,整理出如圖1所示的新一代機器人(AI Robot)的構成要素,特別是人型機器人。人型機器人相比於工業機器人,擁有更高階複雜的感知交互系統,包括感測模組和相關軟體(導航技術、智慧決策等)。與常見的服務型機器人相比更需要保持平衡,普通服務機器人有底盤,用輪式驅動,較不存在摔倒的問題,講求靈活彈性的人型機器人靠雙足行走,需要適應不同的地面,每個關節受力更加複雜,對減速機和馬達響應的速度要更快。我們也希望所見到的人型機器人,能夠具備語意理解、人機交互(能與我自然的互動)、自主決策等能力,來實現人類賦予它的任務,更期望它能回應人類對它下的指令,因此人型機器人需要強大的感知能力、認知能力、動作能力。人型機器人具備任務級的大腦、技能級的小腦、基盤級的機械臂、靈巧手、機器視覺等組件,這三個要素讓機器人實現對環境的感知交互、運動控制、任務執行等。
圖1、新一代機器人系統的構成要素。資料來源 : Gartner Hype Cycle for AI Technology, M2 Research & Analysis
目前工廠裡頭使用的機械手臂,幾乎都是事先根據特定動作目的而編程好的,難以實現通用化能力,透過對於某一個特定領域編程對應的軟體,達到滿足特定用途的機器人應用,比如生產線中執行辨識雜亂工件,進行取放上下料的動作。
人型機器人的主要技術在感測、決策和運動三個面向,人型機器人相較工業機器人(機械手臂)是更複雜的系統,製造難度更高,因為它必須在執行工作時,保持平衡且快速的移動。它的手眼力感測器能接收壓力、影像、聲音等訊號,且融合來自大腦的指令讓手腳關節作動。人型機器人的感測、決策技術複雜,近來在LLM和GAI的引入,機器人可以透過模仿學習,執行各種複雜的任務,這讓機器人自身的決策難度大幅降低,若機器人本身一些硬體持續優化,很有可能成為製造業升級與服務業創新應用的工具。
二、機器人面臨的挑戰與發展路徑
我們觀察機器人的發展從機械手臂、機械手臂搭載AGV、到以履帶式、全向式輪軸驅動的AMR等,它們均只能在同一平面空間作動,若機器人要執行教育、娛樂、照護、陪伴、接待、導覽、探勘、救災等應用,人機協作不可避免,而工廠裡的機械手臂在這些應用上就有其侷限性,因此相較於機械手臂的人型機器人在工業應用外的智慧化功能展現,就更像人機協作,互動上比機械手臂更具親和性,且可快速的在不同任務間彈性切換功能;人型機器人因為與人類外型相似,有望更能適應人類社會環境,在不同任務間彈性切換,且因其理解世界、與世界互動的方式都跟人類相似,人型機器人已被全球機器人產業視為未來發展的最重要產品。
在機器人領域,有個Moravec's paradox(莫拉維克悖論),就是機器人無法像人類一樣;人類無意識的能力(例如馬上辨識出事物),對機器人來說就是需要很大的運算能力,人類愈簡單直覺的事情對機器人來說是有一定難度的。
大模型的生成、推理能力,讓機器人有自然語言理解的功能,機器人可以用接近人的語言語意,和真實人類溝通,進行基於自然語言的互動。大模型是機器人能力躍升的技術基礎。大模型的向量應用提供了大腦給機器人,使機器人具備更高的事物處理能力。
因此具身智慧型機器人要能夠像人一樣與環境交互、感知、決策、完成任務,其感知技術和認知技術的能力是要非常高的。人型機器人的感測器數量種類、執行機構複雜程度遠高於工業機器人,對控制器的即時算力、機電整合度要求極高。具身智慧是整合環境理解、智慧交互、認知推理、規劃執行於一體的系統化方案。透過海量訓練的大模型,其內蘊的基本知識與思維邏輯,有可能讓機器人的應用場景拓展。
不過雖然全球許多科技巨頭都在投入大模型技術,但目前距離實現真正的具身智慧還面臨著數據、即時性、軟硬體整合等問題。
多層面的技術挑戰: 人型機器人的設計、製造、控制、能源效率、成本以及安全性等多個面向,需要跨學科合作與技術突破來解決,AI模型技術的能力邊界,決定人型機器人的能力上限。
效率不敵專業機器人: 人型機器人因其通用設計帶來的多功能性,難以在特定任務上與專用機器人相媲美,例如生產線製造、掃地機器人、洗碗機,醫療設備等特殊場景。
通用性和商業化成本衝突: 通用人型機器人的多功能特性衍生高昂的設計、開發、生產和維護成本,儘管人型機器人有廣泛應用的潛力,但實現真正商業化時,面臨的成本衝突需要進一步技術突破才能有效緩解。
人型機器人未必是最佳型態的質疑: 飛機最佳的型態不是鳥,機器人的最佳形態也未必一定要是人,人型可能是物種演化的中間狀態。此外人類文明能否能接受一個類人的智慧生命體大規模的與人類共同生活?通用機器人技術層面和商業化上面臨許多不確定性的挑戰,AI Robot是否成為機器服務人類最佳的型態會受質疑。
隨著人工智慧公司投入生成式人工智慧開發,透過大量數據的學習進而生成新數據,以既有的領域知識搭配開發工具實現無代碼平台、無需編寫程式的發展,應用在機器人上是明顯的走向,機器人可以透過學習人類的思維,應對各種情況達到效率提升與操作簡易之效。人型機器人目前主要應用在娛樂、教育和商業迎賓等對智慧化和決策執行要求較低的場景,預估其應用發展的路徑如圖2。
圖2、機器人面臨的挑戰與發展路徑。資料來源 : 工研院產科國際所
小結
以國際的發展來看,雙足步行的機器人研究已經超過50年了。日本早稻田大學加藤一郎教授,原本從事醫學工程研究人工下肢,他在1964年將人工義肢應用至機器人,讓機器人有下肢可行走,加藤一郎可以說是雙足機器人研究的先驅。1986年開發人型機器人的本田技研(HONDA)公司,它的知名產品就是ASIMO。ASIMO的平衡性能及動態控制技術相當精進,它曾多次在公開場合上表演騎機車、踢足球、開瓶倒水等動作,但由於研發成本高且無法實質產品商業化,HONDA最後還是終止了ASIMO的研發。
今日要實現機器人大腦的記憶、思考、判斷、決策等能力,已經有能夠模擬人腦規模網路的超級電腦,使用模擬生物過程的神經擬態系統,每秒能進行數百兆次的突觸操作,讓人工智慧處理更接近人腦的工作方式,同時可以學習更多關於大腦的知識。大腦是人型機器人發展上的關鍵技術,目前無論是歐美的美國矽谷、德英法,或是亞洲的中國大陸、日韓企業,甚或是資本巨頭都瞄準了這個方向進行研發或投資,人工智慧演算法持續的日新月異,許多人已認為機器人技術和人工智慧的黃金交叉,即將讓人型機器人的發展和生成式人工智慧一樣有重大的突破。
未來將有更多政策吸引科技公司投入人型機器人發展,加上人工智慧技術的突破性發展,吸引全球的新創公司和資本投入市場,他們從算力、數據、演算法、應用等面向展示了機器人在各種場景的潛力,足式步行機器人產品發展正處於天時、地利、人和的時機。人型機器人未來5年的發展,很有可能把過去50年面臨的技術問題解決,如果有真正剛需的落地應用場景,那麼人型機器人就能夠實現產業化。