AI Robot的發展與臺灣的競爭力(下)
工研院產業科技國際策略發展所 黃仲宏經理
一、全球主要AI Robot產品概覽
圖1、全球主要AI Robot產品概覽
圖1是目前全球主要AI Robot的產品概覽。TESLA、Figure、Boston Dynamics、UNITREE、Agility,都是相當受到關注的公司,它們的產品都是人型機器人。
TESLA人型機器人Optimus從2021年8月公開至今,不斷在技術上推陳出新,特別是行走能力和抓取物體的能力。2023年5月我們從官網中看到Optimus已經能夠流暢的行走和抓取物體。到了9月,它利用機器視覺技術對移動和非移動物體進行分類,並實現了由神經網路完全端到端的訓練,同時機器人已經能夠完成單腿瑜伽站立等動作。2024年12月初展現的Optimus Gen2,看起來已可以模擬人體手指的觸感壓力,輕鬆拿起雞蛋等易碎物品。Optimus Gen2的手有11個自由度,步行速度較前一代機器人提升了30%,整體重量也減輕了10公斤,其運動和操作能力更加接近人類的動作。預期Optimus機器人離量產的時間應不遠了,但是要達到其所說的10萬台目標,可能還是要先有實際績效的落地應用。隨著技術的不斷進步和產能的逐步提升,Optimus人型機器人的升級和驗證進展仍會持續受到全球的關注,它是人型機器人在這波發展浪潮中是成是敗的指標。
再者是Figure公司,這家公司在短短一年內就成功研發出高度技術含量的Figure 系列人型機器人,並正式向公眾展示了該機器人雙足動態行走的能力。Figure01在2024年2月已進入BMW美國工廠實訓,且與OpenAI合作ChatGPT導入Figure01。機器人基於端到端運動控制演算法,結合OpenAI的GPT,更是早於TESLA公開展示了人型機器人在無需預設程式的情況下的高度自主性和智慧化交互。
Boston Dynamics 於1992年從學術領域實驗室誕生,受美國軍方資助,經歷三次易主,先後被美國Google、日本軟銀、韓國現代汽車收購。國防軍事開發的背景奠定了其對成本不敏感的企業特性。機器人採用液壓驅動以及3D列印技術打造零件,成本高昂,商業化進程緩慢。不過它的Atlas人型機器人在工地所展示的人機協作情境,引發了全球機器人迷極大的迴響,讓人很難不關注其後續的發展。
UNITREE(宇樹科技)成立於2016年8月,專注於消費級、產業級高性能四足機器人,靈巧六軸機械臂等研發、生產及銷售。人型機器人H1,預計售價將在幾十萬人民幣以內,它的雄心是想要以有競爭力的價格期許成為地面上的大疆。
Agility公司成立於2015年,總部在美國,是從俄勒岡州立大學拆分出來的機器人公司,現位於俄勒岡州賽勒姆開設機器人製造工廠RoboFab,主要投入物流、巡檢等應用的雙足機器人,機器人產品名稱是Digit,已有卸載貨車、搬運箱子、管理貨架等倉儲搬運等實績。Agility Robotics聯合創始人兼首席執行官Damion Shelton說「我們建立Digit是為解決當今勞動力中的難題,例如受傷、倦怠、高流動率和無法填補的勞動力缺口,最終願景是讓人類變得更人性化。當你在開發新技術來使社會變得更好時,最重要的里程碑是當你能夠大規模生產該技術時,它可以產生真正的、廣泛的影響。」
Agility公司目前一年有數百台Digit機器人的生產能力,號稱未來有能力擴展到每年10,000台機器人。為加速機器人更好的應用,公司對機器人非必要的結構和功能做了刪減,以功能第一的思維保留最精簡、最核心的結構部分,例如機器人末端執行器採用夾爪,而非五指手的形態,他們的說法是「高度仿人的機械手非常複雜」。Agility公司已經和亞馬遜、福特等公司進行合作;Digit已經在亞馬遜的工廠進行測試,用於物流的搬運,並在GXO全球物流公司進行物流任務應用。Agility公司被評估很有可能成為全球首個實現商業化量產的人型機器人公司。
我們從目前全球主要AI Robot的產品發展,整理出幾個重點趨勢:
- 美國科技公司具備算力和大模型優勢,有望引領人型機器人發展。
從機器人的進展來看,TESLA處領先地位,它從晶片、資料訓練、大模型到本體製造、運控模型均自研自產,2025年已喊出千台量產目標。還有NVIDIA,其廣為人知的強大算力能力加上資料訓練平台優勢,已利用晶片、資料、大模型、開發平台,為人型機器人公司打造底層開發生態,NVIDIA現今至少和14家人型機器人公司進行合作。
其次是Google,從放棄本體聚焦機器人大模型,到再次牽手機器人公司合作下一代人型機器人,Google也是具備大模型能力。OpenAI目前透過投資和自己小規模研發機器人本體。此外,還有蘋果和Meta,蘋果目前專注機器人細分感知領域,平台推出機器人感知系統ARMOR可用於機械臂,Meta已收購Digit觸覺感測器團隊。
- 以美國為首的創業型公司與科技公司加強大模型合作,加速商業化場景落地
Figure公司的Figure02機器人已獲得BMW、Amazon等訂單,公司預期這兩大客戶未來4年訂單需求10萬台,25年銷量目標幾千台,Figure公司先前獲得許多科技巨頭的投資,股東背景雄厚。
Agility專注物流場景,已得到Amazon、GXO訂單,商業化放量進度最快,目前正在建置1萬台機器人的產能。1X專注家庭場景,2025年目標1千台產量。Apptronik計畫2025年底商業化量產,已與Google合作下一代機器人。德國Neura Robotics 2025年1月在手訂單10億歐元。我們觀察到以上公司均有加入NVIDIA的Cosmos,大模型加持反覆運算加速。
- 機器人公司均重視落地應用場景,2025年是人型機器人量產元年
絕大部分公司先落地汽車生產線和物流場景,部分企業如1X和Neura Robotics也重視家庭應用場景,雙足和手部形態多樣化。2025年各家的目標從幾百台到幾千台不等,預計2025年這些機器人公司的總產量可望突破1萬台。隨著大規模量產,供應鏈將切換至亞洲的業者,綁定特斯拉的Tier1為目標。
人型機器人的首要發展趨勢就是它會有更平穩迅速的移動步伐和手部夾持,儘管當前人型機器人和人類一樣擁有手足硬體並相互關聯,但它仍不像人類一樣擁有天生的靈活性,甚至在某些方面表現得比我們預想的更加笨拙,人類這種端到端的能力是與生俱來的,而機器人則不具備。因此人型機器人的感測器與肢體觸覺技術仍然會是眾多公司技術追逐的方向,例如機器人行走時判斷機器人本身與其他物體之間的距離的光達技術,或是壓電元件、形狀記憶合金(Shape Memory Alloys, SMA)等材料技術。人類之所以能夠做出精準的動作,其原因在於人體擁有豐富的感知神經網路,這些神經網路通過為大腦提供感知信號,進而實現精準控制。
機器人發展的一個原因是人力的短缺,另一個主因就是扮演機器人大腦的人工智慧技術,在GAI不斷有許多應用突破下,人工智慧被看好能讓機器人執行複雜的動作和辨識任務,加速人型機器人的普及,人型機器人是人工智慧技術實現的最佳載體之一。不過挑戰之一在於技術實現的機器人成本與落地場景的應用。技術實現被探討的重點是外型一定要長得像人嗎?以輪式的物料運送搬運的自主移動式機器人來說,其移動效率和靈活性遠遠高過雙足步行機器人,那為何今天有那麼多的企業投入人型機器人的產品呢?機械手臂有它使用上的侷限性,我們觀察機器人的發展從工業用機器人到產業用機器人,從機械手臂、機械手臂搭載AGV、到以履帶式、全向式輪軸驅動的AMR等,它們均只能在同一平面空間作動,若機器人要執行教育、娛樂、照護、陪伴、接待、導覽、探勘、救災等應用,人機協作不可避免,而工廠裡的機械手臂在這些應用上就有其侷限性,因此相較於機械手臂的人型機器人在工業應用外的智慧化功能展現,就更像人機協作,互動上比機械手臂更具親和性,且可快速的在不同任務間彈性切換功能;人型機器人因為與人類外型相似,有望更能適應人類社會環境,在不同任務間彈性切換,且因其理解世界、與世界互動的方式都跟人類相似,人型機器人已被視為AI時代的工人、AI時代的人類伴侶。
更平穩的步行移動和手部夾持、更智慧的感測技術(語音辨試和視覺辨識)、勞動力不足的問題還有人工智慧技術帶來的突破,是我們認為當今人型機器人發展的重點和理由。觀察上述主要投入人型機器人的全球企業,似乎都專注於機器人足部步行移動能力的平穩性以及手部的靈巧操作,我們看到波士頓動力ATLAS機器人能夠做出前後空翻以及舞蹈這種複雜動作。人型機器人組成的足球隊要在2050年的RoboCup(機器人世界盃)和真人足球隊比賽,而且機器人要贏得這場比賽,這個新聞讓我們有了豐富的聯想,開始想像機器人和真人互相踢球射門的情境。
二、臺灣的機會
圖2是人型機器人各結構所展現的性能,探討臺灣相關產業在目前全球人型機器人如火如荼發展下的機會前,我們盤點人型機器人技術發展的挑戰主要是:1、自主移動,2、辨認識別,3、精密控制,4、通訊溝通。
圖3將人型機器人技術的發展列出,分別是利用晶片、感測器、演算法模仿人類感知的機器人認知技術、高精度控制技術、機器人自主移動、機器人通訊技術等等。這裡我們看到臺灣產業的機會,包括1、臺灣具IC製造的完整生態系與先進晶片的製程技術;2、完善的機器人零組件供應鏈;3、資通訊產品豐富的系統整合實績。
圖2、人型機器人各結構所展現的性能。資料來源 : 工研院產科國際所
未來每年可能有數百億美元市場規模的人型機器人,臺灣可以在應用上提供高附加功能的整合性方案,並以關鍵零組件的產品切入歐美業者的供應體系。也就是臺灣具IC製造的完整生態系與先進晶片的製程技術、完善的機器人零組件供應鏈、資通訊產品豐富的系統整合實績。
首先是臺灣具IC製造的完整生態系與AI晶片的製程技術,包括先進晶片的開發,7nm (含)以下製程技術。相關業者未來在先進異質整合封裝技術之創新晶片(如小晶片整合封裝模組、矽光子等晶片開發),以及異質整合微機電感測技術之創新晶片開發,0.35μm(含)以下之晶圓級製程也將會有一定的能量,因為這些將是賦予智慧機器人功能,像是人工智慧、高效能運算、高效能推理、高效能通訊等之所需。
圖3、人型機器人技術的發展。資料來源 : TESLA、工研院產科國際所
臺灣已具人型機器人零組件的供應鏈,業者有能力發展「辨識技術、驅控系統的重要零組件」,它們是滿足機器人眼睛(感測器)、手足靈敏的關鍵。如同人類一樣,人型機器人主要作動的機構是它的運動關節,其由控制系統、伺服系統(驅動器、伺服馬達、編碼器)、減速機組成,這三個機構件的成本占比估近7成。
人型機器人的運動關節至少要滿足幾個特點:1、高效率;採用直流電池驅動的人型機器人,講求的是續航力,想要長行程的續航力,傳動機構、運動機構必須要有優秀的傳動效率。2、輕量化;人型機器人重量要求非常苛刻,因為其運動關節不是幾個,是幾十個,甚至上百個,重量對於機器人關節來說非常重要,所以我們也看到有些機器人的骨架從鎂合金變成碳纖維複合材料。3、模組化;須讓人型機器人在它的手部或是足部有拆換的易用性和不同機器人之間的通用性,這牽涉到實用化的量產技術。4、高扭矩高剛性;人型機器人面臨的應用場景免不了有接觸和碰撞,所以它的承載能力要很高,而且要有一定的過載能力,因此所使用的聯軸器、時規皮帶、齒輪、直流伺服馬達、減速機、行星式滾柱螺桿等,都要有一定的扭矩和剛性。5、有成本競爭力的量產技術,這涉及到落地應用的剛性需求。
此外多年來,臺灣已在資通訊產品具備豐富的系統整合實績,若未來人型機器人全球每年的市場規模達數百萬台,臺灣許多具資通訊技術整合能力的廠家,絕對有量產機器人產品的能力。
生成式人工智慧問世以來,人們真正注意到它是能接受文字、聲音、影像或數據的多模態技術,模型在加入更多參數後,可以處理更複雜的工作,這也讓人對智慧機器人未來發展有了更多的想像。
相比智慧型手機、個人用電腦等端側設備,人型機器人需要的是語言、影像、動作結合的多模態大模型,從單模態到多模態,有望實現更好的大腦。目前在主流的具身智慧大模型中,普遍採用VLM(Vision Language Model,視覺語言大模型)作為骨幹,擔任「Task Planning」的任務,即所謂的大腦。人腦的組成主要為大腦和小腦,人類大腦的主要功能是記憶、思考、判斷、決策、解決問題。小腦主要負責控制身體活動協調與平衡,現今的閉源模型使得很多具身智慧團隊需從頭開發大腦和小腦。整體來看,由於訓練資料的缺乏,大腦的「Task Planning」能力相對成熟,而小腦的「Motion Planning」則較弱。近日受到相當關注的語言大模型DeepSeek-R1,它的開源策略被認為有望在大腦層面降低產業門檻,推動更多的力量向更底層的運控集中。
人型機器人的小腦由機構件主責,我們觀察到小腦已是許多機器人企業擅長的領域,對於它作動的機電控制上愈來愈有信心,在人型機器人的運動關節作動上,追求的很多技術指標與工業機器人區別很大,例如控制技術、驅動技術等,還有人型機器人的手臂不像工業機器人被要求的精度、高速、大負載,但是要具備安全性、高扭矩密度、抗衝擊等,這些帶來了電機選型、傳動方式上的設計挑戰,包括輕量化結構開發技術、動態環境適應技術、複合薄型馬達動力耦合技術等。
小結
人型機器人相較工業機器人是更複雜的系統,製造難度更高,如果機器人本身一些硬體持續優化,例如1、高複雜度靈巧手的功能實現;2、螺桿量產與降成本;3、諧波減速機產業鏈完善;4、力感測器技術;5、機器人視覺與動作捕捉技術等,這些都是現今臺灣業者有能力的項目。若加上有真正剛需的落地應用場景,那麼人型機器人就能夠實現產業化,從人型機器人量產節奏的角度,2025年將會是突破性的一年。萬台級別的量產將帶動下游產業鏈進入產品量產階段,而萬台級別的資料獲取和訓練有望真正解決資料匱乏的難題,推動人型機器人向更通用化、更實用的階段。