車百智庫研究院調研報告《聚合智能視角下,智能機器人發展的思考與建議》(以下簡稱《報告》)顯示,智能機器人的量產與規?;涞刂罚h比智能汽車更復雜。它不僅面臨技術瓶頸,還涉及數據、標準、安全、倫理以及跨行業適配等多重挑戰。
基于對十余家智能機器人企業的深度調研,總結了產業發展的核心難題,并梳理了行業在發展路徑上的分歧與探索方向。
01
數據需求多、獲取難
與智能汽車相比,智能機器人訓練所需的數據類別更廣、數據量更大。類別上,機器人不僅需要移動數據(類似智能駕駛)、交互數據(類似智能座艙),還需要大量操作數據。數據量上,相較于汽車只有2D層面的制動加速、轉向2個自由度,機器人涉及3D移動和操作,僅單個手部就有超過20個自由度,全身自由度超過100個,需要訓練的“維度”更多,數據量需求可能更大(部分專家認為,現階段很難判斷具體需要多少數據量,只能大致判斷需求量會更大)。
智能機器人數據獲取難度更高。機器人訓練數據來源主要包括網絡視頻數據、仿真數據、真實數據三類。其中網絡視頻數據數量眾多但質量相對較差,由于不同機器人產品尺寸、重量、手部結構等細節差距較大,環節上往往只會用于早期的預訓練;領域上只能用于移動、交互訓練和操作訓練中的任務理解,無法用于涉及與人類、物體接觸等注重精確的具體操作訓練。
仿真數據能夠更好地匹配產品參數,但目前仍難以精準模擬真實世界的摩擦力、重心、物體表面軟硬度等物理細節,仍主要用于預訓練環節。
真實數據能夠用于各類訓練的全環節,但面臨諸多挑戰:一是缺乏冷啟動數據。汽車沒有智能駕駛也是一個完整的產品,因此智能駕駛汽車企業通過在數以百萬計的“人駕”汽車上安裝傳感器就能獲取真實駕駛數據。而機器人在智能水平不足的情況下很難大規模銷售,獲取真實數據只能依靠人為操控,成本極高。例如采集一條抓取動作數據需上千元人民幣(涉及光線、角度、物體材質等變量調整);訓練一個電池分揀任務需上萬條數據,成本達上千萬元人民幣;讓機器人勝任汽車工廠中的工作成本可能高達5億美元;
二是“數據孤島”效應更明顯。即使是汽車行業,一家企業的智能駕駛數據也因傳感器、硬件配置不同,難以復用于其他企業的智駕模型訓練。而相較行駛于道路等固定2D環境的汽車而言,智能機器人在尺寸、形態上的設計更加多樣,軟硬件配置更加多元,一個品牌的機器人真實數據更難復用于其他廠商。
因此,如何用少的算力、最低成本的海量數據做成數據飛輪,快速生產所需要的高質量數據是當前面臨的一個關鍵挑戰。 ?
分級體系和分場景標準制定難度大
智能機器人的分級評價體系存在分歧。參考智能駕駛L1-L5級分級標準,在智能產業發展早期階段,一套統一的行業分級評價標準,能夠更好的錨定行業發展階段和未來方向,更好的向公眾傳播。但區別于場景特定、評價維度有限的智能駕駛領域,智能機器人涉及操作、運動、決策等多項功能和技術,難以兼顧“準確性”與“傳播性”。
目前眾多行業機構效仿智能駕駛分級,提出了智能機器人分級框架。例如國家地方共建人形機器人創新中心發布的《人形機器人分類分級應用指南》,從具身智能、下肢運動、上肢作業、應用環境四個維度劃分L1-L4級標準(見圖表1);北京人形機器人創新中心牽頭制定的團標《人形機器人智能化分級》從感知、決策、執行、協作四個維度建立了四維五級評價體系(見圖表2);此外,部分企業也建立了自己的分級評價標準,例如星動紀元從能力、技術、場景三個維度建立了L1-L5(見圖表3)級的分級框架等。
圖表1 《人形機器人分類分級應用指南》
資料來源:公開信息
圖表2 《人形機器人智能化分級》
資料來源:公開信息
圖表3 《人形機器人分級框架》
資料來源:星動紀元
圖表4 人形機器人智能化、自主化演進路線
信息來源:國家機器人檢測與評定中心(總部)等聯合《機器人智能等級劃分標準》;上海市標準《智能機器人智能化等級評估規范》自主性-場景模型,中國移動、創業邦《2024年人形機器人研究報告》。車百智庫研究院整理
可靠性標準及相關測試驗證體系不完善。傳統工業機器人主要處理單一任務,以平均無故障時間(以下簡稱MTBF,Mean Time Between Failures)作為可靠性評價指標,主要考量硬件壽命。而智能機器人涉及連續復雜任務,面臨的環境更加動態,除硬件可靠性外需要增加功能可靠性(任務完成度)、動態場景適應性等測評認證,目前相關標準、測試體系尚不完善,影響工業場景落地應用。例如汽車產業流水線投資大,任何單點故障或停滯可能導致整條產線中斷,停產每分鐘將造成數萬甚至數十萬美元的損失,需要嚴格的可靠性標準和驗證體系。
場景側、使用側標準尚未形成。智能機器人不是一個行業,用于哪個行業就需要符合對應行業、場景的邏輯和要求,這一方面需要智能機器人企業不斷提升產品泛化性,針對應用做適應性訓練,也需要場景方、客戶明確標準和提供相應的支持。目前大多數場景可能尚未做好準備,例如部分商場顧慮消防安全,要求機器人提供防火證明,但因缺乏相關標準,形成“自證陷阱”阻礙了落地推進。?
面臨更加復雜的安全與社會倫理挑戰
需要嚴密的數據安全和網絡安全防護體系。與智能汽車類似,智能機器人需要傳感器和網絡連接來采集大量用戶、場景相關數據。由于智能機器人未來應用場景更加廣泛,可能無意間采集私人對話、空間布局甚至密碼信息,產生安全事故的后果會更加嚴重,需要更加嚴密的安全體系。
需要額外考慮人機協作安全性。區別于以“避讓”為主的智能汽車和以“靜態環境”為主的傳統工業機器人,智能機器人涉及大量人機混合作業,且運行于動態非結構化環境,處理人機協作的安全性成為核心挑戰。這既包括一些技術難點,如在動態環境(如地面油漬、突發障礙)下的緊急制動難度較大,也在如何安全應對各種人類互動行為上形成了corner case(邊角案例)難題。
面臨更加嚴重的社會倫理問題。一是關于機器代人問題,區別于只涉及“司機”的智能駕駛,智能機器人憑借通用性適用于更多場景和崗位,在量產階段可能引起更大面積的社會輿論問題;二是智能機器人在C端應用場景多涉及心智、身體不健全的用戶,如面向兒童的教育機器人、面向老年人和病人的陪伴護理機器人等,這可能產生由于知識庫的局限提供了錯誤或者帶有偏見的信息,形成錯誤認知而導致更嚴重的后果。
與汽車場景的融合面臨挑戰
汽車制造規模大、鏈條長、場景多,且自動化基礎較好,環境相對固定,已成為智能機器人早期落地的優選場景,但除上述數據、標準、安全問題外,也面臨諸多特有挑戰。
一是從“通用”到“專用”的轉變問題。工業產品創新往往要經歷demo-定制化方案-標準化產品的轉變,從“通用”機器人demo到汽車“專用性”產品面臨諸多挑戰:訓練和開發工具方面,汽車領域特有工具和訓練體系尚未形成,智能機器人廠商在汽車制造垂域的多模態數據采集和訓練體系尚不完善;人才和組織方面,既懂汽車制造業務又能理解人形機器人技術的跨學科人才較少,類似汽車產業的Tier1系統集成商角色尚未形成,缺少銜接“科學家”和“工人”的“工程師”角色;產品規劃方面,需要探索既能快速滿足汽車制造現有場景需求和成本要求,又能訓練機器人泛化能力向更多汽車乃至其他制造場景遷移的方案。
二是規?;缙诘募夹g能力、成本存在“先有雞、先有蛋”問題。一方面,現階段智能機器人的能力和成本尚不具備量產需求。目前智能機器人不具備高精度力控和手眼協調的精細化操作能力,且連續任務完成度較低,只能用于支持檢測、揀選、搬運等非接觸或不需要精確力控的簡單作業。例如Optimus用于電池包分揀和搬運,優必選Walker S系列在比亞迪、東風柳汽、極氪工廠執行安全帶檢測、車門鎖檢測、物料搬運、分揀任務等。且成本大多處于30-100萬元人民幣區間,需要進一步縮減到10-20萬元人民幣區間。另一方面,技術迭代和成本優化需要規?;慨a支撐,包括建立基于量產的數據飛輪體系,結合實際業務實現核心零部件的定型、標準化等。
圖表5 智能機器人在汽車制造場景應用路線圖
信息來源:蔚來汽車、閉門研討會發言。車百智庫研究院整理
發展路徑上的兩大分歧
“人形”和“非人形”存在分歧
人形機器人的重要意義已經形成共識。其具備更強的通用性和社交屬性,能夠最大限度的適應針對人類建立的環境和工具,且相似的外表能夠更好的被C端用戶接受,必然是智能機器人的“終極理想”。
但現階段是否有必要做人形機器人(特指雙足人形機器人,不含輪式等)存在分歧。一類觀點認為,人形機器人不只是終極理想,也是滿足大規模訓練數據需求的必然選擇。人形機器人具備更好的數據可得性,真實數據和模擬數據復現效率更高,例如通過人類動作捕捉采集真實數據、利用網絡視頻中存在的大量人類移動數據等。
另一類觀點認為,人形機器人需要同時考慮移動、操作、交互,實現難度較大,目前B端實際場景需求,主要來自以靈巧手為代表的更精細操作能力(如承擔以往機器人解決不了的裝配工作),半身、輪式機器人可能更具備優勢。且四足、輪式機器人與雙足機器人技術復用程度較高,可先采用四足、輪式機器人形成商業和數據閉環,再逐步過渡到雙足人形機器人。
優先C端和優先B端存在分歧
目前智能機器人主要用于展覽、科研等場景,市場潛力不足百億元人民幣,未來面向B端工業制造、商業服務、C端家庭消費,將形成三個數萬億元人民幣級市場。
目前行業對于C端和B端場景進入的順序和路徑存在分歧和不同的實踐。一類觀點認為,B端產品和C端產品在技術上并沒有明顯壁壘,相關技術和數據可以實現一定程度的復用,可先重點突破場景相對固定,價值更加明確的B端場景,隨著技術進步再逐步拓展至C端場景;
另一類觀點則認為,B端和C端面對的用戶、需求的能力完全不同。例如B端工業場景注重的是可靠性、效率、性價比,B端商業場景需要解決商業鏈條不同參與主體的訴求,C端則更需要建立大眾感知的品牌,賦予不同人群的實際價值;B端公司和C端公司將成長為兩類公司。如果最終目標是C端場景,應該更早的專注C端進行布局,期間采用先四足、再人形的漸進式路線。
執筆人:張永偉、于渤涵、張強