http://alilang188.cn 2025-10-11 14:23 來源:科創(chuàng)板日報
阿里通義千問大語言模型負責(zé)人林俊旸昨日在社交媒體上發(fā)文表示,已在通義團隊內(nèi)部建立機器人和具身智能的小組。
在2025云棲大會上,阿里云與英偉達在物理AI領(lǐng)域達成合作。而此次阿里組建機器人和具身智能的團隊,標志著阿里通義大模型正式涉足具身智能大腦領(lǐng)域。
通義大模型走向物理AI
林俊旸提及建立機器人和具身智能團隊時表示,多模態(tài)基礎(chǔ)模型正轉(zhuǎn)變?yōu)榛A(chǔ)智能體,這些智能體可以利用工具和記憶通過強化學(xué)習(xí)進行長時序(long-horizon)推理,而它們絕對應(yīng)該從虛擬世界走向物理世界。
據(jù)了解,林俊旸畢業(yè)于北京大學(xué),其研究興趣集中于大規(guī)模語言模型和多模態(tài)大模型。他曾在阿里達摩院負責(zé)打造超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6,通用統(tǒng)一多模態(tài)預(yù)訓(xùn)練模型OFA,中文預(yù)訓(xùn)練模型Chinese CLIP等。目前是阿里通義千問的技術(shù)負責(zé)人。
“多模態(tài)基礎(chǔ)模型如果僅用于視頻生成,仍停留在相對初級的階段。視頻生成只能證明AI對物理世界的理解能力,更關(guān)鍵的在于控制能力。阿里從純軟件AI應(yīng)用轉(zhuǎn)向開發(fā)能夠控制智能終端與機器人的‘大腦’,實質(zhì)上是在重新定義勞動力,這其中蘊含著巨大的市場空間。”快思慢想研究院院長田豐表示。
他進一步指出,阿里當前采取的策略是:在軟件層面自研“大腦”,在硬件層面則通過投資整機廠商進行布局。
9月8日,阿里云領(lǐng)投了機器人初創(chuàng)公司自變量機器人1.4億美元的A+輪融資。此前,阿里還投資了法奧意威、星動紀元、逐際動力、宇樹科技等多家機器人企業(yè)。
“要實現(xiàn)從通用人工智能(AGI)到超級人工智能(ASI)的跨越,關(guān)鍵在于是否具備足夠強大的‘大腦’,能夠處理跨工業(yè)、農(nóng)業(yè)、服務(wù)業(yè)等多領(lǐng)域的復(fù)雜任務(wù),并達到人類水平。眼下整機技術(shù)路徑尚未收斂,硬件形態(tài)仍處于發(fā)散階段,因此通過投資參與是更為靈活和高效的方式。”田豐稱。
不止阿里,大廠紛紛入局
阿里的此番入局并不意外。當前,全球巨頭都在下場具身智能,物理AI成為新戰(zhàn)場。
在今年6月的年度股東大會上,英偉達 CEO黃仁勛曾提到:“人工智能和機器人技術(shù)是最大的兩個增長機會,代表著數(shù)萬億美元級別的增長機會。”
9月云棲大會期間,阿里云就與英偉達在物理AI領(lǐng)域達成合作。阿里云人工智能平臺 PAI 將集成英偉達Physical AI軟件棧,將為企業(yè)用戶提供數(shù)據(jù)預(yù)處理、仿真數(shù)據(jù)生成、模型訓(xùn)練評估、機器人強化學(xué)習(xí)、仿真測試等全鏈路平臺服務(wù),進一步縮短具身智能、輔助駕駛等應(yīng)用的開發(fā)周期。
除了阿里外,京東、騰訊等互聯(lián)網(wǎng)廠商也在瞄準具身智能的大腦。
京東已經(jīng)發(fā)布附身智能品牌JoyInside,為機器人、機器狗和AI玩具等提供機器人的“大腦”能力,并與數(shù)十家主流機器人品牌達成合作,包括陪伴類的Fuzozo芙崽、火火兔;教育領(lǐng)域的元蘿卜AI、心大陸、Folotoy、嚕咔博士;產(chǎn)業(yè)領(lǐng)域的眾擎、云深處、魔法原子等。
騰訊Robotics X實驗室與福田實驗室聯(lián)合發(fā)布具身智能開放平臺 Tairos “鈦螺絲”。據(jù)騰訊首席科學(xué)家張正友介紹,Tairos 具身智能平臺希望為機器人本體與應(yīng)用開發(fā)商補齊關(guān)鍵軟件能力,就像為各類機器人裝上“大腦”,讓機器人具備感知世界、規(guī)劃任務(wù)以及自主決策等能力,從被動執(zhí)行指令的機械體進化為主動適應(yīng)現(xiàn)實世界的智能生命體。
具身智能“大腦”邁入發(fā)展深水區(qū)
具體來看,不少大廠選擇從自身業(yè)務(wù)場景切入,落地具身智能技術(shù)。
“例如在倉儲、物流、服務(wù)業(yè)等場景中,讓具身智能‘大腦’達到解決專業(yè)任務(wù)的水平是具有可行性的。像順豐、美團等企業(yè),都在朝這一方向積極布局。它們在提升自身生產(chǎn)效率之后,再進一步通過生態(tài)合作將技術(shù)擴展至更多元的應(yīng)用場景。”田豐提到。
田豐還特別指出,阿里巴巴具備將自身業(yè)務(wù)與平頭哥芯片技術(shù)融合的潛力。“在優(yōu)化機器人大腦的基礎(chǔ)上,與平頭哥進行協(xié)同,推動云端AI芯片逐步向智能終端落地,無論是機器人芯片還是自動駕駛芯片,都將為大模型的規(guī)?;茝V提供硬件支撐。未來,更有機會構(gòu)建起機器人領(lǐng)域的‘AppStore’應(yīng)用生態(tài)圈。”
不過,具身智能的大腦仍處于探索階段。宇樹科技創(chuàng)始人王興興曾多次表示,當前硬件的性能其實足夠支撐應(yīng)用,核心瓶頸在于AI模型本身的能力不足,導(dǎo)致硬件潛力無法被充分釋放。此外,他對于當前熱門的VLA模型也持保留態(tài)度,認為其模型架構(gòu)仍需進一步的迭代升級。
談及大廠紛紛入局具身智能大模型所帶來的影響,田豐指出,當前機器人大腦的發(fā)展仍需聚焦于專業(yè)場景的突破。在他看來,專業(yè)場景下的應(yīng)用仍存在明顯不足,更不必說實現(xiàn)通用場景的覆蓋。
“物理AI對可靠性、精確性、速度要求更高。在物理環(huán)境中,一旦決策失誤,整條生產(chǎn)線上的光伏板或鋰電池都可能受到影響,帶來巨大的試錯成本,遠高于軟件AI的容錯空間。目前我們需要彌補的短板非常多,包括物理環(huán)境中的任務(wù)流程設(shè)計、業(yè)務(wù)深層知識以及行業(yè)經(jīng)驗等,這些方面都尚未被充分挖掘和理解。”
田豐相信,未來具身智能的“大腦”將邁入發(fā)展的深水區(qū)。“從數(shù)據(jù)、邏輯再到?jīng)Q策,整個業(yè)務(wù)流的思維鏈條將被拆解得極為細致,我們必須厘清其中每一個環(huán)節(jié)的因果依賴關(guān)系。”