當(dāng)下,人工智能技術(shù)正從“感知智能”邁向“行動智能”,如何科學(xué)、公正地評估機器人在真實物理世界中的真實能力,成為制約行業(yè)發(fā)展的核心命題。就在11月20日,智源研究院、智元機器人、Qwen、星海圖、自變量、清華大學(xué)、西安交通大學(xué),GOSIM 國際國內(nèi)合作伙伴進(jìn)一步攜手,共同推動生態(tài)建設(shè),并正式成立 RoboChallenge 組委會。這標(biāo)志著具身智能真機測評的開源協(xié)作不僅邁入了標(biāo)準(zhǔn)化的新階段,更以“開放共同體”的行業(yè)共創(chuàng)模式,為具身智能技術(shù)的落地與迭代注入新動能。
2025年深圳國際人工智能展覽會上,一臺名為“小量”的機器人正有條不紊地忙碌著:精準(zhǔn)地拿起杯子,熟練地接取冰塊,細(xì)致地添加各類小料,整個流程一氣呵成,僅用兩分鐘就呈上一杯色澤誘人的果味冰沙。周圍人群的驚嘆聲此起彼伏,而更令人矚目的,是這臺機器人背后那股強大的力量——2023年12月才成立的深圳初創(chuàng)公司自變量機器人。這家公司雖成立時間不長,卻已成功斬獲8輪融資,累計金額超20億元,成為具身智能賽道上一匹耀眼的“黑馬”。而這一切成就的背后,離不開阿里、美團(tuán)等巨頭的鼎力支持,以及一位清華學(xué)霸多年堅守的機器人夢想。

在自變量機器人創(chuàng)始人兼CEO王潛的宏偉藍(lán)圖中,單點任務(wù)不過是通用機器人走向廣泛應(yīng)用的一個小小開端,他真正的目標(biāo),是讓通用機器人真正走進(jìn)千家萬戶,成為人們生活中不可或缺的一部分。
初心:跨界逐夢的機器人情懷
王潛身上有著清華學(xué)子鮮明的特質(zhì):理性、執(zhí)著且富有遠(yuǎn)見卓識。他本碩均畢業(yè)于清華大學(xué),是全球最早將注意力機制引入神經(jīng)網(wǎng)絡(luò)的學(xué)者之一。其相關(guān)研究成果與Google在該領(lǐng)域的首篇論文一同登上頂級會議,這一成果后來更是成為Transformer架構(gòu)的核心,為現(xiàn)代大模型技術(shù)奠定了堅實基礎(chǔ)。
在美國南加州大學(xué)攻讀博士期間,王潛毅然將研究重心轉(zhuǎn)向了自己熱愛的機器人領(lǐng)域。他在頂級機器人實驗室潛心鉆研多年,深度參與多項機器人學(xué)習(xí)與人機交互研究。這段寶貴的經(jīng)歷,讓他深刻認(rèn)識到傳統(tǒng)機器人技術(shù)存在的諸多局限,也使得打造通用機器人的想法在他心中深深扎根。
博士畢業(yè)后,王潛曾在美國創(chuàng)辦量化基金公司,事業(yè)發(fā)展順風(fēng)順?biāo)?。然而,?nèi)心深處那份對機器人的執(zhí)著熱愛從未消減,“晚上經(jīng)常睡不著,滿腦子都是做機器人的想法”成了他當(dāng)時生活的真實寫照。2023年,大語言模型技術(shù)取得突破性進(jìn)展,王潛敏銳地捕捉到機器人行業(yè)迎來歷史性機遇,于是果斷解散基金,毅然回國創(chuàng)業(yè)。
這一決定并非一時頭腦發(fā)熱。在他看來,中國在硬件制造與供應(yīng)鏈領(lǐng)域具備全球領(lǐng)先優(yōu)勢。“美國硬件人才大多被大公司的‘金手銬’束縛,而中國的供應(yīng)鏈優(yōu)勢可能領(lǐng)先美國一個數(shù)量級。”更關(guān)鍵的是,中國的數(shù)據(jù)收集成本僅為美國的十分之一,這為具身智能的研發(fā)提供了核心支撐。

2023年12月18日,王潛初到深圳,自變量機器人正式宣告成立。這座充滿創(chuàng)新活力的城市,其完善的產(chǎn)業(yè)生態(tài)讓他深感震撼。“實驗室里機器人所需的硬件及零配件,大多產(chǎn)自深圳,在這里兩天甚至半天就能配齊所有零部件。”深圳強大的“產(chǎn)業(yè)磁場”,成為他實現(xiàn)夢想的理想土壤。
孤勇:堅守端到端路線的突圍
自變量機器人自成立之初,便毅然選擇了一條與眾不同的技術(shù)賽道——“大小腦統(tǒng)一的端到端大模型”路線。這一選擇在當(dāng)時飽受爭議,甚至遭到業(yè)內(nèi)專家的直接質(zhì)疑。
多年前,當(dāng)王潛首次提出端到端思路時,一位知名機器人教授當(dāng)面否定:“端到端雖然很有意思,但可能永遠(yuǎn)只是個玩具,難以真正落地。”面對質(zhì)疑,王潛始終堅守自己的信念,因為他深知傳統(tǒng)技術(shù)存在的瓶頸。
所謂端到端模型,與傳統(tǒng)分層架構(gòu)有著本質(zhì)區(qū)別。傳統(tǒng)模式將任務(wù)拆解為感知、規(guī)劃、控制等多個獨立模塊,每個模塊各自運作。而端到端模型則通過統(tǒng)一架構(gòu),實現(xiàn)從感知、規(guī)劃到控制的全流程閉環(huán)。“分層模型每多一步拆解,就會引入額外誤差和不可控噪聲,難以實現(xiàn)可靠執(zhí)行;而端到端統(tǒng)一模型能在‘感知—決策—執(zhí)行’全流程保持連續(xù)性,從根本上解決這一問題。”王潛耐心解釋道。
自變量的技術(shù)理念可概括為“縱向統(tǒng)一”與“橫向統(tǒng)一”:縱向?qū)崿F(xiàn)從視頻、傳感器原始輸入到機器人運動輸出的全流程由同一模型處理;橫向讓不同任務(wù)共用一個模型,訓(xùn)練與推理均在統(tǒng)一架構(gòu)下完成。這一理念在WALL - A模型上得到了充分驗證,該模型使機器人僅用二指夾爪,就能輕松完成拉拉鏈、疊衣服、澆花等復(fù)雜操作,數(shù)分鐘級任務(wù)成功率超過95%。
突破:從模型迭代到場景驗證
自變量機器人的產(chǎn)品演化軌跡,清晰地印證了其技術(shù)路線的正確性。成立僅兩個月,公司便成功研發(fā)出第一版具身智能操作模型,可完成切菜、倒水等復(fù)雜操作;2024年底,更是發(fā)布全球最大參數(shù)規(guī)模的具身智能通用操作大模型——Great Wall系列WALL - A模型,實現(xiàn)了三大核心突破。其一,多模態(tài)信息融合,能夠整合感知數(shù)據(jù)、自然語言指令與運動控制信號,實現(xiàn)輸入到輸出的端到端映射;其二,已展現(xiàn)出零樣本泛化能力,在部分未見過的新任務(wù)場景中無需重新訓(xùn)練即可適配,這是通用機器人的關(guān)鍵標(biāo)志;其三,在動態(tài)環(huán)境感知、實時任務(wù)規(guī)劃和超長程任務(wù)上取得突破,能完成拉拉鏈、扣扣子、掛衣服等長序列復(fù)雜操作。
定力:堅持真機數(shù)據(jù)路線
在數(shù)據(jù)策略上,自變量機器人堅持“高質(zhì)量真機數(shù)據(jù)”路線,與行業(yè)內(nèi)依賴仿真數(shù)據(jù)或互聯(lián)網(wǎng)視頻數(shù)據(jù)的做法截然不同。王潛態(tài)度堅決:“所有涉及復(fù)雜物理交互(如接觸豐富的手部操作)不應(yīng)完全使用仿真數(shù)據(jù)。我們探索了十幾年,結(jié)論是手部復(fù)雜操作無法通過仿真數(shù)據(jù)進(jìn)化。”
公司構(gòu)建了多渠道數(shù)據(jù)收集體系:集中式數(shù)據(jù)采集場地、分布式現(xiàn)實環(huán)境收集、機器人部署后的數(shù)據(jù)回流,從三個維度保障數(shù)據(jù)質(zhì)量,為模型訓(xùn)練提供堅實支撐。王潛將泛化能力分為四個層次:基礎(chǔ)條件泛化(適應(yīng)光照、物體位置變化)、跨環(huán)境泛化(從一個場景擴(kuò)展到多場景)、對象層面泛化(對未見過的同類物體完成任務(wù))、任務(wù)泛化(探索解決未學(xué)習(xí)過的任務(wù))。目前,自變量模型在前三個層次已展現(xiàn)出優(yōu)異的通用性。
引力:20億融資背后的巨頭布局
自變量機器人在資本市場的表現(xiàn)堪稱驚艷:成立不到兩年完成8輪融資,累計金額超20億元。2025年9月,公司宣布近10億元A + 輪融資,由阿里云、國科投資領(lǐng)投,國開金融、紅杉中國等跟投,老股東美團(tuán)、聯(lián)想之星等追投。值得注意的是,這是阿里云首次布局具身智能領(lǐng)域,也是美團(tuán)第二次加注。
阿里、美團(tuán)、京東三大巨頭在具身智能領(lǐng)域的布局邏輯差異明顯。阿里投資數(shù)量最多,已布局10家相關(guān)企業(yè),核心邏輯是通過云計算和大模型擴(kuò)展AI應(yīng)用邊界,構(gòu)建具身智能技術(shù)生態(tài);美團(tuán)布局更早更全,從物流、配送機器人到大模型、AI芯片,覆蓋上下游全鏈條;京東雖起步較晚,但節(jié)奏迅猛,4個月內(nèi)投資6家企業(yè),聚焦零售、物流、家庭三大垂直場景,打造場景導(dǎo)向的技術(shù)生態(tài)。
路徑:從To B切入,劍指家庭市場
面對具身智能領(lǐng)域備受爭議的商業(yè)化問題,王潛有著清晰且明確的規(guī)劃。他堅信“家庭是機器人最大市場,預(yù)計3 - 4年會出現(xiàn)早期產(chǎn)品”。經(jīng)濟(jì)學(xué)測算顯示,人類家務(wù)勞動占比高達(dá)四分之一卻未計入GDP,這意味著家庭機器人市場潛力巨大,甚至有望超越工業(yè)及其他場景。
自變量機器人的商業(yè)化路徑確定為“To B切入,逐步延展至To C”。王潛表示,2025年公司將在多個功能性場景實現(xiàn)商業(yè)化落地,讓機器人在開放、隨機場景中自主完成復(fù)雜操作。對于部分企業(yè)將人形機器人送入工廠從事簡單重復(fù)工作的做法,他直言“那其實就是PR行為”,強調(diào)真正有價值的商業(yè)化,必須依賴具身智能模型泛化能力的提升。
價格方面,王潛預(yù)測,消費者可接受、產(chǎn)業(yè)鏈可支撐的價格區(qū)間約為1 - 2萬美元(折合人民幣10萬元上下),目前仍需通過產(chǎn)業(yè)鏈優(yōu)化降低成本。他同時預(yù)判,類GPT - 3水平的具身智能大模型有望一年內(nèi)出現(xiàn),而人形機器人的“ChatGPT時刻”則需要3 - 5年。
遠(yuǎn)方:挑戰(zhàn)中構(gòu)建生態(tài)閉環(huán)
盡管自變量機器人已取得顯著進(jìn)展,但王潛仍清醒地認(rèn)識到通用機器人之路充滿挑戰(zhàn)。他指出,當(dāng)前限制機器人產(chǎn)業(yè)化的核心是“大腦”而非硬件:“展館里不乏運動能力出色的機器人,但它們提供的實用價值有限,更多是形式價值。”
面對挑戰(zhàn),自變量機器人正積極構(gòu)建具身智能生態(tài)。2025年9月,公司在合肥發(fā)布《具身智能生態(tài)建設(shè)計劃》,依托自研具身基礎(chǔ)模型,打造全球具身智能創(chuàng)新與產(chǎn)業(yè)核心樞紐;此前,開源端到端具身智能基礎(chǔ)模型WALL - OSS,這是全球首個面向物理世界交互、具備落地能力的開源端到端具身智能基礎(chǔ)模型。
對于長遠(yuǎn)發(fā)展,王潛明確“軟硬一體”的商業(yè)模式:“機器人無法復(fù)制Windows或Android的模式,需軟硬件高度耦合,軟硬一體是最合理的選擇。”
2025年世界機器人大會上,搭載WALL - A模型的“量子1號”機器人自如地完成制作香囊、整理客廳等復(fù)雜任務(wù),引來現(xiàn)場觀眾駐足關(guān)注。身高172cm、擁有62個自由度的“量子2號”,展現(xiàn)了全棧自研硬件的實力。王潛站在展臺旁,冷靜觀察著一切,臉上并無太多波瀾——對他而言,展臺上的掌聲只是前進(jìn)道路上的小小點綴,那個讓通用機器人走入千家萬戶的夢想,正以“深圳速度”一步步從藍(lán)圖變?yōu)楝F(xiàn)實。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

