立花里子种子 千寻智能韩峰涛:到2025年底,投资东说念主会更看好具身智能

发布日期:2025-04-01 04:52    点击次数:160

立花里子种子 千寻智能韩峰涛:到2025年底,投资东说念主会更看好具身智能

文 | 王方玉立花里子种子

裁剪 | 苏建勋

来源:智能显露

显露(Emergence),是生成式AI海潮的一个要害气候:当模子范畴扩大至临界点,AI会展现出东说念主类一般的灵敏,能会通、学习致使创造。 「显露」也发生在试验宇宙——硅基文雅一触即发,AI范畴的创业者、创造者,正在用他们的灵敏与头脑,点亮兑现AGI的漫漫征程。 在新旧坐蓐力轮换之际,《智能显露》推出新栏目「显露36东说念主」,咱们将通过与业界要害东说念主物的对话,纪录这一阶段的新想考。

“为什么机器东说念主这样火,然则落地的运用却那么少呢?为什么机器东说念主的销量老是上不去?”

2023年6月30日,照旧珞石机器东说念主CTO的韩峰涛在上发表的万字长文《当机器东说念主拥抱大模子》中提倡这些疑问。文中,韩峰涛意志到机器东说念主可用性差、浸透率低的根源在于智能水平不够,并找到了AI大模子——这个能够处置机器东说念主智能问题的最终谜底。

数月后,韩峰涛离开珞石机器东说念主再创业,地方是“具身智能”。

韩峰涛找到了高阳。高阳博士毕业于有着“具身智能大本营”之称的伯克利大学,在计划机视觉和强化学习有多年臆想教化,目下是清华交叉信息臆想院的助理老师和博导。

一个是机器东说念主硬件行业的老兵,期待机器东说念主可以借助AI醒觉智能;一个是臆想AI十多年的科学家,但愿AI能够赋能物理宇宙,韩峰涛与高阳两东说念主一拍即合,千寻智能就此创立。

千寻智能公司前台 来源:作家拍摄

两个工夫诞生的首创东说念主,给千寻智能赋予了浓郁的“理工男”气质。

千寻智能位于西二旗软件园的办公室,前台并无过多的遮挡,最吸睛的则是一台自家的东说念主形机器东说念主正在门口进行调试。

从首创初期几个东说念主的团队,到当今快要60东说念主,公司范畴的快速扩展让办公空间略显细微,责任日里,会议室险些全满,采访本日致使很难找到酣畅会议室。

在这样极简的办公空间中,韩峰涛在与《智能显露》采访中应景地说说念“这是我二次创业,资金使用着力在业内是很高的。”

可为了接管东说念主才,千寻智能也可以不吝重金。

前不久,千寻智能挖来前字节高出 AI 工夫各人解浚源,担任具身智能部正经东说念主。在韩峰涛看来,兑现具身智能需行业最优秀的东说念主才,这些东说念主才很贵,但值得用钱。

咱们也和韩峰涛聊到脚下投资机构对具身智能的复杂情感(采访发生时,朱啸虎对具身智能的“看空”言论还未出现)。赛说念虽火,但投资机构关于其中的智能化、生意化远景,仍无共鸣。

“到本年年底,他们折服就看好和信托了。”韩峰涛对《智能显露》自信地说说念。

纪念第一次创业的历程,韩峰涛样貌那是“拿着锤子找钉子”,主淌若为了用上终生所学的学问;第二次创业,韩峰涛想要回首到最简直的阛阓需求——处置机器东说念主的智能问题,提高机器东说念主的泛化才略和可用性。

同期,韩峰涛还学会了更有用率地“用钱”。他的教化是,公司经营最大的阔绰来自于“重作念”,要幸免这个问题,管制层关于要落地的决策必须深度想考、诚心诚意,还要信守政策定力,把钱花在公司高下皆原意的一致方针上。

当下,具身智能公司正扎堆发布东说念主形机器东说念主新品,设施快的,则忙着送机器东说念主进工场和生意门店,它们也被外界和媒体更多地宽恕和扣问。

千寻智能则奋战在另一条跑说念上。千寻既作念软件,也作念硬件,但把更多元气心灵投向了具身智能模子研发。韩峰涛一直宝石的不雅点是“如果一家作念机器东说念主本色的公司不作念具身智能模子,它也不知说念什么是好的硬件。”

“咱们目下在模子进修和机器东说念主本色研发上的元气心灵分拨,大要在8:2。如果一产物身智能企业的方针是达到GPT3.5的水平,企业的主要元气心灵应该放在模子才略上。”韩峰涛示意。

具身智能是全球顶级的科学家和专科东说念主才起劲攻克的前沿问题。它代表着东说念主类在AGI以外的另一个终极假想——让机器东说念主像东说念主一样通过交互、感知和活动自主实施各类复杂任务,匡助或替代东说念主类。

正因“终极”,通器具身智能一度并不被投资机构所信托和招供。与AI大模子相似,这是个斗胆的、长周期的、不细目性高的赛说念,直到2024年10月好意思国具身智能公司Physical Intelligence(以下简称PI)的一场发布会。

在发布会展示的demo中,PI把叠一稔作念到了基本实用化的水平,兑现了机器东说念主前所未有的泛化才略,这让好多投资机构、从业者们看到了通器具身机器东说念主的但愿。

PI的新模子发布成为里程碑事件。具身智能范畴此前存在着多条的不同的工夫途径,它们运行平缓向PI的“融合端到端大模子途径”握住。

具身智能赛说念在一级阛阓的热度也在PI的发布会之后飙升,成为继大讲话模子后新的投资热点赛说念。2024年10月于今,国内的星动纪元、星海图、自变量机器东说念主、它石智航等多产物身智能创业公司拿到数亿元的新一轮融资。

千寻智能亦然其中之一,它于近期完成5.28亿元Pre-A轮融资,投资方包含了阿好意思旗下Prosperity7 Ventures(P7),招商局创投、广发信德、靖亚成本、东方富海、华控基金等。

本年3月中旬,千寻智能对外皮露了Spirit v1 VLA 模子一镜到底叠一稔的demo(样片)视频,复现了好意思国公司PI的泛化操作才略。这亦然公司自建设以来获得的最大的阶段性工夫恶果。

韩峰涛承认通器具身智能的兑现还很远,但他并不挂念在短期内会际遇瓶颈。

“具身智能跟大模子一样也存在Scaling Law,模子才略主要取决于数据的质地和数目。而在目下行业内高质地数据很少的情况下,以PI为代表的厂商一经达成了可以的效果。改日跟着数据质地晋升和数目增多,模子才略还将赓续晋升。” 他对智能显露示意。

要对东说念主类产生价值,结出生意化果实,也并不需要万能的具身智能。韩峰涛认为,改日2-3年具身智能就可以在一些细分场景落地和生意化,从而让企业发展和融资愈加可赓续。

在咱们的采访和知乎的万字长文中,韩峰涛皆提到了刘慈欣的演义《朝闻说念》。

在这个短篇演义里,原始东说念主因为仰望星空的时辰超越了某个预设的阈值,而触发了外星高档文雅——天地排险者的警告。因为在高档文雅看来,当人命意志到天地奥密的存在时,距它最终解开这个奥密唯有一步之遥了。

韩峰涛认为一样的哲理也稳当当下的具身智能赛说念。“经过半个多世纪的发展,今天的机器东说念主产业也许正迎来仰望星空的那一刻。”他在文末抒怀地写说念。

以下是《智能显露》和千寻智能首创东说念主韩峰涛的对话。内容略经裁剪:

“具身智能的价值很快会成为共鸣”

《智能显露》:关于具身智能,投资机构好像还有比较大的不合,真格戴雨森说通用东说念主形机器东说念主还太早,Coatue叙述里提到具身智能可能不会有 ChatGPT 时刻。你怎么看?

韩峰涛:我认为到本年年底,他们折服就看好和信托了。

就好像部分投资东说念主正本的作风是“不投大模子,中国大模子公司没戏。”然则DeepSeek火了之后作风发生很大转换,致使不留心估值也但愿参与其中。

第一个,这些投资东说念主此前没看到中国企业能把东西作念出来;第二个,从工夫发展来看,具身智能一经具备落地的基础工夫才略了,仅仅产品形态界说,方针东说念主群,包括工夫开发回要再完善一些。

要开发一个通用东说念主形机器东说念主还很远立花里子种子,但改日2-3年具身智能就可以在一些细分场景落地,但不一定放在东说念主形这个形态上。

《智能显露》:你说改日2-3年具身智能就可以落地。能例如诠释一下哪些细分场景吗?

韩峰涛:比如说叠一稔的场景,服装厂、洗衣房皆需要叠多量的一稔。我在上一家公司处理过这个需求,原先的工业机器东说念主处置不了,但具身智能大模子可以,至于正经实施的本色是不是东说念主形无所谓,能处置问题就可以。

五月色图

《智能显露》:是以具身智能和东说念主形机器东说念主是两回事,并不是同步发生的。

韩峰涛:对,东说念主形机器东说念主和具身智能是两个不同的地方:东说念主形机器东说念主更强调本色的形态,而具身智能则不局限于东说念主形机器东说念主,更瞩目模子才略和AI才略。

在具身智能的观念中,机器东说念主可以呈现多种形态。

《智能显露》:你挂念具身智能下一步的智能晋升际遇瓶颈吗?

韩峰涛:我认为不会。第一个,叠一稔一经是一个特地难的操作了,如果具身智能可以叠好一稔,那其他好多任务皆可以完成得特地好,改日折服会解锁越来越多才略。

第二个,具身智能跟大模子一样也存在Scaling Law,当今的模子才略主要取决于数据的质地和数目。

目下行业内具身智能的高质地数据还很少,在比较少的情况下一经获得了很可以的效果。而咱们特地明确意意想,具身智能数据的质地和数目还会大幅增强、增多,在此基础上,模子才略折服会变得更强。

《智能显露》:比较AI大模子公司,具身智能大模子公司拿到的融资额要少。是不是作念具身智能大模子不怎么烧钱,可以花的少一些?

韩峰涛:融资金额和发展阶段是密切关系的,AI大模子一经发展7、8年了,具身智能大模子才一年多,融资金额折服不如前者。具身赛说念当今融的这些钱是不够的,改日折服还要再接着融资。

从用钱金额上来说,作念具身智能大模子可能不像AI讲话大模子花那么多钱。

一方面,AI大模子当初踩的坑、累积的教化,咱们可以鉴戒学习,比如怎么作念工程化、怎么培养东说念主才,这就能省不少钱。另一方面,具身智能需要的算力少,因为模子范畴小,咱们目下范畴在10B以内。

就千寻来说,这是我二次创业了,资金使用着力在业内是很高的,咱们第一个模子只花了很少的钱,然则获得了可以的效果。

《智能显露》:好意思国具身智能公司的估值更高,资金更多,要与其竞争,是不是得走性价比途径,像DeepSeek一样?

韩峰涛:是的,从全球竞争来看,中国具身智能企业折服照旧要讲性价比,得用中国相对比较好的工程师团队、供应链团队、工程化手段,才智追逐。

关于千寻的发展阶段来说,目下咱们融资的情况比较乐不雅,也饱胀撑持咱们工夫的快速迭代。

具身智能的改日折服是在中国。因为中国的硬件、供应链、采集数据工东说念主的工资皆更低廉;中国的运用场景特地多。在数采几百几千台的时候,中好意思可能还能PK一下。

如果咱们斥地一个1万东说念主、10万东说念主的数据工场,或者接管众包的方式去采集数据,好意思国折服是比不外的。

“不论在生意照旧工夫上,优秀的具身智能企业一定是软硬件皆作念的。”

《智能显露》:你离开珞石机器东说念主,再创业为什么遴荐了具身智能?

韩峰涛:第一次创业作念工业机器东说念主,我认为是拿着锤子找钉子,我是学机器东说念主阻抑的,是以上一家公司即是搞机械臂。但此次不是,第二次创业我认为要回到阛阓的简直需求,创业的契机来源于那儿,以及阛阓上需要什么样的产品。

具身这个赛说念创业的契机来源于AI的进步,AI讲话大模子、图像模子,包括一些视频生成皆是在杜撰宇宙。自关联词然,在杜撰宇宙获得告成之后,AI折服是要延迟到物理宇宙的。是以此次创业的中枢推能源照旧AI。千寻智能的中枢业务即是具身智能大模子。

《智能显露》:千寻会自研机器东说念主硬件吗?

韩峰涛:天然。关于一个软硬一体的产品,只作念软件折服不行。从生意化闭环上来说,行业再往后走的时候,如果唯有软件就很难卖出去,莫得营收,就莫得主见撑持你企业改日的发展。

第二个在工夫上,目下咱们通过一些网上的视频以及我方的数据工场的数据来进修模子。但改日模子的进化取决于咱们卖出去的产品荟萃到的、简直的场景里边的数据,这些数据会匡助模子赓续进化。

如果莫得我方的终局硬件产品,就拿不到这些数据。在自动驾驶行业,寰球一经看到只作念软件的缺点了。

是以不论从生意上照旧从工夫上,一个告成的或者有后劲的具身智能企业,一定是软硬皆作念的。

反过来,如果一家作念机器东说念主本色的公司不作念具身智能大模子,它也不知说念什么是好的硬件,它可能会作念好的零部件,但不知说念什么是好的整机。不知说念什么样的硬件遐想和迭代地方稳当具身智能。

千寻智能的机器东说念主本色 来源:作家拍摄

《智能显露》:你怎么看宇树最近这样火,它在好多东说念主看来是家硬件本色公司。

韩峰涛:宇树爆火给偏硬件的公司折服是带来一波红利。然则,机器东说念主要走向通用和万能,中枢不在硬件。

硬件火了之后,寰球率先会追问这个机器东说念主能作念什么,就会发现具身智能的问题不处置,绝大多数事情照旧作念不了。稍稍平定下来之后就会发现,机器照旧很笨,还得依赖于大脑的阻难。

《智能显露》:机器东说念主本色部分,千寻智能见长的是什么?是手照旧足?

韩峰涛:本色部分咱们是上半身见长。咱们的具身模子和硬件皆更宽恕于操作,主淌若机械臂和灵巧手这些。

千寻的方针是改日十年让10%的东说念主领有我方的机器东说念主,咱们想让机器东说念主去匡助东说念骨干活或者代替东说念骨干活,干活其实主淌若靠上半身。体魄的转移方式对干活有影响,但不要害。

《智能显露》:当今具身智能发展的瓶颈在什么地方?

韩峰涛:咱们认为是东说念主才枯竭。高阳之前说过一个不雅点,三年内东说念主才将成为具身智能要害瓶颈。因为工夫和know-how在快速迭代,你必须得找到一流的东说念主才智加速剖判迭代和工夫迭代的程度。

具身智能赛说念处于一个无东说念主区,天然工夫途径大约细目了,但到底将战争哪个地方走,内部还有好多小的点。这需要在最前沿的理智的、优秀的东说念主才来完成。

纪念深度学习从2012年到当今的发展历程,险些通盘大的施展皆是其时在臆想这个地方的优秀博士臆想出来的,等于是高校课题径直促进了产业化的施展。是以关于校招,咱们就盯着中国一流的前几个高校的优秀博士,臆想地方作念计划机和东说念主工智能的。

“具身智能Scaling Law还有很大红利,模子才略将赓续晋升”

《智能显露》:具身智能大模子存在一些工夫途径的不合,有的信托端到端模子,有的信托大小脑分层,还有讲话系统和感知系统等不同模块,千寻智能接管了什么样的途径?

韩峰涛:咱们是莫得别离大脑小脑的,就径直一个端到端大模子VLA (Vision Language Action),讲话、图像、算作皆在内部。

研究到这个模子要跑在机器东说念主上,端侧的算力有限,如果讲话部分太大,运行速率就没那么快,会影响机器东说念主反映速率。咱们就需要作念个弃取,在机器东说念主端侧放一个小的讲话模子,大要3B到7B,咱们基本上用开源的一经进修好的讲话模子。

模子大小,取决于你需要这个模子对环境的会通有多深。如果机器东说念骨干个浅薄任务,咱们就跑端侧的小模子,加上算作这部分,加起来悉数是10B以内的VLA模子就行了。

《智能显露》:我发现当今越来越多具身智能企业运行讲“端到端”了,这一经是行业共鸣了吗?

韩峰涛:是的,行业的工夫途径一经相对握住了。触发要素是前年10月好意思国公司PI的新模子,它把叠一稔这件事作念到了基本达到实用化的水平,这是个很大的工夫进步,是里程碑式的事件。

在PI之前,具身企业的demo(样片)皆是一些很浅薄的持取。雷同叠一稔这种流畅的、长程的、关于复杂对象的操作,正本的具身智能一直兑现不了。而PI的进修设施,即是端到端大模子VLA。

趁便提一句,PI的两位主要首创东说念主是咱们聚起原创东说念主高阳的师兄,他们并吞个导师。

《智能显露》:你们对具身智能的物体识别准确度,目下条件高吗?

韩峰涛:看场景条件吧,一般来说,具身智能模子关于识别的精度、准确度条件比自动驾驶要低一些,比如让机器东说念主拿个纸巾,识别错了再持一次也可以,不会像自动驾驶一样造成交通事故。天然咱们折服会赓续晋升它的识别度。

《智能显露》:你们当今怎么进修具身智能大模子?

韩峰涛:千寻当今进修具身智能大模子,跟进修大讲话模子的范式和设施基本是一样的。

先用质地没那么高,但各类性很好的海量数据作念预进修,让模子对宇宙有一些基本剖判,但这个阶段径直干活精度还不够,是以需要高质地数据作念微调,微调完之后再通过强化学习提高告成率。这个经由对应于大讲话模子的预进修、SFT(监督微调) 和RLHF(强化学习)。

《智能显露》:预进修和微调分别用什么数据?

韩峰涛:预进修用多量的互联网上东说念主类干活的视频,比如YouTube和爱奇艺这些,数据质地可以差少量,但一定要大,各类性一定要好;微调就用高质地数据,咱们用的是简直的遥操作数据,是在数采工场简直采集出来的。

举个学游水的例子,可以先看视频去了解基础的姿势也即是预进修,再请的游水教学手把手教学也即是高质地数据微调,最终学会游水。

《智能显露》:有的厂商用仿真数据,这类数据质地怎么样?

韩峰涛:每种数据源有我方的优舛误。视频数据量很大但精度不高;遥操作数据精度很高,但量不大。仿真数据的本性是比较易得,但精度不太好。咱们也用仿真,把视频和仿真用在预进修。

总体来说,当今莫得任何一种单一数据可以撑持大模子的进修。最合理的决策是把不同数据用在不同的进修阶段。

仿真数据关于刚性物体师法的还可以,稳当进修对刚性物体的持取。但关于柔性物体,比如叠一稔场景,一稔动了怎么变形和通顺,仿真数据的可用性不行。

《智能显露》:有一些厂商,如智元机器东说念主开源了一些数据库,这些数据其他家可以用吗?

韩峰涛:这类数据可以拿来作念预进修,但不稳当作念微调。

在刻下阶段,数据质地和硬件是强关系的,别家在他的硬件上采集的数据,在千寻的硬件上不成径直用,因为包括数据采集的频率、位置、精度、末端实施器规格等皆不一样。

这亦然为什么我说,好的具身智能企业,一定要软硬件皆作念,因为它是软硬聚首优化的。

“具身智能2-3年可以落地运用,但汽车整机厂不是合适场景”

《智能显露》:有些事情传统工业机器东说念主可以作念得很好,为什么当今照旧器具身机器东说念主来作念,比如在特斯拉工场搬电板。

韩峰涛:正本的工业机器东说念主和当今具身智能的中枢各异,在于具身智能有才略会通环境变化并颐养算作。但传统工业机器东说念主不可以,它是被编程写死的,只可几年如一日的重叠算作。

就搬东西来说,搬运物品的位置、口头发生了变化,传统工业机器东说念主不成我方颐养,但具身智能可以。

《智能显露》:特斯拉让东说念主形机器东说念主搬电板,这个场景是简直的需求吗?

韩峰涛:是简直存在的需求。不同产线的锂电板的规格、摆放的姿态、位置可能皆不一样,是以工业机器东说念主没法处理。然则生意上不一定算得过来账,东说念主形机器东说念主价钱太高,用东说念主工可能着力更高、更低廉。

《智能显露》:前段时辰有个很热的话题:东说念主形机器东说念主进汽车工场。你怎么看东说念主形机器东说念主进汽车工场?

韩峰涛:率先从生意化这个角度,汽车主机厂(即整车厂)其实不是一个尽头好的客户,因为正本主机厂的自动化程度一经特地高了,那内部天然说有不少工东说念主,但工东说念主操作复杂,用机器东说念主或者自动化特地难替代的,不稳当机器东说念主早期落地。

相背,汽车零件厂,例如电板厂是更好的落地场景,用东说念主更多,工序浅薄。

具身智能产业才刚刚运行,东说念主形机器东说念主硬件也刚刚运行,两个特地早期的工夫会通一块,去干一个特地复杂的事,这特地难。是以汽车主机厂不是很好的落地场景,马斯克我方造车,是以机器东说念主在我方工场用,但国内好多东说念主奴隶这样作念,我认为是没搞昭彰。

《智能显露》:有机构提倡了具身机器东说念主落地的先后轨则,认为工夫难度上to G小于to B小于to C,你怎么看?

韩峰涛:从工夫难度上确乎是,G端政府可能更多是维持行业和企业发展,给一些示范名目,可能会选一些相对比较顽固的场景,对安全性条件没那么高。

To B的工场场景亦然相对固定,但to C的场景因为每家的装修皆不一样,环境愈加复杂,是以难度也更高。

然则从阛阓范畴来说,C端大于B端大于G端,是以在选生意化方针的时候,要详细来看,均衡好落地难度和阛阓空间。

《智能显露》:具身大模子熟悉况且可用之后,通用东说念主形机器东说念主是不是就可以兑现了?硬件上还有哪些卡点?

韩峰涛:关于刻下来说,比较成为卡点的有灵巧手、双足的高动态性能、外界抗扰才略、续航才略,然后一些力传感器、数据传感器、电子皮肤这些其实皆是卡点。而且这些卡点皆不是AI进步可以处置的。

东说念主形机器东说念主要朝上阻难,是卡在材料、电机功率密度等一些基础学科问题上。具身智能朝上阻难,是卡在模子才略上。