姜大昕走“窄门”
发布时间:2025-06-19 14:34:31  阅读量:

  在姜大昕的办公室门牌上,曾经挂着他手绘的Logo,灵感正是来自阶跃函数(Step Function)——神经网络中最早的激活函数★◆★■◆,用折线图表示时,就像往上攀登的一级台阶★★◆■◆◆。

  这不仅是公司的名称和Logo,也寄托着阶跃的技术野心■★◆★。这些也促使它在通往多模态的两条路里★◆,选择了人迹罕至的那一条。

  相比起靠200万字上下文出圈的Kimi,借星野打出差异化的MiniMax,以及早早To B的智谱★■,阶跃星辰一直颇为低调★★◆■★,而在低调的背面,则是缺乏独特的亮点和标签,以至于在打到白刃战的大模型赛道,存在感并不强。

  希望能够一步走到位的阶跃星辰,选择收束C端应用,也正是因为想要实现这个目标,其技术复杂性更高◆★◆★◆★,因而无暇顾及其他“烧钱”还成果微薄的业务。

  被称为★★◆◆★■“多模态卷王★★■”的阶跃星辰于2023年4月成立◆★■◆■◆,其Step系列基座模型研发速度快,模型凡是发布就必定“量大管饱◆■◆■”。

  恒业资本创始合伙人江一告诉字母榜■■◆★,尽管阶跃星辰的野心不小,但投资人首先考量的正是技术路线目标能否达成,如果偏差太大,资本恐怕难以买单■★★。

  客观来看,在公认多模态(视频+语音+文本)是AGI最终形态的当下★■■■◆,更成熟的技术路径,是基座大模型从文本到语音到视频的小步慢跑,先独立发展,再互相铺垫迭代到多模态大模型。

  就在数天前,阶跃星辰被爆出在去年12月对角色扮演类Agent产品“冒泡鸭”停止大范围投入◆◆■,原团队合并至对话产品■◆■◆★“跃问★◆■■★◆”(现更名为“阶跃AI◆★■◆◆”),仅留部分员工运维。

  欧昆告诉字母榜,小鹏、理想等汽车正在开发垂类Agent,阶跃借助车载助手的合作形式◆■◆★■■,在数据源上难免落后于车企自身的agent。

  不同模态,也就有不同的算法和结构,拼装出的多模态如何整合统一最终丝滑配合也成为了当下的新难题。

  曾经,谈及从微软出走创业,姜大昕引用了大学好友的一句话“这个世界上每天刮很多风◆★■★,但这个风刮到你家门口◆■◆■★,一辈子就那么一两次”。

  根据市象报道■◆,阶跃星辰Tech Fellow段楠离职,任京东探索研究院视觉与多模态实验室负责人★★。公开信息显示,段楠最初在阶跃星辰对外身份是视频生成模型负责人,后期以Tech Fellow的头衔出现◆■■★★。

  如今◆★◆◆★,“就连阶跃星辰做的最好的视频模型团队都出走,让人担忧,阶跃拿到的资源是否能支撑他们完成设定的路线?”某头部科技大厂大模型从业者直言。

  在竞争异常激烈的大模型赛场■◆,去年迅速崛起的六家里,每一家都有其标签◆■。月之暗面是长文本★◆■■■,智谱是B端市场■★■★■,Minimax是垂类陪伴赛道,百川是医疗。相较之下,求全的阶跃星辰似乎少了些标签,因此也就少了些记忆点■★★◆■。

  需要注意的是,首个通用Agent的概念已被Manus锁定,阶跃已经失去竞争通用Agent入口的先机。

  “现在投大模型公司,主要就两个核心要点■■★★★■,第一个是容错率◆★◆,第二个是成功的概率。”

  如今■■■★,当风冲的方向与姜大昕相反,打逆风局的阶跃星辰想要坐稳牌桌■◆◆,恐怕要准备新筹码了。

  根据chatBot Arena(知名大模型评测网站)统计,截止6月4日■◆,在统计的242个大模型中,除了字节◆★■★■■、阿里、腾讯等科技大厂外★■■★,创企中DeepSeek稳定在榜单前10 ★◆,六小龙内◆★,零一万物和智谱上榜,其中智谱的GLM-4-Plus-0111位居26位(Rank UB)◆★■。

  “我咨询开发者平时使用哪家大模型做基座来做APP或Agent开发时,几乎没有听到过阶跃的名字■◆。”

  但对于阶跃来说,无法忽视的是一个悬在头顶的问题■◆★★◆★,阶跃星辰的“AHA moment”何时来临?

  于是,在阶跃星辰成功前◆★,相比起使自家大模型在文本、语音、视频生成等任一维度拔尖儿◆■,阶跃星辰的重心会落在原生多模态模型的内部调整,这也造就了阶跃大模型的缺乏亮点。

  而不管是否与企业深度合作,以及基于有限的数据input,能不能拿出亮眼的Agent功能,还要看阶跃Agent团队的答卷。

  或许这对阶跃来说是最保险的合作形式◆◆,阶跃能够借此★■◆◆■◆“换量■■■”获得用户,OPPO也能进一步夯实AI手机的概念。

  同时,在人才密度空前之高的大模型赛道,阶跃星辰的创始团队也低调到少了些亮点★◆■。

  而阶跃在当下要走的是一条比OpenAI更激进的路线◆■■,即挑战端到端的原生多模态大模型★★★■◆◆。一步走到位尽管激进■◆◆,一旦成功也必然是巨大的技术突破■■★★。

  对此,亦有阶跃员工告诉字母榜(ID:wujicaijing),去年年底冒泡鸭业务组确有裁减,但主要针对产品、测试、运维等岗位■★,同时,近期视频模型团队部分核心成员跟随段楠加入了京东。

  尽管阶跃星辰在“冒泡鸭”业务爆出调整时回复称,将在汽车、手机、具身智能、IoT等关键应用场景的智能终端和Agent布局,比如与吉利汽车拓展“AI+车”的场景,还与智元机器人达成战略合作,探索AI+具身机器人应用场景◆★■■◆,但阶跃的探索似乎并不深入。

  姜大昕在接受媒体采访中表示,阶跃星辰的差异化特点就是多模态能力,多模态领域存在着非常巨大的机会。

  5月,阶跃星辰创始人姜大昕接受硅星人采访时曾说■◆■◆★,■■◆◆■“国内的大模型公司里,像我们这样重视模态的全覆盖并且坚持原生多模理念的公司并不多。我们认为多模态是实现AGI的必经之路■◆★★■。”

  阶跃星辰对投流的谨慎或许是阶跃AI■★◆★◆★“不被看见”的原因之一,不过,同样陷入窘境的还有阶跃自家的Step系列大模型■★★■★。

  作为颇具影响力的第三方大模型测评网站■◆,chatBot Arena以其影响力吸引大模型企业加入测试自己的新模型★◆,也是OpenAI 的GPT-4o的首发地。

  在某科技大厂做AI产品经理的陈然(化名)告诉字母榜,尽管阶跃星辰多模态模型占比极高■◆◆★◆,样样都全,但似乎成了开发者眼中的大模型调用备选项,“论便宜★★■、版本又多的有阿里通义,论文本分析场景特长有DeepSeek◆■■、Kimi,阶跃缺了点存在感和记忆点■◆★★◆。■■★◆■◆”

  《对话阶跃星辰姜大昕◆★◆■■★:Sora技术有局限,多模态理解生成一体化才是未来》★◆★■◆◆,来源:界面新闻■★◆◆■■。

  一定程度上◆◆■,chatBot Arena的排名代表了外界对大模型企业们的认知,尽管第一时间推出了自家的推理模型◆■★,但阶跃星辰的榜上无名,映射的正是DeepSeek引发新一轮竞赛后,大模型创企的尴尬。

  “去年Kimi光投流一个月能烧一亿,相比之下,阶跃AI靠的几乎是自然流量。”

  《阶跃星辰To C产品“冒泡鸭”将停运◆★■,重心转向终端Agent|智能涌现独家》,来源智能涌现。

  但在可灵AI宣称营收破亿的当下◆★★◆◆,阶跃的视频大模型对开发者的吸引力有限,此番视频模型团队的调整,也让其技术迭代速度面临更艰巨的挑战。

  不同于OpenAI式的在文字大模型上逐步添加语音◆★◆◆、视频以进行多模态融合的道路,姜大昕希望阶跃星辰可以做第一个迭代出端到端的原生多模态大模型。

  对此★■★◆★,姜大昕在接受硅星人采访中曾说“去年大家对Sora感到兴奋的时候★◆,我们非常失望。”原因正是由于阶跃星辰团队认为大模型发展的主线是理解生成一体化,但Sora没有在这个路线走◆◆■■★,走弯了。

  尽管有微软背景■◆★,但在大模型领域■◆◆■■◆,创业者有杨植麟这样带着“天才少年”标签的■◆◆■◆★,还有如王小川★★◆◆、李开复这样的成功创业者,露面不多的姜大昕知名度并不算高。

  对★◆“没有亮点◆★◆■◆★”的阶跃星辰来说◆★◆◆★■,它还需要找到愿意为它的远大愿景买单的投资人。

  以OpenAI为例,Sora和ChatGPT分成两种不同的算法和架构推进,同时阶段性迭代,成熟后再融入同一套基座大模型,这也是国内大模型厂商的普遍选择。

  做一步到位的原生多模态大模型,意味着姜大昕选择了一扇“窄门”,这条路少有人行,荆棘遍布★■■■◆◆。也许它方向没错,但对需要亮点的阶跃星辰来说,逐梦AGI并不轻松,它还在等待自己的“奇迹时刻★■★★◆”◆■■。

  此外,作为位列AI六小龙的必备要素,相比起月之暗面自2023年初成立以来融资规模超110亿元★◆■◆★、智谱的国资频频加持,在六家里,阶跃星辰的融资规模并不是最多的,单轮的融资额也不是最高的。

  阶跃AI并未上榜◆◆◆,可以推测阶跃AI的月活尚未达到300万■◆★◆,因此并未被QuestMobile纳入榜单统计。同时,MiniMax旗下的星野为第10位■◆,星野的成功正是阶跃星辰■◆★★◆“冒泡鸭”业务调整的原因之一◆■★★■◆。

  阶跃星辰回应字母榜称■★◆◆◆,“早期,我们基于当时的模型能力进行了一些产品探索★■。2025年,随着多模态和推理能力的成熟■■◆◆,我们产品进行收敛,聚焦Agent方向。”

  无论是2024年7月一口气发布Step-2万亿参数语言大模型正式版、Step-1.5V多模态模型、Step-1X图像生成大模型★■◆★,其中Step-2国内大模型初创公司首次公开万亿参数MoE语言大模型,还是今年1月一周内阶跃星辰发布了6款模型,还包括推理模型■★■★◆◆。

  参考2月阶跃与OPPO 的合作◆◆■◆■★,阶跃为OPPO的智能助手小布提供“一键全能搜”■■★◆■、“一键问屏”(拍照识图)的服务,在Agent产品经理欧昆(化名)看来,“这是目前大模型厂商和B端用户最直观和基础的合作形式★■★◆★,并未涉及到基层调整,只是feature 级别的叠加,参考OPPO,阶跃与吉利汽车的合作,是否能拿到底层车机的系统权限,还是只做车载助手呢?”

  此前在智能涌现采访中,谈到ChatGPT带来的冲击■■◆★,姜大昕形容★◆“感觉整个世界在身边呼啸而过★◆■,留下自己在风中凌乱。◆◆★★■■”彼时茫然的他选择跳出微软创业★■■■,为“有时候风冲的方向跟我好像还挺一样的”而高兴■◆◆。

  这是姜大昕眼里阶跃星辰最大的亮点■★★■★■,但在外界看来,一步到位的多模态大模型仍然在PPT阶段,似乎难以获得直观的感知★■■◆◆★。

  《独家|阶跃星辰Tech Fellow段楠离职,任京东探索研究院视觉与多模态实验室负责人》,来源:市象。

  根据QuestMobile数据,截止2025年3月,在月活TOP15的AI原生APP榜上,六小龙里,月之暗面的Kimi从原本的第2滑到第4★◆★◆◆,月活仍为千万档,智谱、MiniMax包揽9、10位,月活不到千万,昆仑万维排在最末位,其天工AI月活为215万。

  姜大昕曾在采访中有类似的表述,他说,“有的科学突破可能在积累上早就发生了,但有点像大家说的‘涌现◆■◆■’,只看到◆■■■★‘砰’地一下上去了,是一种跳变。但这个朝着目标迈进的过程,只要没有达到那个点,它就是0★★◆◆◆。★◆■◆■”

  在大模型抢人大战下半场,巨头们如腾讯、阿里、字节等,创企如Kimi■◆◆■★、MiniMax、智谱等,都有着背景殷实的技术团队◆■◆★。技术瓶颈突破的不确定性是大模型厂商们都需要面临的问题,但无论选择那条路,时间都不等人■★★。

  在采访中★■★,针对视觉模型,姜大昕形容目前很多方案是“胶水模型”,把多个模型拼凑起来的思路不会是最终的形态。他希望自己能成为实现视觉模型一体化的那个■■◆■。对于未来,阶跃星辰无疑是乐观的。

  更危险的是,一旦阶跃被别家抢先■★■◆■★,那么被姜大昕视为其最大亮点的原生多模态大模型也将失去。阶跃星辰的定位,恐怕会比现在更加尴尬。

  进入2025年,国内大模型融资几乎停滞。同为明星创企★★■■,Kimi如今还未正式推出自己的视频生成模型,而OpenAI在宣称的400亿美元融资到账前,Sora也并未有新的进展■◆◆◆◆,都是因为足够宏大的目标背后◆★◆■,需要更多的资金。

  就职于六小龙的某市场人员告诉字母榜,作为市场岗,财大气粗的Kimi、MiniMax有更大的发展空间■◆◆◆★,相较之下,阶跃星辰的吸引力并不太高。

  2023年创业之前,创始人姜大昕是微软全球副总裁,主导过微软搜索引擎Bing★◆■◆★,微软云Azure、办公全家桶Microsoft 365等产品的自然语言理解系统。