内蒙古防火门胶厂家 对话梅涛:世界模型不是口号,没有底座,具身智能走不远

出品 | 《态度AGI》内蒙古防火门胶厂家
作者 | 袁宁
对话 | 杨霞清 袁宁
编辑 | 丁广胜
过去年,生成行业始终在热闹与现实之间摇摆。
边,新模型轮番刷屏,“世界模型”的叙事被不断;另边,朴素的问题却始终法回避:客户为什么付钱,公司靠什么活下去。直到Sora关停,这种摇摆才多少被戳破了点:原来再大的技术声量,也不通向商业闭环。
智象未来创始人梅涛显然不太愿意把自己放进这种热闹里。
和当下AI行业里许多调、锋利、擅长制造叙事的创始人相比,他显得不太擅长利用“优势”。若只看外部标签,他足够亮眼:加拿大工程院外籍院士,论文引用过四万次,曾任集团总裁、京东探索研究院院长、微软研究院资研究员,主研发过多款全球数百万日活的商业产品。
但某种程度上,梅涛讨论的内容却显得有些“不时宜”。今天大愿意听的是“颠覆”,而不是“服务”;是“重构世界”,而不是“先把客户服务好”。可梅涛偏偏反复讲的是后者。他说,生成这件事,离商业化其实很近。但前提不是你做出个多炫的C端玩具,而是你得进入真实行业,进入创意生产、短营销、门店引流、影视制作这些具体场景。
某种意义上,这也是智象未来这公司的样子:在生成域声量不大,但技术上直保持前列,重要的是,收入和增长已经跑了出来。据梅涛透露,去年公司收入过亿,今年季度签约收入已过去年全年;To OPC端单月新增用户也已突破千万。4月16日,智象未来又宣布完成新轮5亿元融资。
梅涛很少接受采访,这也是他今年次较为完整地对外谈及这些问题。
对既要追模型,又要追产品;既要解释技术信仰,又要证明现实价值;既要回答“你们和大厂有什么不样”,也要回答“为什么客户现在就愿意买单”的公司来说,如果说过去几年,AI创业者常见的情绪是兴奋,那么到了今天,落在梅涛这样的创业者身上的,多像是种复杂得多的东西。
面对这种复杂,他反而说得直接:Sora关停为什么“意料之外,也是意料之中”;为什么普通泛C用户不是他们当前真正的核心用户;生成为什么会通向世界模型;而具身智能,又为什么离不开个足够强的底座。
顺着这些问题,你看到的不只是智象未来的路径,也是个创业者如何在模型、产品和商业化之间,搭条不悬空的线。
以下是网易科技《态度AGI》栏目与智象未来创始人兼CEO梅涛的对话内容,经不改变原意的编辑。
生成比大模型跑得慢,但离商业化却近
网易科技:先聊聊Sora关停,3月25日那天早上,你看到这个消息的反应是什么?惊讶吗?它像个意外,还是迟早会发生?你后来怎么理解这件事?
梅涛:我当时听到,并不是觉得特别惊讶,是意料之中,也是意料之外。
意料之外是,没想到它关得这么。我原来以为它会继续迭代,或者至少保留API服务。
意料之中是,我直觉得,AI生成这个域,单做C端业务很难跑出个特别好的商业闭环。OpenAI没有的流量入口,不像Google、字节这种公司,本身就有很大的C 端入口。生成这个域,本身又偏业用户,或者企业服务的商业模式。
如果只是娱乐型用户,来玩下,其实不会停留很久,留存率不,付费意愿也没有那么强。所以某种意义上,Sora 的关停,反而从反面验证了我们自己初的战略判断:生成这条路,创业公司当下阶段应该做好企业服务。
网易科技:这件事是不是再次说明,生成真正难的地,不只是模型能力,而是商业化路径?
梅涛:对,我觉得这是非常现实的问题。大模型公司后都要面对怎么挣钱的问题。
对AI 生成行业来说,这个问题到今天仍然是核心问题。我们直觉得,创业公司如果身处这个域,还是应该把企业服务作为主向。我们自己从Day One 开始,就不是想成为个纯 C 端娱乐产品,而是想做个以全模态世界模型为底座、面向企业服务的公司。
近如果你关注硅谷的些情况,会发现大对些扎扎实实做企业服务的公司,印象和评价都在提升。因为长期来看,把客户服务好、把商业闭环做扎实的公司,反而容易走得远。
网易科技:回头看,从你2023年创业到现在,你觉得生成行业大概走到哪阶段了?
梅涛:其实我觉得整个 AI 域,到今天都还是早期。我觉得上半场都还没有结束,可能上半场中场。
如果类比大语言模型的话,我们自己的判断是,Sora 出现的时候,大概有点像 GPT-3;后面像可灵这类模型出来,我觉得大概接近 GPT-3.5。
当然,如果你拿它去对标今天的大语言模型,比如 GPT-5这个阶段,它还是有点滞后的。但它也已经开始进入“智能涌现”阶段了,开始可以做比较大规模的商业化了。其实,生成是离商业化近的。
网易科技:为什么这么说,你提到说模型大概还在 GPT-3.5这个阶段,但其实它的商业化速度,比同时期的大语言模型要早?
梅涛:因为模型和语言模型大的不同是:语言模型不能有太多幻觉。如果它以很概率输出幻觉,那就是本正经地胡说八道。
但不样。我们服务的是数字创意行业,很多在语言模型里会被定义为“幻觉”的东西,在用户和演看来,其实叫“创意”。他并不会严格要求这个人须百分之百长成这个样子,这两个人的比例须点不差。你稍微偏点、给他多点想象空间,他反而觉得好。
而且它的商业化速度其实也是很快的,空间也足够大。今天你看到文字 token,100万 token 可能也就几块钱,但图片和不是这样。
我们做张图片,token 消耗量就很惊人;做段5秒、10秒的,token 消耗量就大。但用户愿意为它买单,因为它要么创造情绪价值,要么创造商业价值。
网易科技:但 token 消耗大这件事情,给你们带来价值的同时,对于用户来说也是成本。用户未愿意为全部成本买单。这个怎么平衡?
梅涛:其实还好。Sora 关停有个很大的原因,是它消耗力很多,但90 都花在预训练上了,训练成本太了。我自己粗略了下,它每年可能花掉50多亿美金,大头都在预训练上。
当然理也花钱,但我认为它主要是因为没有形成个真正的商业闭环。
对我们来说,多模态或者的付费用户收入,其实已经可以覆盖费用户的成本了。虽然 AI 行业有个共同特点:,付费率比较低;二,用户忠诚度比较低,到处游走,我们叫“游民”。
热闹的C端用户,目前不是生成的真实用户
网易科技:去年你们收入大概到什么规模?
梅涛:我们去年的收入过个亿了。而且我们今年 Q1的签约收入,已经过了去年全年。
网易科技:这部分客户主要是谁?
梅涛:我们既有 To B 的客户,也有 To OPC 的客户。
To B 的客户分几个行业。类是商业营销客户。我们服务了几万中小型电商。
二类是线下门店。我们有套软硬件结的智能营销终端,Q1已经服务了过1万线下实体门店。其实在整个 AI 行业或者多模态行业里,很少有人能把软件和硬件结起来去赋能实体门店。
三类是影视制作公司、短漫剧工作室。此外,我们还有运营商、云厂商这样的客户,像华为云、阿里云也都是我们的客户。
To OPC 这边,Q1我们单月新增全球用户就过了1000万。
网易科技:全球范围内1000万用户,这部分市场是怎么开的?
梅涛:我们的 SaaS 工具现在已经在全球100多个国有3000多万用户在用。我们的广告智能终端也已经开始往东南亚走了。
如果是 To C 或者 Professional C 的业务,我们主要通过用户增长、广告投放、社区运营这些平台化式去做。
如果是 To B 企业服务,那就很简单,找渠道。我们在东南亚找渠道,将来也会去欧美。欧美线下门店其实可能比国内适我们的产品,因为国内电商太发达了,但那边实体门店发达。
再往后,如果我们的硬件足够丰富、服务足够体系化,我们就可以把供应链的优势和 AI 结起来输出。我觉得今天对很多大模型公司来说,个很大的命题就是:怎么把供应链优势和 AI 结起来,切进大的流量入口。
网易科技:现在你们的商业化到底是什么结构?你刚刚说有 To B,也有 To OPC。
梅涛:我们还是关注 To B 业务。
To C 我们也做,但不是为了 To C 而 To C。对我们来说,To C 像个放大器:面它是我们模型能力直接的输出,另面它也是放大器。我们看重的是,C 端用户的反馈和数据也会反过来闭环到我们这里来,形成产品和数据的飞轮。
但我们的核心业务,还是 To B。
我们内部有个1+1+3的战略。
个 “1”,是底层技术模型。我们现在叫它全模态世界模型。之前大会说模型,但我现在觉得,生成正在经历从多模态模型走向世界模型。从架构、数据规模、应用场景来说,我个人认为,视觉模型其实是容易走向世界模型的条通道。
二个 “1”,是中台能力。我们做了层中台,把模型能力、API 能力、行业 know-how、安全可控的 Skill 编排能力都汇集起来。我们希望自己成为个能力中枢,去端到端服务客户。
上面的 “3”,是三个Agent,也是三个行业应用。我们摸索了三年多,从创业天开始就在尝试商业化,也踩过坑,后找到三个我们认为天花板足够、而且 AI 能发挥变革作用的域。
网易科技:这三个域分别是什么?
梅涛:个,是给 OPC 的业创作者的工具。我们在海外有套产品,在国内也有对应产品,帮助用户快速生成图片、,用来做自媒体、广告营销等内容传播。现在全球已经有过3000万个人用户了。
二个,是商业短营销。因为我们之前在电商、广告系统里做过很多事情,我自己在时也做过很早代互联网广告,所以我直觉得,商业短营销这个域天花板很。
这里面我们现在做两件事:个是线上跨境电商的短营销,包括素材生成、投放等;另个是线下实体门店智能营销,我们希望通过软硬件体的智能营销终端,帮助我们大量实体门店做引流、做营销。
三个,是 AI 影视制作协作智能体。大也看到了 AI 对影视行业的影响,尤其是短漫剧市场在爆发,我们也想抓住这个机会,所以我们做了套多人协作的影视创作平台,服务创作团队和工作室,叫“帧赞”。
这三个向,我们认为都是可以长期做的企业服务的域。
网易科技:你们也有很多个人用户。为什么不先做个特别泛的大众产品?现在很多模型公司多的还是瞄向了大众范围。
梅涛:我觉得普通用户目前不是我们的真实核心用户。
你看现在我们的 AI 创作工具的用户活跃分布很有意思:周到周五活跃用户很多,到了周末基本上没人用。因为我们本质上是个生产力工具,用户是拿它来干活、来工作的,不是拿它来单纯娱乐的。
我们当然也有些 C 端用户,但很多人只是来尝鲜,不是个每天都会频使用的用户。对这类用户来说,有几个问题:,付费意愿很低;二,用户忠诚度很低,哪里能薅羊毛就往哪里走,是“游民”。
所以创业公司如果做纯泛 C 工具,我觉得很难构建特别的壁垒。每公司基因不样,但对我们来说,还是坚持做长期的企业服务,做 SMB、中腰部客户。我们的客户其实也可以理解成种“大 C”或者“小 B”,跟普通泛 C 不太样。它在金字塔中间那层,但很值钱,客单价,商业模式也清晰。
而且做这层用户,也容易避开大厂平台型产品的正面冲击。
网易科技:这种 To B 服务能力,跟你们团队之前的经历有关系吗?
梅涛:有。我们这个团队跟别的团队不太样。
先,我们直都在工业界,没有哪个人是大学教授身兼数职,我们所有人都是 all in的。二,我们团队成员里既有做 To C 产品的,像来自字节的,也有做 To B 业务的,像来自华为、京东、阿里。基于我们团队做 To B 服务的行业经验、经历和服务意识,可能适做企业服务。
这种东西很多时候靠经验、靠时间积累。我们有很强的客户资源,但重要的是我们对商业化和客户的理解。我们出去见客户,客户是非常相信我们的。
因为我们是站在客户角度思考问题,不是上来就售产品内蒙古防火门胶厂家,而是先告诉他,在 AI 来的时候你该怎么做、你跟我作能得到什么、我能得到什么。我会把这个道理讲明白,这样客户才愿意作。
网易科技:但是企业服务其实是比较重的,要入行业,也要做多“苦活累活”。
梅涛:对。企业服务定是比较重的。
我觉得企业服务有几个要素定要做好。,底层模型要有自己特的东西,所谓“人我有,人有我优”;二,产品要有创新力,要速迭代;三,商业上要有生态意识,你得能在客户所在的生态里,调动资源把客户服务好。
我们现在做商业化,有个原则叫品。也就是说,产品和果要能够对应起来,好能清楚出价值。
比如我们给电商商提供服务,会收个比较低的基础费用,交付素材以后,还会帮他去投放、运营。客户真正挣到钱、产生 GMV 之后,我们再去分价值。
先让客户挣到钱,再谈我们怎么分钱,按结果付费。我觉得这是个很闭环、但也对创业公司要求非常的商业模式。
网易科技:如果把同行放进来比较,你们现在会把谁当作对标对象?
梅涛:说实话,我们很难找到个对应的对标。
如果你只是做个大语言模型公司,那对标会很清晰。但我们现在做的是多模态世界模型,很难找到个模样的对象。我们内心其实想做的是,多模态世界模型域里的“企业服务型平台公司”,有点像Anthropic。
所以我并不是特别关心对手。我直觉得,还是要坚持做自己。投资人看不懂可以不投,这没关系。今天不投,也不代表明天不投。
我们自己是比较低调的公司,不怎么吹。但如果你看我们的模型能力、产品力、收入规模、商业化布局和生态,你会发现我们其实是非常稳健的创业公司。
没有强底座,具身智能很难走远
网易科技:我们再来具体聊下 “1+1+3” 中的每个部分。先,技术层面您刚刚提到,未来会从模型走向世界模型。但“世界模型”现在行业里说法很多,李飞飞、杨立昆都有不同表达。你理解的世界模型到底是什么?
梅涛:这是个很好的问题,也是个开放式问题。因为现在很多人都在说自己做世界模型,但据我观察,很多所谓的世界模型,并不是真正的世界模型。
在我看来,个真正的世界模型至少需要三个要素。
个,它要能够表达全世界所有模态的信息,包括视觉信息、动作信息、传感器信息、天气信息等等。它须能够全位表达各种信息,而不是只表达某个域的信息。所以世界模型须是原生的全模态。
二个,它须有理能力。之前的模型,像是世界的视觉模拟器。但真正的世界模型,须能够结物理规律、因果关系,去做严密理,而且这种理要经得起验证。
三个,它须能够构造这个世界。我们经常说 model the world,但我觉得真正的世界模型应该是 mold the world,它不仅要理解世界,还要能构造、重塑世界。你如果不能创造这个世界,你也不能真正理解这个世界。
所以我理解的世界模型,须同时具备:表达世界、演世界、构造世界的能力。
不过,现在的世界模型在行业里面也有各种声音。就像刚刚提到的,种是像 Yann LeCun ,多是通过预测世界状态、构建状态空间去预测下个状态,这个路线偏具身智能。种是像李飞飞、包括 Google 些工作里体现出来的,偏3D 交互形态。
还有种就是我们这派,多是从生成出发,认为很多东西可以从大规模数据里学出来,不定要先构建个显式状态空间,也不定依赖强先验知识。
所以现在行业里其实是三种不同流派。
网易科技:我看到很多生成大模型公司近也在往世界模型转向。生成模型和世界模型,又有什么差别呢?
梅涛:每个人对世界模型的理解都不样,每个公司的禀赋也不样。
对我们来说,世界模型重要的,是底层架构要创新。不是说今天我有个模型,就能自然做成世界模型;也不是说我有个具身智能的 VLA 模型,就能自然做成世界模型。
先,我们认为,世界模型须是个统架构的问题。底层定是个统的架构。要有个能统编码各种模态、并且让不同模态能够自由交互的底座模型。
我们马上会发布个新模型,它和过去 DiT 路线不样。过去做模型,图片有图片的编码,有的编码,动作有动作的编码,文字有文字的编码。我们的下代模型,不再是每个模态各自编码,而是统在起,原生处理。
二,在应用路径上,我觉得世界模型会走向三个向:条是生成。这里面包括消费,也包括精度、可控、毫米精度的具身智能。你也看到我们近跟些具身智能公司在作,帮他们生成大规模训练数据;二条是3D 交互。未来你会看到,我们也会发布类似3D 交互的能力;三条,才是真正直接面向机器人训练的世界模型。
所以关键的问题是:你有没有套真正能支撑世界模型的底座。以我现在的判断,不管是 DiT 还是其他主流架构,都还不能支撑将来的世界模型发展。
网易科技:也就是说,从“模型”到“世界模型”,你们认为底层架构须升。
梅涛:对。我们的判断是,目前所有主流模型架构都不能支撑将来真正的世界模型,所以须做架构创新。
当然,我们也不是说现在这个新架构就是终形态,它只是我们在不断探索前沿技术过程中的个阶段认知。作为创业公司,如果你想做世界模型,就定要不断动底层技术往前走。
网易科技:为什么架构创新这么重要?
梅涛:因为如果大都还沿着 DiT 路线往前走,那你想证明模型比别人好,后只能去堆质量的数据、堆多力。
但这个事情不是创业公司能做的。所以创业公司定要通过架构创新,去提模型能天花板,并且用比大厂低得多的成本完成模型训练和理服务。我们的新模型 UiT 比 DiT 好的地,就是能天花板,而且能支撑多下游任务。比如图片编辑、修改,很多任务都能用个模型解决。
为什么能做到?因为过去 DiT 的主流做法是把文字、图片、识别信号分别编码,编码过程中会有信息损失,而且是分开编码的。后在隐空间里做交互,再解码回去,这个过程会带来幻觉和不可控。
而我们的模型没有这个过程。文字、图片、、动作这些 token,都是以接近原始信号的式直接进入模型,没有中间大的信息损失。所以它的精度可控会好,颗粒度细,能天花板也。
网易科技:我发现现在很多初创公司,都开始把自己的定位往“世界模型”上靠。主要的原因是什么?
梅涛:我觉得是这样的。有些公司可能确实是为了讲故事,为了提自己的估值,这个也可厚非。
但像我们这种公司,不是为了讲故事而讲故事。我们确实是因为有结构的创新、架构上的创新,所以我们能支撑原生多模态的世界模型。
并且我们已经有实际案例在做了,包括你们刚才看到的和机器人公司的作,包括我们跟百图生科向的作,包括跟科大的机器化学作,我们已经在做世界模型的案例了。
所以对于智象来说这是自然的延长线,不是为了讲故事。因为我们有实际案例,也有实际的模型架构去支撑我们做到这点。
世界模型不是个悬在天上的概念,它应该真正落到真实场景里。
网易科技:你们现在跟具身智能公司的作,是模型能力升的自然延伸,还是多出于商业化的考虑?
梅涛:对我们来说,这是个很自然发生的事情。
因为模型升以后,它就具备了生成可控、精度动作的能力。现在具身智能又这么火,很多老朋友找到我们,还有多公司在谈这种业务。所以我觉得这既是种业务创新,也是个很好的世界模型数据入口。
比如对给到我们的是带夹爪、毫米精度的真机操作。我们能做的,是把它变成毫米精度的真人操作,然后通过大量生成,去支撑预训练模型需要的千万小时训练数据。
所以它是我们1+1+3里面某个“3”的延长线。因为有底层模型、有中台,我们其实可以支撑很多“3”,有些自己做,有些跟行业伙伴起做。
网易科技:这个即将发布的新模型对你们来说,是个里程碑吗?
梅涛:其实我们的模型创新直都在做。
从模型创新能力上看,2017年我们团队就写了全球篇文生论文。那时候我还在微软。很有意思的是,当年那篇论文的作者,现在都在我们公司,而且都是核心基模研发人员。
到了2023年,我们大体还是沿着原有架构往前走;到2024年,我们基本上已经在并跑;到了2024年底、2025年,我们把模型升成扩散加自回归,这本身也是架构创新。再到2026年,我们又升到 UiT,这是的架构创新。
所以你看到,我们在模型创新能力上其实直走得比较靠前。
而且这个架构,不是所有团队都能做。就我们了解,过千亿参数规模的多模态模型,现在可能不过三,另外两大概率还是大厂。
网易科技:你们世界模型前面还有个词,叫“全模态”,pvc管道管件胶从到全模态,变化是什么?
梅涛:全模态包括文字、图片、、动作、传感器信号、声音、音频、3D 等等,不只是。
我们之所以强调“全模态”,不是为了换个名字,而是因为我们新的底层架构是真正支撑全模态交互、全模态原生编码的。
很多人讲世界模型,其实底层并没有模型架构创新,多还是靠多数据、好的数据去做。我们不是这样。
网易科技:说到这里,我有朋友是做模型的,后来转去做多模态,薪资下子很多。这是为什么?
梅涛:因为多模态某种意义上已经隐隐进入具身智能这个域了。而目前具身智能这个向,故事和资本热度,确实比我们丰富些。
但反过来说,我觉得很多具身智能公司其实低估了件事:没有强底座,它是很难走远的。
所以我们现在做具身智能的数据成、生成,未来也可能会发布些相关开源模型。我们其实是想把这张桌子掀开,证明件事:做多模态模型的公司,不只是能做生成,我们本身就有很强的底座能力。
很多具身智能公司如果没有很强的生成和理解模型做底层支撑,其实很难往后走。
网易科技:模型底座能自然延伸出来这种能力吗?
梅涛:因为我们有很强的几千亿参数的底座模型,法能力是很强的。
比如未来如果要做个端到端的具身智能模型,我们可能需要的数据小时数,只是些公司的十分之,甚至百分之。因为我们的模型已经在几百万小时别的数据上学到了很多规律。
这也是为什么我们跟机器人公司的作会比较顺。因为我们生成的精度很。大部分我们能做到毫米精度。这个精度基本上已经能够满足具身智能训练大模型时对监控和标注的要求。
所以对我们来说,具身智能或者世界模型,不是突然横着长出来的块业务,而是我们做模型这条线很自然的延伸。
网易科技:如果再往层说,模型本身和“世界模型”之间的联系在哪里?模型能够“理解和模拟这个世界”吗?
梅涛:对,模型本身就要求你去理解和模拟这个世界。
但这里面也分两种理解。我们之前训练模型,多用的是互联网数据,它关注的是视觉理:这个人应该在什么位置、故事应该怎么讲、画面要符叙事逻辑,它强调创意表达。
但具身智能不样。具身智能需要的是人称的人手操作,它不追求你的背景多漂亮、故事多完整,它要求的是每个关节动作都要和真实机器人操作保持致,它追求的是精度。
所以不样。我们过去不是没有能力,而是没有这类精度数据。今天为什么我们跟机器人公司作?
因为他们能给我们大量真实工厂数据,包括、XYZ 坐标、多自由度角度、旋转向,甚至传感器数据。我们拿到这些数据以后,就能反向成和生成大量精度训练,这就是我们的优势。
每都有自己的生态位,行业起伏影响不大
网易科技:近阿里的“快乐小马”模型果也很亮眼内蒙古防火门胶厂家,生成会不会从字节、快手“双寡头”,变成多玩竞争。你怎么看阿里在这个赛道的位置?
梅涛:我愿意从行业结构上看。
我认为,不管是在还是美国,未来在大模型、多模态、世界模型域,都会出现些巨头。对于底座模型来说,只要你有足够资源、力、数据、人才,大厂肯定是有能力做出通用模型的。
所以像字节、阿里,都是有可能做成这件事的公司。只是每个公司的商业模式不样,字节可能偏 To C,阿里可能偏 To B,但它们底层能力都很强。
网易科技:但你肯定也会被反复追问:怎么跟大厂,怎么跟国外模型比,怎么跟其他生成公司区分?
梅涛:天天被讨论。但说实话,我并不关心对手。我觉得还是坚持做自己。
先我觉得市场足够大。赛道是万亿美金的市场,对容得下很多大厂,也容得下很多创业公司。大很多时候是互为生态、互为依赖的关系。
对我们来说,我们的平台里也会调用三工具,别人也可能调用我们的工具。每个企业都有自己的生态位。
比如在电商域,些平台型公司提供的是流量平台和底层基础设施,我们存在的价值,是给它的商、给它的平台生态做垂直的应用服务。我们提供工具,提供素材交付。
大厂定有自己的生态位。创业公司要做的,不是跟它背靠背硬,而是在它的生态里找到自己的位置。
网易科技:我们继续聊另个“1”,你刚提到,1+1+3里的二个 “1” 是中台。这个中台像是为了技术发展,还是为了商业化?
梅涛:两层原因都有。
,从技术角度,它是须的。因为我们认为,现在 Agent 也好、应用也好,要做到安全可控、可靠,须有这样层能力编排。
底层会包含很多 API、工作流编排、能力调度,这样我们才能支撑多应用,也支撑未来生态伙伴在我们上面再去构建应用。
二,从商业化角度,我们也希望自己成为个能力中枢的平台,通过中枢能力的汇,为客户提供端到端 API 服务。
而且这里面也不是只能调用我们自己的模型。虽然主模型肯定以我们自己的为主,但现在行业里已经有共识:没有任何公司的模型,能够满足所有客户、所有场景的需求。所以适当的时候,我们也会调动三模型。
网易科技:再聊3个场景,影视制作这块,现在漫剧、AI 短剧都很火。你们服务的是这类客户,还是偏电影制作?
梅涛:现阶段多还是短剧、动态漫、绘本这些向。
但我们对这个行业有个很明确的判断:如果是做精品短剧,比如50集、100集、100分钟以上的内容,“人成片”并不现实,很可能也是玩阵子,难以出精品。因为它本质上是个非常业的流程,有演剧本、有分镜、有抽卡、有审核、有剪辑,不是个人就能做完的。
所以我们做的不是去破现有工作流,而是让这个工作流。我们的影视平台面向的是个创作团队、个工作室。
比如个3-10人团队,有人做制片、有人做演、有人做分镜、有人做审核、有人做抽卡,每个人各司其职,我们要服务的是这个完整流程。
网易科技:满足这部分需求的平台市面上也挺多的,我们的核心差异是什么?
梅涛:有几个特点。,整个工作流很丝滑。每个人进来后都有自己的角,只要做好自己的角就行了。做审核的人就心审片,不需要再操心剧本。
二,它能做团队管理。比如演、制片关心的是,团队里谁把 token 用到了致,谁消耗了很多 token 但果般,谁贡献了多少镜头、多少产能。我们能把这些率和成本可视化,这对团队管理很关键。
三,我们能沉淀大量媒资、素材和中间产物,并做智能检索、智能存储、后续复用。没有这些媒资管理、IP 管理、团队管理和佳模型搭配,你很难真正给客户好的体验。
网易科技:也就是说,你们的逻辑不是做个单点工具,而是把整个工作流、管理链条和模型能力都封装起来。
梅涛:对。我们自己已经承制了将近5000分钟短剧,所以我们知道行业里好的模型应该怎么组,哪个环节用哪个模型优。客户不需要自己跑去到处试模型,我们已经把行业里优解尽量配置好了。
这也是为什么我们说自己不是简单做个工具,而是在做真正可落地的企业服务。
网易科技:还有个场景是“商业短营销”,为什么这些中小电商、门店会选择你们,阿里不是有优势吗?
梅涛:因为我们能把软件和硬件很自然地结在起,帮助他们做线下引流、提升广告制作率、降低成本。
而且店可以直接在我们的小程序和应用上自由创作自己的短广告。我们内部常说的是“多、快、好、省”的模式:率、成本低,而且能带来真实价值,所以他们很喜欢这套产品。
奥力斯 万能胶厂家 联系人:王经理 手机:18231788377(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区
网易科技:这里说的硬件是指什么?和硬件结,这又怎么理解?你们做硬件是为了什么?
梅涛:硬件是个广告屏,它有各种形状各种大小,主要是给实体门店服务。
其实很好理解。我们做业务,本质上是在提供内容。论是做 SaaS 工具,还是做结果交付,我们终交给客户的,都是创意内容,尤其是内容。
但内容生成出来以后,定要有地呈现。它可能呈现在手机上,可能呈现在门店里的屏幕上,也可能呈现在车机屏幕上,或者别的终端里。
所以我们说“做硬件”,并不是说我们定要自己从开始研发整套底层硬件。我们的其实不是造硬件本身,而是进入那些关键的流量入口。
比如线下门店。我们会希望通过些联研发、OEM、解决案整的式,把我们的产品变成线下门店里的个实体流量入口。
所以如果你这么理解就比较清楚了:我们并不是为了做硬件而做硬件,我们是想做门“流量入口”的生意。
客户买的不是生成过程,而是个能被验证的结果
网易科技:你刚才提到你们现在有部分业务是“以结果付费”。这个我还挺意外的,因为生成听起来是个很难量化结果的东西。这个模式你们是怎么跑通的?
梅涛:这个问题非常关键。其实这是我们以前踩过坑之后,慢慢摸出来的。
开始我们是把能力当成个 SaaS 工具给客户,后来发现客户用得很少。为什么?个原因是客户自己不会用,门槛还是;二个原因是,就他会用,不同的人用出来果也不样。你和另外个人用同样的模型,做出来的可能个没人点,个天能挣1万美金。
后来我们发现,客户买单的逻辑其实没有想清楚:他到底是愿意为个成功的买单,还是愿意为前面那些失败的抽卡过程买单?
如果你按 token、按成本跟他收费,他定会不断压你的价。如果你按果收费,果又很容易变成主观判断。
怕的是那种特别主观的客户。你做出来之后,他永远说“90 了,明天再调下”;明天又说“95 了,很接近了,但还得再改”。那这个模式就没法成立。
所以后来我就觉得,须把“客户满意度”变成个可以量化、可以及时验证的目标。
网易科技:所以你们后怎么定义这个“结果”?
梅涛:很简单,我们做的是短营销 Agent。
我们帮客户做完、投放出去以后,这个东西好不好,不是客户主观说了,而是看有没有人点击、有没有人下单、能不能证明它的商业价值。只要有点击、有转化、有订单,这个结果就是客观的。
所以我们的模式就变成:客户先付个非常基础的费用,覆盖生成的 token 成本;等这个真的帮他挣到钱了,我们再去分他的增量收益。
这个模式旦建立起来,客户就很开心。因为他知道自己不是在为失败样本买单,而是在为结果买单。基本上没有客户不愿意跟我们作,很多时候我们反而接不过来。
网易科技:为什么要在短营销这条线上做这么多投入?
梅涛:因为它连接的是很大的交易场景。
举个例子,在我们服务的这套体系里,上面可能有两百万电商商,下面有9亿全球消费者。我们做的是内容电商、兴趣电商、短电商,不是传统货架电商。
内容电商的特点就是对短广告的需求量特别大。个很普通的商,个月对短的需求就可能是几千条,年下来接近10万条。
这10万条,不可能靠实拍。你不可能直请模特来拍、直搭场景。很多内容定是 AI 生成,再结部分实拍去迭代。
所以这个空间非常大。你光 token 就已经是笔很大的收入了,何况你还可以参与分佣。
网易科技:但这种能力显然不是夜长出来的。你们为什么能做成?
梅涛:先,和那些纯应用公司比,我们是有模型能力的公司。有模型能力的公司和纯做应用的公司,能力结构是不样的。
其次,我们团队本身就对电商很熟。不管是负责电商业务的同事,还是我们自己的团队成员,有的人以前负责过海外业务,有的人在电商待过很多年,对线上电商、线下门店都有很的理解。
而且我们是从2023年就开始做电商相关业务了。其实路上也是跌跌撞撞:开始做 SaaS,后来做其他模式,再到现在做结果型模式,是路摸爬滚过来的。我们积累了很多行业 know-how,也积累了很多数据和客户。
所以这块真正的壁垒,我觉得就是时间壁垒。
网易科技:但听下来在产品这么丰富的前提下,你们同时还要持续进模型能力。怎么兼顾?这两拨之间会不会资源?
梅涛:你这个问题很关键。我们在智象内部,其实是个很强技术中台的结构。某种程度上说,我们的组织形态有点像字节:下面有很多产品线,但产品线本身相对比较薄,上面是个很强的技术中台,大复用同套研发资源。
而且今天的研发跟以前也不太样。现在我们的研发同学,很多工作50 到 都已经在借助 AI 工具完成,所以整体率其实比过去很多。也正因为这样,同样批研发资源,能够支撑的业务比以前多。
但资源争夺肯定是存在的,尤其是在产品和模型之间。因为产品等不了模型研发。模型研发再快,也要按月来,可能是个月、三个月、半年;但产品迭代很多时候是按天、按周进的,两边节奏不样。
那怎么办?这也是为什么我们定要做个类似“技术中台”或者“模型中台”的原因。
我们的中台里,面有我们自己的模型在持续迭代;另面也会集成三模型、三 API,甚至些开源的语言模型。通过这种模型组,我们就能保证产品线的同事不需要依赖我们自研模型的迭代速度,才能往前进产品。
换句话说,产品团队可以根据具体场景,去调用市面上当前适的能力,再结我们自己的模型能力做组,先把产品快速跑起来。
如果按以前那种思路——先等自己的模型做好,再去做产品——那基本是行不通的。因为模型能力的突破本身就是有周期的,而产品不可能停在那里等你。
所以我们的思路直是:模型持续突破,产品快速迭代,中间靠中台做解耦。
放下自我,做1到100的事情
网易科技:你是典型的科学出身创业者。过去三年,你觉得大的挑战是什么?
梅涛:大的挑战,是身份清,放下自我。
你要忘记自己以前是什么教授、博士、科学,重新把自己当成个创业者,从0开始,去见投资人、见客户、见员工,说服别人相信你。
二个变化,是要放弃“永远追求创新”的惯。做学术,你今天做完个0到1,明天还想再做个新的0到1;但做企业不样,做企业是0到1、1到10、10到100、100到穷。你要把件事情做到致,而不是每天开新题。
做公司是逆水行舟,不进则退,非常残酷。做科学,今天这个0到1不成,还可以换个题继续做;做企业,如果你这个赛道没跑出来,可能就真的失败了。
所以我现在非常尊重创业者和企业,因为成功概率真的很低。
网易科技:如果只说当下业务层面,你现在关心的件事是什么?
梅涛:模型能力。我近讨论多的就是模型。怎么把模型做得好点,架构上怎么再创新点、优化点,让果好看点;下步模型往哪个向走;我们还缺什么样的人才。
其实人才我们认识不少,硅谷那边也有很多校友和学生,但现在缺的不是认识人,而是把他们招回来的资源。
网易科技:这里的“资源”主要是指什么?
梅涛:核心还是力资源。有些硅谷头部公司,人均卡数可能过1000块。国内很多公司其实工资未给不起,但资源确实比较难匹配。
大模型公司在国内外的资源条件,尤其是卡的资源,可能就是差个0。
网易科技:但模型这波其实在全球来看表现还是挺亮眼的,这背后主要是因为什么?
梅涛:对,在模型和多模态这个域,公司走得是很快的。
你看春节那段时间,些国内模型出来以后,基本已经到了全球非常有竞争力、甚至阶段 top的位置。包括你刚才提到的些产品,其实竞争力都非常强。
当然,我们也不能只看榜单。榜单多反映的是刷榜能力,真正重要的还是用户体验,是用户实际用起来到底好不好。
从海外来看,Google 的模型也很强。它本身的研发实力、流量入口、资源投入都非常大,而且它未来的产品形态也很可能会嵌进自己大的生态体系里,这个竞争力是毋庸置疑的。
但即便如此,我还是认为,公司在这个域并不输美国公司。论是模型果、底层创新,还是商业应用生态,我们都有很强的竞争力。
面,的年轻工程师很多,工程师红利非常明显;二,我们有数据红利;三,的应用入口也很多,商业化场景特别丰富。
所以我对这个域其实是有信心的。公司未只是跟随者,有机会在和多模态这个向上成为引者。
而且还有个特别强的优势,就是供应链。为什么我们会去看硬件、看终端、看线下入口?就是因为在创业,你定要尽量结有优势的部分。
网易科技:如果要总结智象未来的护城河,你会怎么说?
梅涛:我们内部常说,护城河有三层。
层,是模型创新力。如果你没有模型创新力和前瞻,你不可能把自己的模型排到全球页。我们不定保证自己永远,但在自己垂直域里定要排在前面。
二层,是产品力。现在产品迭代太快了,快就是竞争力。产品要和用户反馈、数据回流形成飞轮。
三层,是商业生态力。做生意不是靠你单斗,而是在生态里起做,跟客户共赢、跟渠道共赢。
如果这三层做不起来,你很难成为真正长期的企业服务公司。
网易科技:所以今天做 AI 创业公司,其实要求非常。
梅涛:非常。今天对创业者的要求很。对创始人来说,你得是六边形战士;对公司来说,你得学会既做模型、又做应用、还要做商业化。这是活下来的备法则和技能。
所以现在有些投资人会说,草根创业越来越难。互联网时代很多是模式创新,但今天多是科技、硬科技的创新,对资源、人才、组织要求都。
网易科技:那在团队管理上,怎么让群本来都很强、也都很有主见的人长期起往前走,有了解你们团队其实还是很稳定的。这个靠什么?
梅涛:我觉得有几个关键词。
,要有梦想。你如果没有个足够大的梦想,没有人愿意跟你干。你说我要
做世界模型、做人工智能顶端的事情,才会有人愿意跟你起做。
二,要有力。力不是权力,而是别人觉得你靠谱,觉得跟着你有机会成功。
三,要充分授权、相信团队。我们团队里很多人我都作很多年了,我们之间有很强的信任。我经常跟他们说,每个人都要成为自己那个域里好的人。公司不是谁个人的,但你得把自己做成那个域强的人,才能真正帮助公司,公司也才能回报你。
我们公司内耗很少,基本没有。创业公司能做到今天这个产出比,我觉得靠的就是信任和密度协作。
网易科技:你们近好像又要close轮融资,现在投资人在做决策的时候,看重你们什么?
梅涛:投资人很有意思,很多人也不止投了我们做的。
他们投我们的原因,先是觉得这个赛道足够大,全模态世界模型这个赛道大。层逻辑定是投赛道。
二,他们投我们,是因为他们觉得我们是支非常严肃、非常正规、非常业地服务企业客户的团队。他们会觉得,To B 这条路虽然慢点,但长期是对的,后劲很足。
再往下,他们看中的几个点,个是模型能力强,个是产品迭代快,个是我们确确实实在做 To B 生态,而且生态很广。我们现在服务了几万 SMB、几百大客户。对个初创公司来说,这很难。
你会看到我们陆续有很多好消息出来。我们还是比较走自己的节奏。不管今天是谁出来了,还是谁关了,对我来说影响不大。
因为赛道里真正认真做企业服务、把商业化闭环和生态做这么的公司,可能就我们。很多投资人找了很多公司聊,后还是回到我们这里来,因为他们觉得我们是严肃地知道怎么做 To B 生意的公司。
网易科技:今年你们重要的目标是什么?
梅涛:,模型要持续创新。我们今年会发布几个世界模型向的成果:个是生成模型,希望它能在好的榜单里保持先;二个是交互模型,我们会做种新的范式、新的体验;三个,我们也会在具身智能模型和数据生成向继续进。
二,产品要持续迭代。你会看到我们发布新的 Agent、新的能力,包括长时长的生成、混剪能力、营销 Agent 等等。
三,商业化要继续跃升。去年大看到的只是个阶段的数字,我们今年希望有个很大的增长。
网易科技:后个问题,如果只用句话介绍智象未来,你会怎么说?
梅涛: 从愿景上说,我们希望用人工智能技术服务人类,创造美好的生活。
如果是对客户、对公众介绍,我会说:智象未来是以全模态世界模型底座为核心,坚持做好企业服务的全球化公司。
*往期回顾
《态度AGI》期:对话李开复:大模型创业狂奔年 中美差距缩小 我十年不套现《态度AGI》二期:对话小川:我们不跟进大模型价格战《态度AGI》三期:对话戴文渊:大模型价格战不解决核心问题《态度AGI》四期:对话智源研究院院长仲远:GPT4不是国内大模型的尽头《态度AGI》五期:对话朱啸虎:5年后将没有立的大模型公司存在,因为没有商业模式《态度AGI》六期:对话梅花创投吴世春:“大模型五虎”想要跑出来非常难《态度AGI》七期:对话跃然创新CEO李勇:做大模型应用 如何和巨头错位竞争《态度AGI》八期:对话智谱AI CEO张鹏:生成是AGI经之路,App将在“不知不觉”中到来《态度AGI》九期:对话科大讯飞总裁、研究院院长刘聪:大模型已从追赶对标走向自主原创《态度AGI》十期:对话360周鸿祎:魔法对付魔法,大模型安全问题得靠大模型《态度AGI》十期:对话彩云科技CEO袁行远:越ChatGPT,需要开“黑盒”《态度AGI》十二期:对话傅盛:不看好双足机器人商业化,三五年都没戏《态度AGI》十三期:对话宇树创始人兼CEO兴兴:通用机器人的iPhone时刻还需要3-4年《态度AGI》十四期:对话MiniMax创始人闫俊杰:不赢,就应该被淘汰
《态度AGI》十五期对话荣耀赵明:AI时代 开放肯定会击败封闭
《态度AGI》十六期对话昆仑万维席科学颜水成:大模型的三个共识与三个分歧
《态度AGI》十七期对话聂再清:生物医药即将迎来“ChatGPT时刻”,2-3年内实现重大技术飞跃
《态度AGI》十八期:对话刘作虎:手机是AI应用体验好的载体《态度AGI》十九期:对话realme徐起:AI已成为消费者购机的主要考量因素《态度AGI》二十期:对话喻友平:大模型已从“暴风骤雨”到“润物细声”《态度AGI》二十期:对话月之暗面杨植麟:竞争是做正确的事 当下关心“留存”《态度AGI》二十二期:对话许四清:眼下投AI,就是在不确定里找到然
《态度AGI》二十三期:对话讯飞创投伙人朱永:AI创企已经迈入了价值兑现的关键时刻
《态度AGI》二十四期:对话啸:我看好应用层,直没投基础大模型
《态度AGI》二十五期:对话投资人姚海波:人形机器人尚未解决“手”和“脑”问题
《态度AGI》二十六期:没有这双“”手,特斯拉机器人也难成!魔法原子总裁吴长征:90件自己造,2025机器人场景落地生死年!《态度AGI》二十七期:对话智元伙人姚卯青:不做大模型的机器人公司没有未来《态度AGI》二十八期:对话小雷:单日面试1.4万人,朱啸虎连投三轮的AI应用什么样?《态度AGI》二十九期:半马获亚军,订单暴增800,对话松延动力创始人姜哲源《态度AGI》三十期:对话昆仑万维CEO汉:大厂争座,中厂地盘《态度AGI》三十期:对话姜大昕:AGI实现路径清晰了,世界模型不远了《态度AGI》三十二期:对话成投资洪婧:SaaS已死?在不赚钱?错了!《态度AGI》三十三期:傅利叶十年鏖战,要撕掉人形机器人“大玩具”标签《态度AGI》三十四期:对话势科技柯国霖:AI for Science是实现AGI的经之路《态度AGI》三十五期:对话盛景网联彭志强:跳出SaaS亏损黑洞!从“工具”到“结果”的AI RaaS转型法则《态度AGI》三十六期:对话顾嘉唯:售出千万台,爆618,他却说“只想做下代AI终端”
《态度AGI》三十七期:对话程控股叶芊:具身智能走过“婴儿期” 2025是交付
《态度AGI》三十八期:对话XREAL徐驰:AI眼镜只有5岁智商
《态度AGI》三十九期:对话谷歌全球广告总裁:搜索广告正在被AI改造,关键词逻辑变了!
《态度AGI》四十期:对话宇树科技CEO兴兴:回应关于宇树上市,机器人降价,AI投入以及出货量
《态度AGI》四十期:对话VAST创始人宋亚宸:“3D时代的抖音”当属创业者
《态度AGI》四十二期:访 | Soul怎么做AI伴侣?CTO陶明:我们不定义关系
《态度AGI》四十三期:对话Plaud莫子皓:还没投广告 国内产品销量已经
《态度AGI》四十四期:对话灵足时代联创邵元欣:做机器人域的“英伟达”
《态度AGI》四十五期:VLA模型仍存在明显缺陷 大晓机器人携ACE范式入
《态度AGI》四十六期:对话传音阿里夫:向大于速度|300亿美金市场的“非洲之”用AI找二曲线
《态度AGI》四十七期:破解具身智能“数据荒”,对话鹿明创始人:数据采集率提升5倍,成本降至1/5
《态度AGI》四十八期:给机器人做仿真训练 这创企年营收破亿 预计26年翻4倍
《态度AGI》四十九期:对话周亚辉:不和字节腾讯卷,要在海外做“AI版Spotify\"
《态度AGI》五十期:对话傅利叶CEO顾捷:意念控制机器人不是科幻 1-2年就落地
《态度AGI》五十期:对话吴军:AI刚起步,泡沫期或在2028年,大部分AI公司终将消亡
《态度AGI》五十二期:对话枫清科技雪峰:龙虾之后,企业搞AI没有退路了
相关词条:管道保温 塑料管材生产线 锚索 玻璃棉毡 PVC管道管件粘结胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定内蒙古防火门胶厂家,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。