文 | 正见TrueView,作者 | 欢佬,编辑 | 咏鹅

这是2026年目前全球科技圈最具戏剧性的一幕分野。

大洋彼岸,曾以极具震撼力的视觉效果惊艳全球、被视为迈向AGI关键一步的Sora,突然被按下了暂停键,没有过渡期,没有灰度方案,应用关停、API下线、ChatGPT内置视频功能一并撤走。OpenAI给出的理由冰冷而现实,算力成本与商业回报的严重倒挂。

然而,这场退场的余波尚未平息。4月18日,Sora核心负责人比尔·皮布尔斯发文宣布离开OpenAI。他回顾了几项重要里程碑,早期Sora样本中实现了物体永久性、领先于行业预期的高保真1080P多镜头生成。

CEO山姆·奥尔特曼在评论区送上告别:“你的创造力推动了OpenAI和全世界以全新方式体验AI视频。”但这份体面的致辞,掩盖不了一个更残酷的现实,连主创都留不住的项目,已无人问津。

截至2026年2月,Sora累计消费者收入仅约140万美元;每天维持运行的算力成本却高达1500万美元,一年烧掉约54亿美元。Appfigures估算,其投入产出比接近2500:1。更刺眼的是30天用户留存率1%,60天留存率0%,几乎没人愿意为它持续付费。

但在太平洋的这一端,中国AI视频赛道非但没有因为先驱的撤退而降温,反而呈现出截然不同的沸腾景象。

4月,阿里HappyHorse-1.0模型空降第三方盲测榜单并登顶;快手可灵AI单季收入达3.4亿元人民币,2026年1月年化收入运行率已攀升至超过3亿美元;字节跳动的Seedance 2.0更是在一个月内连续三次涨价,客户仍趋之若鹜,有机构API最低年消费门槛高达1000万元;而一向谋定而后动的腾讯,更是被曝出豪掷重金、疯狂挖角,誓要在5月拿出能与字节正面硬刚的视频模型。

Sora的关停,戳破了硅谷关于视频生成技术乌托邦的幻象;但在中国,AI视频早已脱离了纯粹的技术浪漫主义,蜕变为一场深不见底的算力豪赌,以及巨头们为了捍卫核心领地而进行的贴身肉搏。

透过喧嚣,站在未来的时光坐标轴上回望,我们该如何理解这种冰火两重天?

先驱的墓碑

要想看懂中国大厂的狂热,必须先理清Sora退场的真实逻辑。

多模态视频生成的本质,是一个吞噬GPU的算力黑洞。它对算力的消耗,是大语言模型的百倍乃至千倍。

据行业测算,Sora生成一段1080P视频的物理成本在0.5到1美元之间,而C端普通用户为单支视频付费的心理预期,甚至不到0.1美元。

这种10倍的商业倒挂,意味着Sora用得越多,OpenAI亏得越惨。当OpenAI的战略重心转向企业级智能体和具身智能时,关停Sora不仅是止损,也是对大模型商业化路径的一次纠偏。

但不能将Sora的失败,简单地归咎于成本太高。更深层的原因是,它从一开始就不是为解决某个问题而设计的。

Sora的底层逻辑是技术先行,做出最惊艳的视觉效果,然后指望用户自己找到应用场景。但事实证明,普通用户的新鲜感只能撑几周,新鲜感一过便找不到持续使用的理由。专业创作者则因为生成视频不可控、一致性差、商业可用率仅5%-10%,无法真正嵌入工作流。

问题出在视频生成的算力黑洞本身就决定了这条路不能走通用路线。生成一段10秒的1080p视频,AI需要处理约12亿个像素点,计算量是文本生成的成千上万倍。

这决定了AI视频必须是狙击枪而不是机关枪,瞄准具体场景精准打击,而不是追求什么都能生成。

Sora选错了赛道,它想做一个通用视频生成工具,但视频生成的高昂成本注定了这个方向在经济上不成立。

正如图灵奖获得者、前Meta首席AI科学家杨立昆在Sora发布初期就指出的,依赖概率模型的生成式技术路线注定失败,这类模型无法真正理解物理世界的因果关系,只是在统计意义上猜像素应该怎么排列。

OpenAI最终选择了断尾求生,关停Sora、退回与迪士尼的10亿美元合作款项,集中精力推进世界模型的研发,顺便为IPO准备一份更干净的财报。

这个决策本身无可厚非,但它揭示了在AI视频这条路上,技术的领先并不自动转化为商业的成功。

甚至可以说,技术越极致,商业可能越难跑通,因为算力成本会随着画质的提升呈指数级增长,而用户的付费意愿却不会。

场景为王的中国式解法

在硅谷算不平的账本,在中国却有着另一种解法。

最直接的引爆点,是狂飙突进的微短剧市场。在这个动辄千亿规模的下沉市场里,AI展现出了碾压级的降维打击。

字节跳动的Seedance 2.0视频模型直接服务于抖音、剪映、既梦等庞大的内容创作者,进而转化为短视频平台上的广告流水。

快手的可灵亦是如此,背靠7亿多月活的短视频生态,迅速实现了可观的月度商业化收入。

此外,字节还探索了与内容公司的分成模式,不再是单方面烧钱。2026年字节漫剧日Token消耗已突破7000万元,首次超过真人短剧。

但字节Seedance 2.0虽然收入可观,火山引擎总裁谭待却坦言,我们还没有做3年的盈利规划。即便如可灵AI做到年化收入超3亿美元,考虑到算力成本,净利润恐怕也相当微薄。

没有独立视频产品的阿里也杀入了这个市场。4月初,匿名模型HappyHorse-1.0空降Artificial Analysis盲测榜单登顶,文生视频、图生视频双双超越字节Seedance 2.0和快手可灵。

随后阿里出面认领,这匹快乐马出自新成立的ATH事业群AI创新事业部,掌舵人是前快手可灵技术负责人张通。

即便HappyHorse跑出了全球第一的测试身位,阿里面临的依然是缺乏原生的、高频的、具备统治力的内容消费池的尴尬。如果不能让这匹马跑在自己的生态里,它就只能沦为一款需要四处寻找API客户的底层工具,陷入极度被动的价格战。

目前,阿里试图将HappyHorse与淘天电商生态绑定,解决中小商家商品视频制作的痛点,AI视频可批量生成多版本、多场景、多语言内容,大幅降低创作门槛。

但这是一个重运营的活儿,且面临着集团内部极为紧张的GPU算力分配博弈。在基座模型、阿里云服务和电商赋能之间,尚不知这匹快乐马,能分到多少粮草。

如果说阿里是在寻找让技术产生最大裂变的场景,那么腾讯则面临着另一重“镜像”考验。

放眼整个中国互联网,没有谁比腾讯拥有更丰富的AI视频变现土壤。视频号破5亿的日活、微信生态内海量的社交互动、游戏业务中数不清的NPC构建,以及每年创造千亿营收的庞大广告分发网络。

在这片广袤的流量池里,大模型只要能带来1%的点击率或转化率提升,都会立刻化作财报上数十亿美元的真金白银。

然而,腾讯初期的谋定而后动显然错判了形势,即便这符合腾讯一贯的战略惯性。

但这一次,旧日历翻不出新篇章。AI视频生成不是一个可以在应用层面上轻松复刻的功能,它是一项极度依赖长期数据投喂、底层架构创新和重资产算力堆叠的苦活儿、累活儿。

一旦在基座模型上落后,再庞大的流量生态也将沦为空中楼阁,甚至面临被其他底层技术提供商管道化的致命风险。

这也是为什么,向来稳健的腾讯在今年按下了疯狂的加速键。无论是核心高管在内部会议上对“动作慢了”的坦诚反思,还是大幅追加的百亿级AI投资、对字节Seedance核心开发团队的不计代价挖角,包括原字节Seed视觉AI平台团队负责人肖学锋,都表明腾讯彻底抛弃了等风来的幻想。

即将在5月亮相的混元视频新模型,不仅是一次技术发布,更是腾讯保卫社交内容生产力的关键一战。

跑赢消耗战

但即便有生态支撑,AI视频依然是一门极其艰难的生意,算力成本是悬在所有玩家头上的达摩克利斯之剑。

当下跑在AI视频赛道的厂商都无比清楚,他们正在跑的,是一条Sora跑过的路。

Sora死于算力成本无法被收入覆盖,国内大厂目前之所以还能撑住,很大程度上是因为需求尚未完全释放,算力消耗还未到临界点。

一旦用户规模指数级增长,Sora的今天也许就是他们的明天。

这也是为什么行业出现了两极分化的定价策略。

字节率先涨价,4月即梦基础、标准、高级会员的月度积分分别从1080、4000、15000下调至725、2210、6160,积分缩水近六成。

而谷歌和快手则选择降价换市场,谷歌Veo 3.1 Lite将720p视频生成价格压至0.05美元/秒,可灵推出会员限时8折优惠。

这两种策略本质上是在算力成本、客户粘性和市场规模之间寻找平衡点。涨价的逻辑是筛选高价值客户、优化算力分配;降价的逻辑是用规模效应摊薄成本、抢占市场份额。

但无论是哪条路,都指向同一个问题,在当前算力成本下,AI视频的利润率到底能做到多少?

更棘手的是,算力资源正在成为AI视频公司最稀缺的战略资源。在AI视频这条赛道上,即便是头部玩家,也必须时刻警惕算力成本吞噬掉所有利润。当Token用量在2026年暴涨,厂商有再多算力依旧不够烧,要把算力留给谁,成了关键问题。

美国科技界或许更迷恋于通过暴力美学直达AGI的星辰大海,一旦发现某条路径短期内无法形成商业闭环,便果断将其搁置。但中国互联网的底层逻辑,历来是在泥泞的商业应用中倒逼技术迭代。

Sora的关停,本质上是AI行业技术崇拜时代的终结。但Sora的退场并不意味着AI视频赛道的降温,反而可能推动行业完成从技术竞赛到价值竞赛的转型。

当前的AI视频生成赛道仍处于发展初期,2025年全球市场规模仅10亿到20亿美元,与数百亿美元的潜在创意工具市场、千亿美元的视频广告市场相比,还有巨大的拓展空间。

真正的考验在于,谁能率先找到那个让算力投入和商业回报打平的平衡点。这不是一个纯粹的技术问题,而是一个关于商业模式、生态协同和成本控制的复杂系统工程。

视频生成的算力成本不会降低,至少在可预见的未来不会。能够承受这种长期消耗、并将消耗转化为商业壁垒的玩家,才真正有机会笑到最后。

目前字节的优势最明显,它有抖音这个天然的分发渠道,有即梦和剪映两个端到端的产品,有海量的创作者愿意付费。

而阿里的机会在于电商,电商视频是所有视频内容中商业转化率最高的品类之一,如果能用AI视频替代传统商品拍摄,每一条生成的视频背后都有清晰的ROI。

腾讯的潜力则在于生态宽度,如果腾讯能把混元视频模型和视频号、阅文160余万部商业化授权IP、腾讯视频影视版权库等资源深度整合,理论上可以构建一个从IP到内容生产再到分发的完整闭环,但问题是,腾讯的动作太慢了。

可灵AI主打短视频创作者和电商营销,商业化跑得最快,但快手的用户规模和生态深度毕竟不及字节和腾讯,可灵的增长空间天然受限。

此刻中国的AI视频赛道,正处在最热闹也最紧迫的时刻,真正的战争才刚刚开始。