
一个月里,AI 视频企业爱诗科技和 AI 创作平台 Liblib 先后官宣了一笔大额融资:
10 月 23 日,LiblibAI 宣布完成 1.3 亿美元 B 轮融资。这是 2025 年至今国内 AI 应用领域最大规模的单笔融资,由红杉中国、CMC 资本及某战略投资方联合领投,老股东顺为、源码、明势、? 策均加码。(有媒体指出该战略投资方为蚂蚁集团,就此,我们向 Liblib 求证,对方称"和蚂蚁之间没有披露融资关系"。)
一周前,爱诗科技也宣布完成 1 亿元人民币 B+ 轮融资,由复星锐正、同创伟业、顺禧基金等共同投资,同时公布公司旗下产品 PixVerse 与拍我 AI 用户规模突破一亿,年度经常性收入(ARR)超过 4000 万美元。这轮融资距离上一轮 6000 万美元 B 轮融资,仅仅隔了 40 天,两轮累计融资超 5.2 亿元。
这两则融资消息不禁令我联想到,国庆期间,Sora2 在创投圈热闹传播的同时,再度引发人们对 AI 图文和视频类创业公司还有没有机会的忧虑。
9 月 30 日,OpenAI 正式发布了全新的视频生成模型 Sora2,同时推出基于该模型的社交应用 SoraApp。与前一代相比,Sora2 的能力实现了质的飞跃:在物理模拟的精确度、画面的逼真度、生成的可控性上几乎趋于完美,能够做到语音、音效与人物口型的精准同步。更具想象力的是,SoraApp 带来的社交玩法让用户可以客串入镜、重混他人作品、甚至在虚拟世界中与名人同框。几乎一夜之间,奥尔特曼成了"全世界最忙的人",他的数字分身穿梭在长城、三亚、NBA 球场和显卡商店之间。这些病毒式短视频也让 Sora2 在社交媒体上出圈。对业内来说,OpenAI 想做应用的心,一目了然。
有人说,这就是视频版的" GPT 时刻";也有人说,Sora2 是 AI 版的 TikTok。这些说法的有效性有待更长的时间来验证,至少眼下,Sora2 让视频 AI 领域重新热闹起来。
但对创业者而言,这是个好消息吗?两家公司不约而同选择在此时公布融资消息,不知道算不算对外界忧虑的一种回应。
回想去年初 Sora 爆火时,投资人和创业者似乎还在反应的过程中。几乎没人公开喊出"做中国版 Sora "的口号——"热闹归热闹,但那是 OpenAI 的热闹。" OpenAI 模型一更新,就可能让许多产品逻辑瞬间失效。今年,SoraApp 的问世则让人们第一次看到应用层的巨大想象空间——那个可能是真正属于创业公司的窗口,与此同时,越来越多的"国产 Sora "开始上路。" 100 个国产 Sora2 已经在路上",这是一位 AI 博主的生动形容。
无论如何,正如中国要有自己的 OpenAI,中国也一定会有自己的 Sora。只是中国版 Sora 会是谁呢?这个机会到底是属于模型公司,应用公司,亦或是大厂的囊中之物?
就在 Sora2 搅动舆论的同时,Sand.ai 上线了全新的音画同步视频模型 GAGA-1。在合伙人 Chris 看来,与所有人之前的预期相比,AI 视频赛道向 C 端市场的转变将显著加速。"之前投资人都在问 AI to C 到底该怎么做。仅靠逻辑解释总是单薄的,还是要‘把事做出来’。Sora 给了一个很好的示范。"
视频版的 GPT-3.5 时刻
" Sora2 是迈向 GPT-3.5 时刻的一步。"
按照 OpenAI 在官方博客中的说法,2024 年 2 月推出的初代 Sora 模型相当于视频领域的 GPT-1 时刻——它让" AI 视频生成"首次看起来开始发挥作用,通过扩展预训练计算,模型具备了对象持久性等基本能力。Sora2 被官方定义为" GPT-3.5 时刻":它能更好地遵循物理规律,理解跨多个镜头的复杂指令,准确保持世界状态,并首次实现了通用的视频与音频生成系统。它不仅能生成高真实感的视觉内容,还能同时合成环境声、语音与音效,完成完整的视听体验。
与模型同步发布的,还有一款由 Sora2 驱动的全新应用—— SoraApp。在这款应用中,用户不仅可以一键生成视频,还能 Remix 他人的作品、上传人像 Cameo 进行客串、并在可自定义的 Sora 信息流中发现新内容。用户只需一次短暂的视频与音频录制,便可高保真地"进入"任何 Sora 场景,与 AI 共同出镜。
这让 OpenAI 的 CEO 萨姆 · 奥特曼意外成为了国庆假期的"流量担当"。他开放了自己的肖像权,网友们随即掀起了"数字奥特曼"创作热潮。这些短视频迅速在社交平台上传播开来,成为 Sora2 爆红出圈的加速器。
虽然 SoraApp 仍处于"邀请测试"阶段,但它的增长速度远超 ChatGPT。应用分析机构 AppFigures 数据显示,其首周 iOS 下载量达到 62.7 万次,高于 ChatGPT 首周的 60.6 万次。
仿佛发令枪响,Sora2 的发布让全球 AI 视频领域进入"超级加速"阶段。Sora2 发布仅半个月后,谷歌于 10 月 16 日推出 Veo3.1 与 Veo3.1Fast,被普遍解读为正面迎战 OpenAI 的举措。此前一日,百度宣布旗下视频生成模型百度蒸汽机再次升级,支持 AI 长视频实时交互生成。
与一年半前 Sora 刚出来时的状态不同,这一次,中国的视频 AI 创业者不再低调观望,一年多时间里,越来越多的"国产 Sora "正在登场。
10 月 10 日,曹越团队的 Sand.ai 凌晨上线了全新的音画同步视频模型 GAGA-1!这些由 GAGA-1 生成的视频,自带声音、音效和情绪,其质感与电视剧片段极为相似。这家公司成立于 2024 年年初,股东包括源码、今日资本、经纬创投、创新工场等知名机构,以及知名企业家王慧文、宿华。
10 月 17 日,爱诗科技在宣布融资时,顺便秀了一波成绩——公司旗下产品 PixVerse 与拍我 AI 服务于 C 端大众与专业创作者,目前用户规模已突破一亿;年度经常性收入(ARR)超过 4000 万美元,MAU 超过 1600 万。2024 年 11 月正式商业化,不到一年时间收入增长超过 10 倍,是过去一年全球收入和用户增长最快的 AI 平台之一。
9 月,生数科技宣布完成数亿元人民币规模的 A 轮融资。新一轮融资由博华资本领投,百度战投、北京市人工智能产业投资基金、启明创投、达泰资本、卓源亚洲、BV 百度风投等老股东持续跟投,建发新兴投资等产业合作方加码入场。
在 9 月的投中 AI 应用沙龙上,生数科技副总裁张数透露,公司平台累计生成视频数量已超过 3 亿条,自开启商业化以来,仅 8 个月时间,ARR 便突破 2000 万美元,且仍保持快速增长态势。
此外,这个赛道上还有从大语言模型转向多模态的 Minimax,快手的可灵,以及字节的 Seed ——传闻中字节旗下 4 个团队都在探索 AI 视频。Sora 不会进中国,中国 AI 视频创业者最大的对手可能还是字节,爱诗科技和 Liblib 两家头部公司的创始人也都出自字节。
模型赛道的故事结束了吗?
去年,Sora 问世时,我们曾写过《"已经有三个人跟我说要做中国版 Sora "》和《"今天,所有 VC 的会上都在谈 Sora "》。那时 OpenAI 作为模型巨头无远弗届的能力,让许多投资人望而却步,文生图、文生视频一类应用场景又被认为是最容易被 OpenAI 这样的巨头覆盖的。当时有投资人告诉我们,关注的一家 AIGC 公司也在开发基于特定产业数据的独有的模型,而不是仅仅调用别人的 API。"不然很难指望他们在应用层面做出真正差异化的东西。"
今年,几家头部的 AI 视频模型公司已经跑出来了,已经走到单笔过亿金额的轮次,但融资的过程想必总要回应投资人的各种质疑。有视频模型从业者曾告诉我们,他试图跟投资人阐释的一点是,多模态模型和大语言模型是两个不同但空间同样大的领域,且内部有极强的可拓展性。但不是所有的投资人都相信这个故事,不少人将"做模型"的公司视为一类,认为"模型赛道的故事已经结束了"。
从业者显然不这么认为。"大家对纯产品公司太乐观了。很多应用层的创新都可能被模型直接吸收。"在 Chris 看来,与之相反的,部分人对模型的认知还是有些狭隘,比如 Sora 会被认为是 Agent。" Sora2 的视频是‘模型直出’的,并不存在复杂的协作流程,也不是多个片段拼接的结果。你只需输入一句信息量极小的提示,Sora2 就能生成一个多镜头、具有完整叙事逻辑的视频。如果没有 Sora2,大家可能还以为视频模型的突破还停留在画面质量的维度,但 Sora2 展示的是另一种可能性——模型能讲故事。换句话说,语言模型所展现的各种智能正在逐渐向多模态模型扩散。"
作为视频模型创业者,他的看法是,Sora2 包括上半年的 GPT-4O 以及 Nano-Banana 都已传出明确的信号,即"模型是核心,产品侧的功能设计只是暂时的桥梁。应用公司摸索出来的有效功能,很有可能只是帮助模型公司明确下一步的优化方向。"
这让人想到大约十年前,网景创始人、硅谷著名投资家马克 · 安德森所提出一个广为流传的说法:"软件正在吞噬世界"。后来 AI 出来后从业者们又提出" AI 正在吞噬软件"。
"现在这个说法可以更加具体化,即模型在吞噬产品。" Chris 补充道。
他的看法是 AI 应用的可能性无限,但支撑这些应用的力量,不再是传统意义上的产品能力,而是"模型能力 + 业务认知"的结合。企业需要把业务理解直接内化进模型,让模型本身成为价值交付者。这样的创新模式对组织能力的要求极高——核心团队必须兼具科研、产品与商业化能力,还要实现高效沟通与目标对齐。
这或许也是创业公司和大厂竞争的核心机会。毕竟在 AI 领域,顶尖的研究者还是屈指可数。"这个时代,‘杠杆效应’很大,拼的不是人才数量,而是质量——你有三五个各领域最顶尖的人,凑在一起,和大厂竞争也不会落下风。" Chris 说。
按照这种说法,Sora2 现象不能简单认为是"一夜爆发",可能是模型能力长期积累的自然结果,甚至还有大量潜力未被释放。因此,Chris 判断模型的演进还远未结束。2025 年初,manus 的发布大获成功,市场的主流声音一度变成"纯产品公司的机会来了,模型只接 api 就可以。";但随着下半年 Nanobanana、Sora2 陆续发布,带来了一个更强烈的信号:"内化产品能力的模型,比起传统范式下的产品形态,很可能会降维打击。"
应用的机会来了?
AI 视频模型类公司固然不可忽视,在 Sora 冲击波后的一年多时间里,更多视频应用创业者也已经冒了出来。
两个月前,恒星 AI 发布了自己的 AIGC 视频社区平台。创始人张伟曾是阿里大文娱泛文娱中心首席内容官,2024 年成立恒星 AI,试图建立一个 AIGC 视频社区。另一家成立于 2025 年的长视频 AI 生成公司 MovieFlow,创始人也是影视背景,产品整合了全球顶尖的 AI 视频模型(包括 OpenAI、Google 等),目标是把需要上百人团队、数月工期的电影制作,压缩为 " 一键生成 "。
需要阐明的是,OpenAI 不仅在 Sora 模型上进行升级,还带来了内容上的范式创新。基于模型而来的 SoraApp 成为一个社区平台,支持创作者一键生成视频、上传人像 cameo、Remix 他人作品,甚至像刷 TikTok 一样在信息流里发现 AI 内容。
可以想见将来,AI 不仅能生成视频,还能决定"视频如何被观看""创作者如何被推荐"时,整个内容平台的生态规则都可能被重写。难怪长期对视频生成持谨慎态度的知名分析师 BenThompson 直言,这是"一个可能撼动 Meta 和 Tiktok 社交帝国根基的威胁"。
"视频 AI 的终局一定不是生产工具,而是通往‘人人都是导演’的 AIGC 视频社区。"在张伟看来,这是视频 AI 从"工具"到"社区"的演进路径,类似于移动互联网催生短视频平台、长视频平台衍生出社交化创作的过程。因此,他坚定走视频社区的道路。
Nathan 曾是一名一级市场的投资人,如今是 MovieFlow 的联创。关于 Sora2 带来的启发,他概括为两点:一是面向 C 端用户免费的趋势;另一个是 AI 时代会诞生新的社区物种。
"新的社区物种的诞生,首先取决于内容供给侧是否出现爆发—— AI 能做到这一点;其次,UGC 的用户和文化是否与移动互联网时代不同——这也是 AI 视频社区的机会所在。"
模型当然很重要,但在他看来,模型底座的竞争将呈现"群雄逐鹿"的局面,而非某一家公司独占。对创业公司来说,重点不应是与巨头硬碰硬地去做底层模型,而应将资源聚焦于 C 端应用。"只要模型不在细分领域做到效率第一,开发者和应用方就不会调用它。与其拼底座,不如把精力放在用户体验和场景创新上。"
Sora2 的问世像是一记发令枪,打响了 AI 视频社区的"竞速赛"。在这样一场全新的竞赛里,谁都想成为"中国版 Sora ",但没人敢确定那条"赛道"究竟通向哪里。
无论如何,不同公司必须找到自己的定位。有的选择做"大体量业务",机会大但门槛极高;有的则在"创作者工具"或垂直细分场景中寻找突破,上限虽低,但有自己的基本盘。
比如,SandAI 给自己的定位就是,如果有机会,还是努力去摸一摸上限,即便这显然不是条容易的路。恒星的张伟则认为,技术的边界仍在不断被推开。"我们不认为这是挑战,而是一种持续突破的过程。过去半年,我们从 10 秒、15 秒、20 秒到 30 秒、再到一分钟的视频生成时长,每一步都在刷新极限。这就是我们对科技边界的理解——不断拓展。"
当生活在 OpenAI 的阴影下成为一种常态,还能冒出来的公司或许会有更强的生命力。
股票配资排名提示:文章来自网络,不代表本站观点。