网上吹 AI 视频的很多,但真上手试过的人少。Sora 一直说"即将上线"、Runway 月费 $15、可灵和即梦倒是免费开放了,但到底哪个能真正拿来干活?

我花了 7 天,用同一个脚本("一个穿红色外套的人在雨夜的城市街道上行走,霓虹灯倒映在湿漉漉的路面"),在 4 个平台上各跑了至少 5 遍,结果差异大到离谱。

为什么测这几个

Sora 是 OpenAI 的"王牌产品"——虽然至今没全面开放,但通过 API 已经能跑。Runway Gen-4 是行业老玩家,从创业第一天就在做 AI 视频。可灵 3.0 是快手出品,国内用户最容易接触到。即梦是字节跳动的产品,背靠豆包大模型。

四个产品,四个技术路线,价格也完全不在一个量级。

工具
Sora(OpenAI)
当前状态
API 内测
费用
按量付费(约 $0.1/次)
运行端
云端
统计时间
2026 年 5 月
工具
Runway Gen-4
当前状态
公开可用
费用
$15/月(标准版)
运行端
网页端
统计时间
2026 年 5 月
工具
可灵 3.0(快手)
当前状态
免费 + 付费
费用
免费每天 10 次
运行端
网页 / App
统计时间
2026 年 5 月
工具
即梦(字节跳动)
当前状态
免费 + 付费
费用
免费每天 5-10 次
运行端
网页 / App
统计时间
2026 年 5 月

测试场景 1:文本生成视频(Text-to-Video)

最基础的场景,输入一段文字描述,看谁生成的效果最接近描述。同一个 prompt 每个工具跑 5 次,取最好一次对比。

可灵 3.0 — 质感惊艳,物理规律最好

可灵 3.0 的画面质感是最好的。雨滴打在路面上有真实的溅射效果,霓虹灯在水洼里的倒影随着镜头移动有合理的光影变化。人物行走的步态自然——胳膊摆动和腿部动作几乎没有"AI 抽搐感"。5 次中有 3 次基本可用,这是四款中成功率最高的。

缺点是细节偶尔出错,比如有一次外套一开始是红色然后变成了暗红。生成时间约 3-5 分钟。

Sora — 构图最电影感,但太贵了

Sora 生成的画面构图是真·电影质感。镜头运用多样化——它自动加了推近和摇镜,光线追着人物走。雨夜的氛围感是四个里最好的,冷色调的控制非常精准。但 Sora 的物理理解相比可灵还是差一些——有一次人物的脚直接穿过了水洼,没有产生涟漪。

最大的问题是成本。按 API 调用算,每次生成约 $0.1,跑 5 次光测试就花了几十块。而且目前只支持英文 prompt,中文不友好。

Runway Gen-4 — 稳定但平庸

Runway 最稳。5 次生成全部成功(至少画面完整),但视觉效果是最平淡的——像是手机拍的普通视频,没有电影感。人物行走是"平移式"的,身体几乎没有上下起伏,一眼假。不过 Runway 的 UI 体验最好,有 timeline 编辑功能,可以逐帧调整。

即梦 — 速度最快,质感中规中矩

即梦的生成速度最快,约 40-60 秒出片,比可灵快 3-4 倍。画质介于可灵和 Runway 之间,霓虹灯光效和氛围感不错,但人物细节经不起细看——手指偶尔粘连,瞳孔位置漂移。胜在免费额度够用,App 端随手就能玩。

测试场景 2:图生视频(Image-to-Video)

上传同一张照片(用 Midjourney 生成的城市街景),让 AI 把它动起来。这个场景对做短视频的人最实用——一张静图变动态画面。

可灵 3.0 和图生的效果最自然——它能在保持原图构图的基础上,让车流动起来、树叶微微晃动。城市远景的云层缓慢飘过,整体画面几乎以假乱真。Runway 也不错,但它会把原图"大幅度改写"——上传的街景图被改成了不同的光线和色调,你不一定喜欢这种"自由创作"。Sora 的图生视频功能尚未开放。即梦能做,但动效幅度很小,只是给画面叠加了一层"微微抖动"的效果,不够用心。

测试场景 3:运动幅度和控制力

真正的考验来了。我试了"一个人从站姿到蹲下捡东西再站起来"——这个连续动作对 AI 视频来说极难。

结果几乎全军覆没。可灵 3.0 在这个测试中表现最好——能识别出"蹲下捡东西"这个连续动作的前后逻辑,但被捡起的物体在画面里会变形(从水瓶变成了一团模糊的东西)。Runway 的动作幅度很小,人物只是微微弯了下腰,根本没捡起来。即梦直接忽略了"捡东西"这个指令,改成人物站在原地转了一圈。Sora 拒绝生成了这个动作—API 返回了"无法处理复杂动作序列"的错误。

诚实说一句:目前为止,任何 AI 视频工具都无法可靠地处理"人物与物体交互"的连续动作。不要期待能一键生成一个有情节的 15 秒短视频。

我的结论:可灵 3.0 画质最好且物理规律最真实,但生成慢、被墙(国内访问稳定但海外慢);Sora 最具电影感但贵且复杂动作会拒绝;Runway 最稳但平庸;即梦最快但精度不够。没有"最好的",只有最适合你当前需求的。

好的地方

1. 画质已经能用了。 尤其可灵 3.0 的 1080p 输出,在短视频平台完全够看。一年前 AI 视频还是 360p 马赛克,进步确实快。

2. 图生视频的落地价值最高。 做短视频、电商主图动态化、旅行照片转小视频,这四个工具都能帮上忙,且操作门槛很低——上传、等、下载,三步搞定。

3. 即梦和可灵的免费额度对轻度用户友好。 每天 5-10 次免费生成,做日常素材够了。真正高频使用的创作者才会考虑付费。

不好的地方

1. 复杂动作完全不行。 你无法用它做有人物交互情节的视频。AI 视频目前最适合的是"氛围感短片"——风景、城市街景、抽象艺术,而不是叙事情节。

2. 一致性差。 同一个 prompt 跑 5 次,5 次的结果可能完全不同。不能指望它像 Midjourney 那样稳定产出风格统一的画面。对品牌做系列内容来说是个大问题。

3. 生成速度太慢。 可灵 3.0 一次生成要 3-5 分钟,Sora API 也要 2-3 分钟。做视频剪辑的人习惯了几秒渲染一条,AI 视频的节奏让他们抓狂。

4. 定价混乱。 Sora 按次计费跑一次 $0.1,Runway 月费 $15 限制生成次数,可灵和即梦的付费套餐逻辑也不一样。没有一个统一的"好用又便宜"的方案。

适合谁 / 不适合谁

✅ 适合:

❌ 不适合:

一句话:选可灵 3.0 做高质量素材,选即梦做快速试错,预算充足且做英文内容才考虑 Sora。Runway 目前处于中间地带,除非你需要它的编辑功能,否则两个国产工具够用了。