奔跑中的奶酪

哪个最好用?9 款主流视频大模型评测!

哪个最好用?9 款主流视频大模型评测!

 视频大模型 - 详细

 第一梯队 简介
 Sora PPT阶段,发布演示效果 Top1,OpenAI 出品。
 可灵 注册可用,实际可用效果 Top1,快手出品,支持多任务。
 即梦 注册可用,每天免费 60 积分,可生成 12s。
 Luma 注册可用,免费用户需要等很长时间。
 Runway 注册可用,Gen-3 测试模型非常接近 Sora,但需要申请。
 SVD 本地部署,唯一的开源视频大模型。
 PixVerse 注册可用,对标 Runway,特用 Magic Brush 运动笔刷功能。
 Haiper 注册可用,生成动漫风格的视频,是一把好手。
 Leonardo 注册可用,目前最好用的“图片转视频”工具。
 第二梯队 简介
 Pika 注册可用,实际生成效果一般。
 Genmo 注册可用,实际生成效果一般。
 Veo PPT阶段,谷歌出品。
 生数 PPT阶段,生数科技出品。
 一粟 PPT阶段,极佳视界科技出品。
 OpenSora 本地部署,宣称要用开源的方式来达到 Sora 的效果。
 AnimateDiff 本地部署,伪视频生成工具,Stable Diffusion 的插件。

2024 年 2 月 15 日。

OpenAI 发布了全新 文生视频模型 Sora,随后震动了整个互联网,人们大呼“现实不存在了”!

无论是生成时长,还是视频连贯性,还是对物理学的理解。

Sora 都是独一档的存在。

然而,半年过去了,Sora 还是处于 PPT 阶段,还是没有实际可用的渠道。

考虑到 Sora 给互联网带来的震撼,再加上 Sora 正式版大概率会在今年的秋季发布会推出。

奶酪还是将 Sora 放在了视频大模型的第一位。

A17_Sora

地址:https://openai.com/sora

演示:https://www.tiktok.com/@openai

可谁能想到呢!

当初 Sora 画下的大饼,今天快手的 Kling 可灵大模型帮它实现了。

由于使用了大量的快手素材,在生成效果方面稍显“土味”,因此生成质量相比 Sora 略显逊色。

但可灵大模型,却是“目前实际可用”的最强视频大模型。

无论是分辨率高达 1080P,时长最高可达 2 分钟,还是目前的完全免费。

中文互联网欠可灵大模型一次热搜。

A17_Kling

地址:https://kling.kuaishou.com

收费:免费,且可以多任务运行,每个视频生成大概需要 3 分钟。

功能:文生视频、图生视频、视频续写、肢体动作、首尾帧融合。

使用:手机下载 “快影APP” 即可使用。

另一个表现突出的国产视频大模型,是抖音推出的 Dreamina 即梦

即梦大模型,主打使用“中文自然语言”,正好可以与抖音旗下的视频剪辑工具“剪映”一并使用。

不过即梦使用的是传统的扩散模型,因此生成效果一般,质量也不稳定。

而且最高只能生成 12 秒的视频。

A17_Dreamina

地址:https://jimeng.jianying.com

收费:免费用户每天登录送 60 积分,且积分不会累积,每秒消耗 4 积分,也就是 16 秒时间。

功能:文生视频、图生视频、首尾帧融合。

国外还有一款与“可灵大模型”几乎同时发布的视频大模型 “Luma Dream Machine”。

而且 Dream Machine 不用申请,不用等,注册就能上手使用。

不过 Luma 的表现不尽人意,细节也做得不好,加再上免费用户要需要等很久才能看到结果。

所以现在的热度已大不如以前。

A17_Luma

地址:https://lumalabs.ai/dream-machine

收费:每天免费 5 次生成次数,免费用户的生成速度较慢。

功能:文生视频、图生视频、首尾帧融合。

Runway 是最早的一批视频大模型。

从 Gen1 发展到 Gen2,Runway 无论在生成质量,还是可自定义程度,Runway 都是第一梯队。

而最新发布的 Gen3 测试模型,更是无限接近了 Sora 大模型。

就演示视频来说,无论在是时长、清晰度、镜头运动以及流畅度,都要强于可灵和 Luma 模型。

不过就是需要申请才能作用。

A71_Runway

地址:https://app.runwayml.com

演示:https://runwayml.com/blog/introducing-gen-3-alpha

收费:送 500 积分,Gen2 每秒消耗 5 积分,Gen3 每秒消耗 10 积分,

功能:文生视频、图生视频、视频延长、首尾帧融合、视频内容替换、AI 数字人、运动笔刷。

2023 年 11 月 21 日。

Stability 推出了 Stable Video Diffusion,也就是基于 Stable Diffusion 的开源视频生成模型。

SVD 支持文生视频和图生视频,同时具有多视角合成和微调功能。

从演示视频来看,效果等同于 Runway 的 Gen2 模型,而且SVD 是目前唯一的开源视频大模型。

目前最新版为 1.1,可以在 WebUI、ComfyUI 中部署使用。

A71_SVD

地址:https://stable-video-diffusion.com

演示:https://stability.ai/news/stable-video-diffusion-open-ai-video-model

安装:https://www.bilibili.com/video/BV1uQ4y1V7bP

还有一款非常低调的国产视频大模型 Pixverse

说它低调,是因为它「先出海,再海归」,界面全英文,不看介绍你很难知道它是国产大模型。

最近推出的 Magic Brush 运动笔刷功能,它能精确控制视频元素,就像修图一样修视频。

相比起 Runway 的 Motion Brush,功能更加灵活,操控性也更强。

终于有国产视频大模型可以和 Runway 掰手腕了!

因为它的定位是对标 Runway

A71_PixVerse

地址:https://app.pixverse.ai

收费:注册送 100 积分,每天登录送 50 积分。

功能:文生视频、图生视频、一致性角色视频。

由两位华人博士创业者建立的 AI 初创公司 Haiper ,也推出了视频大模型。

Haiper 提供了文生视频、图生视频和视频重绘等功能,就生成质量来说,“真实风格”的不太行。

但生成动漫风格,特别是迪士尼风格的视频,Haiper 却是一把好手。

A71_Haiper

地址:https://haiper.ai

收费:每天 10 积分,可同时运行 3 个任务。

功能:文生视频、图片视频、视频重绘、视频延长。

国外最受欢迎的图片生成平台 Leonardo,最近也加入了视频生成领域。

虽然没有“文生视频”的选项,但它的“图生视频”功能,却是目前最好用的“图片转视频”方法。

即使是免费用户,也能下载高清无水印的视频。

A71_Leonardo

地址:https://app.leonardo.ai

收费:每天送 150 积分(不累积),相当于 6 个视频。

功能:图片转视频,免费用户也可以生成的图片为高清视频,并且无水印下载。

接下来要介绍的视频大模型,则是第二梯队,又或者是还处于 PPT 阶段的。

1、Pika

Pika 也是最早一批做视频大模型的公司,最早于 2023 年 7 月上线。

它是由“华人美女学霸”创立的 AI 应用,凭借在当时还算惊艳的生成视频效果,获得了多轮融资。

可随着各路竞品的推出,Pika 在技术上没有了领先优势,甚至已经远逊于其它视频大模型。

实际测试的效果也不如人意,Pika 的流量已经断崖式下跌。

地址:https://pika.art

收费:注册送 250 积分,每个视频消耗 10 积分。

功能:文生视频、图生视频、口型合成、视频延长、视频局部修改。

2、Genmo

Genmo 也是一款视频大模型。

它的特点是简洁易用,即使是普通用户也能轻易上手,但就是生成效果不尽人意。

甚至,它是我体验过的视频大模型里,效果最差的一个。

地址:https://www.genmo.ai

收费:每天 100 积分,免费用户有水印。

功能:文生视频、图生视频。

3、Veo

谷歌出品,仍处于 PPT 阶段。

地址:https://aitestkitchen.withgoogle.com/tools/video-fx

4、生数

国内生数科技出品,仍处于 PPT 阶段。

地址:https://www.shengshu-ai.com/vidu

5、一粟

国内极佳视界科技出品,仍处于 PPT 阶段。

地址:https://world-dreamer.github.io

6、Open Sora

一个宣称要用开源的方式来实现 Sora 效果的项目,需要本地部署。

地址 1:https://github.com/hpcaitech/Open-Sora

地址 2:https://github.com/PKU-YuanGroup/Open-Sora-Plan

7、AnimateDiff

最早还有一个基于 Stable Diffusion 的插件 AnimateDiff

它可以生成连续的图片来模拟生成视频,所以它只是生成一张 GIF,并不是真正的视频大模型。

因此 AnimateDiff 生成的 GIF 图片连贯性非常差,尽管它已经升级了多个版本。

此外,你还可以使用抖音推出的 Lighting 版本,速度更快。

地址:https://github.com/guoyww/AnimateDiff

抖音:https://huggingface.co/ByteDance/AnimateDiff-Lightning



最后

  1. 欢迎关注奶酪 公众号 获取奶酪所有的原创资源,回复文章编号,比如 i01 就可获取对应的资源。
  2. 欢迎订阅我的 “奶酪书签专业版”,15年沉淀,超过 5000 个分类井条有序的好用实用 html 网站书签。
  3. 本文由「奔跑中的奶酪」原创创作,欢迎订阅、留言和 打赏,也欢迎引用和转载,但要注明出处。
注:本文由 奔跑中的奶酪 作者:奔跑中的奶酪 发表,其版权均为作者所有,如需转载,请注明作者名字以及文章来源。
27

评论:

1 条评论,访客:0 条,站长:0 条
  1. 小熊猫Firedoge
    小熊猫Firedoge发布于: 

    捉虫:“哪”写成了“那”

发表回复