抖音快手新战场,视频生成大模型的同与异

09-04 586阅读 18评论

文 | 新态度Pro

动态视频生成AI运用正在迎来新的变数。

2023 年,Runway 发布了文生视频/图生视频大模型 Gen-2 ;2024年头, OpenAI 的 Sora 展现视频又掀起了一波评论,不过现在 Runway 缺少汉化版别, Sora 还处于未公开阶段,被外界戏称为期货,而瞅准了这段空窗时刻,国内也见缝插的发布相关模型/运用,发布者是国内最大的两个短视频途径——抖音和快手

本年 6 月份,快手敞开了可灵AI大模型运用请求,声称“全球首个普通用户可用的实在印象级视频生成大模型”,尔后不断晋级并在 7 月 25 日全面敞开内测,一起正式上线了会员系统;紧接着在 7 月底和 8 月初,字节的即梦AI的 1.0.0 版别正式上架到安卓/苹果运用商铺,而在此前 5 月份,剪映 Dreamina 官方就已宣告其品牌的中文名为“即梦”,并上线相关 AI 视频生成功用。

与国外不同的是,国内的AI视频生成大模型果然如此地由最大的两个短视频途径先下手为强入局。但详细而言,即梦AI和可灵AI的初期的运用布局不尽相同,之于其母公司的含义也截然不同,究竟字节内还有豆包,可灵AI之于快手,更接近于“全村的期望”这一人物。

另一方面,二者生成的AI视频风格显着有着不同,即梦好像更拿手动画风,可灵却卷向印象风。二者的这种差异与前期的布局不无关系,虽然现在还无法说明互相方式的好坏几许,但从当下的言论来看,印象风的AI视频好像要更有新鲜感。

即梦VS可灵,特性和位置大不相同

从现在言论倾向来看,字节即梦AI的视频生成体现不如快手可灵AI。《新态度》以为,这来源于其各自的视频剪辑途径剪映和快影自身的特性不同,以及整个字节系和快手系对AI的布局也有所不同。

剪映的即梦AI作为一个独自的移动运用需求更长的上线周期,而快手挑选了直接将移动端的运用搭载于其视频剪辑途径快影上,极大缩短功用全面上线的周期和难度。

 抖音快手新战场,视频生成大模型的同与异

不过关于剪映为何要从头拓荒出一个运用,在《新态度》看来,不管是从月活进步需求,App体量,以及收费方式来看,剪映都必须将即梦AI独自拓荒出一个运用。

首先剪映自身的月活用户在整个移动端视频剪辑这个赛道来看早已一骑绝尘,据 Qusetmobile 此前的数据显现约有一亿,这乃至不包括剪映的海外版 CapCut ,因而剪映更需求考虑的是就将其直接集成到剪映自身的App上的性价比。

因为剪映上本来已有相关AI图生图的功用模块,以及特定方式的图生视频模块,加之剪映自身又非常吃手机内存,若将即梦AI的视频生成一切功用作为一个模块植入剪映,会使得剪映自身变得愈加臃肿。

而且收费方式的平衡也是个问题,假如将即梦AI直接植入剪映,那么只或许有两种收费方式:1、直接一刀切进步剪映全体会员收费,2、或许在会员收费基础上,即梦AI相关功用别的收费。但是现在剪映的会员费用现已不算低了,这两个方式关于本来的剪映用户来说都会难以承受。

但关于快手的快影来说,这三方面状况又刚好跟剪映相反:与剪映比较月活进步空间更大,可以靠更多的更强壮的AI功用模块来引流;App自身体量也不算大,本来的会员费也用远远低于剪映,现在剪映包年会员费用是499元,而快影接连包年88元,费用可进步空间还很大,因而可灵AI作为功用模块植入是现在更优的解法。

 抖音快手新战场,视频生成大模型的同与异

另一方面,可灵AI跟即梦AI在内部的位置大不相同。

在字节系内运用层面,除了即梦AI,还有谈天机器人豆包,豆包跟即梦相同具有独自的移动端 App,一起也植入在了比方飞书的字节系运用途径上。依据 Similarweb 的榜单,在 7 月,豆包的访问量现已排到了国内第四(前三分别是Kimi,文心一言以及通义)。除此之外字节在运用层还有其他比方猫箱、星绘等AI运用,但因为这些运用的存在感并算不高,在此就不多赘述。 

而反观快手,早前发布的爽快大模型在运用层面水花并不算大,可灵AI运用一上线即引起了广泛重视。 

8 月 27 日,在快手的光合创作者大会上,快手盖坤泄漏,已有超越 160 万人运用过快手的视频生成大模型可灵AI,并累计生成超 1600 万条视频。乃至在 7 月的 Similarweb 榜单上,可灵AI排到了国内第 18 位,是现在国内排名最高的视频生成类AI运用。

只不过因为即梦AI的 app 正式上线和可灵AI的内测敞开都是在 7 月,咱们还需求等候 8 月榜单的发布以得出进一步的定论。 

据悉,早在 Sora 展现视频发布后不久,就有相关人士猜想其模型为“Diffusion模型和Transformer模型的结合”,简略来说便是 Transformer 了解文字,Diffusion 扩展图片。而在可灵AI官网的介绍中也说到:“根据对文本-视频语义的深刻了解和 Diffusion Transformer 架构。” 

据业界人士称,这样的架构在本年年头时业界就已遍及开端研讨。也便是说,快手开端研讨可灵AI或许还要更早一点。虽然 Diffusion 和 Transformer 结合并不能算一个Creative idea,但那时国内的大多大模型厂商还在各种通用百模大战之中,能选定视频生成这样一个更详细乃至是投入更大的赛道,并非一个简单事。 

关于字节来说,豆包和即梦虽然是不同的团队在担任,但就以上的榜单来看,比起即梦AI,豆包AI在现在各方AI运用大战白热化的阶段,好像愈加可以帮字节搏出位。因而,可灵和即梦之于其母公司的含义是完全不同的。

可灵AI之于快手,也天然接近于“全村的期望”这一人物。

即梦拿手动画风,可灵卷向印象风

OpenAI 现在在全球 AI 界独领风骚除了自身技能的抢先,也与其优先发布奠定的用户心智以及获取了更多实在数据练习机遇有关。仅仅问题在于,视频生成式AI的先手优势,是否会有谈天机器人AI影响那么大,在OpenAI看来,或许并不大,否则 Sora 也不会如此不慌不忙。 

事实上除掉 OpenAI 这一极点事例,就国内的 AI 谈天机器人而言,单纯的机遇先手优势也不重要,乃至本来途径的规划优势也不重要。 OpenAI 之后,国内大厂最早刷存在感的大模型是百度的文心一言,2023 年 3 月份就已上线,而现在流量排名榜首的 AI 运用却是独角兽 Kimi ,上线于 2023 下半年。 

原因在于,在谈天机器人这个赛道,Kimi 占有的是某个特定内容方式的先手优势。

以 Kimi 和文心一言、通义等AI的方式作为比照来看,大厂的这些 AI 谈天机器人一开端就学着 OpenAI 的 GPT ,冲着更全面更通用的方向去的,这必然会导致不管是获客层面仍是模型练习层面都会广而不精。而 Kimi 虽然也是通用大模型,但却有一个非常精准且高效的切入点——首要运用场景为专业学术论文的翻译和了解、辅佐剖析法律问题、快速了解AAPI开发文档等。清楚明了,这方面的内容更具有逻辑性,关于 AI 来说相对更简单了解和输出。 

也便是说,Kimi 背面的月之暗面比大厂都更早锚定了初期的中心付费用户以及商业化方式,加之满足坚决的营销投入以及精准的营销获客途径,有助于 Kim 完成生成内容质量上的滚雪球。 

据《智能出现》报道,月之暗面在B站的转化人均本钱报价高达 30 元左右。 这个价格不仅在AI界,在大多数范畴也算非常昂扬。 从竞价广告的逻辑来看,其出价更高也意味着将分到更多的流量。 不过或许关于Kimi来说是值得的,究竟其中心受众集体跟B站用户重合度也比较高。 

而在视频生成AI这个赛道,可灵AI把握的也是内容方式的先手优势。

实际上,现在市面上早已不缺某个特定方式下的AI视频生成运用,例如此前很火的各种AI动画风格,瞬间全宇宙风格,各种日漫游戏风格,以及静态人物相片生成某个特定动态表情的运用等……这些运用往往体量小,愈加简单到达商业化。比方现在抖音用户正在测验的“AI拥抱”——输入两个人独自的相片,即可生成二者拥抱的动态视频。 

据悉,这个功用来自一个叫做魅脸的小程序。而该小程序商业化方法非常粗犷,安卓端生成三次拥抱视频收费9.9元。而且不管是抖音仍是快手上都有这个小程序。 

但显着,以上这些AI视频内容方式都无法完全给业界带来震慑,仅可作为C端用户的日常文娱消遣。而抖音用户比较起快手用户也更爱讨论生成这类生成AI相关的内容(以两个途径月活用户和AI论题浏览量的比值距离得出)。 

不知是否有遭到自身途径这些视频内容方式的影响,不管是现在交际媒体上的一些测评成果,仍是《新态度》自主测评成果来看,即梦AI生成的内容的确在某些特定的底图和描述词之下体现更佳;而更多时分,快手的可灵AI生成的视频,物体动态和光影更天然,画面质感更佳。不过在移动端,可灵AI生成内容的速度要慢于即梦AI。 

 抖音快手新战场,视频生成大模型的同与异

以上两个视频是同一张鲜花相片作为底图,输入相同的描述词往后两个AI各自生成的作用。即梦AI的生成内容更豪放更有动画感,可灵AI则是更抑制更有灵气的印象感,现在的言论也的确更倾向于认可后者这种天然的印象风格。

也便是说,可灵AI或许跟 Kimi 相同,提早想清楚了自己首先要服务的那部分中心用户以及内容方式——对印象有更高要求的人群,并料想到了只要这种内容方式才可以给业界带来一些新的变数。 

这时再看抖音方发布即梦AI这个中文姓名时,快手的可灵AI很或许现已在为上线做准备了。 

写在最终

不过,因为抖快各自把握着流量巨大的视频内容宣发途径,所以假如有一天抖音的即梦AI生成的内容的确显着更让用户惊叹,倒也不难经过自身途径向用户传递这一信息。 

正如一些特定的小程序或AI运用相同,此前仅仅一个抢手应战,抢手视频,就可以掀起新的一轮图生视频浪潮,即梦AI当然也可以用自身途径的优势到达口碑回转,仅仅或许很难再以本来动画风格的内容方式出圈,用户或许正在对这些动画风格的生成内容失掉新鲜感(而且动画方向的版权问题更大)。 

所以即梦AI接下来需求持续发力的点,或许便是可灵AI的印象风格。

此外,即使Kimi、阿里、百度等大厂主导的谈天机器人这个赛道现在还算是和平共处,但快手和抖音带起的AI视频生成浪潮作用却是马到成功,更检测模型自身的内容生成质量和进化速度,接下来其他大模型厂商很有或许也会加入到这场AI生成视频的竞赛中。 

依照本文的逻辑,有着视频号一起也有强壮配套文娱工业的腾讯,在传统互联网大厂中好像更有优势,但那便是后话了。 

文章版权声明:除非注明,否则均为ZBLOG原创文章,转载或复制请以超链接形式并注明出处。

发表评论

快捷回复: 表情:
评论列表 (有 18 条评论,586人围观)
网友昵称:斩尽风月
斩尽风月 V 游客 沙发
面比大厂都更早锚定了初期的中心付费用户以及商业化方式,加之满足坚决的营销投入以及精准的营销获客途径,有助于 Kim 完成生成内容质量上的滚雪球。 据《智能出现》报道,月之暗面在B站的转化人均本钱报价高达 30 元左右。 这个价格不仅在AI界,在大多数范畴也算非常昂扬。 从竞价广告的逻
09-05 回复
网友昵称:芝雅霜
芝雅霜 V 游客 椅子
包括剪映的海外版 CapCut ,因而剪映更需求考虑的是就将其直接集成到剪映自身的App上的性价比。因为剪映上本来已有相关AI图生图的功用模块,以及特定方式的图生视频模块,加之剪映自身又非常吃手机内存,若将即梦AI的视频生成一切功用作
09-05 回复
网友昵称:难拥他心
难拥他心 V 游客 板凳
心一言以及通义)。除此之外字节在运用层还有其他比方猫箱、星绘等AI运用,但因为这些运用的存在感并算不高,在此就不多赘述。 而反观快手,早前发布的爽快大模型在运用层面水花并不算大,可灵AI运用一上线即引起了广泛重视。 8 月 27 日,在快手的光合创作者大会上,快手盖坤泄漏
09-05 回复
网友昵称:我型我塑
我型我塑 V 游客 凉席
《智能出现》报道,月之暗面在B站的转化人均本钱报价高达 30 元左右。 这个价格不仅在AI界,在大多数范畴也算非常昂扬。 从竞价广告的逻辑来看,其出价更高也意味着将分到更多的流量。 不过或
09-05 回复
网友昵称:小乔@躲猫猫
小乔@躲猫猫 V 游客 地板
App体量,以及收费方式来看,剪映都必须将即梦AI独自拓荒出一个运用。首先剪映自身的月活用户在整个移动端视频剪辑这个赛道来看早已一骑绝尘,据 Qusetmobile 此前的数据显现约有一
09-05 回复
网友昵称:画一面红妆
画一面红妆 V 游客 6楼
,而瞅准了这段空窗时刻,国内也见缝插的发布相关模型/运用,发布者是国内最大的两个短视频途径——抖音和快手本年 6 月份,快手敞开了可灵AI大模型运用请求,声称“全球首个普通用户可用的实在印象级视频生成大模型”,尔后不断晋级并在 7 月 25 日全面敞开内测,一起正式上线了会员系统;紧接
09-05 回复
网友昵称:╰蓝鸢尾*
╰蓝鸢尾* V 游客 7楼
penAI 这一极点事例,就国内的 AI 谈天机器人而言,单纯的机遇先手优势也不重要,乃至本来途径的规划优势也不重要。 OpenAI 之后,国内大厂最早刷存在感的大模型是百度的文心一言,2023 年 3 月份就已上线,而现在流量排名榜首的 AI 运用却是
09-05 回复
网友昵称:华亭鹤
华亭鹤 V 游客 8楼
度等大厂主导的谈天机器人这个赛道现在还算是和平共处,但快手和抖音带起的AI视频生成浪潮作用却是马到成功,更检测模型自身的内容生成质量和进化速度,接下来其他大模型厂商很有或许也会加入到这场AI生成视频的竞赛中。 依照本文的逻辑,有着视频号一起也有强
09-05 回复
网友昵称:旧事如花满枝桠
旧事如花满枝桠 V 游客 9楼
图生视频浪潮,即梦AI当然也可以用自身途径的优势到达口碑回转,仅仅或许很难再以本来动画风格的内容方式出圈,用户或许正在对这些动画风格的生成内容失掉新鲜感(而且动画方向的版权问题更大)。 所以即梦AI接下来需求持续发力的点,或许便是可灵AI的印象风格。此外,即使Kimi、阿里、百度
09-05 回复
网友昵称:磨叽到心烦
磨叽到心烦 V 游客 10楼
的架构在本年年头时业界就已遍及开端研讨。也便是说,快手开端研讨可灵AI或许还要更早一点。虽然 Diffusion 和 Transformer 结合并不能算一个Creative idea,但那时国内的大多大模型
09-05 回复
网友昵称:别听谣言四起
别听谣言四起 V 游客 11楼
戏称为期货,而瞅准了这段空窗时刻,国内也见缝插的发布相关模型/运用,发布者是国内最大的两个短视频途径——抖音和快手本年 6 月份,快手敞开了可灵AI大模型运用请求,声称“全球首个普通用户可用的实在印象级视频生成大模型”,尔后不断晋级并在 7 月 25 日全面敞开内测,一起正式
09-05 回复
网友昵称:听闻恩幼
听闻恩幼 V 游客 12楼
和平共处,但快手和抖音带起的AI视频生成浪潮作用却是马到成功,更检测模型自身的内容生成质量和进化速度,接下来其他大模型厂商很有或许也会加入到这场AI生成视频的竞赛中。 依照本文的逻辑,有着视频号一起也有强壮配套文娱工业的腾讯,在传统互联网大厂中好像更有优势,但那便是后话了
09-05 回复
网友昵称:蛋蛋的糖云
蛋蛋的糖云 V 游客 13楼
,在《新态度》看来,不管是从月活进步需求,App体量,以及收费方式来看,剪映都必须将即梦AI独自拓荒出一个运用。首先剪映自身的月活用户在整个移动端视频剪辑这个赛道来看早已一骑绝尘,据 Qusetmobil
09-05 回复
网友昵称:悦华
悦华 V 游客 14楼
图和描述词之下体现更佳;而更多时分,快手的可灵AI生成的视频,物体动态和光影更天然,画面质感更佳。不过在移动端,可灵AI生成内容的速度要慢于即梦AI。 以上两个视频是同一张鲜花相片作为底图,输入相同的描述词往后两个AI各自生成的作用。即梦AI的生成内容更豪放
09-05 回复
网友昵称:蓝见╮
蓝见╮ V 游客 15楼
型是百度的文心一言,2023 年 3 月份就已上线,而现在流量排名榜首的 AI 运用却是独角兽 Kimi ,上线于 2023 下半年。 原因在于,在谈天机器人这个赛道,Kimi 占有的是某个特定内容方式的先手
09-05 回复
网友昵称:蓝羽绝殇
蓝羽绝殇 V 游客 16楼
声称“全球首个普通用户可用的实在印象级视频生成大模型”,尔后不断晋级并在 7 月 25 日全面敞开内测,一起正式上线了会员系统;紧接着在 7 月底和 8 月初,字节的即梦AI的 1.0.0 版别正式上架到安卓/苹果运用商
09-05 回复
网友昵称:偶遇浪鬼
偶遇浪鬼 V 游客 17楼
又刚好跟剪映相反:与剪映比较月活进步空间更大,可以靠更多的更强壮的AI功用模块来引流;App自身体量也不算大,本来的会员费也用远远低于剪映,现在剪映包年会员费用是499元,而快影接连包年88元,费用可进步空间还很大,因而可
09-05 回复
网友昵称:ζ软肋
ζ软肋 V 游客 18楼
“Diffusion模型和Transformer模型的结合”,简略来说便是 Transformer 了解文字,Diffusion 扩展图片。而在可灵AI官网的介绍中也说到:“根据对文本-视频语义的深刻了解和 Diff
09-05 回复