首页 >> 园区动态 >>产业新闻 >> 字节大模型内部赛马 下一个爆款 or 烧钱深坑?
详细内容

字节大模型内部赛马 下一个爆款 or 烧钱深坑?

时间:2024-08-19     【转载】

今年最火的两款全球AI产品,当属视频生成大模型产品Sora和音乐生成大模型产品Suno。

今年4月,经Suno爆改的周杰伦金曲《以父之名》和《夜曲》直接封神,在音乐界掀起了一股不小的波澜。不少人认为,这两条赛道会催生出新的爆款产品,谁能够拿下其中一条赛道,谁就能成为AI行业的王者。

两款AI产品的火爆,迅速点燃了国内大厂对这两条赛道的争夺战。阿里发布了通义万相AI视频服务,字节跳动发布了“PixelDance”,快手发布了视频大模型产品“可灵”,QQ音乐、网易云音乐也发布了AI创作功能,而AI头部公司的Minimax、生数科技、智谱AI也纷纷跟进。

在这两条热门赛道中最不遗余力的当属字节。9月24日,火山引擎在深圳举办AI创新巡展上,发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,意味着字节正式宣告进军AI视频生成赛道。

不仅如此,字节还在音乐生成赛道上,推出了Seed-Music音乐生成模型,并于今年7月推出了发布了全新版本的海绵音乐APP,主打“一键创作你的AI音乐”,这款产品也是字节AI音乐产品的代表作。

至此,字节完成了在AI视频和AI音乐这两条热门赛道上的全布局。火力全开之下的字节,能够得偿所愿吗?

字节AI赛道创业:试错、内部赛马并举

豆包视频生成大模型的发布,是字节在AI领域的一次重磅亮相。

据火山引擎介绍,豆包视频生成模型基于DiT架构,通过高效的DiT融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。

而在此前视频生成模型大多只能完成简单指令,豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。例如,后者可以让不同人物完成多个动作指令的互动,使人物样貌、服装细节甚至头饰,在不同运镜下也保持一致,接近实拍效果。

基于豆包视频生成大模型,字节内部也推出了相关的具有AI视频生产能力的产品,主要由两个业务团队在推进,一个是豆包,一个是剪映,可以看做是内部的一场赛马。

豆包对外的产品是豆包APP,剪映则是即梦AI APP,两者的底层技术都是使用的豆包视频生成大模型,即梦使用的是豆包视频生成大模型“PixelDance”。

两款产品虽然都有着视频生成能力,但即梦更具有代表性。

即梦的前身是Dreamina,是原字节跳动中国CEO、转岗至剪映的业务负责人张楠的创业项目。刚上线之时,这仅仅是一个文生图的创作产品。随后,Dreamina瞄上了Sora的潜力,内部基于PixelDance模型开始研发视频生成能力,今年2月,Dreamina的视频生成服务开启对外测试。

今年5月,Dreamina改名即梦,宣布其AI作图和AI视频生成功能全量上线,并在抖音内进行大量投放。张楠更是在朋友圈转发,称即梦刚刚上线,还有很多待优化的地方。


电话:400-000-0000
邮箱:12345678@126.COM
地址:北京市XX区XX路XX大厦XXX室
COPYRIGHT 2013-2017 京ICP备10000000号-0
seo seo