效果追上Sora,字节跳动一口气发布两款视频生成模型

来源: 9月21日(1)

责任编辑: 弓璇

发布时间: 2024-09-25 21:23:31

0

0

图片来源:字节模型生成视频截图

界面新闻记者 | 肖芳

界面新闻编辑 | 文姝琪

9月24日,字节跳动一口气发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。

目前,新款豆包视频生成模型正在即梦AI内测版小范围测试,未来将逐步开放给所有用户。但从发布会现场展示的视频生成效果来看,无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型都表现出不错的效果。

比如,其中一个视频输入是,“特写?个??的面部,有些??,戴上了?副墨镜,这时?个男?从画?右侧?进来抱住了她。”视频画面显示,其不仅遵循了这个复杂指令,还能够按指令的时序去完成连续的动作,两个主体之间也能比较顺畅的进行交互,而且人物表情也比较准确传达了指令所描述的情绪。

而一位提前拿到内测资格的创作者体验生成的视频也显示,其生成的视频不仅能够遵循复杂指令,让不同人物完成多个动作指令的互动,人物样貌、服装细节甚至头饰在不同运镜下也保持一致,接近实拍效果。

一位多模态大模型科学家看完上述创作者使用豆包视频生成的视频后告诉界面新闻,如果demo效果保真的话,豆包视频生成大模型确实是相当不错了。从学术角度或者模型能力角度来说,其肯定达到了Sora的水平,尤其在在人物动作上非常棒。

字节跳动旗下火山引擎总裁谭待在发布会接受界面新闻等媒体采访时透露,豆包系列大模型并不是按照某个固定的时间计划发布的,有好东西就尽快推出。“我们的逻辑是推出的产品要质量可靠,有充分用户反馈,不能是半成品。就像视频和语言模型发布一样,不一定要抢第一,要推出成熟的产品。”

但在一位行业观察人士看来,这个节点一口气发布两款视频生成模型,对字节跳动更大的意义在于“拥有”。Sora发布之后,国内从业者都期待字节跳动能够第一个做出来中国版Sora,最后却是快手第一个做出来了“可灵”,而且效果还不错,字节跳动必然承受了一些压力。

并未过多公布模型技术细节

据界面新闻了解,豆包视频模型支持黑白、3D动画、2D动画、国画、水彩、水粉等多种?格,同时支持1:1、4:3、16:9等多个比例,能够适配电影、电视、电脑、手机等多场景。

相较于可灵等国内其他视频生成模型,豆包视频模型技术细节上略显神秘,并未对外公布太多信息。

此前,快手方面对外公布的信息显示,可灵背后的技术原理和Sora类似,都是把常用于视频生成人工智能的扩散模型与Transformer架构相结合,这有助于其理解更大的视频数据文件并更有效地生成结果。和Sora相比,可灵的一个关键优势是依托于快手短视频平台,数亿用户上传了大量可用于训练可灵的视频数据。

据谭待介绍,豆包视频模型经过剪映、即梦AI等业务场景的持续打磨和迭代,深度优化的Transformer结构,则大幅提升了豆包视频生成的泛化能力。同时,豆包视频生成模型基于DiT架构,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。

他强调,在镜头切换时可同时保持主体、风格、氛围的一致性是豆包视频生成模型的技术创新所在。

界面新闻从多位大模型从业者处了解到,人物动作是当下视频生成模型共同面临的挑战,Sora做得也不够好。目前,Sora看起来主要还是以运镜和基础动作为主,复杂动作比较差,豆包视频模型生成的demo已经有了明显提升。

但这仅限于豆包视频模型生成demo展现出的水准,几位从业者均表示,实际的水准比较难判断。

谭待在采访中明确表示,这两款视频生成模型并不是期货,字节跳动已经在内测API和应用,预计国庆节后会公开更多API。

已规划视频生成模型商用方向

界面新闻在发布会现场发现,此次前来参加发布会的人多到严控进场的程度,绝大多数参会者都是火山引擎的合作伙伴和对大模型有潜在需求的企业客户。

谭待在发布会现场也向这些合作伙伴和潜在客户介绍了豆包视频生成模型的商用方向,包括电商营销、动画教育、城市文旅、微剧本等企业场景,同时也能为专业创作者和艺术家们提供创作辅助。

这和此前可灵探索的商用方向基本一致,但字节跳动更务实一些。可灵推出后,快手高调推出了由可灵深度参与制作的奇幻微短剧《山海奇镜之劈波斩浪》,并于近日联合李少红、贾樟柯等9位知名导演启动了完全依托视频生成大模型制作电影短片“可灵AI”导演共创计划,试图以此来证明视频生成大模型在影视制作领域的可用性。

从《山海奇镜之劈波斩浪》的探索来看,可灵真正深入参与影视剧制作仍然有较大难度。和外界想象差异较大的是,这部微短剧虽然画面均由AI生成,但整部影片并不是又AI一气呵成,而是使用可灵大模型的文生图和图生视频功能生成了很多时长5秒的分镜头,再由后期剪辑团队人工剪辑而成。从成本降幅来看,其带来的价值也不如外界预期的那么大,整体的降幅不超过四分之一。

豆包视频生成模型的侧重点在于电商营销等对视频内容质量要求相对较低的场景中。在上述多模态大模型科学家看来,从目前各个视频生成模型的能力来看,它们距离商用影视创作有多远还有点难说,但应用在电商营销等场景中已经完全够用。

字节跳动并未在发布会上公布豆包视频生成模型在商用场景的定价。谭待表示,视频模型和语言模型应用场景不同,定价逻辑也不同。要考虑新、老体验和迁移成本,而最终能否广泛应用取决于是否比以前生产力ROI提升很多。

但他强调大模型价格已不再是阻碍创新的门槛。今年5月,豆包大模型公布低于行业99%的定价,引领国内大模型开启降价潮。火山引擎披露的数据显示,截至9月,豆包语言模型的日均tokens使用量超过1.3万亿,相比5月首次发布时猛增十倍,多模态数据处理量也分别达到每天5000万张图片和85万小时语音。

在谭待看来,大模型的应用成本已经得到很好解决,行业要从卷价格走向卷性能,支持更大的并发流量正在成为大模型行业发展的关键因素。

新闻热榜

1

兄妹团的成员们中秋快乐祝全国家人们中秋快乐#乡村#接地气#振兴乡村#中秋#中秋节

2

中日就核污水达成共识,为什么?

3

“留学报国、海创未来”京津冀欧美同学会德州行活动举行

4

马斯克:美国政府的开支将使国家破产!

5

感觉在印度的经历没对她产生任何影响

6

首届海峡两岸工程师论坛在福州开幕

7

事关台湾,信息量有点大!国防部霸气发声,一语轰动全球舆论

8

吃着中国的饭,还想砸中国的碗,韩国派人来访,王毅强调2个字

9

青春华章丨人民网评:让青春在创新创造中闪光

10

美国移民局新规:绿卡有效期延长至3年!

11

【深改在一线①】川渝“破界协同”生成8大类100项“高竹经验”

12

斯里兰卡宣布全国实施宵禁

13

7.7亿农村人口摆脱贫困

14

“唱响大湾区共筑中国梦”东莞市统一战线合唱展演活动圆满落幕

15

1992年出生的她,任副市长!

16

9月18日,广州市花都区市场监督管理局发布关于涉美诚月饼的情况通报。从情况通报来

17

伦敦警察险被制服论武功俗世中不知边个高

18

泼天富贵没接住?中俄天然气本要走蒙古,为何又变成哈萨克斯坦

19

突发,普京亲自签署,梅德韦杰夫获得新职务!

20

最新!已致220名联合国员工死亡

21

内塔尼亚胡或无退路

22

非洲驻华外交官与中国学校足球友谊赛在京举行

23

“新农人”成长记:从“农机达人”到“农技达人”

24

微塑料或导致脱发

25

#用抖音记录卡车生活#卡车司机的心酸和无奈

26

黎巴嫩贝鲁特南郊遭以色列袭击已致37人死亡

27

驻日美军驾车违规右转撞死骑手

28

西宁市招商引资推介活动在西安举行

29

浙江牢记殷殷嘱托奋力在深化改革、扩大开放上续写新篇

30

上海现紫红色天空

31

香港《的士司机违例记分条例》今起生效

32

我在大凉山,坐标盐源县,这里就是离太阳最近,离城市最远的地方,这里盛产糖心丑苹果

33

打赏女主播欠300万

34

2024世界制造业大会开幕式预热片

35

中拉青年以对话推动文明互鉴

36

卡塔尔半岛电视台:以军强行关闭半岛电视台位于巴勒斯坦约旦河西岸城市拉姆安拉办事处

37

这是我生长的地方(半岛全媒体记者朱宝仪

38

王华杰出席防汛防台工作视频会议并讲话,王靖出席

39

重兑现、拼服务,江苏徐州广邀“城市合伙人”

40

精准发力、靶向监督丨宜阳县纪委监委全力护航营商环境向优向好

20

辟谣观音桥抓人贩子

20

深中通道自通车以来,通行车流量达200万辆次,日均10万辆#旅行大玩家#深中通道#深中大桥

20

【地评线】东湖评论:让检察文化建设和传统文化传承美美与共

20

中美战区领导通话

20

京港洽谈会新亮点:京港AI应用加速器正式启动

20

女子坠入11米深井

20

国足1比2沙特

20

法国总理巴尼耶正式组阁,内阁成员名单公布

20

巴哈马总理:中国脱贫事业为“全球南方”提供了很好借鉴

热门攻略

1

哈里斯接受二辩邀请促对手参加特朗普婉拒:为时已晚

2

捷克反对党在地方选举中获胜

3

7点出发|男子花60元买螃蟹,绑蟹绳占20元!监管部门:下架!

4

祝祖国繁荣昌盛

5

青岛滨海学院一研究中心入选省外事研究与发展智库

6

颐和园别动大爷火了

7

长沙舰外舰紧张对峙

8

不一样的文化节!不一样的文化味!2024中国·唐山国际旅游岛重机文化节举行

9

被卖掉古石碑已追回

10

以色列犹太人真的是太聪明了,这次出奇制胜,使用高科技重创了黎巴"

11

俄罗斯中央核试验场负责人安德烈·西尼岑称,为恢复核试验做准备

12

印度洋出海口3大可能设想:缅甸融入中国经济圈,一解马六甲困局

13

防灾减灾科普短视频展播

14

秋分|风吹稻香,“丰”景正好!

15

学报告谈思路,广州妇女学研究会专题学习活动近日在穗举行

16

从经济利益的角度进行分析,印度一方"

17

东北雨姐视频疑造假

18

王俊凯要求影院退款

19

辽宁徐大堡核电500千伏送出工程(一期)开工建设

20

速度来看今日要闻!9月22日十条新闻摘要,两分钟看完!

20

遵义师范学院:免费公益培训课让毕业生提前掌握就业“秘笈”

20

三桥连两岸两岸同发展

20

"重大突破:印度又一邻国对华风向逆转

20

团风县“首席服务员”制改革推动营商环境再优化

20

用好协商民主,凝聚中国社会最大公约数

20

拜登在私宅接待日印澳领导人,有何用意?

20

王楚钦3比0黄镇廷

20

敬酒不吃吃罚酒!中国这次不再废话,美国察觉大事不妙,紧急改口

20

真没想到!黎巴嫩爆炸的寻呼机来源追查到保加利亚与挪威

20

重庆云阳发生山火

20

大连发布最新通告:严厉打击各类涉海涉渔违法犯罪行为

20

世乒联官宣,WTT冠军赛名单,国乒4大天王退出,王楚钦做意外决定

20

国务院参事调研组来广西调研沼气CCER项目情况

20

1990年,一重庆农民打倒十几个混混,到派出所后才知他身份不一般

20

卿梦与山苏竟在西瓜视频展开PK大战

20

地方国资委新媒体指数月度发布(2024年8月)

20

老人景区摔倒后去世

20

扫黑警察郑成月,狂飙“安欣”原型之一,耗时11年为陌生人翻案!

20

辽宁徐大堡核电500千伏送出工程(一期)开工建设

20

晋江致歉

20

杭州高温日数破纪录

20

黎看守政府总理米卡提宣布取消联合国大会之行

20

日本地铁的变轨过程#带你看世界

20

印度炮弹运往乌克兰,“反俄同盟”出现裂缝,普京请求中国拉一把

20

【地评线】东湖评论:民俗润泽乡间激活振兴力量

20

从目前情况看,国内正在形成五大趋势,大家要提前做好准备。(1)

20

全球能源互联网发展合作组织在纽约举办“未来能源”活动

20

台企卷入黎传呼机爆炸案解释不清,民进党还想靠“认知作战”甩锅

热门游戏

  • 1
    凤冈县举办示范性幼儿园卫生保健工作经验交流活动

    射击枪战 /热度:99322

    点击下载

    喜欢的雷电将军人妻版

  • 2
    美国终于同意五常增设2个位子但莫迪失望的是?美国拒绝印度

    射击枪战 /热度:38557

    点击下载

    播州区:“稳就业保民生”5200余人参与招聘

  • 3
    泽连斯基:乌“胜利计划”将是与俄对话开端和基础

    射击枪战 /热度:46064

    点击下载

    城管当街殴打老人

  • 4
    崩坏3 缅甸湖南商会执行会长朱卫东:让优质的中国制造走向全球

    射击枪战 /热度:35829

    点击下载

    TikTok4个月后被封

  • 5
    原神 中国公共外交协会会长,吴海龙:美国对华遏制“害人害己”!

    射击枪战 /热度:33720

    点击下载

    普京签署命令梅德韦杰夫获新职

  • 6
    出发吧麦芬 为了本国民众,巴基斯坦部长呼吁国际增加对阿富汗难民的外援

    射击枪战 /热度:67249

    点击下载

    国庆放假安排来了

  • 7
    永劫无间手游 重庆的雨终于来了!天气预报果然不骗我,你那里下雨了吗?

    射击枪战 /热度:22562

    点击下载

    卫星看“南水”润民十年间丨一渠清水穿城过“百年煤城”铺新绿

  • 8
    向僵尸开炮 “海南警方”新媒体负责人王坤:创意普法引导网络文明

    射击枪战 /热度:49329

    点击下载

    10人被立案、55名公职人员被问责!江西新余佳乐苑小区特别重大火灾事故多名相关责任人被查处

  • 9
    鸣潮 男子带粮食去韩国超重被拦,博主揭露粮食客内幕,列举禁进口产品(1)

    射击枪战 /热度:69894

    点击下载

    @上海市民“十一”来海南感受秋冬旅游魅力

  • 10
    艾塔纪元 重庆大新闻!61岁程志毅落马!速度之快!估计今晚某些人又要失眠

    射击枪战 /热度:21120

    点击下载

    法国总理巴尼耶正式组阁内阁成员名单公布

关于我们 | 联系我们 | 加入我们 | 网站地图 | 自助投稿 | 在线举报 | 玩家心声 | 最新咨询 | 游戏情感 | 游戏设计手稿 | 游戏概念艺术 |