首页 | 综讯 | 财经 | 法治 | 影视 | 棸焦 | 公益 | 道德 | 教育 | 社会 | 科技
文化 | 廉政 | 房产 | 旅游 | 消费 | 网评 | 生态 | 医卫 | 地方 | 案件 | 监督
食品 | 民生 | 能源 | 文物 | 关注 | 权益 | 报道 | 健康 | 三农 | 汽车 | 图片
设为首页
加入收藏
联系我们
滚动新闻: ·商务部新闻发言人就美近期通过对外军援一揽子法案答记者问 ·国家发改委与塞尔维亚有关部门达成三份合作文件 ·外交部:对法国等12个国家免签政策延长至2025年12月31日 ·综述|读懂中国式现代化的世界意义 ·第11批在韩志愿军烈士遗骸交接正在磋商 ·拜登签署含涉华消极条款的对外军援法案 中方表示坚决反对 ·日本6.6级地震后,震中附近一座核电站出现故障 ·中方回应美对华再掀301调查:一错再错 ·王毅:遵守国际法没有“例外”,美国没有“特权” ·揭“伏特台风”真相:操弄网络攻击溯源 栽赃陷害中国  
  您现在的位置:网站首页 > 科技 > 内容  

直接生成16秒高清视频 我国自研视频大模型在京发布

发布日期:2024-4-28  查看次数:375 来源:新华网  作者:

 
 
    核心提示:只需一段文字指令就能生成一段逼真视频,今年初,文生视频大模型Sora在全球人工智能业内外引发广泛关注..
 

     新华社北京4月27日电(记者魏梦佳)只需一段文字指令就能生成一段逼真视频,今年初,文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日,2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。

  记者从会上获悉,这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容,不仅能模拟真实物理世界,还拥有丰富想象力。

  清华大学人工智能研究院副院长、生数科技首席科学家朱军说,当前国内视频大模型的生成视频时长大多为4秒左右,Vidu则可实现一次性生成16秒的视频时长。同时,视频画面能保持连贯流畅,随着镜头移动,人物和场景在时间、空间中能保持高一致性。

  在动态性方面,Vidu能生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果。

  “Vidu能模拟真实物理世界,生成细节复杂且符合物理规律的场景,例如合理的光影效果、细腻的人物表情等,还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍,由于采用“一步到位”的生成方式,视频片段从头到尾连续生成,没有明显的插帧现象。

  此外,Vidu还可生成如熊猫、龙等形象。

  据悉,Vidu的技术突破源于团队在机器学习和多模态大模型方面的长期积累,其核心技术架构由团队早在2022年就提出并持续开展自主研发。“作为一款通用视觉模型,我们相信,Vidu未来能支持生成更加多样化、更长时长的视频内容,探索不同的生成任务,其灵活架构也将兼容更广泛的模态,进一步拓展多模态通用能力的边界。”朱军说。

 
热门·推荐    
坚决打赢反腐败斗争攻坚战持久战
坚决打赢反腐败斗争攻坚战
新华社北京1月8日电 中共中央总书记、国家主席、中央军委主席...
· 严明纪律把党建设得更加坚强有力
· 直播间里的“受害者家属”:不想要同情的流
· 2024年春风行动收官 发布岗位超430
· 在新时代大力弘扬红色文化
· 增强土地要素对优势地区高质量发展保障能力
· 唱响新时代的“长江之歌”

点击·排行    
多部门就房地产市场密集发声 在因城施策方
陕西榆林|现实版《狂飙》悲剧再次“上演”
境外电信诈骗犯罪集团有哪些圈套?
雷佳音:想演好戏,就做个有心人
上半年全国共追回外逃人员582人 追赃1
高额彩礼娶媳妇没几天就跑了 彩礼诈骗盯上
防晒衣火爆背后
多一分体谅 生一分清凉
以案说法|河南信阳:划拨的养殖农用地能否
“内鬼”被双开:泄露应当保密的内容!

热门·图文    
多部门就房地产市场密集发声 在
陕西榆林|现实版《狂飙》悲剧再
境外电信诈骗犯罪集团有哪些圈套
雷佳音:想演好戏,就做个有心人

投票·调查    
你是从哪里知道本网站的?
  • 网友介绍的
  • 百度搜索的
  • Google搜索的
  • 其它搜索过来的
  • 网址输错了进来的
  • 太忙了不记得了
  •  

     

    新华瞭望网版权所有 京ICP备108655196号 

    Copyright@2024 by www.snxinhua.com all rights reserved