近日,阿里云推出了一款全新视频生成大模型I2VGen-XL,并在魔搭社区开放体验。该模型能够将用户上传的一张图片在2分钟左右生成一段1280*720的高分辨率视频。据悉,未来该模型将进一步实现2K超清效果,适用于短视频内容生产、电影制作等场景。 视频生成大模型的技术门槛较高,需要克服文本和视频内容匹配度、视频画面质量、画面连续性等诸多技术挑战。此前,阿里云和微软等科技公司相继推出了一系列可控视频生成研究成果,例如用户可通过定义空间布局、运动模式等条件来生成视频,但其画面清晰度难以满足真实场景应用的需求。 目前,I2VGen-XL的模型和代码均已开源,国内外社交媒体上已出现了大量创意AI视频生成内容,例如在城堡上展翅的恐龙、宇航员在飞船中行走的科幻电影画面等等。阿里云在视觉生成领域已有丰富的经验,此前已推出AI绘画创作大模型通义万相(基座模型Composer)和可控视频生成模型VideoComposer。团队在该领域发表60多篇CCF-A类论文,并在国际顶级视觉竞赛中获得10余项冠军。