由Qingying开发的先进开源视频生成模型CogVideoX1.5

阿里云创新中心> 创业资讯> 由Qingying开发的先进开源视频生成模型CogVideoX1.5
0

由Qingying开发的先进开源视频生成模型CogVideoX1.5

齐思GPT 2024-11-08 00:00:00 356
在Hugging Face上的THUDM/CogVideoX1.5-5B-SAT存储库介绍了由Qingying开发的先进开源视频生成模型CogVideoX1.5。该模型是其前身的重大升级,能够以更高分辨率生成10秒视频。值得注意的是,CogVideoX1.5-5B-I2V变体以其支持任何分辨率的视频生成能力脱颖而出。该存储库对于对视频生成感兴趣的人特别有用,因为它包括图像到视频(I2V)和文本到视频(T2V)变换器模型,以及用于推断的必要权重。
在Hugging Face上的THUDM/CogVideoX1.5-5B-SAT存储库介绍了由Qingying开发的先进开源视频生成模型CogVideoX1.5。该模型是其前身的重大升级,能够以更高分辨率生成10秒视频。值得注意的是,CogVideoX1.5-5B-I2V变体以其支持任何分辨率的视频生成能力脱颖而出。该存储库对于对视频生成感兴趣的人特别有用,因为它包括图像到视频(I2V)和文本到视频(T2V)变换器模型,以及用于推断的必要权重。此外,它与CogVideoX-5B系列的VAE和文本编码器模块兼容,简化了现有用户的更新流程。该模型根据特定的CogVideoX许可证发布,提供的引用为那些希望深入了解模型技术细节的人提供了学术参考。对于从事AI生成视频内容领域的创意人员和开发人员,该存储库代表了一个探索尖端视频生成技术的宝贵资源。- CogVideoX是一个开源的视频生成模型,是Qingying的升级版本。 - CogVideoX1.5-5B系列模型支持10秒的视频和更高分辨率。 - CogVideoX1.5-5B-I2V变体支持任何分辨率的视频生成。 - 该仓库包含CogVideoX1.5-5B模型的SAT-weight版本,包括Transformer、VAE、Text Encoder等模块。 - 该模型遵循CogVideoX LICENSE。 - 可以引用该模型的论文为"CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer"。

后缀.jpg

版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问