由Qingying开发的先进开源视频生成模型CogVideoX1.5

齐思GPT 2024-11-08 00:00:00 356

在Hugging Face上的THUDM/CogVideoX1.5-5B-SAT存储库介绍了由Qingying开发的先进开源视频生成模型CogVideoX1.5。该模型是其前身的重大升级，能够以更高分辨率生成10秒视频。值得注意的是，CogVideoX1.5-5B-I2V变体以其支持任何分辨率的视频生成能力脱颖而出。该存储库对于对视频生成感兴趣的人特别有用，因为它包括图像到视频（I2V）和文本到视频（T2V）变换器模型，以及用于推断的必要权重。此外，它与CogVideoX-5B系列的VAE和文本编码器模块兼容，简化了现有用户的更新流程。该模型根据特定的CogVideoX许可证发布，提供的引用为那些希望深入了解模型技术细节的人提供了学术参考。对于从事AI生成视频内容领域的创意人员和开发人员，该存储库代表了一个探索尖端视频生成技术的宝贵资源。- CogVideoX是一个开源的视频生成模型，是Qingying的升级版本。 - CogVideoX1.5-5B系列模型支持10秒的视频和更高分辨率。 - CogVideoX1.5-5B-I2V变体支持任何分辨率的视频生成。 - 该仓库包含CogVideoX1.5-5B模型的SAT-weight版本，包括Transformer、VAE、Text Encoder等模块。 - 该模型遵循CogVideoX LICENSE。 - 可以引用该模型的论文为"CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer"。

上一篇：汽车厂商“批量生产”大模型｜AI光年

下一篇：FLUX.1-dev服装生成器是一款前沿模型旨在彻底改变我们对时尚和服装创作的看法

上一篇：汽车厂商“批量生产”大模型｜AI光年下一篇：FLUX.1-dev服装生成器是一款前沿模型旨在彻底改变我们对时尚和服装创作的看法