HunyuanVideo 1.5 - 腾讯混元免费开源的轻量级视频生成模型

HunyuanVideo 1.5 是腾讯混元大模型团队开源的轻量级视频生成模型,基于 Diffusion Transformer(DiT)架构,参数量为 8.3B。支持生成 5-10 秒的高清视频,分辨率可达 480p 和 720p,可通过超分模型提升至 1080p。用户可通过输入文字描述(文生视频)或上传图片配合文字描述(图生视频)来生成视频。模型支持中英文输入,具备强指令理解与遵循能力,能实现多样化场景,如运镜、流畅运动、写实人物等。支持写实、动画、积木等多种风格,可在视频中生成中英文文字。HunyuanVideo 1.5 的创新 SSTA 稀疏注意力机制显著提升了推理效率,可在 14G 显存的消费级显卡上流畅运行。HunyuanVideo 1.5 - 腾讯混元免费开源的轻量级视频生成模型

>>展开阅读