Z-Image - 阿里通义实验室开源的图像生成模型

Z-Image是阿里通义实验室开源的图像生成模型,具有高效、快速和强大的图像生成能力。采用单流扩散Transformer架构(S3-DiT),将文本、视觉语义和图像VAE token整合为统一输入流,最大化参数效率。其核心技术创新包括解耦分布匹配蒸馏(Decoupled-DMD)和强化学习与分布匹配蒸馏融合(DMDR),显著提升少步生成性能和图像质量。Z-Image-Turbo版本仅需8次函数评估就能生成高质量图像,支持亚秒级推理延迟,适配低显存设备,擅长照片级真实感图像生成和双语文本渲染。Z-Image-Edit版本专注于图像编辑任务,可依据自然语言提示进行精确编辑。Z-Image-Base是未经蒸馏的基础模型,为社区提供更广泛的微调和定制开发空间Z-Image - 阿里通义实验室开源的图像生成模型

>>展开阅读

HunyuanImage 3.0 - 腾讯开源的免费多模态图像生成模型

HunyuanImage 3.0(混元图像3.0)是腾讯发布并开源的原生多模态图像生成模型。模型参数规模达80B,是目前测评效果最好、参数量最大的开源生图模型。混元图像3.0支持实时生图功能,用户可边打字边出图,毫秒级响应,超写实画质。支持复杂文本生成,如海报、漫画等,以及多种风格的图像生成,如实物摄影、科普插画等。具备原生多模态能力,可同时处理文字、图片、视频与音频等多种模态的输入与输出,无需多个模型组合。混元图像3.0拥有强大的语义理解与推理能力,能解析千字级别的复杂语义,生成长文本内容,可生成真实的高质感图片。1759061684-1759061684-HunyuanImage-3.0-website1.png

>>展开阅读