Z-Image - 阿里通义实验室开源的图像生成模型

作者:Jam 发布时间: November 28, 2025 分类:技术 No Comments

Z-Image是阿里通义实验室开源的图像生成模型，具有高效、快速和强大的图像生成能力。采用单流扩散Transformer架构（S3-DiT），将文本、视觉语义和图像VAE token整合为统一输入流，最大化参数效率。其核心技术创新包括解耦分布匹配蒸馏（Decoupled-DMD）和强化学习与分布匹配蒸馏融合（DMDR），显著提升少步生成性能和图像质量。Z-Image-Turbo版本仅需8次函数评估就能生成高质量图像，支持亚秒级推理延迟，适配低显存设备，擅长照片级真实感图像生成和双语文本渲染。Z-Image-Edit版本专注于图像编辑任务，可依据自然语言提示进行精确编辑。Z-Image-Base是未经蒸馏的基础模型，为社区提供更广泛的微调和定制开发空间 Z-Image - 阿里通义实验室开源的图像生成模型

>>展开阅读

HunyuanImage 3.0 - 腾讯开源的免费多模态图像生成模型

作者:Jam 发布时间: October 5, 2025 分类:技术 No Comments

HunyuanImage 3.0（混元图像3.0）是腾讯发布并开源的原生多模态图像生成模型。模型参数规模达80B，是目前测评效果最好、参数量最大的开源生图模型。混元图像3.0支持实时生图功能，用户可边打字边出图，毫秒级响应，超写实画质。支持复杂文本生成，如海报、漫画等，以及多种风格的图像生成，如实物摄影、科普插画等。具备原生多模态能力，可同时处理文字、图片、视频与音频等多种模态的输入与输出，无需多个模型组合。混元图像3.0拥有强大的语义理解与推理能力，能解析千字级别的复杂语义，生成长文本内容，可生成真实的高质感图片。