Alpamayo-R1 - 英伟达开源的带推理能力的视觉-语言-行动模型

作者:Jam 发布时间: December 3, 2025 分类:技术 No Comments

Alpamayo-R1是英伟达研发的具有推理能力的视觉-语言-行动（VLA）模型，专为提升自动驾驶在复杂场景中的决策能力设计。通过引入因果链推理机制，让车辆能像人类驾驶员一样分析场景因果关系（如“因前方有行人需减速”），而非单纯执行预设指令。模型采用多摄像头输入和轻量级编码技术降低计算成本，并通过强化学习优化轨迹规划，实测在长尾场景中使事故风险降低35%。创新点包括结构化因果标注数据集和模块化设计，支持实时推理延迟低于100毫秒。 Alpamayo-R1 - 英伟达开源的带推理能力的视觉-语言-行动模型

>>展开阅读

Ovis-Image - 阿里AIDC-AI团队开源的文生图模型

作者:Jam 发布时间: December 3, 2025 分类:技术 No Comments

Ovis-Image 是阿里巴巴国际数字商务集团 AIDC-AI 团队开源的 70 亿参数文生图模型，专注于高质量文本渲染。基于 Ovis-U1 架构，继承了先进的视觉解码器和双向 Token 精炼器，能处理复杂的文本布局需求，如海报、横幅、LOGO 等。Ovis-Image 在文本渲染方面表现出色，支持多种字体、尺寸和长宽比，同时保持清晰可辨的文本和语义连贯性。 Ovis-Image - 阿里AIDC-AI团队开源的文生图模型

>>展开阅读

悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

作者:Jam 发布时间: December 3, 2025 分类:技术 No Comments

悟界·Emu3.5是北京智源人工智能研究院开源的多模态世界大模型，参数量达340亿，具备原生世界建模能力。通过10万亿多模态Token（含790年视频数据）训练，能模拟物理规律，实现图文生成、视觉指导、世界探索等任务。创新的"离散扩散自适应"技术使其图像生成速度提升20倍，性能超越Nano Banana模型。模型已开源，适用于具身智能、虚拟场景构建等领域。悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

>>展开阅读

Z-Image Turbo - 阿里通义开源 AI 绘画模型

作者:Jam 发布时间: December 3, 2025 分类:技术 No Comments

阿里巴巴通义实验室开源 Z-Image AI 绘画模型，其中 Z-Image-Turbo 在仅需 8 次函数评估的情况下，可达到或超过领先模型的性能。分享一个免费在线免费使用「Z-Image Turbo」网站，据介绍性能和效果碾压 Flux。免费在线体验，支持提示词示例与任务追踪。 20251202-2

>>展开阅读

Apple Music发布2025年度中国大陆最热歌曲TOP100

作者:Jam 发布时间: December 3, 2025 分类:音乐 No Comments

>>展开阅读

限速 25km/h+涨价千元！新国标电驴是保护还是添堵？

作者:Jam 发布时间: December 3, 2025 分类:日志 No Comments

2025年12月1日，被称为“史上最严”的《电动自行车安全技术规范》（GB 17761-2024）正式全面落地实施。新规旨在通过提升防火、防篡改等安全标准，从根本上解决电动自行车长期存在的安全隐患。然而，在新规实施的首日，就引发了广大车主和网友们的争议。甚至有网友直言：不想让大家骑电动车，明说就行！而大家的争议，主要集中在以下三个核心点。