MiMo-Embodied是小米集团开源的全球首个成功融合具身智能(Embodied AI)与自动驾驶的跨具身基础模型。解决具身智能与自动驾驶之间的知识迁移难题,实现两大领域的任务统一建模。同步支持具身智能的三大核心任务(可供性推理、任务规划、空间理解)与自动驾驶的三大关键任务(环境感知、状态预测、驾驶规划),形成全场景智能支撑。通过统一架构整合室内操作(如机器人导航、物体交互)与户外驾驶(如环境感知、路径规划)任务,打破传统视觉语言模型(VLMs)局限于单一领域的局限。
>>展开阅读
AgentEvolver是阿里巴巴通义实验室开源的智能体进化系统。通过自我提问、自我导航和自我归因三种机制,实现智能体的自主学习与进化。AgentEvolver采用服务导向架构,将环境沙盒、LLM和经验管理模块化,支持多种外部环境和工具API的无缝集成。其优势在于高效学习、成本效益和持续进化能力。与传统强化学习方法相比,AgentEvolver在探索效率、样本利用率和适应速度上表现出色,减少了人工数据集的依赖和随机探索成本。AgentEvolver的框架代码已开源,为开发者提供了灵活的定制和开发空间。
>>展开阅读
SAM 3D是Meta公司推出的基于SAM系列的3D重建模型,包含SAM 3D Objects和SAM 3D Body两个分支。其中SAM 3D Objects能从单张照片生成可交互的3D物体模型,支持复杂场景和遮挡处理;SAM 3D Body专注于人体重建,可精准还原姿势、形状及关键点,适用于虚拟人和动画制作。模型采用统一架构整合2D分割、深度预测等任务,通过创新数据引擎大幅提升了真实场景的泛化能力,相关代码和体验平台已开放。
>>展开阅读
Parallax是分布式AI实验室Gradient开源的全球首个“全自主AI操作系统”。支持在Mac、Windows等异构设备上跨平台部署大模型,让用户完全掌控模型、数据与AI记忆。系统内置网络感知分片与动态任务路由机制,可根据推理负载实现智能调度,在单机、本地多设备、广域集群三种模式间无缝切换。Parallax已兼容Qwen3、Kimi K2、DeepSeek R1、gpt-oss等40余种开源大模型。
>>展开阅读
HunyuanVideo 1.5 是腾讯混元大模型团队开源的轻量级视频生成模型,基于 Diffusion Transformer(DiT)架构,参数量为 8.3B。支持生成 5-10 秒的高清视频,分辨率可达 480p 和 720p,可通过超分模型提升至 1080p。用户可通过输入文字描述(文生视频)或上传图片配合文字描述(图生视频)来生成视频。模型支持中英文输入,具备强指令理解与遵循能力,能实现多样化场景,如运镜、流畅运动、写实人物等。支持写实、动画、积木等多种风格,可在视频中生成中英文文字。HunyuanVideo 1.5 的创新 SSTA 稀疏注意力机制显著提升了推理效率,可在 14G 显存的消费级显卡上流畅运行。
>>展开阅读
美沙投资论坛上,埃隆·马斯克、黄仁勋和沙特官员共同宣布的一项大规模基础设施投资:即合作在沙漠中建设一个 500 兆瓦级的AI数据中心,也被称为“AI工厂”。文章的核心在于解释马斯克与黄仁勋看似矛盾的未来工作预测:马斯克认为随着AI和人形机器人的进步,工作将成为一种选择而非谋生手段;而黄仁勋则警示,短期内AI只会提高效率,导致人们更忙,因为待办任务密度增加了。这种矛盾反映了AI发展在长期愿景(马斯克)与近期现实(黄仁勋)上的时间差异,同时指出算力瓶颈——能源和散热问题——是制约AI进步的关键挑战,并提出了太空计算作为未来的解决方案。
>>展开阅读
AgentEvolver是阿里巴巴通义实验室开源的智能体进化系统。通过自我提问、自我导航和自我归因三种机制,实现智能体的自主学习与进化。AgentEvolver采用服务导向架构,将环境沙盒、LLM和经验管理模块化,支持多种外部环境和工具API的无缝集成。其优势在于高效学习、成本效益和持续进化能力。与传统强化学习方法相比,AgentEvolver在探索效率、样本利用率和适应速度上表现出色,减少了人工数据集的依赖和随机探索成本。AgentEvolver的框架代码已开源,为开发者提供了灵活的定制和开发空间。
>>展开阅读
MemOS是MemTensor等开源的面向大语言模型(LLM)的记忆管理与调度框架。将记忆视为与算力同等重要的资源,通过标准化的MemCube记忆单元,统一管理明文、激活状态和参数记忆。MemOS采用三层架构设计,包括API与应用接口层、记忆调度与管理层、记忆存储与基础设施层,构建了从用户交互到底层存储的全链路记忆管理闭环。支持Model Context Protocol(MCP),让模型具备标准化的“读写外部记忆”能力,任何支持MCP的Agent、IDE或模型都能直接访问MemOS。MemOS优化了多轮对话中明文记忆的组织方式,引入KV Cache重用机制,大幅提升推理性能与一致性。还针对云平台优化接口性能,使记忆写入进入毫秒时代,同时开源版本引入异步机制,让记忆操作更轻、更快。
>>展开阅读
- «
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- ...
- 24
- »