高中辍学,照样进 OpenAI:他换了一种学习方式,用 AI 学 AI

23岁,高中没念完。在简历上,他拿不出任何一所大学文凭。但在 OpenAI 的内部系统里,他的抬头是:Gabriel Petersson,Research Scientist(研究科学家),Sora团队。高中辍学后,Gabriel Petersson 先后在 Depict.ai、Dataland、Midjourney 工作,2024年12月正式加入 OpenAI 做视频生成研究。学位没有。 项目一大串。v2_79d567a511304a489afbec4954a8bc05@1743780481@ai_oswg1091885oswg1053oswg495_img_png_tplv-1marlgjv7f-ai-v3_600_400_600_400_q70.jpg

>>展开阅读

当人和AI“脑子都被吃掉了”:两份研究揭示人与机器的共同命运

你肯定也有过这种体验:刷了两小时短视频后,感觉脑子像被掏空了一样,什么都不想干、什么都记不住。你看,这是不是有点像当年全球热门游戏《植物大战僵尸》里的经典台词:“你的脑子被僵尸吃掉了”?如今,我们甚至有一个更精确的词来形容这种现象:“brain rot”,也就是“脑腐”。这个词被牛津词典评为2024年年度词汇,使用频率一年里暴涨230%。

>>展开阅读

Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

Depth Anything 3(DA3)是字节跳动Seed团队研发开源的3D视觉重建模型。通过单一Transformer架构实现任意视角下的空间几何重建,仅需预测深度图和射线图即可还原三维场景,相比传统方法精度提升35.7%,运行效率达126 FPS。其创新点在于采用"深度-射线"统一表征法,无需多任务模块,支持从单张图片到多视角视频的灵活处理,能适配自动驾驶、SLAM等场景。模型在视觉几何基准测试中全面超越现有方法,相关代码和演示已公开。Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

>>展开阅读

DeepSeek-Math-V2 - DeepSeek开源的数学推理模型

DeepSeek-Math-V2是幻方旗下AI公司DeepSeek开源的数学推理模型,最新版本基于DeepSeek-V3.2-Exp-Base改进,性能超越Gemini DeepThink,达到国际数学奥林匹克(IMO)金牌水平。模型采用多头潜在注意力(MLA)技术大幅降低推理显存消耗,通过递归定理证明管道结合非形式化与形式化推理,解决了Minif2F测试88.9%的问题。其配套开源数据集ProverBench包含325道高中至本科难度数学题,涵盖数论、代数等10个领域。<a class="js" DeepSeek-Math-V2 - DeepSeek开源的数学推理模型

>>展开阅读

Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

Depth Anything 3(DA3)是字节跳动Seed团队研发开源的3D视觉重建模型。通过单一Transformer架构实现任意视角下的空间几何重建,仅需预测深度图和射线图即可还原三维场景,相比传统方法精度提升35.7%,运行效率达126 FPS。其创新点在于采用"深度-射线"统一表征法,无需多任务模块,支持从单张图片到多视角视频的灵活处理,能适配自动驾驶、SLAM等场景。模型在视觉几何基准测试中全面超越现有方法,相关代码和演示已公开Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

>>展开阅读

Z-Image - 阿里通义实验室开源的图像生成模型

Z-Image是阿里通义实验室开源的图像生成模型,具有高效、快速和强大的图像生成能力。采用单流扩散Transformer架构(S3-DiT),将文本、视觉语义和图像VAE token整合为统一输入流,最大化参数效率。其核心技术创新包括解耦分布匹配蒸馏(Decoupled-DMD)和强化学习与分布匹配蒸馏融合(DMDR),显著提升少步生成性能和图像质量。Z-Image-Turbo版本仅需8次函数评估就能生成高质量图像,支持亚秒级推理延迟,适配低显存设备,擅长照片级真实感图像生成和双语文本渲染。Z-Image-Edit版本专注于图像编辑任务,可依据自然语言提示进行精确编辑。Z-Image-Base是未经蒸馏的基础模型,为社区提供更广泛的微调和定制开发空间Z-Image - 阿里通义实验室开源的图像生成模型

>>展开阅读

ROCK - 阿里巴巴开源的智能体训练环境沙箱

ROCK(Reinforcement Open Construction Kit) 是阿里巴巴开源的智能体训练环境沙箱,解决智能体在真实环境中无法规模化训练的难题。ROCK 提供了高稳定的沙箱管理服务,每个智能体(Agent)都有独立的“安全屋”,互不干扰,即使某个环境崩溃,也不会影响其他环境。具备全方位健康监控、智能负载均衡、自动故障恢复等功能,确保训练过程稳定高效。ROCK 与阿里此前的强化学习(RL)训练框架 ROLL 深度协同,构成完整的智能体训练闭环。ROLL 负责训练算法,而 ROCK 提供训练环境,让开发者能从单机实验无缝扩展到大规模集群训练。ROCK - 阿里巴巴开源的智能体训练环境沙箱

>>展开阅读