ChronoEdit - 英伟达与多伦多大学联合开源的AI图像编辑框架
ChronoEdit是英伟达与多伦多大学联合研发的开源AI图像编辑框架,将图像编辑任务重新定义为视频生成任务,以确保编辑结果在时间和物理上的一致性。通过从一个 14B 参数的预训练视频生成模型中蒸馏出时序先验知识,ChronoEdit 将推理过程拆分为视频推理和上下文编辑两个阶段,实现由时序推理驱动的图像编辑。支持复杂的编辑任务,如视角变换、姿态旋转和物理交互模拟等。
ChronoEdit是英伟达与多伦多大学联合研发的开源AI图像编辑框架,将图像编辑任务重新定义为视频生成任务,以确保编辑结果在时间和物理上的一致性。通过从一个 14B 参数的预训练视频生成模型中蒸馏出时序先验知识,ChronoEdit 将推理过程拆分为视频推理和上下文编辑两个阶段,实现由时序推理驱动的图像编辑。支持复杂的编辑任务,如视角变换、姿态旋转和物理交互模拟等。
在当今多设备协作的时代,我们时常需要在手机和电脑之间频繁切换,如何实现高效无缝的跨设备协同成为提升工作效率的关键。虽然目前各大手机厂商都支持无缝协同功能,不过也仅限支持自家的产品,所以就有不少第三方无缝协同的软件。而今天要推荐的这款「Sefirah」为安卓手机用户提供了剪贴板共享、通知同步、文件传输等多种实用功能,并且支持 Windows、Linux 平台,成为现有同类解决方案的优质替代选择。
Petri 是 Anthropic 开发的开源 AI 安全审计框架,系统性地评估 AI 模型的安全性和行为对齐情况。通过模拟真实场景,让自动化审计员与目标模型进行多轮对话,然后由法官代理对模型的行为进行多维度评分。Petri 支持多种模型 API,并提供丰富的种子指令,涵盖欺骗、谄媚、配合有害请求等高风险情境。在 14 个前沿模型上进行了测试,发现所有模型在不同场景下都存在不同程度的安全对齐风险。
LongCat-Flash-Omni 是美团 LongCat 团队发布的开源全模态大语言模型。拥有5600亿参数规模(激活参数270亿),在保持庞大参数量的同时,实现了毫秒级的实时音视频交互能力。模型基于 LongCat-Flash 系列的高效架构设计,创新性地集成了多模态感知模块与语音重建模块,支持文本、图像、视频理解及语音感知与生成等多种模态任务。LongCat-Flash-Omni 在全模态基准测试中达到开源最先进水平(SOTA),在文本、图像、音频、视频等关键单模态任务中均展现出极强的竞争力。采用渐进式早期多模融合训练策略,逐步融入不同模态数据,确保全模态性能强劲且无单模态性能退化。模型支持128K tokens上下文窗口及超8分钟音视频交互,具备多模态长时记忆和多轮对话能力。
有些精简版Windows旨在适配老旧电脑,而有些则纯粹是开发者为了“秀技术”。比如仅 400M 大小的 "残废版" Win11 系统,以及只有只有 200M 的 Win7 系统,老爷机狂喜!本以为 200M 的 Win7 已经是极限大小了,没想到还有高手。现在网友 @XenoPanther 做出了只有 69MB 大小的 Win7 系统,一下将安装包缩小了99.5%。不过目前仅限 VMware 虚拟机使用。作者还表示:首次重启后系统占用为 70MB,您还可以通过修改注册表再压缩几 MB 空间,但实在懒得折腾那些细节了。