ChatGPT Agent正式发布,奥特曼:感受AGI时刻
2025 年 7 月 18 日北京时间凌晨 1 点,OpenAI 进行了一场直播,介绍了他们最新、最强大的模型。他们将 DeepResearch 和 Operator 功能合并到一起,打造了一个同时能够做深度研究和 Browser-Use 的 AI Agent —— ChatGPT Agent。
2025 年 7 月 18 日北京时间凌晨 1 点,OpenAI 进行了一场直播,介绍了他们最新、最强大的模型。他们将 DeepResearch 和 Operator 功能合并到一起,打造了一个同时能够做深度研究和 Browser-Use 的 AI Agent —— ChatGPT Agent。
RoboBrain 2.0 是智谱开源的先进具身大脑模型,为机器人提供强大的感知、推理和规划能力。RoboBrain 2.0包含 7B 和 32B 两个版本,采用异构架构,融合视觉编码器和语言模型,支持高分辨率图像、视频、语言指令等多模态输入。模型具备出色的空间理解、时间建模和复杂推理能力,能应对动态环境中的连续决策任务。模型基于分阶段训练策略逐步提升性能,适用工业自动化、物流仓储、智能家居、医疗康复和农业自动化等多种场景,助力具身智能从实验室走向真实世界。
RoboOS 2.0 是智谱开源的跨本体大小脑协同框架,推动机器人从单一智能向群体协作智能转变。框架用“大小脑”架构实现高效分工,云端大脑负责复杂决策与协同,小脑模块专注于执行具体技能。框架支持多机器人协作,具备轻量化部署、标准化接口和实时感知能力,能快速适配不同硬件与任务需求。框架优化的端云协同机制和多模态数据处理能力,进一步提升机器人在动态环境中的适应性和执行效率,广泛适用物流、家庭服务、工业生产等场景。
PromptForge 是强大的 AI提示工程工作台,能帮助用户高效地创建、测试和优化 AI 提示词。PromptForge通过智能生成功能提供优化建议,支持多模型比较和动态参数调整,让用户灵活对比不同模型的效果。PromptForge 配备系统性评估引擎,自动生成全面的测试套件,涵盖鲁棒性、安全性、准确性和创造性等多个维度。平台具备完善的提示管理功能,支持搜索、标签、历史记录和导出导入,确保用户不会丢失已验证有效的提示。PromptForge 适合专业用户和开发者使用,能将提示工程从艺术转变为科学,广泛应用在内容创作、教育、企业客服、游戏开发和数据分析等领域。
自动识别提取网页内容浏览器扩展插件「Instant Data Scraper」释放你的双手,再也不用手动复制整理网页里面你需要的内容。无需任何设置,安装好后,只要在感兴趣的页面单击插件,就能完成网页内容爬取。网页有多个表格类型的数据,可单击 “Try another table” 进行切换,直到抓取到自己感兴趣的内容为止;如网页有“更多”、“下一页”等按钮,可点击 “Locate Next button” 按钮进行手动指向,可实现自动翻页爬取。
最近 AI 浏览器层出不穷,除了 Dia 外,现在还有一款名为「BrowserOS」的开源 AI 浏览器,内置了 AI 智能体的能力,这意味着你可以用自然语言命令它帮你完成特定任务,还支持本地 Ollama 下载的指定模型,例如 DeepSeek 模型。
k2是Moonshot AI推出的具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型。k2 模型上下文长度为 128k,不支持视觉功能,支持 ToolCalls、JSON Mode、Partial Mode、联网搜索功能等。
Grok 4 是 xAI 推出的最新AI大模型,Grok 4 的推理能力相较于前代提升 10 倍。模型具备卓越的推理能力,能在 SAT、GRE 等高难度考试中接近满分,在多项基准测试中超越其他前沿模型。Grok 4 支持多模态功能,能理解主观概念、生成代码和可视化内容,在语音交互上进行重大改进。Grok 4分为两个版本,Grok 4 是单代理(single agent)版本, Grok 4 Heavy 是多代理版本(multi agents),支持四个代理同时工作,上下文窗口最高支持 256k tokens。