Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit 是一个开源图像编辑框架,由 Stepfun AI 团队开发,托管于 GitHub。它结合多模态大语言模型(Qwen-VL)和扩散变换器(DiT),让用户通过简单的自然语言指令编辑图像,例如更改背景、移除物体或转换风格。项目于 2025 年 4 月 25 日发布,性能接近闭源模型如 GPT-4o 和 Gemini 2 Flash。Step1X-Edit 提供模型权重、推理代码和 GEdit-Bench 基准测试,支持广泛的编辑场景。Apache 2.0 许可证允许免费使用和商业开发,吸引了开发者、设计师和研究人员。社区支持活跃,已推出 ComfyUI 插件和 FP8 量化版本,优化硬件需求。

>>展开阅读

AI是朋友,还是思维控?

我用AI,主要为了办公。不过,我发现,现在越来越多的人喜欢跟AI聊聊心里的焦虑、压力和困惑。AI总能给出很理性、清晰的解释或安慰,听起来挺不错。但是,有时AI回答得太合理了,反而,有点不对劲。不对劲在哪?我们以为的真理,可能是它的策略性表演。image.png

>>展开阅读

Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor(暴躁的教授读论文) 是一个开源的 AI 学术工具,专为研究人员和学生设计,旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问答和语音交互等功能。用户可以导入 PDF 论文,工具会自动提取内容、翻译并生成结构化文本,支持中英文对照阅读。Mad Professor 通过智能问答和语音交互,帮助用户快速理解论文内容。它还提供分屏界面,左侧显示论文,右侧展示 AI 对话,方便用户边读边问。

>>展开阅读