本地部署QwQ-32B

3月6日,阿里巴巴推出并开放源代码的全新推理模型通义千问QwQ-32B,据阿里官方发布信息显示,其在数学运算、编程开发与多领域应用的综合表现接近DeepSeek-R1水平,同时通过技术优化显著降低运行门槛,可实现普通显卡设备的本地化运行。

>>展开阅读

小模型,大能量:QwQ-32B 以 1/20 参数硬刚满血 DeepSeek-R1

近期,AI 领域涌现出令人瞩目的进展,尤其是在大型语言模型 (LLM) 的推理能力提升方面。其中,强化学习 (Reinforcement Learning, RL) 正逐渐成为突破传统模型性能瓶颈的关键技术。不少研究已证实,RL 能够显著增强模型的推理能力。例如,DeepSeek R1 模型通过整合冷启动数据和多阶段训练,实现了深度思考和复杂推理,达到了当时的领先水平。

>>展开阅读