报告名称: 通用型Agent Manus以及阿里QwQ-32B正式推出,国内AI生态再升级
报告类型: 行业报告
报告日期: 20250306
研究员: 侯宾
行业: 传媒
投资评级:强于大市(维持)
【内容摘要】
事件:阿里巴巴于3月6日凌晨发布并开源全新的推理模型通义千问QwQ-32B。通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现了质的飞跃,整体性能比肩DeepSeek-R1。在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。此外,monicaAI正式对外发布通用型AIAgent产品Manus,据该团队介绍,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,显示其性能超越OpenAI的同层次大模型。
QwQ-32B性能比肩DeepSeek-R1,支持消费级显卡本地部署。阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B,在数学、代码及通用能力上整体性能比肩DeepSeek-R1。QwQ-32B拥有320亿参数规模,而DeepSeek-R1则具备6710亿参数(其中370亿被激活)。因此,阿里巴巴QwQ-32B显著降低了部署使用成本,在消费级显卡上也能实现本地部署。因此开发者和企业可以轻松将其部署到本地设备中,进一步打造高度定制化的AI解决方案,适合快速响应或对数据安全要求高的应用场景。此外,该模型在冷启动基础上,阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升,印证了大规模强化学习可显著提高模型性能。我们认为强大的基础模型叠加大规模强化学习或为通往AGI的可行之路,亦将持续推动我国AI应用生态蓬勃发展。
全球首款通用型AIAgent产品Manus正式发布,持续赋能国内Agent生态。Manus作为通用型AIAgent产品,其GAIA评分超越OpenAI的DeepResearch,Lv1-3正确率分别为86.5%/70.1%/57.7%,创下GAIA基准测试新纪录。区别于Chatbot的简单问答,当用户提出问题之后,Manus会根据问题以及要求进行任务拆解以及规划和执行,具备独立思考与执行复杂任务的能力,官网展示的案例中,它能直接交付完整成果,远超OpenAI同类产品。例如,官方向Manus发送了一个包含10份简历的压缩文件,Manus可以解压文件并逐个浏览每份简历,最后给出排名建议,并提供了候选人资料和评估标准作为参考;此外Manus还能异步处理文件,用户可以随时关闭电脑,等任务完成后Manus会通知用户。我们认为Manus发布标志着国内通用型Agent能力的巨大提升,或成为AGI发展的重要一步。
相关标的:阿里巴巴-SW,腾讯控股,百度集团-SW,快手-W,哔哩哔哩-SW,迈富时,焦点科技,巨人网络,蓝色光标,美图公司。
风险提示:AI技术进展不及预期,应用落地不及预期,AIAgent落地不及预期,AI商业化进程不及预期。