阿里巴巴开源了其通义千问系列的全新推理模型 QwQ-32B,该模型基于强大的基础模型,并经过大规模强化学习的训练,实现了推理能力的显著提升。
在技术路线上,QwQ-32B 采用了多阶段强化学习的训练策略。具体而言,模型在训练初期和第二阶段,分别针对数学、编程、通用任务以及通用能力进行了强化训练。实验结果表明,通过少量步骤的通用强化学习,即可有效提升模型的通用能力,并且数学、编程等专业性能并未明显下降。
测评结果显示,仅有 320 亿参数的 QwQ-32B,在数学推理、编程能力和通用能力等方面的表现,与拥有高达 6710 亿参数的 DeepSeek-R1 模型相媲美。 更值得关注的是,凭借其小参数规模的优势,QwQ-32B 已经能够实现端侧部署。虽然在输出速度上可能相对较慢,但经过测评,端侧部署的本地模型能够对同一道数学、逻辑推理问题给出正确的解答,这无疑为 AI 技术的应用场景带来了更大的想象空间。
Monica 近期发布了一款通用 AI Agent Manus。这款应用能够根据用户输入的问题或需求,自动进行“任务拆解-规划-执行”等一系列高效操作,直接为用户交付完整的任务成果,实现任务自动化。
在通用 AI 助手基准测评(GAIA)中,Manus 的表现超越了 OpenAI 的 DeepResearch,位列第一,展现出强大的实力。
在技术架构上,Manus 采用了 Multiple Agent 模式,通过分工协作机制,让每个 Agent 基于独立的模型分别进行任务处理。这种架构能够大幅提升对复杂任务的处理效率,并有效缩短响应时间。
从 Monica 公布的用例来看,Manus 可处理旅行规划、数据分析、供应商采购等日常生活和工作场景中的任务,应用前景广阔。
我们认为,目前模型预训练阶段的 Scaling Law 效应已经放缓,相比之下,推理模型的性能提升表现更为突出。QwQ-32B 的成功也进一步印证了强化学习提升模型性能的重要前提是基于强大的基础模型,两者相辅相成,缺一不可。
此外,Monica 此前曾发布 AI 浏览器插件、PDF 工具、图片工具等多款应用,积累了深厚的技术和产品化能力。因此,整合 AI 技术及产品化能力或将是推进 AI 应用发展的重要路径之一。
建议关注 AI+ 应用场景下的应用突破。具体而言,我们建议关注以下几个方向:
以上建议仅供参考,投资者需谨慎决策。
Fetch.AI(FET)价格看涨Fetch.AI(...
今日创业板指上涨0.5%,深证100、深证50指数也分别上涨0.6%...
华远地产股份有限公司于2024年12月20日召开了第二次临时股东大会...
歌华有线近日宣布在北京地区进行3000台插入式微型机顶盒试点工作,引...
dappOS项目代币即将发布,预计将在币安交易所进行首发。该代币总发...