salesforce 推出了全新的开源深度研究智能体:sfr-deepresearch(简称 sfr-dr)。该模型基于 openai 开源的小型权重模型,采用强化学习技术进行训练,具备自主推理、网络搜索与代码执行能力,能够独立完成复杂的深度研究任务。
在仅使用网页搜索、浏览器环境和 Python 解释器的情况下,SFR-DR-20B 在纯文本版本的 Humanity's Last Exam 基准测试中达到了 28.7% 的得分,展现出强大的自主研究潜力。
SFR-DR 的核心亮点包括:
核心能力:一个通过强化学习(RL)训练而成的全自主研究代理,可自行完成问题分析、信息检索、逻辑推理与代码编写,实现端到端的研究闭环。
性能表现:
训练方法:

高度自主:无需人为设计多代理协作流程,能自主制定研究计划、推导假设、生成解决方案并执行具体操作
论文链接:https://www./link/55f16320eb523947f12d2e94d9630c6e