粉丝1.2万获赞3.2万

起猛了,我好像看见了大模型在训。大模型面壁智能联合清华大学又放大招,研究出 ai 届多边形战士 accident, 它是一个可以自主解决复杂任务的 ai 智能体。 accident 的表现在所有基准测试上都全面超越了 otogpt。 x agent 以大语言模型为核心,理解人类指令后,外循环进行全局任务规划,内循环,确保细节落地执行。为避免死循环、错误调用等执行出错的现象, x agent 加入人机协作交互能力, 人类可以干预建议, accident 也学会了主动寻求帮助。此外, accident 还具备超强工具调用能力,会从 tool server 选择合适的工具,安全高效得完成特定目标。如有必要,它甚至能根据特定任务训练专属 bird 模型。 整个过程的每个步骤, x agent 都会进行反思、评估、进展记录、优化迭代,堪称素质极高的自来卷卷王。举个例子,张三这周末需要和五个朋友一起聚餐,让 x agent 推荐餐厅,他会这么做。外循环,将 任务划分成理解、偏好、搜索、餐厅,给出推荐三个部分。内循环在每个部分里继续拆分步骤,每个步骤又都按照想法、理由计划、评价工具,使用五步进行思考和执行 任务。第一部分,推荐餐厅。用户口味、偏好、花销、预算倾向、地点等信息 x agent 并不知道,于是他请求人类提供帮助,在不确定的情景不随意行动,而是想办法获取更加确定的信息,完成决策。所以开始迫使人类 根据用户的餐厅编号, accident 使用网页搜索工具寻找符合要求的餐厅,但是辨别筛选信息又遇见了麻烦,直接在网页搜索还是有针对性的。参考餐厅评论网站,如果搜索引擎不能识别低脂概念又怎么办? accident 丝毫不慌,思维链条紧密咬合,采取行动有理有据,完美解决 nice 评估对比之后,给出他认为合适的 top 五餐厅名单以及推荐理由供用户挑选。就说周到不周到, accident 这种无论如何也要解决 用户需求的自觉已经到了令人发指的程度。比如用户只是提出让他对一个典型电影数据集做情感分析, x agent 首先自己下载了包含五万条电影评论的 i m d b 数据集,然后自己判断出群一个 bird 模型能够更好完成这个任务。 于是他就真的自己训了二的模型,用他对电影评论进行分析,并说出可视化结果。我当时的表情好像看见了连写日报都要做酷炫 ppt 的卷王同事。 accident 的字母 x 代表未知和无限的可能性。他目前的表现已经突破了现有单个 ai 智能体在执行复杂任务中的能力天花板。在未来, accident 还拥有像生物一样升级进化的潜力。反复 prompt 大模型实在疲倦了,要不要试试一步到位完成任务的 accident?