00:00 / 00:40
连播
清屏
智能
倍速
点赞115
00:00 / 04:01
连播
清屏
智能
倍速
点赞40
AI 用进化算法自己优化自己? 当 AI 代理不再需要人类手动调参,而是自己发现问题、自己改进、自己验证——这就是 Hermes Agent Self-Evolution 带来的范式转变。 【时间轴】 0:05 开场:AI 能自己优化自己吗? 0:53 痛点:提示词工程为什么是门黑活 1:33 GEPA 算法:基因 + 帕累托双引擎 2:21 自然语言反思:GEPA 跟传统遗传算法的根本区别 3:07 效果数据:比 RL 高 10-20%,rollout 少 35 倍 3:33 完整流水线:从技能文件到 PR 全自动 4:29 DSPy 框架:编程而非提示 5:14 五阶段路线图:从提示词到代码全自动进化 5:58 安全护栏:五道防线防止进化跑偏 6:19 争议:EvoMap 指控抄袭事件 6:53 总结 这个项目来自 Nous Research,核心是 DSPy + GEPA(Genetic-Pareto Prompt Evolution)双引擎。GEPA 是一篇 ICLR 2026 口头报告论文,它读取 AI 的执行轨迹理解"为什么失败",然后用自然语言总结经验,指导下一轮进化。不需要 GPU 训练,不调模型权重,每次优化只要 2-10 美元。 论文数据很硬:GEPA 比 DeepSeek 用的 GRPO 强化学习方法平均高 10%,最高 20%,但只需要 RL 方法三十五分之一的 rollout。跟 DSPy 自带的最强优化器 MIPROv2 比,也是全面胜出。 项目规划了五个阶段:目前已实现技能文件优化,未来将扩展到工具描述、系统提示词、工具代码,最终目标是全自动持续改进循环。每一步都有严格的约束门控——100% 测试通过、体积限制、语义保持、PR 人工审查。 2026 年 4 月,中国团队 EvoMap 公开指控 Nous Research 抄袭自进化架构,争论至今没有定论。但多个团队在同一时间独立走向相似方案,至少说明 AI 代理的自我进化已成为最确定的技术方向之一。
00:00 / 04:55
连播
清屏
智能
倍速
点赞11
00:00 / 02:08
连播
清屏
智能
倍速
点赞25