00:00 / 06:50
连播
清屏
智能
倍速
点赞50
00:00 / 02:37
连播
清屏
智能
倍速
点赞20
00:00 / 04:53
连播
清屏
智能
倍速
点赞224
Claude Code 泄露后,我终于看懂 Harness AI 会写代码,已经不是新闻。真正决定它能不能稳定交付、能不能连续跑几个小时不失控、能不能在关键时刻被拉回正轨的,反而不是模型本身,而是你有没有给它一套像“操作系统”一样的 Harness。 - 这期会先讲清楚 Harness Engineering 到底是什么:它和 Prompt Engineering、Context Engineering 的边界分别在哪里,为什么 2026 顶级团队开始把重点从“怎么说”转向“怎么跑” - 我会把一个生产级 Harness 拆成 4 层:工具层、状态层、验证层、权限层。你会更容易理解,为什么 coding agent 真正的难点不是生成第一版代码,而是长流程里的纠偏、续跑、回滚、审批和验收 - 这期也会结合 OpenAI、Anthropic、LangGraph、Manus 和 Claude Code 相关案例,解释为什么今天大家终于意识到:模型再强,也还是需要外围系统 engineering - 我会重点拆一个很危险的错觉:测试全绿,不代表业务正确,也不代表性能、安全、维护性都没问题。很多团队真正缺的不是更强的模型,而是更硬的 ground truth 和更严格的 guardrails - 如果你想自己搭第一个 Harness,这期也会给一个最小闭环:任务 spec、有限工具、测试反馈、checkpoint、人工刹车。不是让你一上来造大系统,而是先做能收敛的系统 - 最后会落到程序员最关心的问题:当 AI 越来越会写代码之后,人类真正值钱的能力到底是什么。答案可能不是“写得更快”,而是更会定义边界、设计验收、管理风险、做最终签字 如果你已经在用 Claude Code、Codex、Devin、SWE-agent,或者你正在搭自己的 agent workflow,欢迎把你最担心的问题留在评论区。你更怕的是跑偏、越权、维护性,还是“测试全绿但线上翻车”?如果这期有帮助,记得点赞、订阅,也可以转给还在把 AI 编程当成“更强自动补全”的朋友。 Harness Engineering,AI Agent,Harness,智能体工程,AI 写代码,编码智能体,长程智能体,长时任务,AI 工程师,Codex,Claude Code,Anthropic,LangGraph,Manus,智能体工作流,Agentic Workflow
00:00 / 08:46
连播
清屏
智能
倍速
点赞108
00:00 / 05:09
连播
清屏
智能
倍速
点赞1099