兄弟们,给你们看一个 codex 正在给我跑的一个任务,对于一个完全不会编程,只会说 yes 的 一个人来说,他帮我干了,干了三个多小时了,给你们看一下,这个就是他的一个工程,现在有三个小时零五分钟。 最近我不是要了那个 tiktok shop 的 那个 api 嘛,然后我就想弄个数据看板,把这些数据都展示出来,就不用分析了嘛。 然后我也体验了一下程序员的烦恼,一开始这个程序是可以跑的,然后那个网页也能呈现的,然后只是那个时间的标注。呃,有点问题,我想 可以自由的选时间嘛,就是像正常的那个 app 一 样,我选几号到几号的数据维度,然后就去改了一个东西,然后整个数据都乱了,然后我现在开始慢慢的把它的这个 bug 给修复掉。
粉丝1164获赞5.6万


有了 ai 之后,写代码这件事变快了,很多人进入了 web 抠定的状态,需求来了丢给 ai, ai 给方案,先接受 ai 写代码,先跑跑看结果,能跑就先算完成。这看起来很高效,但问题也在这里, 很多人不是变成了更强的工程师,而是变成了 ai 时代的 yes 工程师。以前是老板说什么工程师说 yes, 现在是 ai 产出什么人说 yes, 区别只是执行者换了判断力并没有沉淀下来。所以外部 coding 让代码生成变快了,也让很多人更快地变成了 yes 工程师。这时候,真正让人焦虑的,已经不是 ai 能不能写代码,而是 当 ai 越来越会写代码,工程师到底还剩下什么价值?是继续做一个帮 ai 点确认、帮 ai 跑结果,帮 ai 反复纠错的人?还是把那些反复纠正 ai 的 地方,沉淀成一套能约束 ai 验证 ai、 帮助 ai 稳定交付的系统? 这套系统就是哈尼斯。如果哈尼斯听起来有点抽象,其实我们前面已经看过一个最熟悉的例子, claudio 的 自己。在本系列第五期里, 我们拆过 cloud code 的 内部实现,它不是把模型直接放出来写代码,而是在模型外面加了一层运行框架, 工具要经过权限判断,危险命令要被拦截,上下文太长要 come back, 任务过程要能恢复,复杂工作还可以交给不同的 agent。 所以 cloud code 本身就是一套围绕模型搭起来的哈尼斯。但这一次,我们不再继续拆它的内部实现。更重要的问题是,既然 cloud code code 自己靠哈尼斯驾驭模型, 那我们能不能也在 code code 外面搭一套属于自己业务的 harness。 要回答这个问题,最好的办法不是继续讲概念,而是看 andropica 在 二零二六年五月中旬刚放出的 cwc long running a, 仅此视力。它给的不是一个开箱即用的产品, 而是一组可以拿来大哈尼斯的基础积木。这组积木想解决的,正是 ai 拷定力最常见的三个问题,没有证据就说完成,自己构建、自己验收上下文异常净度和约束就丢。所以看这个项目的时候,不要只看它有几个赫克脚本,更重要的是看它和普通 web 拷定的区别。 普通模式是 ai 写完代码,人看一眼,能跑就先过。问题是,这里的完成其实很脆弱, ai 可能没有看过证据,只是根据日制猜测完成了。写代码的 agent 也可能自己相信自己已经做好了。如果任务跑得足够久,上下唯一抗派前面说过的约束和进度还可能丢。 c w c long running agents 反过来做,它不是默认 ai 会完成,而是默认每个验收项都没有通过,这叫 default fail。 完成不是一句口头承诺, 而是一个需要被更新的状态。接下来, ai 不 能直接把失败改成通过,它必须先打开截图日记、测试结果这些证据文件。如果没有看过证据, verify it 这个 hook 就 会拦住它。这一步解决的是,没有证据就不能说完成,然后写代码的 agent 说完成了还不算,要让另一个 evaluitor agent 在 新的上下文里重新看地父,看证据,看验收标准。它只返回两种结果, pass 或者 n 字 work。 这一步解决的是构建者不能自己验收自己最后长任务不能只靠对话记忆,所以进度要写进 progress 点 md 代码要提交到 git。 下一次绘画重新开始的时候,不是靠模型回忆上次发生了什么,而是从文件和提交记录里接着往下做。这一步解决的是上下文会丢蛋,交接不能丢。所以这个官方势力真正改变的不是让 ai 自己跑更久, 而是把 ai 自己说完成,改造成系统有依据的判断完成到这里,官方势力已经回答了第一个问题, harness 最小可以长什么样?它可以用 default file 正据门控独立验收、进度交接,把 ai coding 变成一个质量闭环,但这只是基础积木,真正进入业务之后,这套积木不会长成同一种形态, 不同业务有不同的口径,不同的流程,不同的验收方式。所以接下来更值得看的不是继续研究官方视例里某个呵呵怎么写,而是看这些思路到了真实业务里会变成什么。如果你想看一个更接近真实业务的例子,可以去看德务技术公众号那篇储仓侧落地方案得务技术, 我建议看它不是为了照搬里面的配置脚本、 c 框或者收益数字,那些细节属于他们自己的业务现场。 它真正值得借鉴的地方在于,它展示了 ai 扣顶进入树舱这种强规范、强流程、强验收场景时,哈尼斯应该怎么和业务流程结合。在这样的场景里,业务口径不能只靠模型临场,记住,开发规范也不能只靠人反复提醒,验收结果更不能只靠 ai 自己说,通过 这些东西都要从对话里拿出来,变成流程中的控制点。所以得物这篇文章更像是一个现实提醒, ai 扣定的落地不只是把模型接近 id 一, 而是要把业务口径开发规范验证动作欠进 ai 工作流本身。这也是为什么我把它放在这里。 andrip 的 官方势力让我们看到哈尼斯的最小形态。得物速仓测的实践让我们看到哈尼斯进入真实业务之后,会开始查出业务自己的形态。所以这篇文章真正想说的,不是让每个人都去照搬一个官方势力,也不是让每个团队都去做一套树仓哈尼斯, 而是换一种方式看 ai coding。 当你发现自己总是在反复提醒 ai、 反复纠正 ai、 反复检查 ai, 这些地方就不只是 ai 的 缺点, 它们也是 harry 心该讲出来的位置。 yes 工程师是在每一次对话里纠正 ai, harry 设计者是把这些纠正沉淀成系统。这里说的系统不只是写一段更长的 prompt, 也不只是把自己蒸馏成一个 skill。 prompt 可以 提醒 ai 这次要注意什么, cq 可以 告诉 ai 应该怎么做,但 harness 要做的是让这些判断在流程里被调用,在关键节点被检查,在上下文丢失后还能继续生效。所以 ai 时代真正稀缺的, 不是会不会让 ai 多写几行代码,而是能不能把自己的判断力从一次次对话里的临场纠错,沉淀成一套可复用、可验证、可持续交付的工作系统。本期的内容就到这里了,有兴趣的同学可以自行搜索相关 github 仓库以及公众号文章我们下期见。


告诉你一个残酷的真相,二零二六年拖垮程序员的不是技术债,不是需求变更,而是你每天都在做的一个动作,按回车,你给 clod 一个大活,他干五分钟,停了 等你发号施令,你敲继续,他再干五分钟,又停了一个重构任务,你按了二十次回车, 真正有效的工作时间不到一半。你不是在写代码,你是在当人肉监工。但 cloud code 最新出的这个 go, 直接把这套玩法废了。 逻辑特别简单,你设定一个完成标准, ai 自己干,自己验,干完自己停。比如你说 go test os 下所有测试通过,且令特零报错,然后你就可以去泡杯咖啡了。 cloud 会自己写,自己测,自己改,每轮结束自动评估, 过了就停,没过就继续。你回来一看,活干完了,但注意,百分之九十的人第一步就错了。 你说 go 优化一下代码, ai 根本不知道什么叫优化好了,目标必须向验收单,什么测试通过,什么文件存在,什么输出为零。目标越像合同, ai 越像外包团队, 目标越像感觉 ai 越像人工智障。所以今晚回去打开终端,别急着写代码,先想清楚我要什么,结果,怎么算完成。 把这句话丢给 go, 你 会发现, ai 真正的超能力,不是你问一句,他答一句,而是你指一个方向,他自己开到终点。这才是二零二六年程序员该有的工作方式。

大家都说这个程序员面试叫面试造航母工作拧螺丝,其实吧,有一点夸张,但是也确切啊,程序员工作当中如果有很多不会的东西,你可以去查你,如果你不查的话,你就压根你就不是程序员啊。 呃,程序员也叫 cv 战士, ctrl c, ctrl v, 现在程序员有一个新的名字叫做 yes 工程师啊,什么叫 yes 工程师啊?比如说跟一些 tree 啊, coser 啊, cloud code 对 话,你找 yes, yes, yes, 对 对对就行了啊,当然玩笑归玩笑,程序员当时,嗯,程序员如果一开始面试的话也是 啊,非常麻烦的,因为你如果你技术非常高的话,你根本什么都不怕,像我这种中拉拉的这种水平,想当年面试也是海投啊,只要有面试的这个邀约,我一定是会去的,抓住每一个机会啊。 嗯,现在的话,我也是我们部门的这个临时的这个面试官,面试了很多,这个工程师有些技术也是挺强的,我们公司的要求其实就是一个全站,但是你不用特别牛的那种全站,就是你给自己打六十分啊,就可以胜任了。基本上是啊 啊,所以说这个程序员这个面试吧,怎么说呢,有些公司很严格,有些公司又不是那么严格,一般大的公司可是面可能面试的这个轮次比较多。小型公司的话,你知道技术面那一面过了基本上也就差不多了啊,像我们公司技术面的话就 一面就过我这关就行了啊,基本基本上其他的也就没有了。

如果不考虑买房,我真的愿意一直待在上海。我九三年,今年三十三岁,一七年从哈尔滨一所普通本科学校毕业,毕业后在珠海工作四年半跳槽来到了上海。刚毕业那会一头扎进互联网行业,一直做到现在, 兜兜转转来上海也有三年多了。在上海最大的感触就是机会多,资源丰富,更难得的是,这里有我们成年人想要的自由和平等。在老家找一份像样的安稳工作,往往要靠人脉拼关系。但上海不一样, 他不看背景,不攀人情,只要你敢想敢闯,肯踏实努力,就一定会给你施展的舞台。上海机会多,节奏快,能接触到行业里最新的东西。 我在自媒体上的第一桶金就是在上海赚到的。从深圳调来上海后一段时间,流量出奇的好,还陆续受到了线下探店邀约。也正是这样,我才明白,自媒体的赚钱方式不只有线上, 更多线下变现的可能。当然,不得不承认,上海节奏快,压力大也是真的。做程序员这份工作,项目上线,通宵加班是常态, 有时候凌晨拖着疲惫的身体回家,累到什么都不想做,得缓好几天才能恢复状态。可就算再累,第二天醒来收拾好心情继续去上班。 说实话,上海不是天堂,房价高到离谱,地铁挤到窒息,工作节奏快的像打仗,每天在高压中硬撑着前行。可就是在这种环境下,逼着我们成长、磨砺、沉淀,也让我们看到了更多可能。


一篇一个硬件知识,看完之后轻松成为你宿舍里的硬件领域大神。今天我们讲 amd, amd 的 主流消费级 cpu 名为锐龙锐志,简称 r 系列,而命名逻辑与英特尔的 i 系列实际上大差不差。从入门级到旗舰级分别是 r 三、 r 五、 r 七和 r 九。 我们拿一颗 r 七七八零零叉三 d 举例, r 七代表它是 amd 家次顶级的产品,后面的七八零零叉三 d 七代表第七代,而八零零则代表着同一代中的产品定位。数字越大,越高端性能也就越好,七九四五就比七八零零要更强。 哎呦我靠,越说越感觉自己在讲英特尔。接下来是我个人认为比较难理解的部分,那就是数字后面的字母到底是什么意思?其中桌面端性能从低到高分别是 x、 x、 h 和 h x。 其他的它好像代表内置微卡核显的 g 和 g, t 代表无核显的 f 以及代表超低功耗的 e。 这些应该不会有人买来玩游戏的吧。

这个杠杠什么意思啊?我问你这个杠杠什么意思?问吧。我不是问了吗?问了什么?你看聊天记录啊。我看了呀。所以杠杠是什么意思啊?所以什么?

这个杠杠是什么意思啊?我问你这个杠杠是什么意思?问吧。我不是问了吗?问了什么?你看聊天记录啊。我看了呀。所以杠杠是什么意思啊?所以什么?

你知道吧,应该好好这个梯子。这个梯子很重要。哈哈哈哈。这个梯子不是泳池的梯子吗?哎呀,显得我很傻。你知道吗? 这中间那那个横线什么玩意啊,我想不起来了。那你猜嘛。还有两个机会。我都想不起来还有什么东西能跟这个那么像的东西。你刚前面都提到了呀。 嗯,这就是个场馆。嗯,但答案不是场馆的意思,就是要背后接近的一个意思。背后接近?嗯,背后接近什么东西? 嗯,收缩的那种,就是那种奇异,那种隐身的那种。你的提示我听懂,但是答案好像不知道。 这是个游泳池就是个游泳池。对呀,但是但是他但是答案是游泳。 然后问题是我最喜欢的运动你都猜出来了,这就是个跳台啊,就是那个那个比那个比赛用的一个五米线,然后这个是那个水里面的那个,就是防防油歪的那个 浮标。他画的时候就想着是不是游泳。那为什么会有旗子?旗子是有仰泳的时候就是要到边的,就是那个一个标志。好吧,这我是不懂。 难吗?这个题不难。 这个不是一碗米饭。那应该不是 这啥吗?是是是啊,是米饭。那不是一碗米饭。那就是米饭。对,我画的很生动,生动形象。嗯,我想一想最喜欢啥呀? 最喜欢吃的东西是?是啊是啊,是我来玩。嗯,待会 哇,我给还是给你出个简单一点的吧,因为我讨厌的食物讨厌的食物?他有一点有点难画。哎。我有什么讨厌的食物吗?你为什么说出来呢?没事没事,送给他了送给我了 送给他了,然后好感动好感动。我画个简单一点的吧, 给你画抽象一点吧。都已经画了,我印象中应该是这个样子。是不是蔬菜?嗯,黄瓜?嗯, 我感觉我都感觉有点不像,不太像。那你再画个像点的,因为我吃这个东西吃的挺少的。应该应该,我觉得挺形象的,我就想到茄子都是那形状。苦瓜啊。对对对, 他好像是有那个凸起的那个东西,我觉得。对对对,当兵呢?还是略说说说。我说我说。那我们今天就差不多到这, 你觉得我怎么样?我觉得你很帅,真的,跟你讲话特别的开心。好好好,那我希望我们下次也能像这样喝下午茶。嗯,我也希望。好,走吧走了 适合。我觉得他是一个有一点点腼腆的人,就是想交一些朋友,可能我们话都比较少吧。 哦,关关,你是有什么魅力吗?我觉得他性格挺好的吧,我叫张斌,是一个娃娃脸, 但有时候说话比较那个好厉害,果然 果然, o i l。 果然是冠军,厉害。嗯,其实其他还行吧,挺开朗的他。嗯。

这四个神奇的电脑冷知识,你只要知道,翻鬼就算我输!用了这么长时间的 windows, 你 肯定没发现,微系统的光标其实是不对称的,而 mac 光标是对称的。提到程序员,很多人脑海中呈现的就是不修边幅、不善言辞的技术宅男形象。但你应该不知道,世界上第一位程序员是个女生, 名叫埃达诺斯莱斯,写下了计算伯努利数的算法,被认定为世界上第一个计算机程序。 bug 大家只知道是电脑和软件出现的系统错误,但是你应该不知道, bug 原本的意思就是臭虫,小虫子,最早是一只飞蛾,卡进老式计算机引发故障,从此程序漏洞、 设备故障都被叫做 bug。 u 盘 u 盘起是中国人发明的,一九九九年,一家中国公司发明键盘 q w e r t y, 布局是为了减慢打字速度, 早期打字机按键容易卡壳,这种布局故意把常用字母分散开,防止打字过快导致故障,没想到后来成了标准。关注我,分享更多硬核知识!
