粉丝1.1万获赞3.6万

三月三十一号凌晨, astonopik 年入二十五亿美元的核心产品 cloud code 五十一万行元代码泄露了,原因呢,就是发布的时候配置文件少写了一行。但说实话,刚听到这个消息的时候, 我没怎么当回事,因为现在的这个 ai 编程工具啊,就互相抄作业,已经抄了大半年了,架构呢也大同小异,泄露个元码我觉得能有什么花样的,但是啊,我很快就被打脸了。泄露当天呢,一个韩国开发者用 open i 的 code 代码用 python 从零写了一遍,然后呢,就在 github 上面开源了 两小时五万颗星,三天的十六万颗星,成为了 github 历史上最快突破十万颗星的这个仓库,比小龙虾还要快。然后呢,还有另外一个项目, 和国内用户我觉得关系更大,然后我们在后面再详细说。这整个事件里面,我觉得有两个项目非常重要,想跟大家分享一下。我们一个一个来介绍。第一个项目呢,叫做 cloud code, cloud code, cloud code 搞来搞去,你这样搞的话真的很难让人分清楚啊。 然后我们说回正题啊,这个韩国人的网名呢,叫做 secret, 金华尔街日报呢,去年报道过他,去年他一个人烧了两百五十亿个 cloud code 的 token, 可能是地球上最熟悉这个产品的人之一。 cloud code 泄露的第一时间啊,他没有去直接搬运这个元代码,因为法律风险太高了,他做的事情呢,相当于看了别人的菜谱,记住了做法,然 然后再用完全不同的食材自己做了一份,只借鉴不抄袭,完全用 python, 然后去重写了一遍这个代码。重点在于说啊,它这个几十万行代码不是它手敲的,这几个小时肯定也敲不完呀。它用了一套叫做 oh my codex 这样一个 ai 编程框架,好在 open ai 的 codex 上面,它使用了 dollar team 这样一个模式,然 编排多个 agent 并行的代码审查,然后又用了 dollar rough 这个模式呢,持续执行,直到完成整个的验证。说到这个 rough 模式啊,其实我最近也在用这套东西,体验确实很强,过两天我就可以单独出一个视频,跟大家来分享一下整个流程。简单来说啊,就是 agent 先理解架构, 规划, part 重写方案,然后呢,多个 agent 并行的执行,持续的验证,直到整个代码能够跑通,从读源代码到产出完整的 part 项目,其实几个小时就搞定了。 我觉得他的这一手一箭双雕真的很妙。换语言重写之后啊,法律上跟原始代码拉开了距离,同时也证明了一件事情,五十一万行的生产级系统, ai 几个小时就能从零复刻, 这在一年前我觉得是不可想象的。第二个项目呢,叫做 freecode。 他 这个项目啊,走的是完全不同的一个路线。 freecode 没有去重写原代码,而是直接把泄露的这个 type script 的 原代码改了。他主要做了三件事情。第一个呢,他把所有的这个监测功能都给删了,什么意思呢? 原版的 cloud code 啊,通过像这些 open telemetry, 然后 sentry, grossbook, 好 几个渠道,把你写了什么代码,用了多久,掉了哪些功能,全部会上报给 asterisk。 然后 freecode 呢,把这些全部都给干掉了。 第二个呢,它把安全提示词护栏也给拆了。 asterisk 每次对话的时候都会注入一层额外的系统指令,去限制 cloud 的 这个行为。 freecode 呢,也把这层限制也给删掉了。第 三个呢,就是把隐藏功能给解锁了。 kalco 的 呢,有八十八个 feature flag, 然后公开的这个 kalco 的 版本啊,大部分都是关着的,比如说像多 a g 的 规划啊,深度思考模式,语音输入,后台自动化这些功能啊,其实从代码层面来看,他们都写好了,但 esoteric 呢,就是不给你开放,所以 freecode 啊,也把这些全部都给你打开了。看到 freecode 这个项目之后,我有另外一个感触, 就这次泄露啊,也让大家看到了一个反差, esoteric 呢,一直说自己是最注重安全,注重透明的 ai 公司,但代码里呢,却是完全另外一回事, 三层的用户监控啊,把你使用数据全方位的上报,然后里面呢,甚至还有一个叫做 undercover 点 t s 的 这样一个文件直译过来呢,就是卧底模式,干什么用的呢?就是给他们内部员工加的,让内部员工对外贡献代码的 时候啊,不要暴露自己是 anthropomorphic 公司的这样的身份。所以呢, freecode 也把这些全都给拆了,某种意义上呢,反而让这个工具啊变得更干净更安全了。那这个重大事件对国内开发者有什么意义呢? 到这里啊,很多国内的这个开发者可能已经注意到这个关键点了,因为 esploic 呢,其实长期不服务中国大陆,然后很多人还在想办法去用 cloud code, 因为它功能上确实很强啊。问题是呢,这个封号的力度也越来越大,去年这个下半年 一百四十五万个账户申诉的成功率呢,只有百分之三点三。今年三月份啊,又来了一波,有人用了几个小时之后呢,就被完全封了,那他是怎么查到的呢?其实 ip 啊,其实是其中一项,像 dns 的 y 八 tc 时区,系统语言,他全都会去查,就算你挂了魔法之后啊,设备的时区 tc 八浏览器的语言是中文,这样呢,你照样会被标记。 所以啊,像 freecode 的 这样的项目,在这个背景下,我觉得就非常有意思了。如果你本来就想换国产模型 freecode 呢,它会支持各类的模型服务商,而且走这些渠道啊,你甚至不用担心说 anselopik 还在里面搞这些小九九, 会监控插护栏,偷偷加这个卧底模式。如果你还想继续用 curlcode 的 呢,这波也相当于给你看到了 curlcode 的 它的底牌,明白自己的这个风险点会在哪里。最后来给大家总结一下啊, anselopik 花了几年的时间去建这个围墙,三天呢,就被划开了两个口子, 一个用 ai 去重写,一个呢模改成这个纯净版。开源社区的创造力啊,我觉得在这个 ai 时代,完全超出你的想象。好了,今天视频就到这里,我是第一种学习与超,我们下次见。