最近 openai 又一次经典手滑泄露了最新模型 gpt 五点六,内部代号叫 airsoft 渊尾花。你说这事巧不巧?每次 openai 真正要放大招之前,总会先从某个后台、某段日制某个接口里露出一点味。 爆料里说 gpt 五点六的上下文窗口扩展到一百五十万 toc, 而且最让开发者激动的突破是趣 slop 化。 是的,他变得更加开始有审美了。过去大家对 ai 写代码有个共识,后端逻辑完美,而前端 ui 那 是真拉胯,大模型写出来的前端界面总有一股挥之不去的廉价感。 日内管着叫 slop 泥浆代码,什么臃肿的 css, 辣眼睛的高饱和色彩,搭配僵硬的网格,总之就是一言难尽。但这次情况变了, g p t 五点六在完全没有给出详细提示词引导的情况下,自己凭空捏出了一个极简主义的笔记应用,叫 lunan notes, 不 需要给复杂提示词,也没必要手把手配色直接告诉他。请你参考 apple 设计语言,他自己就做出了成熟的网格布局, 克制的淡紫色调,清晰的标签,分层,舒服的自己层级, gpt 五点六开始理解间距留白层级色彩克制,直接把审美水准拉到了设计总监的段位。而且这种高质量的商业级应用,前端直接秒出。 但这还不够刺激。再说一百五十万 token, 在 开发者实测里, gpt 五点六跑通了一个极其恐怖的数据,一点五兆 tokens 的 上下文窗口。 很多人不理解上下文窗口有什么用,简单讲,它决定了 ai 一 次性能记住多少东西。上下文越短, ai 越像金鱼,你前面刚说完,他后面就忘。 而长,上下文 ai, 它能记住需求文档,记住代码仓库,记住会议纪要。一百五十万 token, 意味着你可以把一个大型代码库、一整套产品文档都可能一次性塞进去。 这才是 agent 真正需要的地基。因为智能体是要直接参与到现实工作中去的,它要自己会记账、会追踪、会拆任务、会调用工具、会自己发现问题,还要保证不要半路失忆。 所以 gpt 五点六真正的目的还是生产力,它是要从问答机器变成干活机器。奥特曼真正想做的是一个能接管数字工作流的超级助手,来修理那个不可一世的 entrapic。 但是六月可不止是 openai 一 家要动手, antropic 那 边也是磨刀霍霍。 colton、 sony 四点八也疑似在后台现身,主打长任务和企业级代理。 google 的 gemini 三点五 pro 也被传耀在六月发力,三大前沿模型将在同一个月内硬碰硬,真可谓是 ai 世界杯同时开赛。 还有一个细节很重要, openai 的 迭代速度正在变得非常不讲道理。以前从 gpt 三到 gpt 四,大家等了接近三年,现在主力模型更新可能三四十天就来一轮更新,这说明大模型行业进入了一个新阶段。过去大家拼的是大版本奇迹, 而现在拼的是连续迭代能力,不是一年憋一个大招,而是一个月磨一次刀。这背后拼的已经绝对不是单纯算力,而是数据闭环、强化学习、工程系统、用户反馈、产品分发。 说白了,大模型公司正在变成超级工业机器,你今天觉得他只是助手?半年后他可能已经开始向同事,而再往后只可谓细思极恐。 当然,所有泄露消息都要打个问号,后台日制不是正式发布,开发者爆料也不等于官方确认,所以我们不能把传闻当官方通告。但我们的确可以看清一个趋势, ai 公司的竞争已经从模型更强,进入到谁更能干活, 从能回答推进到能交付,六月如何,我们拭目以待。这里是起点世界,聚焦最新 ai 资讯,我们下期视频不见不散!
粉丝1.7万获赞10.8万

哎,好的好的,大家好,我们今天手动来带大家从零到一部署在自己电脑上面部署一下最近火爆全网的这个 cloud bot 啊,现在已经改名叫 opencloud, 我 们从零开始,首先我们去 opencloud ai 这个官网,然后往下滑,它有一个 one liner 的 这个 quick start, 非常简单,你只要在复制这个代码,然后开一个命令行,然后把它黏贴进去, 它就会自动去安装这个 opencall, 它会去检测联盟装着 homebrew, nojs 和 git 啊,如果没有的话呢,它会帮你去安装,我这边已经有了,所以它自动开始在安装这个 opencall。 好 的,安装完毕,安装完毕的话,它会自动会进入这个 onboarding 的 这么一个流程啊,它也是非常人性化。首先让你先来先签个协议啊,说这个很 powerful, 但也很 risky 啊。我知道了, onboarding mode, 我 们选 quick start。 然后第一步呢,是我们要接一个模型啊,在后端的模型,它虽然就 open call, 它只是一个中间层吧,你后端的模型还是需要用自己的 a p i 的。 之前呢是我我尝试使用这个 cloud code 的 订阅,可以接入这个 open call, 但是前段时间 cloud code 把它给封了,所以现在就必须只能调用 a p i, 所以美国的模型 api 太贵了,所以我们这里选择支持一下国产。我们使用 kimi 的 模型啊, moonshot ai, 然后 kimi 最近也是浪潮了,自己的这个 kimi k two 呃,二点五的这么一个模型啊,能力上据说是跟 opps 四点五非常相像啊,也是很厉害,然后价格可能只有十分之一,所以我们来体验一下,所以我们这里选 moonshot ai, 月色暗面, 然后把我们之前复制好的一个 api key 给复制进去, create a api key, 然后我们选择一个模型,我们就选 kimi k 二点五。然后呢,我们在这里选的是 在第二步呢,是选这个 channel, 就是 call bot, 呃, open call, 它是可以让你用过用你的这个即时聊天软件,然后来调用它的啊,这里就会去配置一下这个即时聊天软件。我在这里选的是,呃, whatsapp, 然后我们来看一下 whatsapp 怎么 link 啊,它会给你二维码,然后我们要拿 whatsapp 扫一下二维码。 好,我们拿这个 whatsapp 刚刚扫了一下这上面的二维码,然后,呃,现在是可以去继续去设置一下详细的配置。 whatsapp, 它里面有一些 phone, 呃,这个是 phone setup 啊, separate phone just for open call。 我 选择用一个单独的电话号码在 whatsapp 里面,然后这里使用,选择 recommended power mode allow form。 说实话不是很知道是干嘛了。嗯,选择 default 好 了,然后下一步呢,是 configure 这个一些技能啊,这里我先不 configure, 但是我们看一下, 呃,这个 open call 它有哪些技能啊?这些技能本质上来说就是它到底能做哪些事情,你可以看它这里有非常多的集成的这个 integration, 就 你的密钥,密钥管理系统 word 是 可以用来发这个 twitter 的, 然后 bear nose 是 可以用来这个记笔记的一些东西,然后有非常非常多的这个,还有什么 g u g 这种 就是 gmail 啊什么的,非常非常多 open ai 啊什么的很多啊,我们这里今天先不配置了,然后回过头也可以再配置,到时候会问你一些问题,要不要这些 a p i key 有 多选? no no, 如果到时候需要的话呢,可以再单独回过头来配置 好。然后最后一步呢,是这个 hook 啊,自动的这个操作,然后它可以在某些特定的环境下面被触发,然后帮你操作。比如说它这里有一个 session memory 的 这个 hook, 就是说它可以在每个赛季结束的时候呢,自动把赛季的这个你们聊天对话记录呢,保存到他们的这个长期的这个 memory 当中。这里我觉得还是开一下比较好,因为 open call 它是自带这种长期 memory 的 功能的,然后如果每每每一次跟他对话,它会更新长期 memory 的 话,你会发现这个 open call 越用越聪明。 好,然后这些都是系统自带的,我就都开了,然后都开了,然后去设置 gateway, gateway 就是 说是呃呃,如如何去开这个?开个关口,然后让可以让这个你在 whatsapp 里面发送的消息被传递到这个电脑上的 open call 里面。这里我之前已经装过了,所以我们在这里的话就是 reinstall 一下。 好,我们这里的 git 已经装好了,我们现在有有有方法去 hack。 我 的 bug 就是 初设啊,初设的话我们可以推荐是走这个 t u i, 也就是它自己会开一个网页,然后这有一个链接好,然后可以尝试发个消息 啊,很可惜啊,消息没有发成功,我要来 debug 一下。哎,好的,刚刚发现是因为自己的那个 kimi 账号没有充钱啊,现在充了钱就变强了啊,我们现在已经可以 跟他对话了,然后我们在终端呢,可以输入这个 open opencloud dashboard, 然后呢我们来重新进进入这个网页的 ui 啊,然后这里呢我跟他说了个嗨,然后他现在会介绍一下自己可以干哪些事情啊?怎么怎么样,怎么怎么样都是英文啊,太,太烦了,我看他看中文那里边啊, 好,他现在等于说一开始的对话呢,他会让你去呃设置一下他的名字是什么,然后怎么称呼我,然后他是干嘛的?嗯,然后同时呢我们我来就展示一下这个我们这个 whatsapp 的 这个能力啊,就你看我们这边, 嗯,其实 whatsapp 上面是可以给大家直接发消息的,然后在这里的所有的信息呢,我们也都可以在 whatsapp 里面跟他呃聊天,然后他就只要你的这个网关是上线的,他就是可以呃去跑的。 那么今天视频就到这里呢,我们就简单的装一下 cloud bot, 未来的话我们也会在这里继续更新一下 cloud bot 到底能在呃能对我的工作流程带来多大的影响啊?期待可以创造更好的内容给大家,谢谢。

hello, 大家好,今天给大家讲解一下我是如何使用 codex 来驱动 objects 来完成一系列由 ai 驱动的 ce 仿真的。首先我们去 openai 的 官网去下载 codex 这个 agent 桌面单软件。 codex 是 由 openai 推出的一个以编程为主的桌面单应用程序,我们下载完成之后,安装了之后,你可以登录你的账号,这边 codex 它是免费账号,也是有一定的使用额度的, 但是这个额度不多,建议大家还是充一个 plus 会员。下载完成之后,你可以在这边新开一个对话,然后把我这个 呃 qs mcp 的 链接粘到这个对话里面,让它安装一下这个 mcp 插件。这边安装完成之后,我们可以在设置这边看到这边有个 mcp 服务器, 然后这边的话有一个 opcode server, 这个服务器安装完成之后,你的 codex 就 能够和 opcodex 完成一个联通了。至于这个仿真的界面,它是我们完成的另一个项目, 你可以在 task two cae 这个网站下面把链接复制一下,然后交给 codex 让它安装一下。 安装完成之后,我们就可以使用 codex 联合 opcode 来完成一系列仿真了,但在这个过程中,你肯定要把你的 opcode 啊,我们打开 opcode 之后,我们可以在这边的中端窗口下输入 mcp, 然后下划线,然后 looper, 然后过号点击回车,然后这边的话 appux 就 已经开启了一个 m c p。 我 们在 codex 里面,然后我这边新开一个窗口,我们这边的话问他你是否可以和 appux 联通, 他这边是思考了二十四秒之后返回的信息是可以当天可以和 appx 连通了,如果你测试到这一步的话,那说明你已经成功的打通了 codex 和和 opuse, 然后你就可以使用一系列的提示词来对它进行一个仿真。比方说我这边做的一个仿真,仿真专家做一个仿真学分析,要尽可能的贴近真实工况, 不要简化去做。如果是比方说这种动理学仿真的,你就让他要尽可能的贴近真实功放设定播放的帧率也要高,让仿真动画看起来更流畅。我需要在这个 codex 浏览器里面看到最后的仿真的结果。 在这边有一个界面,这边是模型树,我目前是只做了这个项目的,打开预览的一个模型树,后边的话,这个我可能会再完善一下,把这边的零件材料装配,然后分析部都能够去操作和二次编辑, 目前能够你编辑的在这个可编辑窗口,比方说可以编辑一下模型的一些尺寸,比方说我们把这个模型的尺寸圆孔半径改为二十四,在这边点击重新计算,然后这边的话它就在驱动 appui 完成一个重新的计算。 你也可以改,比方说板长板宽,然后其他的一些弹性模量或者是材料属性可以看到它这边就完成了一个模型的重新计算,然后重新进行了一个就是模态分析。我们先在这里讲一下这个 codex 驱动 ios 进行一个由 ai 驱动的 ce 仿真的流程是怎么样的。首先我们在这里的对话框里发一下你的想要仿真的一个提示词,你可以完全照抄这个,当然你想改一下也是可以的, 然后把提示发给这个 codex 之后, codex 就 会去写一系列的脚本,比方说这个模型建立的脚本也是由 codex 的 python 码完成的,当然一些比方说这个像简单的一些模型,它是可以去建立的,当像这个 洗刀模型它就建立的效果不是很好了。这个洗刀模型是由我在 soodeworks 里面去建立的一个模型,把它转化为 str 格式之后,告诉了 codex 在 哪里, 他就可以把他建立的模型和我提供给他的模型进行一个装配。呃,包括后面的像材料定义装配这个分析布载合了的定义,边界条件的定义,以到我们的网格化划分,都是由 codex 来完成的。 到后面的一些结果的后处理也是由 codex 来完成。 codex 完成之后,它会把一系列的脚本发给发送给我们的 opqs, 来完成最后的一些结果的分析,然后到仿真的一些模型的一些计算,它会发送给我们来完成一系列的仿真计算到结果的后处理, 然后完成之后它会创建一个网址,就是这样一个网址,然后我们点击一下就可以在浏览器里面去 看到 oq 所有的仿真结果。目前的一些仿真的话,其实它只能够进行一些简单的动力学或者是心理学仿真心理学效果目前是最好的,动力学的话,其实效果没有那么好, 大家可以当做一个参考。然后我这边再补充一点,就是如何把这个 mcp 给停掉,因为这个 mcp 运行的话,你的 oq 界面是不能进行任何一个点击操作的,就是它是一个主色运行的状态, 然后大家如果想停掉这个 mcp, 呃,然后在 app 里面查看结果的话,可以点击这边的 stop 按钮,然后就可以停掉这个 mcp 服务了,然后就去进行其他的一些操作。 你如果你有问题的话,可以在这个 github 上去提问,或者说你有好的想法可以在这边跟我说一下,我看一下能不能来实现一下。这就是本期的视频内容,大家如果有什么疑问可以向我提问,谢谢大家。

ai 编程能完全免费在本地运行了, codex 和奥莱曼正式打通,开源模型直接接进来。之前想用 ai 写代码,要么掏钱买 api, 要么依赖云服务,每个月动辄几十上百美元,小团队和个人根本扛不住,现在所有成本归零。 olym 这个工具能让用户在自己的电脑里跑开源模型。 codex 是 open ai 的 ai 编程助手,能写代码、改代码、审核代码,两者一组合,本地就能用上 jam 四 qman、 三点六这些模型一分钱不用花,全靠自己的显卡和内存。 具体怎么用,三条路走通。第一,装好 codex 和欧拉玛,两个软件都免费。第二,选一个适合自己电脑的模型, gamer 四的四 b 参数版本就够用,去 camera ai 网站输入显卡型号和内存,网站会推荐能跑的模型。 第三,在命令行里敲一行命令,模型就下载到本地了,大概九点六 g 币,等几分钟就装好,然后启动 codex, 选择这个本地模型。所有 codex 的 功能全都能用,写代码、改页面、调逻辑, 这意味着以后写代码、建网站、调样式都不用靠云服务,自己电脑就能跑数据不出门,速度还快,相当于把 ai 编程的门槛从月费降到了零。打开 codex, 选本地模型开工。 有人用 jma 四四 b 模型生成一个 cs 落地页,复制代码到浏览器打开页面完整布局干净。一个四 b 参数的本地模型就完成了以前需要付费 a p i 才能做的事。

量化交易师的天塌了! github 最新开源发布的量化丁格,一个具有自我进化能力的 ai 交易员,并且支持实盘。它覆盖了外汇、股市、期货和加密市场。 一个完全不会代码的普通人,只需要打出自己想要执行的策略, openai 会自动生成你的策略代码帮你回测,并且根据回测数据结果通过大模型进行微调参数,使策略更稳定。更离谱的是,它的交易雷达会自动爬取全球金融数据, 实时推送当前热门的交易机会,从基本面、财务数据和技术分析多维度告知你市场动态,并发送到你的手机上。它目前支持 windows、 linux 和 mac 系统。如果你也想部署体验,戳评论区。

首先进入这个网页并登录,爱着打不开的可以用 chrome 点击右上角的 generate api key key, 名字随便输。 下面的到期时间 expiration, 选择 never expire, 这样我们就获得了有效期为一百年的英伟达 api key。 点击下方的 copy api key, 复制 api key 之后再打开这个网页,找到你想要的 ai 模型。 我这里以 openai 的 chatgapos 二十币举例。点击右上角的 viewcode, 再打开的页面,点击 shell, 打开软件 chatbox, 没有的先去下载并安装, 打开设置,点击模型提供方并新建名称随便输,只要你看见名字能认出来是哪个模型就行。 下面的 a p i 模式默认即可。然后点击添加 a p i 密钥,输入刚才复制的 a p i key, 打开浏览器刚才选择的模型页面,复制这段链接,这就是 a p i 主机,注意不要少复制或多复制一个字母, a p i 路径默认即可。之后点击下面的新建,打开浏览器页面,找到 model 后面的字母串及模型 id, 不 输入或输入错误的模型 id 会导致模型配置失败。 名称随便输,只要你看见名称就能明白这是哪个模型就行。 最大 token 也可以输一下,即浏览器页面中 max token 后面的数字输完之后保存配置,之后建议测试模型,软件会自动测试并打开模型支持的功能,以免后续使用时出现问题。测试完成后,保存并返回对话页面, 在右下角选择模型, 发个信息测试一下,可以看到速度也挺快的。

openai 刚刚发布了新模型 gpt 五点五,各项指标可以说是非常的炸裂,但是它真的比几天前刚发布的 cloud opus 四点七还要好吗?今天我们从各个方面,包括 ai 编程的前端、后端以及文案生成来对比这两个模型,看看谁才是最强的 ai 模型。 好的,废话不多说,我们开始。在开始之前,我想提一点就是同样的置词,同样的任务, gpt 五点五消耗的时间大概只是 opus 四点七的十分之一,也就是我的体感上,它大概比 opus 四点七快了十倍。有这么夸张? 好的,我们先来看第一题。第一个,我们首先测试一下他们生成网页的能力,那么 gpt 呢?一直被诟病前端能力不太行,我们看看新的 gpt 五点五到底怎么样?第一题,做一个高端的 s 网站,产品是简化版的 notion 笔记软件,风格极简,现代,高级,有产品感,要有各个必要的部分。 这里呢,以防大家不知道 notion 这个笔记软件大概的风格是什么样子呢?这是 notion 的 官网,当然我并不奢望 ai 能生成这种效果一下子对吧,可以看到非常的复杂,非常的漂亮,但是大家可以记一下这个风格。好了,首先我们看 gpt 五点五生成的效果, 可以看到啊,其实还是不错,但是并没有很惊艳对吧?但是它的风格也完美契合我们对它要求,字体什么都是很像 notion 的, 可以看到有产品展示区域,还可以互动 往下拉呢,也有 feature 以及功能的介绍以及价格区域等等,可以说是完全符合了我们的要求,但设计本身并不惊艳。好,现在我们看 cloud opus 四点七。首先毫无疑问,它的设计感比 gpt 好 很多,就像是设计师做的一样,非常的漂亮,有各个不同自己的变换,然后也当然也有互动, 同样也有整个产品界面建设的部分,而且看出来这是一个笔记软件了,也有价格的区域等各个部分。 那整体来看呢? gbt 五点五,这次前端能力啊,还是不如 opus 四点七,尤其是设计上没赶上,差的还比较远。它的优点呢,就是它可以完美理解我们的意图,我说它要像 no 神,它确实像了 no 神, 这点确实不错,但是如果这两个需要分个高下,那我肯定投票给 cloud opus 四点七。在这里第二题,做一个杂志风的 ai 新闻专题页,主题是二零二六年的 ai 大 模型,竞争 风格要像高端的数字杂志,要排版墙,阅读体验好,有视觉冲击。而这里就是纯纯比拼前端的设计感和美感,生成网页好看与否的能力了。首先我们看一下 gpt 五点五,这是五点五给出的答案。首先它是有一定设计感的,确实像是一个数字的杂志 啊,但是呢,没有到惊艳的程度,大家可以看看啊,还是中规中矩这样一个效果好。接下来我们看一下 cloud, 这是 oppo 四点七给出的答案啊。首先我感觉它设计就好了非常多,我们往下拉,这才是我心目中有设计感的电子杂志对吧, 可以看它在对比不同的模型。 ok, 那 这里已经毫无疑问啊,论设计感, cloud 还是要胜出 gpt 五点五很多很多,而且差距还是蛮大的,那这里肯定是 oppo 的 四点七更好了。第三题,我们还是看看生成页面,这次让它生成一个珠宝的跨境电商独立站, 要求风格高级,时尚奢华,适合欧美市场。我们首先看一下 gpt 五点五,给出答案, ok, 这是 gpt 五点五生成的网页,有一定的设计感吧,但是只能说是中规中矩,完全没有被惊艳到, 在珠宝店这样的网站里面,他也不能算是好的,对吧,只能说勉强勉强及格吧,我预感会被 callopus 爆杀,我们看一下 opus, 给出答案吧。 果然 cloud opus 生成的网页设计感美感程度要比 gpt 五点五好很多,有些这种特别注重设计感的这种网页,我觉得这应该是毫无疑问了啊。 我们这里先总结一下前端能力,那么测试的结果大家也看到了,那么其实我是很希望像 gpt 这种综合能力强的模型,在前端能力上也能赶上 cloud opus 最好的模型的, 因为众所周知呢, cloud 它给的额度特别少,特别吝啬,而且它有种种限制,但是结果就是结果,我也不能说谎,大家都看到了对吧?目前来说, gpt 五点五前端能力,尤其是设计感和没赶上 差距 cloud 的 oppo 四点七还是挺远的。刚测完生成网页的前端能力,现在我们把这个笔记软件给补全,做一个真正的能记笔记,能登录能管理笔记的 app, 测试一下两个模型的后端能力。 这里呢,我们就把刚才 cloud opus 点七生成这个网页的代码分别给到 gpt 五点五和 opus 四点七,其中 gpt 五点五它在自家的 codex 里面使用,而我们的 cloud opus 点七模型在它自己家的 cloud code 里面进行使用,然后我们进行对比, 其实此是这样的,当前的项目已经有了完整的前端,请你做好后端,目的是做一个简化版 lotion 软件的全站版本,实现这些功能,注册登录 笔记、列表展示,创建笔记、编辑笔记、保存笔记以及删除笔记,现在我们看看他两个做出来的效果。好的,首先我们验收 gpt 五点五,我们来到他给我们的这个网页前端,还是之前的风格,这里呢,我们首先看注册和登录功能,没有账户注册啊,这里我随便来一个吧。 好了,我们注册之后就直接进来了,然后这里我们新建第一篇笔记试试看, ok, 新建的笔记我们编辑一下,这里完全没有问题啊,我们随便打一下试试,换行也没有问题, 确实实现了这个功能,这里我们点击保存,看保存功能怎么样。保存之后我们刷新一下网页, ok, 他 还在这里,我们点击删除之后确实没有了,我们新建一篇, ok, 所有的功能都没问题,只是最后我们刚才直接注册进来了嘛,对吧?我们退出,然后再登录一遍, ok, 我 们刚才保存的笔记还在,那么 gpt 五点五完美的完成了所有的后端任务。好的,我们现在看一下 cloud hope 四点七教授的答案,它还是没有改官网呀。我们这里点击右上角的打开这个 app, 然后这里呢,我们点击 create content 来注册,不得不说前端还是漂亮,对吧?那么这里我们随便给一下。 好的,现在我们也来到了 app 的 界面,这里我们点击 new note 来建立一个新的笔记,然后我们来测试一下, 也是完全没有问题,它还有自动的保存功能。然后这里呢,我们保存了已经,所以我们刷新一下网页,完全没有问题,这里我们删除一下。笔记也成功了,我们再加一个新的保存。之后我们还是登出一下,然后再登录,看看登录功能有没有问题。 ok, 也完全没有问题,相当于是他两个都完美完成了我给他的。现在我们对比一下这两个模型写作的能力, 那么一直以来呢, gpt 的 写作能力就不如 cloud opus, 那 么现在我们看一下 gpt 五点五有没有缩小或者是抹平这个差距。请写一条适合直接发布的自媒体帖子。注,提示,迭代思维要求像真人写的,有勾子,有观念,一定启发性,不要空话,不要鸡汤。 首先我们先看 cloud open 四点七写出的文案,我以前有个毛病,什么事都先想清楚再动手,后来发现这是反的,很多事情不是想清楚才能做,而是做出来才能想清楚。脑子里推演一百遍,不如真做出来一个粗糙版本,它会暴露你之前根本想不到的问题。所以迪拜思域就是先做个差的再改好这么简单。它的核心是承认一件事情,你第一次判断大概率是错的,越早把它扔去验证,损失越小。别怕底板烂,怕的是你为了让底板不烂,永远没有底 板。写的相当不错,对吧?就是第一句话,我感觉还是有点假,我们先不着急下结论,我们先看 gpt 五点五写的版本。 真正拉开差距的,从来不是想清楚再开始,而是开始之后还能不断改。很多人做事卡住,是因为上来就想做最终答案,要选题完美,方案完整,表达高级,越想做越不敢动。一代思维不是粗糙,是先做出能跑的版本,然后用真实反馈修正他你 写的第一个文案才知道哪里错错,你发第一条内容才知道你关心什么,你做第一个产品才知道需求是不是为需求,世界不会奖励脑子最完美的计划,他想那些不断拿现实教准自己的人,先完成在优化,先上线再打包,先拿到再反馈,再很高级。 说实话,第一句也很假,有点像是 ai 写的对吧?但是整体的文风,整体那个说服力,我觉得文案是比 cloud 好 一些的。 那 cloud 呢?确实更像真人写的,但是它整体的文风和说服力,尤其是后面这一段,我感觉 gpt 写的是要比 cloud 好 的。这里呢,我觉得两个差不多吧。好的,下面这个题还是对比两个模型的写作能力。请写一组推广文案,主要是介绍新的人行、家务机器人、小家, 输出一个短标题,一个短文案,一个行动引导。要求有吸引力,但不要浮夸,不要低级营销,不要空话,不要解释直接给结果。我们首先看 cloud opus 四点七给出的文案, 小佳把家还你,扫地收衣洗碗归位,这些占用你下班两小时后的事情,小佳都能接受。身高一六五,能弯腰,能上楼,能记住每件物品该放的位置,你不必教他太多,第一周他来观察,第二周他已经领路,现在预约享受首批用户的两周免费试用。感觉中规中矩吧,没有很惊艳,而且还有些啰嗦, 没有直击要点。那我们看一下 gpt 五点五给的文案,把家务交给小佳,把时间还给自己。小佳是一台为日常生活设计的人形家务物品,也能根据你的习惯完成,重复琐事, 为了炫技而上家,少一点负担,多一点从容。现在了解小家,看还能为你家分担什么?我感觉 g p 这个营销文案面前写的更好,更有说服力,更卷短,整起来读起来也朗朗上口。所以,好的,现在我们总结一下,把推力强度都调到最高, g p t 五点五模型速度非常非常的快,相比于 cloud opus 四点七, 但是呢,我刚才对比发现,它的前端能力目前还是不如 cloud opus 四点七,后端呢,它两者一样,也可能是我这个题呢有点太简单,没有测出来区别。 最后,文案能力, gpt 五点五好像是赶上来了,我们刚才看到两个文案写的都非常不错,第二个文案写的还比 office 练习好,这是一个好消息。对于 gpt 来说, 最后一点就是 gpt 五点五,这次啊,重点宣传了它强大的 agent, 也就是智能体能力,包括了使用工具的能力啊,包括帮我们操作电脑,完成任务,完成工作能力,也包括自动化执行任务的能力等等等等。 这个呢,需要长时间的测试,我呢也会在不断测试使用的过程中,将自己的真实体会和实测告诉大家。不过有一点值得提,就是这个视频的开头,你猜是谁做的呢?好难猜啊,难道是 gpt 五点五做的?

别再说手机只能刷视频了,现在它也能成为顶级程序员的键盘。没错, openai 第一次把它们最厉害的代码生成模型 codex 直接装进了 chat gpt 手机应用里。 你想想看,全球每个月有超过一亿人都在用 chat gpt, 现在这些用户,包括你我,都能直接在手机上用上旗舰级的代码生成功能了。 这可不是小事。过去像 gigapopilot 这种强大的 ai 编程能力,基本上只在专业的桌面开发环境里才能用,普通人想体验一下,还得专门装个开发工具,门槛挺高。但现在呢? open ai 直接把这个专业能力放到了你我的口袋里,装在一部智能手机上。 这不仅仅是把一个桌面功能简单地搬家到手机上,要在方寸之间、手机有限的资源里实现代码的流畅生成,还得保证效果。这背后的技术挑战可是相当艰巨的。 open ai 究竟是怎么驯服这头代码巨兽的?又会对我们的工作和生活带来什么改变? 这集咱们就来聊聊手机装下代码巨兽,听起来是不是有点魔法?其实啊,这里面技术挑战一点都不少。 open ai 的 codax 模型它可不是个小家伙,参数量特别大,要是想让它直接在手机里跑,那完全不现实,手机的资源根本撑不住。 所以, open ai 肯定用了不少驯兽的办法,比如它们可能对原始的 codax 模型做了兽身,就像把一头大象缩小成小象,但又保留了核心的能力。 这在技术上叫模型蒸馏或者量化,就是想办法把模型变得更小、更高效,可能还有个专门的边缘版模型,来处理手机上一些比较简单的任务。但大部分情况下,这个手机上的代码生成还是得靠云端发力。 你想象一下,当你在 chat gpt 手机应用里敲一段需求,这个信息不会直接在手机里被处理,它会先通过网络飞速传到 openai 的 服务器,在那边更完整的 codex 模型会开足马力生成代码, 接着生成的代码再通过网络迅速返回到你的手机屏幕上。这个来回的过程特别考验网络的响应速度。 为了让你感觉不到卡顿, open ai 需要做很多复杂优化,比如预判你可能会输入什么,提前加载一些内容,或者做好数据缓存。只有这样,才能在手机这个方寸之地带来一种实时生成的错觉。 技术上的确挺了不起的,既然技术上已经实现,那么下一个问题更加关键。开发者们真的会在一块小小的手机屏幕上,用它来完成严肃的编程工作吗?这究竟是玩具还是工具? 手机上的代码生成,它到底是玩具还是工具?其实它更像是特定场景下的急救包。比如运维工程师,假期服务器出问题,身边没电脑,掏出手机问 chat gpt, 立马就能生成脚本救急,这就是应急运维的巨大价值。 或者你是编程新手,通勤路上想验证个算法,或者查新 a p i 怎么用,不用等回家开电脑,手机上就能随时实践,很适合碎片化学习。可它也有明显局限, 处理多文件、 get 版本、控制、完整项目构建,这些手机端都搞不定,它目前只是个生成代码片段的助手,不是完整的移动开发环境,用触摸屏写上百行代码调试 bug, 效率肯定不如物理键盘。 所以在专业开发里,它只能算辅助。但别忘了,把这强大的能力放进 chat gpt 这种一级用户应用,本身就是对市场的大冲击。 像 gigapopilot 这样的专业付费工具,恐怕都要重新定位了。每个月十美元的 gigapopilot 订阅,可能很快就要变成智商税了。因为 open ai 把核心的 codex 代码生成能力直接装进了 chat gpt 免费版就能用,这彻底改写了 ai 编程的市场格局。 你之前用 copilot 每月十美元,现在 chat gpt 免费版就能做类似的事, plus 会员每月二十美元,功能更全。这直接冲击了 copilot 的 定价和付费市场。这不单是价格战,它预示着 ai 编程助手身份的转变。 以前是专业 i d e 插件,现在成了 chat g p t 这种通用 ai 助手自带功能,基础代码生成正快速商品化,成了像手机计算器一样的标配。 gigacopilot 这类付费工具得另谋出路,提供更专业、更深度的集成或更高级功能,才能立足 单纯代码生成江南再收高价。这对想学习编程或偶尔写代码的人来说,是巨大福利。高门件技术,普通人也能轻松上手了。 手机编程到底能帮我们,还是会让我们变懒? open ai 第一次把代码生成能力放进手机,表面上是大大降低了编程门槛。 对全球几亿只有智能手机没有电脑的人来说,这简直是弥合数字鸿沟的神器。以前他们根本没机会接触编程,现在一部手机就能上手。 但是一个新的担忧也出现了。教育界已经在讨论,这会不会就是编程世界的计算器吗? 就是怕大家过度依赖工具,忘记了怎么思考。现在学生对着手机里的 chat gpt 说一声,代码哗啦啦就出来了,那他们还会去琢磨算法、数据结构这些核心的东西吗? 像哈佛大学的 cs 五零课程已经开始调整了,他们现在要求学生提交代码时,不仅要有代码本身,还得解释清楚你是怎么提示 ai 才让它生成这些代码的。这其实是在逼着大家去理解背后的逻辑,而不是单纯的抄作业。 那么这种力量一旦普及,门槛是低了,但我们的思考能力是不是也被拐杖了?当任何人都能轻易生成代码时,这种能力被滥用怎么办?一个随身携带的代码军火库,它的安全和道德边界又在哪里? 手机上的 ai 编程真的只是方便吗?它可能正悄悄变成你手里的恶意代码生成器,甚至泄露你的商业机密。 这个口袋里的潘多拉魔盒才刚刚打开。想象一下,你用手机问 chat gpt 生成一段代码,可模型被越狱后,它能帮你写出钓鱼邮件、恶意软件,甚至用来发动自动化攻击。 而且在手机上操作,这种风险会因为太方便、太匿名而变得更危险。更糟糕的是,你输入的所有代码,甚至公司的业务逻辑,都可能被传到 openai 的 服务器处理,这直接触碰了商业机密和个人数据隐私的红线。 像苹果、三星这些科技巨头,已经禁止员工在工作中使用 chat gpt 了,就是怕这个。所以啊,手机里的代码生成,它带来的便利有多大,背后的隐患就有多深。除了这些安全风险,一个新的法律难题也浮出水面。这种 ai 生成的代码到底算谁的知识产权? 这个问题现在已经引爆了一堆法律诉讼,这技术好是好,但边界在哪儿?得好好想想了。 ai 生成的代码到底是谁的? 这个问题现在已经闹上了法庭,一场针对微软、 geekhub 和 openai 的 集体诉讼正在热烈进行中。原告方觉得 geekhub 在 学习海量开源代码的时候,侵犯了无数开发者的版权,它生成的代码是不是算抄袭? 这个案子可能给整个 ai 生成内容领域定下规矩。不光是版权,开源协议也是个大麻烦。比如 gpl 这种病毒性许可证规定,你用了它的代码,你的整个软件也得开源。 如果 ai 不 小心把这种代码混进了你商业软件,那你的公司可能就麻烦大了,得把自己的商业秘密全部公开,这风险可不是闹着玩的。想象一下,你花大价钱开发的产品,可能因为几行 ai 生成的代码被迫开源,这不就是把企业逼到墙角吗? 所以技术发展得很快,但法律跟不上这些谁写的代码的问题正让很多公司头疼。未来我们可能需要新的法律框架来解决这些复杂的数字产权纠纷, 否则便利背后是无数的潜在法律地雷。 ai 编程助手现在很多还在桌面应用里,或者是个插件,但未来的 ai 编程会变得像你的手机操作系统一样,无处不在,成为一种无形助手。你甚至可以在手机上跟 ai 助手讲讲你的编程想法,它就能帮你搭好核心代码。 等你回到电脑前, ai 已经把手机上的构想细化,甚至跑完,初步整个流程 ai 都能在云端自动完成, 这就是跨设备无缝衔接的编程体验。这种转变,也让 ai 编程领域的竞争焦点变了。以前大家比谁的代码生成得快、生成得多,以后比的是谁更能理解开发者的真正意图。 ai 不 仅仅是写代码,它会更深入地参与到开发流程中, 它能自动帮你修复复杂的 bug, 不 用你一行行地找,能智能地拣写各种技术文档,减轻你的工作量,还能自动优化代码性能,让程序跑得更快。 它会像一个真正的虚拟团队成员,和你一起协作。想象一下一个顶尖的 ai 编程助手,它不只是一个工具,而是你思考的延伸,是你的开发伙伴。它就像一位二十四小时在线的副手,帮你处理那些重复性高、耗时多的工作。 面对这个已经到来的未来,无论是资深开发者,还是刚刚入门的学习者,甚至是我们这些仅仅关注科技的人,都应该好好想想,我们该怎么定位自己,又该如何迎接这场巨大的变化。 你还把 ai 当工具不?你的第一个程序员同事已经上岗了,这意味着你得学着跟他合作,才能不掉队。过去那种只管写代码的时代真的过去了。你看,像 open ai, 把 code interpreter 这种代码生成模型直接放进 chat gpt 的 手机应用里,这就不是一个小动作。 它告诉我们 ai 已经不再是辅助你编程的工具,它成了你的搭档,甚至是一个可以独立完成任务的同事。未来,你不需要死磕复杂的代码语法了,真正的价值在于你能提出多好的问题,能多精准地定义你的需求。 写完的代码,你得像个项目经理一样,去仔细检查,去批判性的评估 ai 给出的结果。所以,最有竞争力的开发者,不再是写代码最快、最熟练的那个,而是那些最擅长和 ai 沟通协助的人,他们懂得怎么问,对问题怎么指挥这个 ai 同事, 现在就是你开始学习提示工程,就是你熟悉 ai 辅助开发流程的最佳时机。因为这场从人写代码到人与 ai 共同创造的变化已经真实发生了,我们不是要被替代,而是要学会与这个新同事一起工作。

clo? clo 还是 clo? 你 肯定被各种各样的龙虾刷屏到烦了,几个月过去,热度丝毫没有退去,愈演愈烈。今天这期我们来点不一样的,不是教你怎么安装和使用 clo, 而是带你十分钟开发一个 mini 版龙虾, 一共只有三百行代码,我不想讨论龙虾到底是有用还是没有用,而想带你从用户视角切换到我这样的从业者视角。我们一起完成 mini 版龙虾的开发之后,相信你对于它的原理以及能力边界的理解能够再上一层台阶。看百变不如实践一变,马上开始。 一、接入大模型,赋予大脑我们要开发的 mini 版龙虾 mini cloud, 第一步就是接入大模型。什么是大模型,相信大家已经不陌生了,就是, 总之大模型就是我们迷你版龙虾的大脑,用来指挥这只龙虾的所有后续动作。因为是迷你版嘛,我们不需要支持配置各种模型厂商,就选择一个国内友好的智普模型吧。先用三十行不到的代码连接智普模型,配置我的智普 api key, 然后就是将我们输入的内容以后台接口的形式发给模型厂商,再将响应的内容展示出来,再无限循环。看到代码不要慌啊,你不需要照搬代码,跟着我了解原理就可以,思路永远比实现细节更加重要。验证下效果,先启动我们这个程序,打个招呼,叔叔你好, 他回应我了,再问个有难度的问题,我喜欢吃糖,为什么?一通分析之后,他告诉了我们答案。先不管答案怎么样,这只虾已经有了,大脑也能开口说话了, 你发消息,大脑响应,再将消息转回给你,完美。二、让大脑有记忆在刚才的程序里,虽然可以无限对话,但是每次对话都是一个全新的请求, 这意味着这个大脑不知道你是谁,不知道你之前和他聊了什么。比如我输入刚才聊的啥,不出意外他啥都不知道。我再问你,我喜欢吃啥? 明明刚才我说了喜欢吃糖,但是他也不知道,挺睿智的是吧?作为一个可捞智能体,这样肯定是不行的。那该如何解决呢?非常简单,你将所有的对话记录存下来,每次新对话,将之前的对话记录原封不动的发回去不就好了吗?加个两三行代码就能搞定。我们再验证一下,启动这个程序, 先告诉他我喜欢吃糖,闲聊几句再问他我喜欢吃啥来着。哎,这次他知道我喜欢吃糖了,也就是他拥有了多轮对话的能力。 但这个时候问题又来了,当我关掉这个对话之后,他就忘了我们所有的聊天上下文,但我希望他能持久的记住我喜欢吃糖。该怎么办呢? 好说,我们先新增两个文档,一、 agent 点 md, 赋予他身份设定你是个友好的助手,每次回复都需要押韵。二、 user 点 md, 告诉我我的用户身份设定我喜欢吃糖。然后在代码里要求大模型每次对话前必须读取这两个文档, 同时赋予大模型自主修改这两个文档的能力。也就是迷你龙虾的大脑可以根据和你的聊天记录自己记下来,他觉得重要的东西。好再验证一下全新的对话,问他我爱吃什么? 哎,他知道我们爱吃糖,而且回复还是押韵的,符合我们在 agent 点 md 里对他设置的要求。再告诉他,我们不仅爱吃糖,还爱吃牛肉。回到 user 点 md 文档,发现已经被改了,记录下来了,我爱吃牛肉,完美! 这样一个有记忆、有人格的 mini 虾就搭建完成了,它不仅仅是一个大脑,还拥有了更加充分的上下文,也就是 context。 context 里有历史的对话记录,以及你的人设,虾的人设完美。三、进入 tours, 赋予它动手能力。 这个时候,虽然我们的龙虾已经很聪明了,但他只能对话,不能够操作外部世界。比如我在目录里贴入一张大家爱看的美女图片,然后问他这是个啥,他说他不知道。我再让他生成一个 ppt 给我,主题不重要,他也会告诉我们无法生成 ppt, 他 只能将文字发给我。这就是所谓的钢中之脑。 现在的他虽然很聪明,但就像一个身处在培养民里面的大脑,无法真实的影响外部世界,或者说他没有手,没有躯干,怎么办?讨饭,我们先赋予第一种工具,叫做帮身拷领,说白了就是我们提前写好一些脚本,然后这个刚中之脑会在合适的时机调用并触发这些脚本, 三十行代码就能解决。首先,我们定义了一堆工具,列出文件,读取文件、创作文件、删除文件,读取图片,再提前写好这些脚本,具体如何执行。回到 agent 的 md 里,告诉他现在已经有了这些工具。重新启动。问他目录下有哪些文件,哎,答出来了。 再问他图片里的内容都是啥,也答出来了,我们好好验证一下。金发女子、白色连体衣、过期长袜,这些都对了。下一步,我们再支持一下近期热度很高的 skills。 这个更简单了,在目录里新增一个 skill 文件夹,将我们要的 ppt skill 拷贝进去,在代码里加上大概二十行,让他每次执行前都能找到已安装的 skill。 好 了,再来试一试,生成一个两页的 ppt, 分 析下马斯克最近的言论。你看,很快就生成出来了,我们看看生成的质量,嗯, 嘿嘿,因为这个 ppt 的 skill 是 我随便写的,我们可以替换成一个社区热门的。再试一下,生成一个 ppt, 分 析马斯克最近的言论。好,深圳完成了,我们看看这回的效果,要好太多了。完美到这一步,我们的 mini cloud 已经具备了 toos 执行的能力。 toos 并不是大脑内部的,而是挂载在大脑外部的, 随着 twos 的 丰富,就可以无限变强。完美四定时任务与心跳这个时候我们已经很强了,用了一百多行代码,就模拟了去年 manas 这样的产品架构。但有人会说, cloud 产品的一个特点就是会自主执行任务, 也就是他会主动执行一些任务,主动给你推送消息。这是怎么做到的呢?很简单,看这二十行代码,支持新增和存储定时任务,同时后台有一个进程,在指定的时间点给你推送消息,启动程序试一下,告诉他五秒钟,提醒我喝水,稍等下 一条一条一条又一条。你可能会说,这不对啊,我看别人的龙虾不需要这么死板的提醒,会在某些时候自然的推送消息,看着更智能,这不是很简单吗?我们刚才新增了这一块喝水的定时任务,是你主动要求他保存的, 我们再给大脑一个定时任务,比如每个半小时总结他和你的对话内容,让他自己判断要不要在另一个时间点定时给你发消息不就好了吗?这块我就不掩饰了,但是原理都是很简单的,说的好听点就是自我净化。定时推送说的简单点就是高级一点的定时任务,但是不管怎么样,完美, 嘿嘿。五、接入飞书、叮叮等对话渠道。哎,有人又会说了,别人的龙虾可以在叮叮、飞书甚至 qq、 微信里聊天呢。你这个黑乎乎的是啥?太丑了,不想用。但要我说,这其实更简单,你可以理解,不管是飞书、叮叮还是网页版,本质上就是套路层,消息转发的中间层, 你的消息呢?通过这个中间层进行转发和接收,先包一个网页,现在看看就有点像回事了,对吧?你好哎,可以正常回复,每隔十秒提醒我喝酒。 哎,提醒我喝酒喝酒还是喝酒?你看到这一步,我们的 mini club 包了一层美观的外壳,好像也不算很美观,主要是我懒得去调样式,但至少他已经像个样子了,各种能力也都有,从性价比的角度完美。 最后总结,最后,不知道大家有没有发现,这个 mini 版龙虾的开发过程就是二零二三年到现在整个 ai 的 进化过程,一开始呢,只有一个大模型,只能一问一答,后来发展出了可以调用外部工具,不管 m、 c、 p 还是 skill, 都是工具的一种。 到现在不仅可以调用工具,还有了定时任务,也通过定时任务实现了所谓的自我进化,以及开始涨到你的聊天工具,比如说 qq 和微信里,他更像一个人了。 短短的三百行代码模拟了最近三年 ai 的 发展历程,大家也看出来这三年 ai 的 发展速度越来越快,但是并没有给人减负,而是带来了更多的焦虑,以及让人越来越老。看到这里的我相信也是花了很多业余时间来学习 ai 的, 大家一定能够深刻的感受到 ai 的 发展速度超过了你的学习速度。我不喜欢贩卖焦虑,相反作为一线的从业者,希望以原理科普的方式缓解一点大家的焦虑,很多热点有没有必要追,是不是噪音在大家知道原理之后就能够自我分辨。好了,喜欢我的话,请给我宝贵的三连,我们一起进步。

永久免费无限量,电脑小白也能装一行命令都不要!哈喽啊,我是王玉,今天给大家带来可能是史上最简单的本地大模型加本地龙虾的部署方案,可以永久告别偷啃叫力,享受免费无限量的 ai 能力, 一次安装终身使用,不依赖云端 a p i, 不 再有掏坑的焦虑,月度限额的烦恼,所有的数据都保存在你本地的电脑上,聊天记录代码片段都不会上传云端,超级安全,还支持多渠道,微信、 qq、 飞书都可以随时随地的用,性能也很强。 这次我会集成最新的千万三点六三十五 b, 这个模型性能堪比主流的付费 ai 产品,完全免费运行在你的显卡上,而且安装过程不需要你懂代码,不需要命令行,不需要你安装什么 wsl 那 些东西, 只需要安装两个图形化的软件,点一点鼠标就能搞定,而且有什么新模型、新插件,新的 skill 都可以装,都可以更新,你需要准备什么?硬件方面推荐十六 gb 以上显存的显卡,当然你没有这么好的显卡也没关系,你下载一个小一点的模型也行。 软件的话,第一步,安装这个 lm studio, 不 会安装的话,可以参考我之前做的本地安装 jma 四的那期视频。 第二步,安装这个 workbody, 这个 workbody 现在是可以接入本地模型的,所以我们直接安装它就可以直接使用这个龙虾的能力了。 ok, 来具体看一下怎么配置这个 lm studio。 第一步,首先是你把这个模型下载好, 然后加载到这个 lm studio 里面,可以看到这个著名的洗车问题三十五 b 的 这个 moe 模型是没问题的, ok, 然后看一下本地 server 的 配置,点这个图标,进到 local server 的 配置页面, 我们看到这里有一行字就是代表我们的 server 已经起起来了,这个地址就是我们的 api server 地址,我们把这个地址 copy 一下,然后到配置 workbody 的 页面,我们点这个图标,然后进到设置页面,点这个模型, 然后进到编辑模型页面,我们提供商选这个 custom 接口地址,粘贴我们刚刚复制的地址,最后加上一个 v e 这个 apikey, 如果你配了的话就填你配的 apikey, 如果你没配,那你就随便填一个模型名称的话就随便填,也可以高级配置。我们这个模型是支持工具调用,也支持图片输入,还支持推理的,所以这三个都可以勾上上下文大小,根据你加载模型的上下文大小填就可以, 然后来看一下实际的使用效果。其实本期视频的这个 ppt 风格的网页就是我让这个千万三点六三十五 b 加 word 八 d 来做的,可以看到这边我让他做一个介绍本地安装小龙虾的短视频, 他帮我写好了短视频文案,包括一个 ppt 风格的网页,有六页的 ppt, 内置了一些动画效果,包括右边的原点导航,还有图片点击放大的效果, 包括需要哪些截图,他也给我列出来了。永久免费无限量电脑小白也能装一行迷你都不要,是不是非常的 nice, nice! 觉得有用的话记得点赞关注,拜拜。

不是吧,就在刚刚 openai 说自己要做一个 github, 可能呃不关注编程的朋友可能会不了解啊,就是全球最大的代码托管平台,也就程序员几乎都要用到的一个平台。 那 openai 据说是因为自己的程序员在开发的时候老是遇上 github 中断的这个问题, 他觉得呃自己做一个 github 呃类似 github 的 平台放放自己的代码的话会比较安全。但是我不认为这是他的真正目的啊。他真正目的应该是想因为现在他的编程工具 codex 的 日活是非常高的,用户是非常多的, 那他就想把这一部分呃用户呢生成的代码中,那这样的话,他既可以提高呃 codex 用户的粘性,它又可以把 codex 用户的生成的代码的或做的项目的呃用来训练下一个模型,真是高啊。

可乐的一夜被颠覆了。昨天晚上我在写代码,写着写着突然说可乐的余额不足,于是我马上去充值,他说我的账号被封了,账号被封了,但是我的他说有接近六万用户了,怎么办呢?人家说 codex 可以, 我就半信半疑去下了一个。然后我就问 codex 一个问题,我说 这个项目是干啥的,没想到过了一秒他就给我输出出来了,我这个代码已经五十多万。行了, 这个任务交给 klo 的 起码得两分多钟。他在理解了我的项目之后,我让他去改了一个 bug, 直接推到了线上,没想到马上就改好了。那为什么差距这么大呢? klo 是 架构型的,所以他的上下文更大, codex 是 干活的, 所以他只把重要的东西放到上下文里面,也就是说他能帮你节省百分之七十的头衔。相比于 klo 的 我就纳闷了,我说我以前也用过 codex, 没见过这么强大啊。于是我就翻了下新闻,发现四月二十三号, oppo 还发布了 codex 五点五携带把能力吊打 call 的 code, 而且 codex 五点五发布之后,一晚上营收就翻倍了。

最近有很多小伙伴问我 clock code, openclock codex 到底有什么区别?有什么功能?如何选择?今天一个视频给大家讲清楚。 clock code 是 终端原声编程智能体,深度理解整个代码库,能够本地执行,专为代码场景设计。 openclock 开源通用 ai 代理框架,能够常驻运行不止编程,可自动化电脑上几乎所有操作 codex 后笨 ai 出的云原声代码智能体,轻量高效,擅长批量自动化终端编码助手。它们都是大模型驱动的 ai 代理,智能体能,理解自然语言,读写文件,执行命令,都面向开发者或者技术用户,主打用自然语言干活, 都支持多文件编辑。 d 操作调试和运行代码。接下来是它们的区别。科尔沁本地终端执行隐私号, 大型项目架构复杂,奔本地开发是单一工具,像一个聪明的终端插件,专注编码,能让你明白问题出在哪里,帮你边做边修改。 都本科啊!全场景自动化,跨软件开源,可定制,满足你的日常化需求。向你的个人 ai 管家,不仅写代码,还能接管通知,定时任务。多平台消息显你拥有全部基础设施。 codex 云端沙盒执行隔离好,清亮高效,并且便宜。向你的编码速记员你口述需求, 它秒编代码,几乎零延迟。如果你只是偶尔在终端写代码,三者都能用。但如果你想让 ai 持续在线跨平台协助深度定制,那 open q 二是最好的选择。好了,今天的视频就到这里了,点赞关注,带你玩转更多 ai 神器!

i 编程领域迎来了一位超级架构师 opi 正式发布了迄今为止最先进的智能体编码模型 gp 五点二 codex。 它在 sve、 奔驰 pro 等多项权威精准测试中均取得了 saoata 的 顶级性能。 这次升级最核心的突破在于其长上下文理解能力和原声 windows 环境支持,即便面对超大型代码库的重构、迁移或功能构建,它也能在长时间绘画中保持完整上下文, 就算任务中途受阻,也能持续迭代而不丢失进度。除了写代码,它更是找茬专家,能系统性的发现代码与数学中的细微漏洞。 更惊艳的是它的视觉性能可以直接将设计稿转化为功能原型。而在网络安全领域,它更是实现了性能三连跳,甚至辅助研究员发现了 rex 的 重大漏洞。目前该模型以下付费用户开放,快去填这位能看图能实操的顶级助手吧!

gpt 五点五刚满三周, gpt 五点六就被扒出来了。报料人 leo 说, gpt 五点六的首批检查点已经启动内部测试,下个月可能就亮相,而且内部代码代号 amber alpha、 beacon alpha 都被挖了出来。甚至有人在 codex 的 日制里发现有调用,已经路由到了 gpt 五点六。也就是说, codex 环境大概率已经在跑五点六了。产品端也没闲着, openai 这周四要上线一个 ultrafast 模式,速度提升二到三倍。注意,这是旗舰模型的加速,不是拿小模型凑数。 今年三月, codax 的 fast 模式已经做到一点五倍速,之前 gpt 五点三, codax spark 借助 siri、 bros 芯片更是飙到一千 token 每秒,是普通模式的十五倍。现在 ultrafast 直接在主力模型上提速, agent 循环、长任务这些场景体验会好很多。再看编程工具这边,两家已经正面交火了。 osropic 先出招,六月十五号起,给付费用户每月加百分之五十编程额度,覆盖 cloud agent、 sdk、 命令行工具和 cloud code。 openai 反应很快,直接宣布三十天内从其他平台切到 codex 的 企业,送两个月免费,按 pro 计划,二百美金一个月算,等于白给四百刀。奥特曼亲自站台,说 codex 是 市面上最强的 ai 编程工具, 三小时内二千个开发者就找过来了。你想想,这背后其实是一个更大的趋势。 gpt 五点三, codex 是 open ai 第一个参与自身训练的模型,到五点五的时候,内部百分之八十五的员工每周都在用 codex 五点六的开发,几乎可以确定是五点五在深度参与下完成的,再加上 codex 三百万周活用户, cloud code 也在爆发,数百万开发者用 ai 写的代码又反哺回 ai 训练,这个飞轮一旦转起来,只会越来越快。奥特曼说目标是 asi, 你 觉得照这个速度还远吗?评论区聊。

每天介绍一个实用 skill, 今天介绍一个解决官方文档查询和接口接入工作需求的 skill, 名字叫 open a box。 这条讲一个具体场景,你想接一个 ai 接口,但文档里参数很多,版本也容易变化。 如果只凭网上二手教程,很容易抄到过时写法,最后报错,还不知道错在哪里。用 open a box skill 的 时候,可以让 open call 优先查官方文档,再把内容整理成你能执行的步骤。 比如输入帮我查官方文档、整理图片、生成接口的调用步骤、参数含义和视力代码。他会先确认资料来源,再提取关键参数、限制条件、请求格式和返回结果。如果你是新手,还可以要求他把视力代码拆成安装、依赖配置、环境变量、发起请求这几步, 它适合处理模型、选择接口接入参数、解释报错、排查这类开发问题,最后得到的是有官方依据的执行方案,而不是一段来路不明的教程。觉得这个场景有用就点赞评论你的工作需求,关注我,下一期继续给你找适合的 skill, 并拆开讲清楚。

bbc 又发生了一场重大泄露事故, codex 平台的模型下拉菜单里突然出现了以下模型, g p t 五点五 o e 二点一 arkneil glacier heisenberg 不 久后, codex 紧急修复了漏洞,菜单已经恢复正常,但显然已经晚了。只看泄露本身 可能只是技术团队的小事故,但把时间往前播二十四小时,故事的背景就清晰了。昨天 andopht 在 非上市股权交易平台上的估值已飙升至约一万亿美元, 而同期 openai 的 估值约为八千八百亿美元。就是那个做出科奥的公司,在资本市场的身价已经悄悄站到了前面。 openai 这一次失误,成功把外界注意力从 antopilot 估值更高,转向了 openai 可能要发新品。至于 gpt 五点五究竟是下周见,下月见,还是永远停留在那个被撤回的菜单里,时间会给出答案。

openclaw 视觉模型配置教程, ai 助手读不了图,三分钟搞定, 从零开始,一步到位。今天分享一个实战经验,怎么在 openclaw 里配置图片识别模型,让 ai 助手能读懂你的截图,全程真实踩坑记录,跟着走不会错。 第一步,在 open k o n g s o n 里添加模型定义,找到 models providers alibaba a models 这个位置,加上通一签问 vo 的 配置。 这里有个关键点,阿里 descope 的 open ai 兼容接口,路径是 compatible mode 下的 v e base url 必须写成 descope 点 l e n c s 点 com, 下面带上这个路径,不然会报四百零。四、 模型 id 是 cribo max, 输入类型标注为 text 和 image, api 格式用 open a completion 二部配 api key, 在 agent's 目录下的 os profiles gson 里添加一个 alibaba 的 profile, 类型是 api 下划线 key, 把你在阿里云 appscop 申请的 t 填进去,如果已经有阿里云账号,在控制台开通模型服务,就能拿到 key。 第三步,设置默认图片模型,在 agents defaults 里把 image model 设为 alibaba 杠 quanview max, 然后在 models 允许列表里也加上这个模型名称。注意不要加额外的字段,加了 vision 冒号 true 会导致启动失败。 接下来是踩坑记录,第一个,配置文件里不要出现不认识的字段,否则 gateway 启动会挂。第二个 base ur l 一定要带兼容模式路径,不是跟路径。 第三个, models g s o n 会被自动覆盖,一定要改 openclaw g s o n 这个源头,改 models g s o n 没用, 配置完之后内置的 image 工具就能正常读图了。实测四 k 截图任务管理器网页截图都能准确识别。还准备了一个 python 直调脚本作为备选,防止内置工具抽风。 好教程就到这里,如果你也在配置 openclaw 视觉模型,照着来就行。