粉丝1.1万获赞9.0万

哈喽,下班了。今天一位运营的同事问我,如果让我只推荐一款 ai 智能体工作助手到底是推荐哪一款? 其实所有的智能体分为两类,第一种是云端智能体,譬如说克拉扣, china c p t 啊, kolex 这种产品呢,它的智能体和它的模型相对绑定。另外一种是智能体和模型是结偶的,譬如说 hermes, open claw, 还有克拉克本身也可以解釜,然后配上背后的大模型,譬如说 deepsea, 譬如说千万,譬如说小米现在所有的奇异投肯的小米 mini, 还有一些原单智能体,像 millers, 后来我去帮他推荐的就是 q 代 x, 为什么我推荐这一款,其实这段时间我一直在试用到底,探索一款到底,对于普通人来说是低门槛的,我可以花点钱,但是要好用的, 我发现克莱斯的确是首选之一,为什么?首先,克拉克的确好用,但是他对我们是有一些门槛的,即使你搞定网络问题,他也会封号,他也有有开号的门槛,也有封号的风险,而风险极大。 但是柯达斯呢?他对这一块,嗯,相对没有那么大的门槛和风险。其次,柯达斯对于中文的理解是非常的到位的,以及配上他的现在 e m g two 的 一个功能,你可以迅速的处理想要的 ppt 图片 啊,以及相关的汇报材料,完全没问题,一句话就可以生成。还有柯达斯另外一个好处,他的量大啊,你花了同样的钱,他能够做更多的事,他 基本上是克拉克的好几倍的一个突破量。而且这一次嵌子 gbt 的 这个升级啊,嵌子 gbt 五点五的升级, 它相对于五点四来说真的改变很大,最大的特点就是说它的黑化变少了。以前使用嵌子 gbt 五点四的时候就感觉招聘个阿里 p 七 p 八一样,黑化一大堆, 动不动就是转折词,啰嗦一大堆。但是五点五这一次啊,它变得干脆利落 啊,更接近于克拉克的这个风格。如果你爱折腾,如果能能够动手去做的话,我建议 hermes 或者是克拉克加 deepsea 这种组合还是最好的,它是终端智能体加上云端大模型的这种组合, 你可能要买 token, 买的 api 的 形式,然后配上你的本地智能体,你的本地智能体对于你的个人的信息的存储啊,你的数据的安全性啊,会有更好的一个本地化的一个模式。

这是一期地毯式 codex 教程,如果你还在焦虑谁谁谁又用 codex 做出了什么无敌的应用或者自动化给自己干活了,那你务必看完本期教程,带你最全面的了解 codex 是 什么,它能干什么,并跟我一起实操完成。从 codex 下载 安装到个人网站、文档制作视频动效,自制工具等等等等,全面了解 codex 这个目前为止最强大最全面的个人 a 政策。 codex 的 界面现在我们来到了 codex 的 主界面,这个对话框你肯定很熟悉,对吧?但是你可以看到左边的这个边栏,就可以看到很多不一样的地方。 首先是上半部分,点击这里你可以快速创建一个新的对话框,快速完成一段与 codex 的 对话。这个搜索你可以同时使用 command g 来调出,快速搜索,你与它进行或者对话等等。现在你可以看到技能和插件这两个板块,这里可以说是 codex 的 一大精髓所在。再过来说, codex 是 一个集合了 chatbot, d e 浏览器,自动化工具等等等等的一个大一统的工作台,所以你可以给他安装插件, skill 以及创建自动化任务。这里的插件市场可以让你来随时扩展更多的功能。比方说这里的 computer use 和 browse use 在 我们后半部分的教程中就会用到这两个功能。 再往下看,可以看到项目和对话两个分栏。在项目中你可以点击添加新项目来将你创建好的文件夹给添加进来。在你创建好的文件夹右侧点击开始对话,你就可以创建出一个新的对话框,那么之后你们对话所有产出或者修改的文件,就会在这个文件夹中进行。 正常情况下, ai 如果直接操作电脑,风险会非常高。所以 codex 使用的是沙盒的逻辑,它相当于给 ai 开了一个单独的隔离小型开发环境,它可以在里面读代码,改代码,运行命令,执行测试,但默认是不能随便控制系统的。 在对话这里,你可以选择默认权限、自动审查、完全访问权限三种权限类型,让 codex 来执行还是非常安全的。再往下看,还有一个对话栏, 常用来进行一些临时产生的问题,当我用完,我就会点击右侧的这个归档按钮,把它给归档,那你也可以在设置你归档对话里面去给他找回来。 回到对话框,你可以在对话框中输入任意的问题,或者要执行的操作,比如帮我整理桌面上的这个文件夹里的发票,并统计这些发票总金额是多少,然后统计在一张 excel 表格中,你看很快他就跑完了。 现在我们来使用 codex 制作一个个人网站,首先在桌面上新建一个我网站的文件夹,然后回到 codex, 进入文件夹,点击这个加号,打开计划模式,这样 codex 就 会根据你给的需求,先开始计划他接下来要做些什么,等他计划完成了,他会给你一份详细的执行方案, 然后点击执行,这样就可以去干别的事情。一杯茶的功夫,你就可以等待你的网站。你可以点击右上角调出一个终端, 把它给你的命令复制一下,回车运行,你就可以在 codex 里面预览这个网站的效果,我们点击展开面板。哎,对了,你看 codex 还自带一个浏览器,你可以在 codex 里面直接查看以及批注,这样你就不用回去再想想怎么描述我是要修改什么地方。 文档与 ppt, 那 除了做网页,我现在更高频的用途是用它来做文档。比如说平时很多人会写策划案,汇报 ppt 视频脚本,以前是用 gpt 生成文字,再到 word, 再复制到 ppt 里面,最终再自己排版。但是 codex 现在已经把这些东西都串起来了。比如说我现在告诉他 使用 html ppt 这个 skill 帮我制作一个宠物账号的商业方案,要求包含市场分析、账号定位、内容模型、变现方式,以及未来三个月的执行计划,并生成一个科技感高级风格的网页 ppt。 然后你看到他就会开始创建文件,生成文案,设计页面,制作动画,自动排版。最后给你一个直接可以演示的网址。尤其是你看像我一样要录制这种口播视频的,我这样的 ppt 就是 用 qq 词直接帮我生成的,他做出来东西天然就很适合录屏。 这个时候顺便介绍一下 qq 词另一个非常好用的功能,分叉非常适合这种,你做到一半突然想要尝试一个新的风格, 或者要尝试两种内容的时候,点一下分叉按钮,这个时候不用重开一个新绘画,重新解释项目背景,他会直接分叉当前的上下文。你可以在分叉县城里面大胆做实验,如果效果不好,直接回到原来的主线就可以了。如果效果更好,就可以沿着这个分叉继续来进行开发视频动效。 说到做视频, codex 最近还上线了一个非常强的插件,由黑正推出的 hyperframes, 你 只需要输入一句话的描述,就可以自动生成带动效排版转场。三 d 视觉的高级动效视频,可以说是完全填补了原来视频模型不适合生成精确的带文字、带数据的动效视频的孔雀。 比如说,你可以直接说帮我根据这个养猪场的年报生成一段科技企业的汇报视频,他就会直接调用前端库来生成一段带数据、带图标的动效视频。 skill 与自动化任务普通的 ai 只能回答问题,但是通过 skill, 你 可以把你工作多年的经验或者流程打包交给 codex 自动去跑。比如说你完全可以使用 at skill creator 来描述你的需求,每天自动抓取某个平台的热门视频, 分析标题,提取高赞评论并整理成 excel, 最后生成第二天的选择题。我自己做了一个急梦,排队的 skill, 如果你有批量使用 cds 的 需求,使用我这个 skill, 它就会在晚上帮你批量提交视频生成的任务,自动检查生成出来的视频并保存到本地。 类似这样的 skill 还有非常多,这个部分就留给你们自己去探索。 computer news 这个是我觉得最近 q 版有这个功能,目前只有 mac 版有这个功能, 它运行起来的时候,它就会像一个真人一样看屏幕,移动鼠标,点击按钮,输入文字,打开软件,切换窗口,使用第三方 app。 以前很多的自动化必须要通过写脚本,调接口,配 sdk, 研究文档。但是现在即使某个软件没有开放 a p i, 很多事情扣代码,直接看着屏幕自己就去操作了,你懂这种方式有多震撼吗?最后的总结 可以看到, codex 提供的内容已经非常非常多了,我这里要下一个爆论就是这一类 agent, 他 绝对不会仅限于编程开发等等, 你已经不能简单的给他定义成工具了,但是你也别太焦虑,拥抱 ai, 先从每天自己最烦最重复最浪费时间的小事开始。 比如说整理文档,改革式做表格,生成封面,做网页,写脚本,做汇报,批量修改内容。当这些事情真正开始被 ai 接管的时候,你自己的潜力或许才刚刚被开发出来。

一定要,一定要,一定要想尽一切办法去用上 codex, 至少我不允许我的粉丝还没有用上 codex 或者是 open color。 这 codex 这玩意儿,那黄仁勋逼着英伟达的全体员工都在用,你想想,全球市值最高的公司 老板亲自下场去逼着员工用一个工具,那你觉得这玩意会没有用吗?百分之九十人啊,到现在还不知道这东西到底是啥,还在那研究怎么用 excel 写文案呢。那我先说结论啊,就 codex 不是 什么编程工具啊,他是现在最适合普通人上手的 ai 工具,没有之一。你以为啊,他只能帮你写写代码?那你太小看他了啊, 他能做的事情就是让一个完全不懂技术的人用自然语言去描述需求,就能搞出一个自动化的一个流程, 甚至是一个小产品。那你看一下,这周六我还跟我朋友在聊啊,他烟草的就他已经在用 codex 去分析数据,你想这意味着什么?就是技术门槛的四个字正在慢慢消失。那你再看看最近新闻,纳斯达克什么再创新高,还有那个什么芯片股涨疯了, 然后存储芯片又断货了,一堆人在那分析来分析去。那其实就一句话, ai 正在重新洗牌,那 codex 就是 普通人能够得着那张牌。那两个月之前如果说你问我,那我会让你先观望观望。 现在啊,他几乎天天更新,就能力已经跌到一个离谱的程度了。你要是现在刚刚二三十岁啊,或者是刚刚毕业,那你听好了,现在 一定要去开始用 codex。 你 现在开始用,你就是在插队了啊,别人在排队,你已经跑到别人的前面去了。大部分人还在等,还在观望啊,等成熟了再说。那等你反应过来啊,那窗口真的早就关了。看完这条视频,我真的希望你马上去研究一下。

只需几天,你就能学会 ai 的 玩炸工具 chat gpt 出品的 codex, 你 信吗?很多人觉得像 codex 这种 能接管电脑的超级应用,肯定是给程序员用的,自己搞不定。其实呢,门槛真的没有你想象中的高。只要你会用 chat gpt 或者豆包之类的对话框, ai, 花点时间转变一下思路, 你就能把 codex 调教成一个极度贴心的私人超级助理。等你用顺手以后,你会发现他什么活都能接, 跑几十张发票算账,去邮箱翻找客户邮件,跨软件做 ppt, 甚至帮你盯着竞争对手的网页。 之前会不会写代码根本不是关键,核心在于你有没有意识去把任务拆解,把重复动作打包。今天这个视频主要是想带着非技术的同学快速上手这个 open ai 推出的 ai agent 的 超级应用。 从云端回到本地,不写代码的同学习惯了查 gpt, 第一步往往不太适用 codex 的 存储逻辑。以前你是在网页上对话 传的文件都存在云端,但在 codex 里面,你给他的文件以及他生成的所有文件,全部都直接保存在你自己的电脑本地。 为了不让文件乱成一锅粥,最好的准备工作是什么?是永远在项目里干活。你可以在文件夹里建一个新的项目,所有相关的聊天和生成的文件都会被 codex 自动归整。在这个文件夹下, 非技术的同学可以设置模式为适合日常工作。 codex 适合什么样的活呢? codex 拥有对你电脑文件的全权访问的能力,它能自动找对文件夹并完成任务。具体来说,这几类活最适合交给他。 一、处理本地的繁杂文件。比如你的下载文件夹中有六十张发票照片,你只需要说去读取那些发票,帮我提取文字,并在本地建一个 excel 报表,看消费趋势, 它就会自动搞定,并在本地生成一个真实的 excel 文件。跨软件的信息收集, 通过插件 codex 可以 直接联通你的常用工具,目前有上百个。你只要敲一个 at 符号,比如输入 at gmail 或者 at notion, 你 就能让它去翻阅过去两周找我做广告的邮件,整理成表格。 第三呢,是代替你直接点点点,它能直接用鼠标和键盘控制你的电脑。通过 at computer use, 它可以帮你打开电脑上的 camera 软件,新建换灯片。甚至还能用 at browse use 帮你自动去点击浏览器里面的按钮,测试网页好不好用。然后呢,要沉淀你的专属 s o p。 把活变成技能。 最阻碍新人提效的一点是总在下重复的指令。在 code x 里面,你需要习惯把你做好的工作变成可附用的技能。笔一上来就想着写多复杂的指令。按这个节奏来, 先用大白话让他干活,如果不满意就让他改,一直迭代到结果,让你拍他腿说,啊,太棒了!这时最关键的一步来了,你直接对他说,我很满意这个结果。 把它变成一个技能,它会立刻把刚才所有的经验提炼成一个可重复使用的标准文件。以后你只需要敲一个斜杠符号,比如斜杠品牌合作分析,它就能瞬间按最高标准重跑一遍。 如果你过程中又发现了更好的排版格式,随时告诉他请更新这个技能,以后都按这种格式输出。进阶习惯,让他二十四小时替你打工。定时自动化,对着你整理好的报表说一句, 请在每周五早上九点执行一次这个任务。更新这张表。 codex 呢,就会把这是加进日程表到点,自动在后台干活。你可以在 automation 的 面板里随时管理这些任务。白嫖全球最顶尖的画图模型 codex 内置了最强的 gpt image two 的 模型,生成的图片呢,会直接存进你的本地文件夹。如果你直接给出参照图描述需求,立即会生成质量极高的图片。 那根据图片生成梧桐树下的新功能的效果图,看一下避坑与管理他的大脑。用 codex 久了,他会越来越懂你,因为他有两个记忆占卜,一个是手动记忆, 这是你的规矩本。当你对它说以后这种落地页都用左侧边栏的排版格式并记住它的时候,它会写进 agent 的 n d 里面。 那第二个呢,是自动记忆,它会默默观察你的工作习惯并记录下来。那重要的提示是呢,不要去手动修改这个文件,让 ai 自己去更新就好,它会越来越聪明。所以呢, 别怕什么终端或者代码,先把你的日常痛点丢给他,建个项目,存个技能,你的工作方式呢,就会彻底被改变。如果你真的想学 ai, 请留言,想学 codex, 我 来教你。

四月份的时候,如果你问任何一个高阶开发者,桌面端该用什么?答案百分之一百是 cloud。 但是为什么到了五月份,大量原本始终的 cloud 的 用户开始疯狂逃离? 答案是令人窒息的账单。表面上看, cloud 更新到四点七之后,解决模糊任务的能力确实变强了,甚至还学会了点儿 gpt 那 种我要稳稳接住你的黑化。但在这背后,他悄悄修改了 tokenizer 的 计费逻辑,不再由用户控制思考深度,而是默认强制思考。 很多用户发现,更新之后的 token 消耗量至少比以前飙升了百分之二十到百分之三十。在传统的对话模式里,这或许还能忍,但在桌面端, agent 需要不断地读取本地文件,检查报错,无限循环执行测试。 一个晚上的全自动 bug 修复跑下来可能什么事都没干成,一觉醒来,几百美金的 token 额度就已经灰飞烟灭,甚至账户直接被刷成负数封禁。 cloud 狂飙的代价是,它正在把桌面 ai 变成一种连中产阶级都用不起的奢侈品。如果说 cloud 是 傲慢,那谷歌的 jammer 在 桌面端的表现只能用惊慌失措来形容。 在很长一段时间里, google 的 动作迟缓得让人难以置信。在这个谁先占领本地桌面谁就赢的关键节点, deepmind 内部似乎陷入了极大的混乱。 jimmy 的 模型表现极度不稳定,上下线差距极大,用很多开发者的话说,感觉就像是对牛弹琴,直接废了。但不可否认,谷歌的底子依然在。为了阻击竞争对手,他们成立了专门的 strike team 死磕 anthropic, 并在违背了多年不碰本地客户端原则的情况下,准备赶在五月二十日 google i o 大 会前极限发布了 mac 版的桌面应用。 谷歌的算盘很清晰,模型层面我暂时没拉开代差,但我要用我手里庞大的 g suite 浏览器和系统级生态强行捆绑你。 而整个五月最让人意外的反转,其实还是 codex 的 反杀。几个月前, codex 在 圈子里的名声并不好,他天天操着一口奇怪的黑话,犹如我不跟你绕,你就是太清醒了。 这种略带江湖气的 ai 语言,让很多严肃的程序员觉得他很不专业。但就是这个像街头混混一样的 codex, 在 五月份彻底掀翻了桌子。他凭什么? 第一,极其暴力的原声计算机控制。它不仅支持浏览器自动化控制,还能直接接管你的电脑操作系统。 很多人戏称它才是真正进化版的太空小龙虾,它会在每天早上你刚睡醒时像个真正的助理一样主动弹出来,告诉你昨天哪些代码跑通了,今天建议怎么改。第二,也是最致命的一击,廉价算力。 这也是为什么大量中国开发者和海外羊毛党集体抛弃 cloud, 转向 codex 的 根本原因。 codex 最聪明的地方在于,它本质上是一个路由器,或者说超级壳子, 它允许用户在后台极度自由地配置第三方 api 接口。在二零二六年的今天,国产大模型在代码生成和多模态理解上的能力已经逼近了美国的一线水平, 更重要的是,它们的价格只有美国巨头的几十分之一。 codex 实际上是借着中国模型的极致供应链优势,在全世界打了一场降维打击的消耗战。你 cloud 确实聪明,但我 codex 挂着国产模型,用只有你十分之一的价格,干成了你百分之九十的活。 在算力成本面前,什么高贵的设计感,什么灭绝师太般的统治力,全都不堪一击。那既然桌面端开打了,既然 agent 这么烧钱,那我到底该怎么用呢?记住一个死理,在桌面自动化时代,永远不要把所有的任务无脑扔给单一的重型模型, 你需要像管理公司财务一样管理你的桌面。 a p i 走向下面,我直接把这套目前硅谷极客圈都在用的三网融合工作流抄给你,建议直接截图或收藏,这能帮你每个月省下至少几百美金的冤枉钱。第一步,零门槛,底层部署, 不要去下载那些花里胡哨的第三方套壳,直接用命令行复制下面三行代码。 jimmy 只要有个公众账号就能白嫖。 codex 需要叉 gpt plus 或 open ai api key, cloud 则最贵,需要 pro 订阅或绑信用卡的 api。 第二步,正确分配工具,装好之后千万别瞎用, 你要学会给它们分配不同的工种。 jammy 去当免费的探路炮灰,他的核心优势是一百万 token 的 免费超大上下文,让他把项目吃透,给出方案,你点头了再动手。 cloud code 可以 当架构师,在多文件的一致性、对边界条件的考虑上, cloud 依然是目前地表最强。 codex 可以 当流水线工人,那些明确的、重复性的需要局换的脏活累活都可以丢给他。但也给个提醒, codex 的 浏览器自动化功能是一个极其危险的吞金兽,一旦它在测试网页时遇到浏览器崩溃,陷入无限重启的死循环,它一个晚上就能烧掉你两百美金,让你的 a p i 账户直接变负数。 所以凡是涉及浏览器的任务,必须一定绝对要设置超时熔断时间。第三步, 把这些工具组合成工作流。早晨掏出 gemini, 把长篇大论的需求文档和乱七八糟的旧代码丢给他,利用免费大模型把思路理清。下午掏出 cloud code, 针对核心模块进行重构,多文件同步修改,确保逻辑严密。下班前就可以让 codex 上场做 review 了。在这场桌面端的大战中,巨头们希望你变成那个无脑续费、任由 agent 烧钱的傻白甜。 但真正的超级个体,是懂得在不同的底层算力之间搭建属于自己的防火墙与调度器。这才是我们今天聊桌面 a p i 的 最终目的。记得关注这里是 ai 商业慢谈,每周分享最新的 ai 资讯和商业理解。

ai 编程能完全免费在本地运行了, codex 和奥莱曼正式打通,开源模型直接接进来。之前想用 ai 写代码,要么掏钱买 api, 要么依赖云服务,每个月动辄几十上百美元,小团队和个人根本扛不住,现在所有成本归零。 olym 这个工具能让用户在自己的电脑里跑开源模型。 codex 是 open ai 的 ai 编程助手,能写代码、改代码、审核代码,两者一组合,本地就能用上 jam 四 qman、 三点六这些模型一分钱不用花,全靠自己的显卡和内存。 具体怎么用,三条路走通。第一,装好 codex 和欧拉玛,两个软件都免费。第二,选一个适合自己电脑的模型, gamer 四的四 b 参数版本就够用,去 camera ai 网站输入显卡型号和内存,网站会推荐能跑的模型。 第三,在命令行里敲一行命令,模型就下载到本地了,大概九点六 g 币,等几分钟就装好,然后启动 codex, 选择这个本地模型。所有 codex 的 功能全都能用,写代码、改页面、调逻辑, 这意味着以后写代码、建网站、调样式都不用靠云服务,自己电脑就能跑数据不出门,速度还快,相当于把 ai 编程的门槛从月费降到了零。打开 codex, 选本地模型开工。 有人用 jma 四四 b 模型生成一个 cs 落地页,复制代码到浏览器打开页面完整布局干净。一个四 b 参数的本地模型就完成了以前需要付费 a p i 才能做的事。

codex 最近更新了新功能,它现在可以直接操控你的 chrome 浏览器了。对比 computer use, 它不会抢你的鼠标,因为它是在后台运行的。配置只要四步。第一步,先更新 codex, 点击设置,点击电脑操控,安装着 chrome 插件, 好点击打开,添加扩展程序,这样就配置好了。在用的时候记得要输入杠 prom, 再加上你的问题,他就在后台帮你操作你的浏览器工作了,同时还能开好几个标签页并行地去跑任务。我让他帮我整理一下我的 note 库,他目前已经在开始工作了。

现在 codex 出了一个非常有意思的一个新功能, pad 小 宠物,对于我们这种玩 ai 的 人来说,它不仅仅是可爱,它还可以在你用 codex 写代码写编程的时候,不用一直盯着 codex 的 窗口等结果。你可以理解成把 ai 写代码的进度条变成一个 会动,而且还能赋予你情绪价值的一个小伙伴。简单的输入一段大白话,他就可以生存出你想要的形象,并给到每一个动作。这里的话给你们示范一遍,我们只需要点击左上角点击插件,然后有个技能,在搜索栏搜索 p e t, 他 就可以出来这个插件,然后我们只要安装即可。 在第二框斜杠 p e t。 选择刚刚下载的技能,注入你想要创建的一个形象人物,点击即可。当 codex 开始干活的时候,他不会只是傻站着,而是会在桌面上显示当前的一个状态,也就是说你先去写文档啊,刷网页啊,或者改代码,他还是会在旁边提醒你现在他在干嘛, 运行的一个状态都是实时给你显示出来。等他把你们的捉虫形象定制好之后,我们退回到桌面重新启动,点击左下角的设置 显示外观。最下方就是我们做的一个宠物了,这里有 codex 自带的一个宠物,你们可以直接选择也行。然后下方就是我们定做的一个捉宠了,选择回到对话框斜杠宠物,它就可以直接唤醒。还小还小还小还小!这样的捉迷宠物你会想养一只吗?

我奉劝所有还没有装 codex 的 人,千万不要装 codex, 为什么?因为你一旦装了之后,你发现你根本离不开他,我给你看一下这玩意多恐 怖,他居然用了两分钟时间给我做了一个直播复盘的系统,这东西特别简单,未来可以把你的行业做成个系统,你做你的团队管理,做你的业务交付,都可以用到,给大家去展示一下具体的 流程,这里面有直播的工作台,有四个功能,原创直播稿、访写直播稿、直播数据分析、成交数据复盘。可以点新建项目,新建一个直播项目组,我点开始访写,就可以把同行的直播稿直接传进去,让他去进行访写,他就会进行运行。我访写这个提示词之前做这么一个系统,找 外包的话可能花个几万块钱,但是 codex 基本上可以一键出了,为什么说基本呢?因为有些小功能还需要在模拟。给大家看一下我跟他调用的过程其实非常简单,我把他的需求标装了一下, 告诉他这该怎么做,而且我前置给他做了一张系统的图片,让他根据图片来做系统一步步的推出里面的一个功能。未来呢,就像小孩搭乐高积木一样,一个一个功能栏,一个一个去跟他做,把这个系统整个完善,最后接一个云的服务器,或者接个 api, 我 就可以直接去用了。 未来一个人就是一家公司,我把我怎么去用 codex 的 具体流程分享给大家。评论区回 ai 两个字我来安排。最近我对一句话特别的上头,未来淘汰我们的永远不是 ai, 是 那些会用 ai 的 人逐步在淘汰那些不会用 ai 的 人,你觉得呢?

今天我才发现, codex 不 仅能写代码,还能做视频,简直太丝滑了。首先在 codex 的 插件市场安装 hyperframes 插件, 然后告诉他你想生成怎样的视频,他就会自动写文案,自动配音,自动添加背景音乐,只需要几分钟就能做出一个高质量的宣传片,全程你只需要点确定确定就行了。

一定要,一定要,一定要想尽一切办法用上 codex, 至少我不允许我的粉丝还没有用上 codex 或者 cloud code。 如果你跟你周围的朋友从来没有谈论过 codex、 cloud code 或者 java, 那 恭喜你,你刷到这条视频可能就是你改变命运的机会。 那有人问 codex 到底是什么东西呢?官方给他的定义就是 gbd 下面的一个编程助手。但是如果你真的这么理解,那你太小看他了。 华人勋现在让因为他所有的员工都要使用 codex, 这可是全球市值最高公司,老板都要让他员工使用它,那为什么呢?因为他就是未来财富的密码。你最近看了这么多新闻,什么纳斯达克又来创新高了,恒大股市又涨疯了,存 储芯片又缺货了,这么多乱七八糟的新闻,其实都在讲述同样一个故事,而这个故事的源头呢,就是因为这几个东西。 卡罗拉的扣的对于大部分人来说门槛还是有点高的。 g m 来体验呢,我感觉还不是特别友好。而如果你两个月前问我扣贷,我可能还会犹豫,但是这两个月以来,它几乎每天都在更新, 甚至有段时间天天都在更新,到现在扣贷能力真的是很爆了,它就是目前最适合普通人上手的 ai 工具了。如果你现在是大学生或者二十多岁,那你太幸运了, 你刚刚进入社会,就迎来了一个弯道超车的机会,它就像是你在食堂打饭排队的时候,突然在旁边开了一个新的窗口,这个时候你最应该做的就是赶快跑到新窗口去打饭。

大家好,欢迎回来,本期视频将给大家分享两个事情,第一个就是我们会去参加二零二六年的上海人工智能大会,那我们这里主要做了一款医学影像的一个鉴别工具,那主要是在做照影机渗漏和脑出血的一个鉴别诊断。 那第二个就是,呃,让大家通过那个 codex, 然后接入到我们的这个微信啊,那这是两个事情, 之前给大家分享过,通过我们的这个智能体系统,它其实已经可以啊,点击发布渠道,然后个人微信号在这里进行扫码登录了,就是已经可以让微信接入到智能体系统了。那今天这视频先给大家分享,就是如何接入到 cortex, 那接入到 codex, 这里引用的是一个开源项目,叫 codexbridge, 那 我们只需要怎么做呢?只需要把这一个链接啊,然后发给我们的 codex 啊,让他看一看这个项目,然后告诉他我需要对接个人微信。那这个时候我们发给我们的 codex 啊,这个时候它就会自动地去啊,处理这一个项目里面的内容,然后给出一张二维码,然后你扫码,然后进行登录就好。 那这是啊,他的一个事情,那第二个事情我们这个就可以暂时放在这就不管他。那第二个事情就是我们这一次参加上海的这个啊,人工智能大会,大家也可以啊,在网上搜啊,就是二零二六 啊,上海人工智能大会如何报名啊?这里是有具体的事情的,那我们可以点进去看一下, 应该啊,应该就是这个,然后他有具体的一个啊,参展的一些著名报啊,报名注册的一些信息,大家可以来玩一玩啊,具体的时间应该是在七月三号到七月六号啊, 然后大家可以安排一下自己的行程,然后去看一下目前大家在做哪些事情,特别是在人工智能领域。 ok, 那 我们给大家分享的就是我们现在在做的一个项目,就是使用 context 还有 cloud code 啊这两个东西。在啊分享的,我把这个 app 先打开来 啊,这是啊,这里正在跑的一个深度学习的一个东西,然后我这边是怎么用的呢?就是,呃,用 cloud code, 然后跑了一遍,然后再让 codex 在 这里做了一些任务, 然后他提出了他的问题,提出了 cloud 的 问题,然后反过来用 context 做一次验证,那 context 有 问题呢?就正好问 cloud 啊它里面的这些一些事情,然后这两个两边的模型是不一样的,这边用的模型是 open ai 的 五点五,那边用的是 office 四点七,就是 cloud 的 一个模型。 那好,我们看一下啊这个项目吧,比如这是一张头颅 ct, 然后这是张,呃,我们在医学里面就是临床里面的一张图像,它是急性缺血性促中的一个患者,然后做了一个介入治疗,介入治疗之后,这里可以看到一些高信号的一个表针, 那我们是不知道这个时候它到底是脑出血还是照相机渗漏的,就是人眼是很难去分辨的。当然有一些临床啊特征,比如它的一个走形,一个分布,然后它的一个 ct 值 啊,和我们的一个脑出血,可以做到一定的鉴别,但是并不能很好的做出一个分辨,因为它的灰度啊,我们肉眼很难去啊,做一眼望过去就能解决这个问题。所以说 这里就借助啊深度学习以及一些传统主学的一些方法,然后去做一个鉴别啊,它的意义在于什么呢?就是我们急性缺血性促充,我们都知道啊, time is brain, 就是 说 六个小时,对吧?那那个时候可能你这个溶栓啊,这些东西都很重要,你把啊这个栓子给它溶通了,那你的血管再通,那你的瘀后就是还可以的, 那如果是没有通的,那一般会去做桥接的一个曲酸,就是做一个血管啊,要么放支架,要么球囊扩张这些操作,然后就把那个血管再做一个开通,那开通之后它也能够去改善啊,术后的 这一身是在呃文献或者说已经是在全球广泛开展的一个医疗技术。但是问题就在于,嗯,我们这一个呃东西做完了之后啊,就是他会出现这一个呃表征啊,这个东西他不太好去区分他到底是脑出血,还是说我们做介入的那个造影剂, 那这就会影响到我们下一步啊,是否要给抗血小板药,就如果你是脑梗,那我给抗血小板药,就算你通了,我也要给抗血小板药,因为我要防止你再次发生脑梗, 然后出现啊院内的二次附中,这是一个事情,这也是有文献啊去支持的,那反过来就是如果这个地方是已经有出血转化了, 那如果我们再给啊抗血小板的药物,那某种程度上就会加重他的一个出血风险,那这个时候并不是说啊去防止他的一个啊再次脑梗,这个时候反而要防止他啊再次出现一个啊出血转化,或者说脑出血 啊,这个时候的危害会比啊在臂的那个危害要大,所以说这个时候就会直接影响到临床的一个治疗。那我们曲酸结束了之后啊,其实这个时候会去常规频扫一个 ct, 那 扫完 ct 之后就是大概一个这样的一个 ct 图, 那我们没有办法去区分的时候,其实在临床上就不太好操作啊,我们就不知道这个时候到底是说我们去用抗血小板,还是说我们不用然后观察 啊?这个时候临床上一般啊,如果是没有这一个高信号的,那我们就认为他是啊在通了没有出血,那这个时候一般会给那些替罗非班这些操作啊,因为替罗非班断续期比较短,他很快就可以代谢完,就是如果他出现那个出血的东西,他也可以立马停,这就是为什么 啊,会很多临床上会用一些啊替洛非班来去解决这个问题。那还有一个就是做完了手术之后,一般就是术后四十八小时,他都会再复查一个 ct, 那 如果是脑出血呢?其实啊,他就啊 这个高信号它会一直会在那,如果不是脑出血,它只是一个简单的造影剂渗漏,那这个地方它就会被我们的脑组织正常的进行一个吸收代谢啊,因为我们脑脊液有一个循环嘛,那这个地方很快就会被吸收代谢完, 那这里就看不到这个高信号,所以说,呃,我们的金标准是有的,只能说是内金标准啊。当然 有一些比较高端的医院,它里面有一些像双能 ct 的 一个操作,双人 ct 它可以去很好的解决这个问题,它可以看出啊,到这到底是血红蛋白,还是说啊它就是一些造影剂。但是问题就在于双能 ct 在 全球的一个普及程度还是非常低的 啊,在我们国内非常好的三甲医院啊,也是只有头部的那几家,它可能会配备双能 ct, 而且做双能 ct 它的那个成本也是更高一些的, 所以说某种程度上来讲,不管从设备还是从普及程度来看啊,这都是一个很长要走的路。那现在我们已经有 ai 有 深度学习这一个框架了, 那我们现在可以借助 ai, 可以 借助各种啊深度学习算法或者说 transform 的 架构,然后去训练一个模型出来,就是以后可以方便临床医生,就我上传一张啊影像的图片,它就能很快的帮我们识别出来啊,这个到底是造影剂深入还是脑出血, 那识别出来的作用就很直观啊,就可以指导临床医生,你是否是要给抗血药板药,还是说你要控制血压,防止烫脑出血 啊?这是啊完全不同的治疗的两个方向,这也会直接影响到患者的一个预后,所以说它的临床价值以及从啊临床的转化,或者说 ai 到应用的一个转化来讲,逻辑是非常啊通的。 但是问题就在于啊,需要一些非常高质量的数据,然后去完善这个工作,所以说我们也和一些医疗机构做了一些合作,然后拿到了相关的一些影像数据啊,这也是我们这一次参加这个大会要做的一个应用展示。 好,这是第一个事情啊,我们回来啊,回来看一下,这是这边正在对接这个 codex, 然后要对接微信嘛,然后让他完成这个工作。那好,我们看了刚才的那个数据,其实我这里有非常多的一个数据在这 就是每一张图里面比,比如这个,这个就是我们肉眼其实能发现啊,这个其实大概率就是一个脑出血嘛,他的不管是从形状上还是那些,这个是比较好判断的,那刚才那个其实不太好判断,对吧? 啊?其实大家也可以看出来,其实肉眼也有一些啊,区别,他到底是脑出血还是脑梗塞,但是难就难在于有时候不好判断的时候,你不知道怎么去做啊,这个时候会影响到患者的一个预后,所以说我们想通过一些算法,然后去优化这个啊识别的工具啊。 好,这是啊一个事情,当然啊,大家感兴趣的话可以来参加一下这个二零二六的上海人工智能大会啊,这里没有广告,这里没有广告。 ok, 好的,那后面后续的一个进展也会给大家做一个汇报,那这是 codex, 我 们待会儿可以看一下,它待会儿做完之后就是一个,呃,一个二维码,你扫二维码就可以对接上你的 codex, 然后你就可以在你的微信里面跟 codex 进行沟通啊, 大家可以看到整个啊 codex 跟 chatg p 不 一样的地方啊,就在于它是一个 agent, 它是一个编程 agent, 当时当然它的功能远不止是一个编程的功能,它有非常强大的一个能力啊。 呃,除此之外啊,上次给大家分享的就是这一个内容,我们用的那个框架,用了开源的那个 moai 的 一个架构,它背后是英伟达的显卡做一个训练, 当然里面的具体的一些算法啊,大家可以也不需要掌握那么详细啊。右边这一个中间这个图给大家讲一下吧,它就是一个啊 ct 值,那我们 ct 值它这里分了几个,比如我们这个啊,绿色这一块啊,我们就认为它是脑窗, 然后啊中值这里有个密度啊,就是这外面这一圈嘛,就是我们的颅骨,那它的信号是比较高的,它会大于三百 啊,所以说这边的数据就是其实是我们不在意的研究对象,我们研究对象就是脑窗嘛,所以说通过这个其实是做了一层筛选的,就是有时候他们勾画的不好,或者说他们把这个颅骨勾画进去了,那这个时候其实会影响到数据的质量, 所以说在这个层面上来讲,通过这一个呃 flag 的 一个东西,然后看能不能剔除掉这些啊,比较质量差的数据啊。当然这个其实很取决于就是临床医生对于这一个疾病的一个判断嘛,就是你的勾画啊, 但这个其实比较简单,你因为你只要有那个高信号,你就直接画就好了,所以说基本数据质量上来看,没有太大的一个问题。 好了,现在这里已经配置完成了,我们来看一下,他已经把个人微信接到了 context 主链路,然后下面是他具体写的一些东西啊,我们可以大致看一下,然后这里是他接入的方法, 我们主要是第一个是打开这个 power shell 啊,我们可以右键这个 win 的 开始,我是 win 十一,那如果你是那个以前的那些系统,你可能要啊输入一下啊, win 加 r, 进入 cmd 吧。 win 加 r, 然后输入 cmd, 然后按回车点确认 啊,你可能需要这么进入,进入到这一个界面来啊,你是 win 十一之前的一个小伙伴,这么进入,那如果你是 win 十一的话,你就直接右键,然后管理员然后进来就可以了。 ok, 那 我们进到这里来之后呢,我们需要啊输入这些命令啊,就直接复制这一个啊东西,然后填入进来, 然后他会告诉我,他生成了一张二维码,然后我们可以打开这一个二维码,这个是二维码的链接,上面是张图片的啊,二维码图片,我们只需要打开这一个链接啊, 输入进来,然后这里有一个二维码,我们通过微信扫一下这个二维码,就可以完成一个对接。好,那我们好再回来,回来我们看一下啊, 那我们现在还需要做一个,就是把这个启动桥做一个链接,那大家可以看一下这个命令啊,这里是指定你的那个操作的项目目录,那如果你不知道你的项目目录的话,你就输前面的 啊,如果你知道的话,你就把这个路径改成你的那个啊,本地的那个项目文件的路径就可以了,那我们把这一个就输这个吧, 然后输入进来,按回车啊,这个时候它就会自动的进行启动啊,启动这个微信的这个桥,这个时候我们把这个终端就放在这里,就不要动了啊,这个时候我们就可以控制 ctrl x, 然后去完成一些任务了。那我先来微信里面发一些信息,比如你好, 那当然这里应该也会有相关的回复啊,这里发了一个你好,那他就会自动的啊,然后回回答你,那微信这边也收到了这一个,就是你好,我在需要帮你查资料、写东西还是改代码,一起处理一些文件啊?这是他在我微信上发的这个信息, 然后还有一些,比如其他的一些命令,比如杠六反斜杠杠六,他就会开一个新的聊天, 然后啊,我的手机里面是说它已经创建了新的 bridge 绘画,那我们可以在这里输一个,比如说你好, 然后 context 就 给了我相关的回复,那这里如果你没有看到啊它的回复的话怎么办呢?就是你可能需要退出一下你的 context, 重新打开这里就会有这条记录了,那我们可以啊,应该啊,这是之前的对接微信啊,这是刚才的那个吧, 改代码还是处理别的事情,对吧?应该是之前的,我们把这两个先归档一下, 确认确认好我们退出啊,这里就是刚才我发这个,你好嘛,就是出来了,就是他在 context 里面也会有去对对应的这个记录啊,所以说你通过微信然后发语音也是可以的。 请问比如我长按一下,长按一下这个录音,请问今天是星期几? 然后把这个录音结果直接发给 context 也可以啊,你直接发语音就行了,不需要,就是转成文字,它是支持语音自动识别,然后去处理你的内容的, 那比如他这里已经回复我了,他是二零二六年五月十二号, ok, 没有问题。那你的 context 就 跟微信做了一个对接嘛?那他同样的所有的信息都会在你的 context 电脑上有一个显示,你也可以使用 context 去控制你的电脑,去啊写一些东西, 所以说这就是呃, context 接入微信的一个全部教程。好的,这就是本期视频,我想分享给大家的全部内容,谢谢大家。

兄弟们, codex 这次更新实在是太给力了,他从一个单纯写代码的工具,一夜之间就进化成了可以操作你整台电脑的狠角色了。就在昨天晚上, codex 迎来了一次重大的升级, 这个被每周超过三百万开发者使用的超级开发工具,终于不满足于指示去写代码了,他直接变成你的数字工作伙伴,能够陪你一直把活干完。 这次的更新让它的能力更强了,它能自己看屏幕、自己动鼠标、自己敲键盘,而且在 mac 上它还可以同时抛好几个 a 阵,而且完全不会抢你现在正在用的窗口,乖的一批, 那些还没有给 c r i 和 a p i 的 老古董软件们,以前把所有的 agent 都整的抓狂,现在的酷币直接像真人一样上手操作,想干啥干啥。而且桌面 app 里还内置了一个浏览器,你可以在网页上直接圈圈点点,划箭头,标注给 agent 下命令。 我觉得这个对前台开发和游戏的调试简直不要更方便了,更觉得是它把图像生成的功能也彻底打通了。这不,最近 opi 刚刚更新了他们的图像模型,做产业概念图、 ui 设计稿、游戏素材,全部都能和写代码无缝的连接,在同一个流程里全部搞定,效率直接起飞。 除此之外,这次更新还狂甩出来九十多个插件,把 gera、 gitlab、 微软全家桶等等的一堆硬核工具全部接了进来。桌面 app 也做了很多升级,能直接处理 gitlab 的 review, 多终端的标签页,还有最重要的,我最需要的 sfs 连接远程的开发机真的不要太香。最后再说说我认为的两个王炸功能, 一个就是超级记忆,之前龙虾之所以火爆是因为它有了 memory, 而这次 codex 升级明显在这方面增强了很多。它会牢牢地记住你所有的偏好,你每次骂它的纠正,你花了很久的时间喂它的上下文以后再做这样的实验,它直接秒懂,不用你每次像家长一样训 它。第二个玩大功能就是自我编排,它居然能够给自己安排未来的任务。几天后或是几周后,它会自己醒来,继续推进那些你长期没有搞完的事。而且它们内部团队已经在用它来去追踪 slack gmail notion 里所有没有收尾的烂摊子了。这个已经就不是助手了,简直就是一个数字的打工人啊!更新我已经收到了,而且彻底上头了,你们呢?准备好被扣袋子卷死,还是准备让他帮你去卷死别人呢?

讲,我本来是 codex 让我自己审核这一块他抽出来的工作有没有问题,然后现在 codex 的 功能就是这个多智能体,就是我可以设置好几个智能体,他们可以自己协助,有人充当干活的人, 有人充当监督的有人,然后有人充当监督监督的那个人的人,然后有人给我进行下一步指令的人,有人给我规划局的人,就是我审查,我审查个蛋,我就负责批准。

如果你还没用上最新的 openid codex, 一定要去用啊,真的太牛逼了啊!大家如果看过之前这个豆包手机啊,你跟他指令,然后他操作你手机那些视频的话,那你今天就想象一下这个流程直接被翻译到电脑上了 啊,这抠代码。现在你跟他说一个东西,他可以直接打开你电脑的应用程序,你就能看他的这个光标在移动,然后直接就在你的应用程序里面进行操作了,非常非常牛逼啊。这个从日常的一些打开邮件,处理邮件,然后他可以扮演一个角色,然后他跟你的同事对话, 呃,再到打开什么这个剪视频的软件,他能直接操作你的电脑来完成。我不再是像之前别的 ai 一 阵他都是打开一个啊这个 服务器,然后在里面去操作很多东西他不知道,现在就直接在你的本地端操作了。而且他比这个 cloud 做的更牛逼的地方在于, cloud 可能更多还是停留在一个工程的感觉上啊,他不能打开你的应用程序去做啊,但是这个 codex 你 是能看着他直接光标在移动的,这个感觉是非常爽的啊,要记着这个体验是要比这个小龙虾好很多的,而且他在关键的需要确认隐私地方,他会停止住, 如果他觉得这个任务可能侵犯到你的本地隐私,他直接就告诉你,对不起,这个事我做不了,可能有些啊影响到你的隐私数据了,所以这块呢,还是可以安全放心的去使用的啊。自从他们这个 code red 啊就是红色警报之后啊,这个升级迭代速度是非常的快啊,不再像曾经一样被人嘲笑说 cloud 和我 jimmy 都做的比他好了。这场事情已经啊, 我相信未来几个月还有大动作啊,之前图像模型升级之后啊,三个月以后这面呢就有大动作了。 gbt 我 觉得也是一样的,非常期待下 gbt 六 啊。我觉得他们最近的这个更新已经越来越让我看到 agi 时刻的接近了。我是志远,如果这期视频对你有所帮助的话,记得点关点赞分享给你,觉得会有收获的朋友们,下期视频见。