这二六年的国摩天花板的备选,无限系的新品芬丽尔是名副其实还是浪得虚名呢,跟我一起来看看吧, 本期内就老样子安排给粉丝先吃,那评论钓台右上角的原始股东友友们支持一下,左下角的推荐走一走,上期的掉落呢在结尾,今天呢给大家带来的是无限系的芬丽尔 rmd 的 系列款,一比七十二的比 的拼装模型,整体的外包装呢,其实对比其他的国模呢是比较薄的,那整体的盒子呢,有着玩法的说明,我们可以打开包装就可以看到一张闪会的背景板,我们直接快速的取下板件,带 模型的关键关节呢,都是破木的材质,三十四块板件,一块地台,整体的板件数量如果放在现在量大管饱的国模里肯定是不够看的,但是我们还是要看整体的模型素质表现,那说明书呢,有全彩,有取件表, 那这是部分颜色的板件,让大家预览一下, 也有一体形成的可动手。 这个红色板件呢,我需要改一个红色的金属漆,那刚好用上迪斯派新品的水性金属漆,都是预调好的颜色,摇匀了就可以直接喷涂了。整体的喷涂的顺滑程度呢,也是比较丝滑的,漆面发色也很不错,有喷涂的条件的兄弟们也可以去试一试。 现在是整体零件的拼装预览,整体分为骨架和外甲,是分开组装的,组合度呢是这几年国模少有的丝滑,这点绝对是好评啊。 换件上呢,你现在看的就是芬利尔的骨架部分,整体的比例呢是非常饱满的,金属漆面呢表现的很不错,这里的红色呢,我是自己上了金属红,那大家不做参考,其他的表现呢,还是非常不错的。 腿部的可动细节呢,是非常性感的,左右呢也有着联动,那现在你看到的就是整体分离耳的全部内容。头部的可动呢很优秀, 有着独立的小型战机,也有着部分可动。驾驶舱是可以打开的,可以用战机后面的连接口与主体连接。胸部的两处窗口是可以打开,左右的可动也有着联动,背后的喷气口也可以展开。 臂甲呢有着多处可动,也有着展开的连动。手臂呢有着多处活动关节,屈臂大于九十度可动,优秀。臂甲呢也有着展开的玩法, 拳可动手呢也非常的利索。胯部的窗口呢可以打开的,有着多处的可动,展现。 腿部的关节呢,因为有着拉伸关节,活动范围很高。屈膝大于九十度可动,优秀脚步有三处活动关节,腿部上有多处的小细节可以打开。 在配件部分呢,复合猎枪有着多处的可玩度,子弹可以拆卸,炮口是可以展开的。 机械臂上多处可动范围,五个爪钩可以展开,也可以安装复合猎枪 软件是武器,也是芬利尔的尾巴,那可以安装在芬利尔的胯部上,拿出配刀,也可以与配刀合体为斩剑。最后的种植中呢,就是这个喷气大剑,那可以展开,也可以放入长刀,用锁扣关节锁住,这个设计真的是太美妙了, 大家也可以看看这一款芬利尔与上一款的复仇女神的对比。 在有趣点的总结环节上,本次呢给大家带来的无限息芬丽尔绝对是这几年的国模把玩手感上是最好的,可玩性很高的国模,我是可以给到很高的评价的。在摆造型的时候呢,整体的活动呢是很方便的,而且呢可动呢都很利索,是深有体会的。附赠的地台呢,也有 pop 键的支撑和稳固。 首先说他是二六年的国摩天花板是没有任何问题的,很推荐大家去感受一下这款模型的设计,很多武器有着小锁扣的细节,未来无限系的路已经走宽了,那设计呢,是在线的,不是为了出现而出现的产品。那当然呢,也有着我最难崩的缺点,这点真的是非常致命的,那就是水贴, 水贴真的是太垃圾了,我从来没有这么说过一款模型,那大家一定要上小蓝屏,那我上了消光,这个都是边玩水贴边掉,玩到最后快要把模型完成宿主了,这么好的模型设计,这个拉胯的水贴真的是不合适。那好了,那以上的全是我的玩下来的整体感受, 如果你也喜欢这款模型的外观,我还是很推荐你去玩玩看的是款很不错的产品。 那么上一局掉落,恭喜这位粉丝与队友对讲没有获得,兄妹你也别急,我们也会不小心掉落,我们要保证我们兄妹吃好喝好,保好继续成为虫虫。那以上全是我个人把关点好的模型呢,需要你亲自喜欢,好的模型 需要你亲自把,本期视频呢,需要帮大家视频做一遍,如果你对这款模型还有任何疑问,或者想要练骨的希希欢迎在评论留言交流,再点小小赞,谢谢大家,我是麦坊,我们下次再见。
粉丝1.6万获赞17.8万

就在今天凌晨, oppo i 刚刚发布了 gpt 五点四,本来是准备入睡的,那我养的小龙虾给我推了一条更新消息,于是乎直接把睡衣换了,直接开干。那今天的话,花几分钟时间讲清楚它到底升级了什么,再附带一个编程实测。 好,下面我们看一下它的五大核心升级。第一个是上下文窗口,由原来的五百 k 变成了 em, 这一个的话对于你去做一些 长任务,复杂任务有很大的帮助。那第二个的话就是操作电脑的能力也增强了,那这个的话桌面端的 q d agent 也会有很大的帮助。第三个的话,就在恰点 g p 它这个聊天应用中原来的思考过程嘛,就它的 sync 你 是不能去中途去修改的,现在你可以随时打断 补充需求,调整方向。第四点的话,它是有一个更高的托管效率以及更快的响应,响应这块的话我刚刚用 q d x 去实测了,确实是有提升。 那第五个的话,就是它把 codex 的 能力直接合并到了这个 gpt 五点四这个模型里面,什么意思呢?意味着后续是没有 gpt 五点四 codex 的, 直接是 gpt 五点四一个模型就搞定了, 不要像原来那样搞得比较乱。而且现在它新增了一个 fast 的 mini, 我 刚也试了,这个 mini 让你的整个编码速度提升的特别快, 但是你的消耗也是成两倍的一个增长。下面我们来看一下它整体的一个跑分情况,跟几家模型对比来看的话,提升不是特别明显,但是也有一些排到了第一。那跑分的话,其实我们就稍微去看一下就行了,因为 你真实的,不管你在编程实战还是他接触到 a 技能里面,还是在看实际中的表现嘛,对不对?我们直接到编程实战环节,还是同样的 prom 哈,如果熟悉我的老粉都知道这两个项目,在这一次不管是国内的顶尖模型还是国外的顶尖模型,我们都拿这两个项目去做测试同样的 prom。 然后这一个项目是稍微比较复杂的,国内的模型的话它没有做到一次性去把整个任务完成,那国外的模型的话, cloud off 四点六以及 g p 五点三, codex 它做到了,但是 jimmy 三点一 pro 它没有做到,第二个它会稍微比较简单一点。好,我们来开始实测,这次我用的是 codex 这个 app 上去做实测啊,提示词也是跟之前测试是一样的, 并且我们开启了这个 fast 模式,也就说它的整个速度是比较快。对于这个比较复杂的项目啊,就是我们把这个图片 a 帧的项目加上一个认证体系,从另外的项目里面迁移过来,并且做了一个落地页,也是之前那几期视频有测过的。我们来看一下它一个完成结果, 总共是做了三十二个文件的一个修改代码,行数是三千多行,从这个也能看出来,整个任务其实是比较复杂的,他的上下文都快跑满了。我们来看第二个项目,就是给这个 skills agent 是 一个终端 ui 嘛,给他加一个呃,外部 ui 也是一个考验他权重的能力,这个的话他改了十八个文件,大概是两千多行代码, 下面我们来看评分结果,我们来看第一个项目是跨项目迁移认证体系,也就是说给这个图片 a 镜头加一些功能嘛,从另外一个项目里面迁移过来,整体的评分标准是来自于两个,第一个是我人工去看它整个功能的完整程度,第二个是我们把它四个项目所做的代码 用顶尖模型去互相 review, 最终得出来一个评分。那整体看的话,这一次 g p t 五点四,它在这个项目上它的表现是比 oppo 四点六要好的,但是在 g p t 五点三 q max 的 时候的话,它是没有 oppo 四点六好的。 ok, 那 接下来三点一 pro 的 话,它是最差的。 好,我们来看第二个项目的一个评分,就是给这个 skills agent 加上一个终端 ui, 考验它权重的能力,那这块的评分的话,其实它给的有点保守了,为什么呢?因为 给我的一个体感哈,就是它这块的一个 ui 比上一次还要好,但是因为它这块没有去体现 ui 嘛,所以说它的评分的话稍微有点落后,但体感的话是更快, ui 更好了,那代码质量的话, a l u 之后的话是没有这个好的好。我们回过头来进行一个总结,我觉得这次最大的亮点哈,就是第一个, 这个上下文窗口变长了。第二个就是他这个快速模式非常非常有用,如果经常用 codex 的 朋友的话,就应该知道他之前是特别慢嘛,那你用这个 fast 这一个命令之后哈, 他的速度确实比之前快了,但是你的消耗也更快了,那这样子就会对 codex 的 会有更大的冲击,因为之前我几期视频就说过, codex 的 不再成为我单独的一个 coding 的 选择,现在就是我在 codex, 然后 codex 的 互相来回去切换,甚至有时候我还会用那个 open code 再加上欧曼 open code 结合起来去做扣顶开发。好,这就是本期视频的全部内容了,如果你觉得视频做的不错,可以给我一箭三连,大家拜拜。拜拜。

一分钟看完一周 ai 大 事。 google 上线 ai 狼人杀,八个大模型在线标系互相套话。 jameson 靠硬核推理夺冠,龙虾 a 阵的含金量还在上升。 ai 雇佣人类平台爆火, 龙虾在线摇人,真人立即接单去跑腿溜狗搬东西,二十万人类注册排队接单。以前是 ai 给人类打工,现在 ai 是 甲方爸爸,龙虾不仅能雇佣人类,还能雇佣同类 ai 雇佣 ai 平台爆火, 龙虾发布外包任务,多个龙虾接单做方案,再由龙虾评选出最优解,赢得赏金,全程禁止人类参与。 龙虾相亲平台爆火,你的龙虾替你找对象做进调测,三观,双方的龙虾聊对眼了才能解锁真人聊天,你能不能找到真爱,龙虾说了算。全球开发者正在用龙虾的逻辑把所有互联网产品重做一遍。 throwback 发布最强大模型 agi 测试和人类盲测拿下第一,主打一百万上下文,与智能体组团干活,不仅能做数据透视表,还能套模板做 ppt。 open ai 发布最强编码模型,编程跑分反超 cloud。 open ai 称这是第一款自己参与创造自己的模型。 ai 迈入自我净化时代。 open ai 推出 codex 桌面版,支持安装 m、 c、 p 和技能包,能同时指挥多个 agent 干活,不仅能用来写代码,还能写小说、画图分 分析数据,产品均五星推荐。奥特曼官宣 ai 接班人计划, agi 已基本达成, open ai 的 管理权将逐步移交给 ai, 以后员工要向 ai 汇报工作。智谱开源最强 ocr 模型,医生手写也能识别,可在本地运行。 hixfield 上线动效视频,动动嘴就能生成 mg 动画,不会 ae 也能做动效字节!发布最强视频模型,能复刻任意视频的运镜动作、人物和声音。 腾讯推出能互动的数字人模型,一句话就能让数字人展示物品,做出特定手势,终结了数字人只能站桩口播。研究员开源对象移除视频模型,不仅能移除视频中的物体,还能移除光影残留,还支持高质量抠像。 研究员开源运动参考模型,能完美复刻任意对象的运动轨迹。研究员开源无痕编辑视频模型,通过时空补全,任意篡改说话的内容,没说过的话也能毫无破绽的说出来。好处是能用来修复口误,坏处是有视频 真相。 stepfun 发布最强开源音乐模型 roblox, 推出四 d 模型,一句话就能生成带物理属性和交互代码的三 d 资产,可零发布三 d 动作复刻模型,不仅能迁移角色动作,还能同时控制镜头运动字节。开源最强分子预测模型, 跑分超过 alpha fold。 谷歌开源论文配图 ai 使用五个智能体协作为技术论文自动生成图标和流程图, 可读性、准确性和美观程度都吊打人类。研究生狠狠马住 rain 上线。 ai 寻狗,上传丢失的宠物照片。 ai 能解锁附近所有门铃的摄像头画面组成天王找回毛孩子。

为什么我说现在就是你开始 vaping 的 最佳时机?因为现在开始的成本真的很低。 openai 的 创始人 sam ottoman 在 推向上宣布,他家旗下的 codex 能免费用了,而且免费的不是什么渣渣模型,而是 openai 最新的 gpt 五点三。 codex 速度更快,逻辑更强,完全不输隔壁添加了 cloud ops 四点六,那我已经深度使用一个月了,并且已经手搓上线了自己的产品。那么这期视频我们一起来学习一下如何正确使用 codex, 开启你的 web coding 旅程。 给还不了解 codex 的 同学简单介绍一下, codex 是 open ai 旗下的编程智能体,而隔壁 cloud code 是 同一种产品,有了 codex, 再加上 gpt 五点三的模型,就可以愉快的编程了。 一般人看到黑底白字的命令行界面估计就被劝退了。别担心, codex 不是 硬核的即刻工具,它有正儿八经的图形界面,官网下载、安装、登录一气呵成,没有什么要你做的复杂配置, 接下来的内容很关键,你要搞清楚两个概念,工作区和 thread 工作区。你可以理解为你的项目文件夹,比如你想做一个网站, 先建立好文件夹之后,所有的代码文件都会保存在这里。而 thread 就是 一个个的聊天窗,这些聊天窗就是 一个个的任务线。这里有个黄金法则,大家一定要记住,不同的任务要开不同的 thread, 千万别在一个窗口,一会让它改 bug, 一 会让它写新功能。另外你也不用傻,等任务完成,你可以同时开多个 thread, 同时处理多个任务,效率直接起飞。前段时间爆火的 skills 在 codex 里直接格式化了,内置了几十种的 skills, 鼠标点点就能安装了。这些 skills 能让你的 agent 如虎添翼,关键省去了繁琐的搜索和安装过程。 最后分享一点个人使用心得。上一个视频里我推荐了谷歌的 anti gravity, 其实这两个产品你可以一起用,把 codex 的 插件装在了 anti gravity 里面,这样你可以同 同时要用多个模型,比如让 g p t 五点三改 back, 让 jammer 做前端,让 cloud 出方案,不用切屏,不用复制粘贴,一个界面汇集世界上最好的三种模型帮你干活。这套 web coding 的 形态, 你值得拥有。以上就是本期视频的所有内容,欢迎关注艾伦,二零二六年,我会持续创作更多 web coding 和 ai 工作流的相关内容,我们下期再见。

前两天我做过一期视频,用同样的 prompt, 同样的真实项目任务实测,对比了 cloud ops 四点六和 gpt 五点三 codex 那 期视频做完之后,评论区有人问 国产模型能不能也拉进来比一下,这次机会来了,这一期视频我要做两件事情,第一个,把上期那两道编程题原封不动的丢给 mini max m 二点五,看看它在同一张考卷上能拿多少分。 第二个的话,我有一个自己一直在用的自媒体 agent 的 项目,之前跑的是 mini max m 二点一,这一次直接升级到 mini max m 二点五,看看他在真实的一个生产电路里面升级到底带来了什么。看过我视频的人都知道哈,我做评测比较关注模型,他在一个真实任务里面的一个表现。 好,我们正式进入编程实测环节,我直接附用之前的两道题, prompt 一 字不改。第一道题的话,是把一个项目里面完整的一个认证用户体系 直接迁移到我有一个图片生成的一个 agent 的 项目里面去,同时再让它做一个落地页,需要考验它对于另外一个项目的一个代码理解能力,架构适配能力以及一些工程规范。 那第二个项目的话,我以本地有一个 skills agent, 之前是做的是终端 ui 的 一个部分,那这一次的话,我希望把它升级成外部 ui, 并且它要保留 string 工具调用流逝输出的一个完整链路,这个就考验它的一个全栈开发能力,以及它的 sse 流逝输出,还有 ui 方面的一些交互。 上期的成绩是 cloud op 四点六和 gpt 五点三勾代码各赢一局,那这一次我们把 mini max m 二点五加进来,看一看它的结果怎么样? 好,开始测试,两个一起弄,可以看到右边这个它识别到我们要做的是一个全单元 y, 它去加载的那个 front designer 这个 skill, 那左边这个项目的话,他发现他是需要去探索已有的项目,去找到那边是怎么做 get up 登录,怎么做谷歌邮箱登录的。先去探索嘛,先去开 saf 界面的探索, 可以看到他这边已经构建成功了,现在在进行一些后端跟前端的验证,整体这个过程测试下来的话,他会遇到一些变异问题,他也自己去修复了。待会等他测试完之后,我们来看一下他跟 cloud 四点六以及 gpt 五点三 codex 同样的代码,同样的提示词完成了一个效果怎么样? 那左边的话先让他一直跑,左边这个任务要重一些,可以看到这个地方他说项目已经启动了,然后他还专门创建了一个简单的启动脚本,来方便我后续去使用。之前我在测试 mini max m 二点一的时候, 有一些开发任务,前端后端写完之后,我需要手工让他去给我写一个 start 点 s h 的 脚本,这一次让你可以看到他在这个过程他自己去发现的这个行为,这一点点赞。现在他说已经完成了,我们现在开始去测试一下 这个就是他把那个终端 ui 变成了一个外部 ui 的 一个版本啊,可以看到左边他已经把我们已有的一些 skill 加载出来了,这个是没有问题的,下面我们来测试一下,给他一个任务,看他能不能去做到加载对应的 skill, 然后工具调用 simi 以及流逝输出都没有问题。好,我们开始 这个申请的过程,看起来没有问题,加载技能也还行,那看他执行命令 ok, 他 也调了对应的工具,只不过这里的这个图标他刚刚是有些问题的,这个状态是有些问题,有个小 bug。 那 整体的话,这一个过程其实已经把我们终端 u i 想要展示的东西已经展示出来,只不过有些小瑕疵。那之前那期视频的话, 也测了 cloud op 四点六跟 gpt 五点三 codex 嘛,左边是 cloud 的 模型,右边是 gpt, 当时我是把票投给了 gpt, 不 管它是从 ui 交互还是它整个功能交互上,明显 gpt 五点三 codex 要优要好一些。我们也可以来测试一下,直接给他一个链接吧,看他怎么怎么搞。 他也在申请,他也在加载技能,那明显能看到 gpt 五点三 codex, 他 做错做的要好一点,对不对? 好,下面我们开始去看他做的那个用户认证那个项目,那做用户认证迁移这个项目的话,其实比我们刚刚看到的任务其实要复杂一些,因为 他需要从另外一个项目去探索,找到想要的东西。其次他还得在这个项目里面去,在各种代码里面去找到他要在哪个地方去修改,前段是要修改哪些,后段是需要修改哪些,所以整体上他的复杂度要高一些。也可以看到他其实并没有一次性去完成这个任务,中间也报错了,我也跟他去沟通交流了, 那最终的话是跟他对话了三轮,他才把这个任务完成了。那这个任务在之前 op 四点六以及五点三 codex 测试的时候,他们是能一次性通过, 跑的时候没有问题,项目也能起起来。那 mini max m 二点五这边的话是有一些问题,我对话了三轮,然后把这个任务搞定了,我们来看一下他的一个表现。 好,我们先看左边,左边是之前 call 四点六写的落地页嘛, 光看 ui 其实没什么难度,因为这个项目主要是考察他去另外一个项目里面把后端代码找到,把对应的数据库找到,找到了之后再放到另外一个项目里面。所以说整体是需要看它的代码实现的功能,比如说这个 get up 登录可不可以,谷歌登录可不可以, 以及它的代码实现的怎么样,因为涉及到登录嘛,肯定安全性这些要考验。下面我们来看一下 mini max m 二点五它这个 ui 写的还可以的,比这两可能稍微会好一点, 那它的这一个谷歌登录跟 get up 登录的话也是 ok 的。 好,我们来试一下它这个谷歌登录 好,可以看到它,其实谷歌登录是 ok 的, 那我这个其实就是一个纹身图的一个 a 帧嘛,那它整体完成度啊,也还可以,但它不是一轮完成的,它中间有一些包的导入错误,还有些细节性的问题没有做的很到位。好,我们来一个整体的一个评分对比。 关于这个纹身图的 a 帧的项目的话, call 的 off 四点六表现优异一些,得分是八点二,那 gpt 五点三 codex 它因为漏了一些功能,所以说它评分要低一些,但是它的整个代码价格、工程规范是这三个模型里面完成的最好的。 那 mini max m 二点五这边它的得分就稍微要差一点,整个的功能完成度还 ok, ui 的 话会比它俩会好一点,但是它的代码架构跟工程规范会偏弱一些。好,下面我们开始做 agent 的 实测,把 mini max m 二点五放到 我已有的一个真实 agent 的 项目里面去,它是做自媒体视频拆解的,之前接的是 mini max m 二点一,这一次升级了, 我们重点看三件事情,第一个是速度,第二个是他的一个拆解深度,第三个的话是表达一个真实感。好,我们现在准备两个窗口,左边的话我准备用来测试 mini max m 二点一,右边的话我们测试 mini max m 二点五。 好,我这边找了一期我之前做 skill 原理讲解的视频,我们同时去点击看左边跟右边他的一个整体的一个速度以及拆解的深度,再看他的一个其他的表现。开始好,这边有点慢,但没关系,我们来看一下, 我们把这个展开,这个也展开,从这个可以看得到,它其实右边会稍微快一些哈,但是这个先不管,因为这个部分的话是跟 a 镜头没有关系,去做语音转,文字是本地的一些模型去转,等他把这些字幕内容提取到之后,我们再看他们的一个速度。 好,现在开始了,大家能明显感觉到吗? mini max m 二点五的是不是快的特别多? 这边已经做完了,这边就是还在,还在做, 那在速度这一块,他现在提升真的非常的明显,特别快,那他最终输出这个结果,我们要怎么去做评测呢?到底是左边的好还是右边的好? 我不能以我主观的去选择哦,右边好,左边好。所以说我找了两个模型去做评测,我们把任务给到它以及它的产出字幕内容全部给到两个模型,第一个是恰当的 gpt, 第二个是谷歌的界面,来去看这两个模型到底哪一个分析的这一个深度, 以及他的一个真实感更强,最终得出的结果。我们来讲一下,那整体的一个结果的话是 m 二点五肯定是提升的蛮多的,第一个是速度变快了,第二个是他拆解的更稀了,第三个的话是他的一个真实感更强了。好,下面我们来做一个总结。 一句话的话就是当前我们这个任务的评测的话,在编程这一块 codex 要领先一些,那 off 四点六要辞职, mini max m 二点五的话更适合做一些速度优先以及你追求性价比的快速落地的一个场景。好,这就是这期视频的全部内容了,熬了一个通宵做的,如果觉得这期视频做的不错了,记得给我一箭三连,大家拜拜。拜拜。

codex 中可以免费使用的,就在前几天,萨姆奥特曼宣布为了庆祝 codex 用人的发布,添加了免费访问服务, 接着更是直接宣布在活动后将会继续向这个 free 用户提供 codex 服务。在 codex 中,我们能够直接使用最新发布出的 gpt 五点三 codex 模型,接下来介绍如何在 codex 中使用这个最新的 gpt 五点三 codex 模型。首次安装 codex 的 话,我们需要在终端中输入这行指令, 就是如果是我们之前安装过的话,先输入下面的代码,也就是这行代码来更新我们的 codex c l i, 否则就会用的是旧模型。输入后呢会提示添加了几个 package, 代表我们更新完成,然后输入 codex, 显示 codex 得到了升级, 比如就在这里显示我们 codex 已经得到了升级,将会使用这个 gpt 五点三 codex 模型。其中我们点击 try new model, 也就是使用这个新的模型, 然后再进入下面的页面中,我们可以看到就顺利使用上了这个模型。他在问我们要不要给 codex 配一个沙箱的环境来保护我们的文件,并控制网络访问入口。其中有三个选项可以选,第一个是 set up default sandbox, 它需要呢管理员权限,会创建一个隔离环境,限制文件的访问范围,然后控制网络权限,这是一种比较安全的方式。 第二种是 user 默认 sandbox, 不 需要完全权限,配置更简单,但隔离能力会弱一些,可能会发生提示错误的一个风险。还有一种就是退出选择之后,进入以下界面,我们就顺利地升上了 gpt 五点三 codex 也能显示我们当前的工作。一个目录进入了 codex 之后,我先拿我之前做的一个小项目做测试。 作为一个自媒体博主,我经常需要对测评 ai 产品,特别是办公赛道与 excel、 数据处理、数据格式化等等一些问题。之前我用 cloud code 加 glm、 四点七错漏子以及数据生成器就是这个表格,它支持人力资源类,然后财务类、销售类、行政运营类 的一个表格的生成,里面包含各种各样的数据,比如员工画名册、考勤记录表、销售订单表、项目进度表等等。 这个数据生成器呢,可以选择每文件的行数、每类型生成几个文件以及导出的格式,还可以在点击预览数数据之后,可以直接下载选中表格。因为当时生成的这个 ui, 我 个人觉得还是比较 ai 味比较重,不是太好看。于是我把这个项目先投给 codex 帮我优化优化。先优化它的性能方面, 可以看到这个 codex 先快速扫描我这个项目的结构、依赖和关键代码、路径、性能和维护性等等,直接对这个仓库的项目进行可运行的一个优化。优化完成了,它主要改了以下这几个文件中的内容,从性能、交互稳定性、项目与文案文档方面进行一个修改完善, 使用起来比原本的更流畅,下载起来的体验也是更快速、更方便。接着我又让 codex 帮我优化了一下界面 ui, 因为之前的 ui 界面我觉得 ai 味儿挺重的,这个是它优化之后的,我觉得审美还是非常可以的,非常清新淡雅的那种,又让它生成了另一个版本的 ui 界面, 科技味儿比较重的这个深蓝色的样子。之后呢,我又让 codex 重新呢做了一个基于网页的瞬时记忆小游戏,用于训练和测试玩家的短时记忆能力。 这个游戏的玩法就是先记住彩色格子的颜色位置,再在空白网格里选色选色,然后填回正确答案。主要的玩法就是进入关卡后,网格中会短暂显示目标彩盒方块,然后目标方块隐藏。进入一阶段, 玩家先在调色板选择颜色,再点击对应位置,达到本关目标数量后,会自动剔掉并判定结果。整体的首页的 ui 设计,包括可玩性以及这个游戏内的关卡。这个方块的设置评分的规则我觉得都是非常的 优秀,从推出 codex c l i, 再到推出 g p t 五点二 codex, 再到如今推出迈克端的 codex 和 g p t。 五点三 codex open i 的 这款工具也在也在不断进化。从模型性能方面呢, g p t 五点三 codex 在 s w e 奔驰 pro 上达到了顶尖的水平。 这个这个测试基础呢,主要是对真实世界软件工程能力的一个进行评估,它在 terminal 奔驰二点零上的表现也是比以前好一些。 这个测评标准主要是衡量像 codex 这样的编程智能体所需的终端操作技能也都在终端上操作了一个情况。文章写到最后,我们又在看网上呢,看到了许多科技圈的信息,一是无痕 ai 将下线 g p c o g p c o 以我个人来说,它不是最顶尖最厉害的模型,但真的确实是无数人心中最具人味的情感依赖和聊天对象。 第二个就是关于 cloud 的, 它的模型能力真的非常厉害,前几天出了 agent teams 功能,上线了 openstar 六,能力也是非常嘎嘎,提升 token 也是嘎嘎,消耗速度是真的快,能力是真的强,但是也是真的好 token。 最近呢,有的人爆出 cloud code 的 可能,买了一些代码,降低用户使用其他非 cloud 模型式的缓存命中率,这样我们就得多花些 token 的 费用。好了,今天的文章就到这里。

全网百万人看过的机动奥特曼版路基艾尔改造教程来了!首先感谢兄弟们的催更,三连助力支持,看在主播这么干的份上,这次也拜托大家三连一下了。 我们可以总结一下,毛点主要就是头部特征造型,其次是红色透明键,然后才是颜色的搭配设计从头开始,按部位讲解改造方案。头部使用的是奇妙积木出品的热爱版路基艾尔,它的大小比例是很适合魔洞河的敖丙区干的, 但是敖丙脖子连接件要用胶水加粗才能适配。有些朋友发现不太一样,其实因为我用 ab 补土重新塑形,延长了部分装甲,有条件的话延长后更加夸张的风格是更适配魔洞核的,就算不延长其实也蛮不错的。 肩膀上的骨板也是直接移植过来的,剪掉方形卡损,打桩链接到胸部上方就可以了, 有条件也可以用 ab 补图,简单填一下缝隙。不过装上肩甲后,这里也是看不到的。背包就是敖丙的小背包,刚好自带红色透明键。胸口下方也移植了路基艾尔的一对小骨刺,直接胶水链接就可以了。 比较难的就是胸口的透明剑,薄饼是透明绿,我的方式是翻磨成透明色,然后喷涂透明红,因为我想保留他的层次感,当然没有翻磨条件的话就只能喷涂成伪电镀红了。 手臂部分大体都是敖丙的零件,只有避铠,不是,因为敖丙的避铠都是骨刺,而且不好看,我是选用了曹仁的避铠,因为我喜欢这个造型,并且接口是通用的。 当然我也有一个更还原的方案,直接一只奇妙的避铠就可以也更还原,也省了一个曹仁的零件。胯部很简单,就是敖丙的改色 腿部,腿部使用的是哪吒的连接处, palm 键需要扩一下孔才能装到敖丙的胯部。脚踝部分的莲花状装甲需要拆下来, 拆除后会剩下一个连接键也是不要的。有朋友好奇为什么不用曹人的脚更还原,其实我一开始是打算用的,但是后面觉得高跟的设计更加有神性的感觉,就保留了哪吒的脚步,事实证明也真的很好看。 最后就是武器部分了,真的只有白起的武器造型是最接近的了,追求还原可以去掉这两个小道角,我是觉得留着更霸气, 重新换个色就有不错的效果了。配色方案很简单,主色是黑铁为电镀,红是蜜银打底喷涂透明红。 粉爵已经交出来了,等大家交作业了。最后主播补充一下,一直以来我的进步都离不开粉丝朋友们的鼓励和支持,我的每一个改造方案也都会专门出教程视频来分享,目的就是跟大家一起分享改造出自己喜欢的角色的快乐。如果觉得我做的不好,做的一般可以滑走 便不感兴趣都可以,但是请不要恶意攻击评论区交流的小伙伴们,以上十分感谢大家!

我试用了几天 openai 新推出的这个 codex 整体使用情况,我是,我觉得我是非常满意,然后用户体验非常好, 尤其是针对那些不喜欢迷你行工具,或者是不知道怎么用 ide 的 那些,给你们看一下这个界面哦, 他这个里都是以文件夹形式,一个项目就是一个文件夹,然后这个文件夹下面你可以跑多条任务,我为什么要出来用呢?你在一个窗口下面,你布置了任务, 你可能还会有些其他的问题,你和他进行了探讨,等你这个上下文过长以后啊,整个模型它的召回率就会比较低, 这就是我们说的那个上下文污染。现在按照这样的方式,他其实已经在引导你,告诉你说,呃,你的一条任务就在一个窗口里面跑,在一个对话窗口里面跑就行了, 然后你可以开多个对话窗口去一个分别执行。还有一块我觉得是比较有特色的,是 openai 做了一个,现在看上去我感觉就是一个给我的技能商店, 然后每一个 skill 你 就可以直接一键安装,安装完成了以后去聊天窗口你就直接可以用,刚刚装好了就在这里就能看到,这个实在是太方便了,然后你不想用了,或者是你觉得不好用,你就直接卸载掉, 这个我真心觉得怎么说,我觉得这应该才是一个软件真正该有的样子吧。然后它的编程我做了一个简单的小测试啊, 因为我看网上有很多人已经测试过了,然后都说速度很快,但我不知道为什么,我这里设置的,我就让他帮我创建一个 to do list 演示程序,然后这是一个很基础的软件了,很基础的一个小的需求了, 但是他应聘的时间你看 work worked for 七分十七秒,我对这个数据, 对这个时间我感觉挺震惊的,然后我就赶紧跑去拿 claus, 四点六跑了一下,一分十七秒就跑完了。那反正我觉得我对 codex 的, 我对它的模型的能力其实是认可的,因为原来我也是在 cursor 里面,经常在 cursor 里面去用 codex 五点三,这个用 codex 五点二,那时候没五点三的时候就用五点二去 改一些比较顽固的 bug, 所以 我对 openlight 的 模型能力从来不怀疑,只是说原来 curses 里面有我没用而已,就没有用官方的了。然后简单说一下这个软件的一些小配置, 这边有个开关建议把打开,因为他可能运行的时间比较长,你电脑可能会睡眠,导致程序运行中断,这个打开了他就能保持你电脑一直处于一个唤醒状态。然后这边是这样模式的话,呃,你可以 相当于你下指令以后,你可以补充你的指令,或者是嗯,他朝另一个方向去思考。这两天反正应该有。我没仔细看他的更新的频率,但我前两天用的有的 bug, 这两天就已经没有了。 我之前这里他会弹出选择框的时候,那个选择框选完了,但是那个选择框不消失, 反正我今天用了一天,我也没发现有这个问题,应该是已经修复了。总结一下,我觉得这次这个格式化界面真的给人耳目一新的感觉。我习惯了格式扣的,但是我用这个我还是觉得用的很爽, 用户体验非常好。格式扣的里面看时间长了我觉得也就切来切去,我切的也很头疼, 我还是强烈推荐大家去试用一下。无论你是做 webcoding 也好,还是说你做一些文案类的工作,我觉得这个软件都非常非常适合你。

兄弟们, codex 性价比拉满了啊?这是我年前买的一个 codex tim 拼车,然后用了满满的一周饱饱的用,每天白天晚上都在用了,他提示我说现在还有百分之二十五的额度,也就是我用了一周他还剩百分之二十五。关键这是在某鱼上 tim 拼车只花了六块八,并且看啊, 还支持最新的 gpt 五点四模型,一个月六块八,还支持 gpt 五点四,并且还用不完啊,性价比拉满。

来,普通人想要用 ai 去接管你的任何工作,你只需要有一个 open ai 旗下的大模型,叫 codex, 不 需要你去下载什么豆瓣元宝,什么 kimi, 你 只需要这一个大模型来跟着我操作。首先 开通一个 china gbt plus 会员,开通成功之后,他就会给你多一个五点二 thinking 这个模型。好,如果说你们现在一个月不愿意花二十美刀去购买,现在也有一些团队的拼车的服务,可以把价格打在二十块钱人民币以内一个月。 好,第一步,登录之后,在任何的 ai 编辑器里边,我使用的是 cursor, 你 也可以使用 vs code 等等在插件市场里面搜索 code x 哦, code x 搜索之后找到 open ai 官方的快捷插件,点击安装好,我已经安装好了。安装好之后就是这个页面使用切的 g p 登录,刚刚我们已经把账号和密码登录了,我们来回到这个 ai 编辑器里边。好,就是这个页面,我们一直点下一步,下一 步,下一步。好,这时候我们选择权限,我们给他,我们给他全部的权限。好, 我们给他完全访问的权限。为什么要完全访问的权限呢?因为风浪越大鱼越贵是吧?这个权限的意思就是你的电脑里边的所有的文件夹,所有的文件夹系统全部归 codex 管理,不管你是做呃编码工作,还是做各种文书工作,还是任何的需要你手动去呃办公的软件。不管你是想安装什么 opencloud, 就是 那个龙虾的机器人吗?还是想安装 cloudcloud 的, 还是想做一个 ppt, 还是想做一个 word, 还是想做一个 呃什么财务的、法律的、文书的那个全部在这个小黑框里面都能够实现,有不懂的可以问我。

这临近过年,我们的国产模型真的太猛了。前面我做过两期视频,用同样的 prom, 同样的真实项目任务实测,对比了 cloud office 四点六, gpt 五点三、 codex mini max 二点五。 那期视频做完之后,评论区就有人让我测试一下质朴新发布的模型 gom 五,咱也是加班加点的干出来了,而且据可靠消息,过两天还有 deepsea 微视版本的发布,到时候也给大家带来一期真实项目的一个编程实测。 求一个一箭三连不过分吧?在这里要插播一下,当我准备去测 gm 五的时候,我去官网去订阅它的 cooling plan, 直接受庆了,就我的套餐买不到。哇,那如果按 ipa 计费的,我目前也没有找到。他们可以用 insulate 的 一个协议来测试 gm 五, 所以我就用了 ppl 他 们家的去测试,他们是非官方首发部署的 gm 五,一个开源模型的一个权重,那兼容安斯罗比的一个协议接到可拉扣的里面也非常方便,因为我之前的评测的话,都是用可拉扣的去做的嘛。所以说为了保证公平公正,我们也是用同样的 工具方的编程任务去做实测。好,我们先去创建个 api k, 这里我就写 gm 五 确认,点击复制好,我们开始进入真实项目的一个编程实测环节,也是同样的 prompt。 哈,那第一个任务的话,是把 我们另外一个项目里面完整的一个用户认证体系,包括邮箱、谷歌认证登录、 github 登录迁移到我有一个新的图片生成 a 级的项目里面,同时让它去做一个落地页, 需要考验它的一个代码理解能力,架构适配能力,一个工程规范。这个任务还算比较复杂,之前用 mini max m 二点五去测的时候,它花了三轮对话才完成的,那 op 四点六跟 gpt 五点三 colex 的 话,它们一轮对话就完成了。 那第二个任务的话是我本地有一个 skills agent, 它是一个终端 ui 交互的,我们把它做成一个外部聊天页面,让它保留 syncing 工具,调用流逝输出。这个任务主要考验它全站开发, 流势输出以及 u i u x 的 一个交互能力。之前测试的话, off 四点六跟 g p d 五点三 codex 他 们一人赢了一局,那下面我们就开始做 g o m 五的一个测试。 这两个项目现在都是开启了一个沙杯进者的模式去探索已有的代码。那右边的话,它弹出来一个让我选择想用的框架以及 u i 主键库,我就按我一个常用的方式去选好,它提示已经成功了。 好,我们打开了他给我们写的这个 y y, 哈,他把这个 skills 是 放在右边的,就展示我已有的一些项目,来测试一下它可用吗? 好,我们开始让他去总结这篇文章,看一下他有没有去做到加载这个 skills, 然后加载完了之后去执行一些脚本去做爬虫,然后再去做总结。可以看到这边他已经加载到这一个 skills 了,下面去执行一些命令 总结出来了哈。整体的话完成度还可以的,就是他这个 ui 上稍微会差一点点,相较于那个 gbt 五点三 codex 的 话,这个完成的没有 gbt 的 好。 左边这个窗口就是 cloud off 四点六写的,这个 ui 上确实会差一些。右边的话是 gbt 五点三 codex 写的,当时我是把票投给了他,那么同时去可以看一下刚刚那个任务,他们俩其实都没什么太大问题,不是特别难,后端也就 thinking, 然后做工具调用, 可以看到都是 ok 的, 没有什么太大的问题。好,下面我们去看一下那一个纹身图 agent 用户认证体系那块它完成的怎么样了? 可以看到它这个已经完成了哈,可以看到这个代码它已经写完了,我们先看它能不能一次性去启动,之前 mini max m 二点五这一块是没有做到一次性启动,我们先开新开一个窗口去测一下。好,我们可以看到 g m 五的话,它目前启动是没有什么问题啊,我们再看一下它实际的一个表现, 我们看一下它整个 ui 表现哈, ui 还行,那我们看它的那个认证功能可不可以用。我们先试谷歌登录,谷歌登录的话,它这块放了一个小 bug 啊,它把那个毁掉的端口弄错了,我们改一下。好,我们继续。 好吧,登录失败了,这边还是有些问题,你看到它登录的时候认证失败了,应该是数据库的表结构那块有点问题,从这么看的话, gbt 五点三 codex 跟 op 四点六还是要猛一些哈,就是它们没有这些问题。 好,我们再来选择谷歌登录,刚让它修复了一下, 好,他终于可以了。哎,有个问题,他登录成功之后没有回,没有进到我们的那个主页面,登录成功之后没有进到我们 agent 里面, 这个算第二轮对话吧,看他第二轮对话能不能搞定好,我们点击登录选择谷歌, 他还是没有修复成功,他还是要再刷新一下,看没有再刷新一下,进来再给他描述一下吧。现在还有个小问题,当我们认证之后,他先跳转了到首页,我再刷新页面,他才进到了 a 镜的里面。 在他这是第三轮了,就证明他在这个方面其实跟 mini max m 二点五差不太多,他们俩再点登录。 我靠,跟这个问题杠上了,他还是修复不了啊,还是有问题,你能不能好好深入去修改一下,去思考一下。 这是我们第四次对话,让他去修改这一个小问题哈,这个表现呢,就有一点不是特别好了,我们再来,如果他再再进不去,我就不撤了,这个就默认他四轮吧。 好,我放弃了。这个问题我不测了,他修他,我跟他一直对话,他修不了。我们之前测 gbt 五点三跟 colorof 四都是一轮。 ok, 我 们下面来看一下评分,整体的一个打分标准是第一个,我人为的去检测他们的一个功能完整性以及 ui 的 一些情况。那代码架构,工程规范,我都是把他们所有的代码给到 gbt 五点三, codeof 四点六,让他们分别去 review, 然后去打分。 它现在结果是这样子的, off 四点六,在第一个项目用户认证里面,它是表现最好的,它在功能完整度以及 ui 落地上是表现的比较好,并且是一轮就完成任务了。但是它的代码架构跟工程规范会有一些小问题, gpt 五点三扣贷 x 的 话,它的代码架构以及工程规范会比它好,而且是这四个模型里面最好的。那它的功能完整度呢?因为它漏了一个谷歌登录的一个前端,所以说这个评分稍微低一点,那它 ui 落地页的话也会稍差一些。 上一期视频测试 mini max m 二点五这一边的话,他是花了三轮对话去完成了这个任务。那智普这边的话,刚刚你也看到了,其实四轮对话完下来之后,他还有一些小问题,所以说评分的话,他俩其实差不太多吧,我个人感觉哈, 我们来看第二个,把这个 skills agent 做成一个外部 ui, 那 这个项目的话就是 gpt 五点三 codex, 它在业务完成上逻辑错误控制以及 ui 代码质量工程实现都是最好的。那剩下这三个的话,大家表现的都差不多吧,大家有优势的地方也有他劣势的地方。 好,下面我们开始进入 agent 的 实测环节,把 gm 五模型接入到我这一个真实的一个 agent 的 项目里面去,它是做自媒体视频拆解的, 主要需要去看他的一个速度,拆解深度以及表达一个真实感。那整个 a 型的工作内容的话,就是先去下载视频,做音频提取,转文字,然后去做内容的结构化分析,爆款元素的提取,最终输出一个拆解报告。好,我们下面开始吧。好,右边也完了, 我们来简单看一下哈,他们两边格式上会有一些差异。在拆解上我们看他这个结构拆解这块,他这个时间出其实是有问题的,他做的不对,因为我这个是十二分钟的,他是做了 十四分钟到十五分钟,那 g m 五这边的话,它也有讲一个时间戳吧。啊对,你看它有二十分钟,还有三十到三十五分钟都来了,所以说我感觉它在整个 a 帧的表现里面不是特别好啊,它这个拆解的深度也不太够,我感觉相较于昨天我测那个 mini max m 二点五的话会稍微差一些。 好,我们下面总结一下。把 gm 五接到这一个自媒体视频拆解的 a 帧里面,它的一个表现情况哈,整体上的话速度偏慢,就响应速度不算快,可能跟当前用户量大有关系,因为都知道它这个套餐都卖的受庆了。第二个的话,它的拆解深度的话相较于 mini max m 二点五会有一些稍稍不足。 第三个的话,它的一个真实感稍微偏弱一些啊,这是整体的一个表现情况。好,下面我们进入整个的一个总结环节,在编程方面的话,一句话,在我的这一个测试项目里面, gbt 五点三 codex 表现最好,比 off 四点六会好一些。 glm 五跟 mini max 它们的体感接近,都是开源的嘛,并且它们的成本非常低,所以说 对于一个高性价比的一些开发任务的话,我觉得这两模型都非常不错。好,这就是这一期视频的所有内容了,如果你觉得这期视频做的不错,一定记得给我一键三连哦。那下一期视频的话大概率是做 deepsea 微四,有可能是在过年那一天发布,我猜测哈,据可靠消息。好,那视频就到这里了,大家拜拜拜拜拜拜拜拜。

好内容我要一直发,坚持的发,重复的发。我之前拍过一条视频,我是说怎么用 ai 去接管你的任何工作,当然前提你是一个小白领,或者是你你做的大部分工作都是 文书类的工作,都是 ppt, word, 或者是做一些图片生成的工作,或者是文案策划的工作。 你不需要玩什么豆包,也不需要 kimi 元宝,你也不需,更加不需要搞那种极客的那种 opencloud, 是 吧?你更加不需要玩这个 opencloud, 你 只需要下载一个 codex 插件,就是 openai 旗下的这个 codex 插件就是这个 codex 插件。 当然我给大家一个路径,你们按照这个路径去做,有任何问题你们可以直接来问我。首先第一步,你们要去选择 gpt, 去 购买一个 cheap 的 七 p t plus 的 会员,这个如果是在官网上会是二十美刀,大概是一百四、一百五或者是一百六十块钱人民币, 我现在已经可以搞到二十块钱以内了。好,一定要搞一个 cheap 的 七 p t plus 会员,二六年,给你们一个 性价比最高的一个方案,就是购买一个车载 gpt plus 会员,购买之后登录到回到咱们刚刚的入口,我已经下载好了我的 codex 的 这个插件,你们在下边啊,这个权限要给他最大的权限。为什么要给到最大的权限?因为风浪越大,鱼越贵。 你给他最大的权限就是让这个小黑屏,让 codex 这个大模型目前已经来到了五点三的这个版本,让这个小黑屏去 控制你的整台电脑的文本。所以说第一步,购买 qgg plus 会员,第二步,下载 codex 的 这个插件。第三步就是打开你的一个文档,在这个文档下边去 使用 codex 的 打磨型去实现你的任何的工作,遇到任何问题前来咨询。

都二零二六年了,我知道你们很多人仍然没有使用上目前最厉害的 ai, 通用的智能体 cost 五点三, 大部分人仍然在使用豆瓣元宝的黑屏,所以今天我手把手的教给大家如何每个月只用花费十五块钱就能够使用到目前这个世界上,或者是我心目中最厉害的通用 ai 智能体 cost 五点三,你们很多人都 下载过这个 cursor 编辑器,是吧?目前最流行的一个 ai 编辑器,那这个 cursor 内置的这个编辑器里面的模型非常的多,有 codex, 有 cloud oposs 的 四点六,都非常的好,但是你需要升级到 pro 的 这个会员的版本,而升级的会员的版本的价格大概是在 每个月大概是二十美刀,所以说我自己也摸索出来了一套,每个月大概是二十美刀,所以说我自己也摸索出来了一套,每个月大概是二十美刀,所以说我自己也摸索出来了一套,每个月大概是二十美刀,所以说我自己也摸索出来了一个。 我们今天三步教你搞定怎么使用上这个 codex。 首先第一步一定要登录 check the gbt 的 官方网址,所以你们在搜索 check the gbt 的 时候,一定要认准这个网址的名称, c h a t check the gbt, 点 c o m。 因为现在国内的那个网站 乱七八糟的,一定要认准这个网址。点击进去之后购买一个 check the gbt plus 会员,购买成功之后你就能看到这个五点二, cbt plus 会员购买成功之后你就能看到这个五点二三 k 的 这个模型。切换到 第二步,来到这个 cosplay 编辑器,进入到这个插件市场,搜索 codex, 认准官方的这个 open ai 的 图标,蓝色的官方的一个版本,点击下载, 下载之后再点击 codex, codex 会进入一系列的用切克 gpt 登录的那个页面,然后用账号邮箱进行登录。第三步就可以在这个对话框里边连接到你的整个的电脑的文件夹进行登录。第三步就可以在这个对话框里边你不光是可以向他提问,他一问一答,这个模式 还可以直接帮你去接管你的整个的电脑系统,接管你的 c 盘, d 盘, e 盘,让他任何的一个文书工作都能够帮你去实现。一定要记住不要使用 cursor 类制的这些模型,因为它实在是太贵了,一个月需要二十美金,如果你没有额外的收入的话,可能不能够支撑你继续走下去。 所以说我自己探索出来了,一套十五块钱就能够使用目前世界上最顶流的 ai 模型。好的,赶快去试试吧。

很多程序员的工具链里,终端 ai 助手已经成为了标配。不过说实话,想找一个用起来比较顺手,不用魔法并且稳定的方案,其实不太容易。最近我发现了一个叫 iflow c l i 的 工具,内置国产大模型,还支持 skills 啊,我用起来比较舒服。大家好,我是海拉的编乘客,今天我使用 i flow 给大家演示两个用法,一个是在日常生活中用它来写一些想法验证啊,写一些 poc。 老规矩,我们不打开 ide, 不 手写代码。第二个,我们使用 skus 来对我们代码仓库做一个体检。 好,那我们先打开 icl i 的 官网,在这里进来之后呢,我们先安装复制这一个命令,然后粘贴到你的终端中。 好,紧接着我们需要登录,我们敲斜杠 else, 然后选择第一个登录, 接着我们选择默认的模型啊,也就是 g l m 四点七。 好,我们语音输入,你是什么大模型啊?这也是我最喜欢问的。好,它现在说是 g l m 四点七大模型啊,也就是说我们可以在 iphone 里面使用多个大模型。 在日常的开发中呢,我们会经常做一些想法上的验证,比如说验证某个技术方案行不行啊?老板甩过来一个需求,说,这个淘宝上边的搜图,哎,拍张照片搜到对应的这一个商品,能不能做?我们先进入目录, 我们叫 image search。 接着呢,我们开启 i flow, 我就直接和他聊,老板说什么需求呢?老板说淘宝上面的这个搜图是怎么做的,是吧?那我们问一下他。 呃,我想问一下,类似于淘宝上面拍照搜物啊,搜到某一个商品啊,这个背后的原理是什么?这个专业术语叫什么啊?请回答我一下,谢谢。 我们通过刚刚描述很虚的需求啊,就可以拿到一个术语叫做以图搜图啊。紧接着我们就直接把需求告诉他, 我想做一个以图搜图的这一个,呃, poc 啊,我想请你帮我列出这种最小的需求是什么? 好,我们看一下,这里有一个以图搜图的最小 poc, 核心需求如下,有一个,上传图片特征,提取 相似图片解锁。然后呢,技术组件呢,建议使用 python, 图像模型呢?建议使用 clip, resnet 和 mobile net。 还有一个向量数据库啊,有一个 fast 和一个。呃, milos 啊, 前端呢?简,建议我使用简单的 html, 后端框架呢,使用 fast api 啊,这个包括选型做的都还可以。 呃,这里我有一些不明白的地方,就是图像模型和向量数据库,因为我其实在写 poc, 我 并不完全需要一个数据库,我只需要让他帮我写文件,最后帮我解锁就好了。这一个数据库呢,可能并不是一个必选的像, 而这一个图像模型呢,这里面涉及到很多个模型,我也不知道哪个模型好,但是在写 poc 的 时候呢,我现在需要验证这一个图像解锁是不是 ok 的, 我并不需要做到非常非常精准的图片解锁, 我需要把这一个 poc 跑完。至于模型我们选择什么模型,还是后面选择单独的某一些模型做一个 fight, 这些呢,都是可以在后面考虑的,不属于我们 poc 的 部分,所以我需要问他。 这里我有两个问题啊,第一个问题是模型上的选择,其实我更想选一个比较小的啊,能够跑完这一个是 poc 的 啊,一个模型就好了。然后呢,请你给我一些建议。第二个问题是,我觉得销量数据库其实并不是必要的,我们可以先把东西存在本地,对吧?然后我们就 可以完成这一个 poc 了。呃,你先不要帮我实现它,不要写代码啊,我们验证一下,我们聊一聊, 在实际的过程中,和 ai 聊天的时间应该是占到整个开发比重的四分之三。呃,我的建议是大家尽量花更多的时间和 ai 聊通了。然后呢,再去落实 好。我们大致扫页,针对 poc。 他 建议这一个清亮模型啊, mvnet v 二 resnet efficient net 这个我都不明白。 open clip 啊,这个我是明白的,但是 open clip 我 印象中它的汉语知识不是很好,并且呢,我们只需要做以图搜图,并不需要做一个文字搜图,所以说这个 我们选一个中间一点的吧,选一个四十五的。然后我们看到问题二,向量数据库的必要性啊,说 poc 间呢,确实不需要向量数据库啊,他认同我了。 好,这里面我们看一下,通过 npy 加鱼弦相似度就可以搞定了啊,零依赖,代码简单。然后呢,一千张以上图片会慢啊,慢呢?估计就是解锁方面吧,我觉得这个不是什么大问题。 然后建议方案模型存储后端前端,然后启动时加载模型,从本地 m p y 加载特征库,然后上传图片,提取特征,与所有特征计算相似度啊,这个看起来都还挺 ok 的, 那我们切到一个 呃 plan 模式吧,我们把我们的开发计划再深入的聊一聊。我现在呢,想请你使用呃, esnet 啊,来帮我。这个模型。 后端呢,使用这一个 fast api。 前端呢?呃,我建议你使用这种单页的一个呃页面,然后呢,我希望通过 fast a p i 把这一个网页 host 住啊, 接着呢,样式上我建议你美化一下啊,用一个类似 vs 的 高高科技感的暗黑模式。 然后我们再想一下,在这一个数据流这一边,有一个启动时加载模型,从本地 npy 加载特征库, 然后上传图片,提取特征,与所有特征计算相似度。这里面还漏了一个情况,需要补充一下,我们可以先写,还需要写一个脚本,把这一个几千张图片把它转化成特征库,才能 在上传特征库的时候提取特征,返回 topk。 结果啊,所以说这里面还漏了一点, 是这样子啊,呃,还有一个需求是我需要你,呃,写一个脚本对吧,可以把对应的图片转换成一个,呃,特征 特征库对吧?好,记得一定要开 plan 模式。 他说图片库的数据来源是什么?需要网上下载样本图片的方案吗?啊,这里我已经准备好了, 大家可以看到这里面有 image 啊,我把它这一个移过来, 在这里我们选择 type something。 你说。接着呢,前端页面需要一个拖拽上传图片啊,实时预览上传的图片, 要把它缩小一点。 接着呢,显示相似度的分数,这个需要的点击查看大图呢,我觉得没有必要,然后我们再提交答案,这个时候呢,他就开始做了 技术栈后端前端存储,还有这个计算啊,运行相似度没有任何问题。 呃,有一个 build features 啊,通过特征库来构建脚本啊,也没有什么问题。 核心功能拖拽啊,返回暗黑色的这个科技感 ui, 现在我们可以看到,作为 poc 的 话,一整个规划是比较靠谱的啊,那我们就直接选择第一个, 呃,看一下这个功能特性上面都好,是吧。我们好,我们接下来安装一下依赖 啊,我们大致扫一眼这一个 view feature 这一块有没有问题啊?大致扫一眼,通常情况下不会有问题,但是难说。 好,我们先构建对应的这一个 feature, 接着呢,我们可以给大家看一下对应的这一个图片里面是什么啊,都是些小猫小狗啊 啊,我现在都已经感受到我的这一个风扇在狂转了。 好,这里面已经,哎,已经做完了是吧?然后他写了两个文件来看一下啊,在 matedata 里面写了一些,应该是原数据,然后在这一个,呃, features 啊, py 里面啊,有十四兆啊,它应该是把这一个图片提取成某某些特征啊,它就和人类一样,人类不能像相机一样记住每一个像素,但是人类呢,也是通过照片上的特征来区分的啊。我们启动服务, 能启动吗?哎,能启动能启动,我们打开好拖拽图片。 ok, 接下来我们验证一下啊,我们选一个蓝猫, 把它截图保存下来。哎,蓝猫原来是俄罗斯的, 打开一下,接着呢,我们点击选择把这个图片读过来。哎,我们可以看到,基本上都可以找到懒猫了。 这个输入法真的是变了,选一个吧,选一个放下来保存,接着以图搜图 搜索。哎,我们可以看出来,那这一个小狗就被搜出来了。 poc 写完了,我们还想知道 poc 距离真实的生产还有多远? 我现在想问一下这一个,如果说我真的要做这种宠物上面的解锁呀,对吧?这个搜索到对应的宠物还有哪些这种非常呃硬核的工作是需要做的啊,我觉得是不是 呃 poc 距离生产还是有一段距离的啊?请你和我聊一聊 poc 层面啊,使用的是这一个 oxford, 还有点意思,它是不是读到了哪些原数据 真实呃,生产需要真实场景的图片啊,手机随手拍,各种角度,光照复杂,宠物遮挡,被主人抱着躲在沙发后啊,这确实是 多宠物同框,这也是,然后模糊低分辨率,这是看起来就是非常多啊,然后数据清洗式,这一块标注式,一块数据增强技术啊,构建更大更多样化的做一些模型的特化,就是模型现代化, 这个生产需要 fight, 然后目标检测,注意力机制,聚焦宠物的关键部位, 多尺度的,多尺度的特征啊,这看起来太多了,太多东西需要做了。现实的建议是先做 mvp, 然后逐步打磨,不要一开始就想做的完美啊,这也是符合咱们这一个就是基本要求的。可以看出来, flog 加 glm 四点七给出的这一个建议啊,都是比较重肯的啊,有哪些东西要做啊?有哪些东西是比较硬核的代码啊? poc 的 最核心的部分可能也就几十行几百行代码, 但是要真正的把一整套做出来还是需要很庞大的这一个工作量的。 在上一个项目中呢,我们写的是 poc 啊,写 poc 的 时候呢,就需要 web 扣定一些,氛围编成放松一些。 但是当我们在加功能啊,想让这一个代码变得更稳定一些的时候,那我们就需要加入一些这种质量审核。我之前写了一个 skills, 那 我们打开这个 skills 来看一下,这个 skills 是 我专门用来检查代码的,那 基于代码整洁之道,聚焦七个高收益的检查维度。比如说命名,一定要是有意义的,命名函数要尽量的短小啊。就是,而且要单一职责,尽量减少重复, 尽量规避过度的设计啊,一些魔法数字,还有结构清晰度和 项目规范。呃,每一个问题都会给他排上不同的级别输出的格式呢?是像这种有原则、有位置,有级别,有问题,有建议啊。然后有两个 reference, 并且这里面会开启多个 a 键来扫描这个,这里面我们让他帮我全面做一下审查汇总的报告。每一个维度开一个 a 键 啊,但是要串行完成,不要并行。如果开四五个 sub a 键的长时间跑的话,会遇到并发症问题啊。我们建议他一个维度开一个 a 键的串行完成,一步一步做。 iphone 目前还没有开放并行,但是在他们的论坛里面有并行的体验卡,如果大家有需求的话,可以去看一看, 大概二十多分钟就把任务跑出来了。呃,跑了接近七十五个问题啊,应该是非常给力的,高优先级的大概有十二个,中优先级的有二十九个,我们看一下,大致扫一眼吧, 有些命名啊,这个项目规范啊,我们往后拉一拉看 啊,高优先级,看看删除组建或实现集功能啊,这就没写,是不是然后 mcp test 啊,我这个也是没写。 嗯,这个检查确实是挺到位的。然后消除重复的文件,更新逻辑, 这里面有重复的代码哎,看起来符合我的认知。然后提取关键业务,敞亮, 重构核心业务函数啊,总的说来还是不错的啊。这里面包括有这个 run, open code, s t k streaming 啊,这个函数呢,要提取 event buffer, event handler, session manager 这些类。呃,都是蛮符合我的理解的。 用了几天,我的感受是够用,而且比较省心。市面上大部分固定 a 键呢,有的功能它都有,比如说 m c p, 工作流 skills, 开箱就能干活,登录就能使用。另外,零点五版本加了两个非常实用的功能, 一个是 hooks, 可以 用来做一些提醒。一个是 restore, 如果你搞砸了,你可以回退。当然,我也建议大家用好 git, 这样子你可以做一个双重保险。那我在体验的过程中呢,也有一些不足。 c l i 的 这一个界面上的细节, 我觉得可能还需要打磨一下,比如说我看不到上行和下行的 token, 在 写大一点文件的时候,我非常想知道他在写文件还是卡住了 i f o 官方与社区,他也希望社区能够涌现一些类似于欧曼 open code 的 这样 强大的编排系统。怎么说来,如果你喜欢在终端里干活, i f o 绝对值得你试。如果你也在使用 i f o, 欢迎来聊聊你的使用体验。我是海陆编程课 ai 永不眠,我们下期节目再见。拜拜。