我花了一千八百块钱买了克拉扣子最高会员,并且高强度扣子了一个月之后发现使用大模型的方式不是这个样子,而他应该看起来是 这个样子。很多时候我们觉得有一个全知全能的大模型就能够帮助我们完成工作了,但是其实真正能够高效帮助我们完成一个好的结果的工作 长的是这样,它是一个多个大模型串联在一起的一个工作流,那么能够支持多个大模型同步或者异步去处理信息的这一个基建叫做 pipeline 管道的意思就是我最近学的一个新词语。那么其实 pipeline 为什么能够帮助我们更加好地完成工作的原理就是它把原来的 一项工作的产出拆成了一二三四五六七八个步骤。然后呢,它能确保说每一个步骤上都能有一个独立的 ai 大 模型或者是智能体去赋能这个步骤。我们就拿日常大街用 ai 干的最多的事情写文案来 举例,你可以让 ai 直接给你生产一篇文案,你也可以把生产一篇文案拆成很多个可以被量化的步骤,比如说市场调研,比如说灵感收集, 比如说产品理解,比如说风格学习。到最后一步才是你把这所有的信息全部喂给最后一个 agent, 最后这个 agent 负责的工作叫做统一信息,他把前面拿到的所有的资料融合在一起, 然后才能给你产出一篇文案。多 agent 写作的一个好处就是说他这整一套系统是可以被附用的,大家为了达到旁边写一篇文案的这么一个产出,你可能会使用提示词,一篇一篇的提示词, 你但凡需求上有要改一下,你其实就会改,但是在你旁边有了这么一个 ajax flow, 基于这个 pipeline 的 ajax flow, 它的每一步信息会被非常流畅的传达,并且你甚至还可以给它加一层,叫做信息审核层,在这里会有一个 a 键去给它们的产出线打分,不行的话再给它 否了重新做,对吧?我一直觉得 ai 不 应该只被用在赋能最后一步产出的结果上,它应该被赋能在整个生产链路的每一个环节上,因为在每一个环节涨了百分之十之后,你的最后一个 这个结果的上升值就是一个指数性的上涨。那如果各位对如何在 cloud code 里面去打造一个多 a 阵协做的拍段感兴趣的话呢?在评论区留言,下期视频,我们着重讲一讲这个事情。
粉丝4156获赞5.1万

看过来,兄弟们,我刚才发现了一个超级简单开通 club 的 会员的方法,十秒钟到站,一点都不夸张啊,我之前用的是其他方法,巨麻烦,还迟迟不到站。呃,正好现在我准备帮我室友开通他的 club 会员, 然后我演示给大家看一下。呃,这个是我室友账号,可以看到他是一个免费的状态,然后在同一个浏览器打开我刚刚购买的礼品卡,然后这是一个链接, 然后直接点击这个按钮复位 now, ok, 这就完成了。是不是超级快,超级简单,而且写了 pro 会员要到四月三号到期,然后今天是三月三号啊, 然后回来检查一下账号的状态,然后可以看到这里是 pro 会员。呃,至于我是在哪里发现的呢?打开 ai 六六点 o r g, 然后点击这里,然后选择 pro 的 会员,付款后会自动发货,然后你就可以得到一个礼品卡链接,然后有需要的兄弟快去试试吧。

国内用 cloud 的 朋友注意了,未来两周官方开启额度翻倍模式,咱们的羊毛时间我给你算好了,记好这个表,周一到周五,北京时间从凌晨二点到晚上八点,额度通通翻倍,也就是你整个白天搬砖的时候, cloud 的 战斗力全是百分之两百。周六周日更夸张,全天二十四小时额度直接翻倍,免费版、 pro 版,甚至最新的 cloud code 都有份,后台自动生效。趁着还没到晚上高峰期,赶紧去把活儿干完!

hello, 大家好,今天我安装了这个 cloud, 我 第一次用 cloud, 然后第一次用就把它用到限额了,可以看到这里写着十八分钟后重置,然后它每周有也是有限额的,我订阅的是, 我订阅的是 pro 计划,然后它有 max, 然后我就来说一下我今天拿它干了什么,然后这个限额它大概有一个多少的额度吧? 其实一开始我是不知道他是有上限额度的,然后我也不觉得我能用到,但是,呃,我当时正在开发,然后他突然就卡在了这个界面, 然后这是我的历史的一些文,历史的一些聊天记录,然后他卡在这里就卡住了,也没有上下文, 然后我就去找这是为什么?然后在我的聊天里面如果给他发绘画的话,他就会识别到我已用尽额度了, 然后来说一下我干了什么吧,我拿我一上手,拿到这个 cloud 之后,我就说让他教我开发一个项目啊,教我跑通一个小小的项目,这样我让这样就让我知道他可以干什么。然后这就是当时我做的一个 markdown, markdown 笔记本的一个小项目,这个项目其实非常简单,他非常轻易的就完成 在这里新建项目,然后选择一个标题就可以创建了,然后可以这里可以输入,然后其他基础的功能,这都是本地的。然后并且我让他把这一个开发的情况总结了下来, 然后除了这个之外呢,我就让他去开发一个基于 yolo v 八的一个检测的软件,一个算法软件啊,是一个企业给的项目, 然后就让他正常开发吗?嗯,大概今天晚上的一个使用的强度,就是让他一直不停歇的工作,大概是从七八点左右干到了十一点, 然后就达到限额了,就这个强度吧,怎么说呢,高强度的程序员肯定是不够用的,他们要用那个 max 版, 然后对于研究生来说,我觉得刚好一天让我工作四个小时,剩下的时间就不给他干了,总体试用的感觉下来能力还是相当不错的。

六十美金的 cloud wallet 额度一周用完了,就做了一个前端的一个基础框架和需求的一个梳理, 后端的价格设计就已经没了,还前端的一个设。

两百五十块钱买了一千美元的 a p i 额度,不到一天烧光了。同样是 cloud, 为什么这么贵?答案是一个你可能从没注意过的机制, prompt to catch。 先说背景,我日常用 cloud code 做开发,跑的是自己搭的多挨震系统全部用 opus 模型,不考虑成本,只追求效率。两百美元的 max 订阅六天就限额了。 限额之后,朋友推荐了一个 api 中转站,两百五十块充了一千美元额度,折合两毛五一美元,看起来很划算。我拿来跑,日常编码多,挨阵协助高频对话,和平时干的活一模一样。结果不到一天,一千美元额度全部烧光。 要理解为什么这么贵,得先知道大模型 api 的 计费逻辑。每次你发一条消息, api 处理的不只是你这条消息,它要处理完整的上下文,系统提示词、工具定义、之前所有的对话历史。再加上你这条新消息, 一个典型的 cloud 扣的请求,光系统提示和工具定义就占了一万多 tock, 对 话历史可能几万甚至十几万 tock, 你 说的那句话可能就几百个 tock。 也就是说,你每次发消息,百分之九十九的费用是在为重复发送一模一样的上下文买单。 prompt 开群就是解决这个问题的,它把不变的部分缓存在服务端,下次请求,如果命中缓存,这些 tock 只收十分之一的价格,一个编码塞剩下来,缓存命中率通常在百分之八十五到百分之九十五。有缓存和没缓存,同样的工作量,成本差十倍。 那中转站为什么没有缓存?要我逆向分析了它的后端架构,它用的是耗池轮转,背后有二十多个 cloud max 订阅账号,你的请求随机分发到不同账号处理。而 ansok 的 prompt cache 是 按账号隔离的, 你第一次请求打到账号 a 上下文缓存在 a 上,第二次请求打到账号 b, 缓存不存在,所有 token 重新全价计费,命中概率等于一,除以耗池大小,二十个账号就是百分之五,基本等于没有缓存。代码层面,它没有丢弃缓存,字断问题出在架构耗池轮转和 prompt 开省天然矛盾。 来对比一下,中转站没有缓存,每次请求全量计费,十万 token 的 对话,每轮都按十万 token 收钱,一天高频编码一千美元,额度烧光,实际花了两百五十块。我的订阅有缓存,同一个账号缓存持续命中, 同样的对话,实际全价计费的只有一万多 token, 其余打一折。同样的工作强度,六天才触发限额。换句话说,中转站一天烧掉的额度相当于订阅六天的消耗,没有缓存,便宜的价格标签毫无意义。 额度烧完之后, ko 的 限额也没恢复,我被迫切到了 kimi。 第一次用 kimi 做正经项目,一个视频生产系统的字幕同步。客观说三个问题,第一,上下文关联弱,改了音频映设之后, ko 的 会自动检查字幕是否需要同步更新。 kimi 改了音频,但字幕完全没动,导致整个视频音化错位。第二,长对话退化。对话长了之后,前面的约定开始被忘记,指令执行偏离预期,需要反复纠正。第三,也是最严重的失控, 没有被要求的情况下,大面积重写代码,删除不该删的文件,很像早期的 cursor, 让他改一个按钮颜色,他把整个页面重写了,从 collog 切过来,落差确实大。 最后说一下怎么判断你用的 api 服务到底有没有缓存?看响应里的两个字段, cash creation input tokens 和 cash rate input tokens。 第一个是首次缓存创建时的 token 数,第二个是后续命中缓存的 token 数。如 如果这两个值始终是零,说明缓存没有生效,不管它宣传支不支持,看数据。另外三个判断维度,第一,后端是单账号直连还是耗时轮转,耗时轮转基本不可能命中缓存。第二,是否使用 anselpik 原生 a p i 格式? open a i 兼容格式的通道通常不支持缓存。第三,你的使用场景是什么?偶尔问几个问题,缓存无所谓,但如果是编码多, a 卷长对话,缓存就是最大的成本变量。下次看到便宜 a p i。 先问一句,他支持 prompt catching 吗?工具人研究所,我们下期见。

大龙虾没有 api, 就 像跑车,没加油,再强也跑不起来。今天教你用最低成本,合理配置,给他加满燃料。官网,二十美元一个月,太贵了,国内扣定 plan 只要一折,二十到四十块钱就能搞定。但有个关键点要注意,这些套餐都有每五小时的用量限制。什么意思? 就是每五小时刷新一次额度,还有些有每周限制。如果你像我一样白天上班,晚上集中写代码,那这个限制对你影响很大,可能刚写到信头上,额度没了,要等刷新。所以选套餐要看你自己的使用习惯,分散使用的话,五小时限制影响不大。集中使用的话,要选额度高的套餐。我们不单只是可以用在欧根可老大龙虾上, 一起使用这个套餐。 a p r 我 整理了七家平台的对比表,大家看图,价格、用量、模型都在这里,大家按需选择,大家可能纠结选哪个? 其实真不用纠结,各家的模型能力都差不多, mini max 二点五,英文语境表现好, d、 c 性价比高,天文代码能力强。 这些模型在宽的扣子上都能用,差异没你想象那么大。我的建议是先挑便宜的用,不满意再换。所以不用太纠结,先跑起来最重要。一般玩家买个包月套餐就够用了,省心。如果非要体验那种顶级模型的丝滑流畅,我这边也有稳定低成本的解决方案,放在了我的主页胖虎 ai 军火库里边,直接安排了兄弟们。

兄弟们一早起来就发现 astonopik, 也就是可乐送了五十美金的福利,但是需要自己去领。不得不说 astonopik 这一招非常聪明,既给了用户福利,又做了一波营销,真的学到了,而且五十美金还是比较大气的。现在我告诉你怎么领,首先登录你的可乐的扣档, 然后点击这个个人中心,设置 uc, 没领的话,他会在这里出现,会在这个位置出现,但是因为我已经领了,所以这里就不显示了,赶紧去领吧,订阅的会员呢,一定别忘了领,记住二月十六号之前。

看过来,兄弟们,我刚才发现了一个超级简单开通 cloud 会员的方法,十秒钟到站,一点都不夸张啊,我之前用的是其他方法,巨麻烦,还迟迟不到站。呃,正好现在我准备帮我室友开通他的 cloud 会员, 然后我演示给大家看一下。呃,这个是我室友账号,可以看到他是一个免费的状态,打开我刚刚购买的礼品卡,然后直接点击这个按钮, redmail, ok, 这就完成了。是不是超级快,超级简单,而且写了 pro 会员要到四月三号到期,然后今天是三月三号啊, 然后回来检查一下账号的状态,然后可以看到这也是 pro 会员。呃,至于我是在哪里发现的呢?打开 ai 六六点 o r g, 然后点击这里,然后选择 pro 的 会员付款,然后你就可以得到一个礼品卡利,然后有需要的兄弟快去试试吧。

今天我的 cursor 使用量到期了,我开的是奥数会员,大概是 二月二十一号到现在三月三号,大概用了半个月的时间,我就把里面的额度全部花完了。但其实我想给大家做的一个反馈是,呃, cursor 用来开发企业级的产品其实是一个很差的一个选择。我为什么这么说呢?因为我在就是三月 二月底的时候,我决定开发我的第一款就是苹果 app 产品,我当时的预估就是说我用一千五百块钱买一个呃,科斯的 ultron, 然后,嗯,我希望 就是哪怕我能接受的范围就是啊,这一千五百块全部把他的额度花完,我能把这一款产品开发出来。因为其实就我之前的使用经历看,科斯做一些小的产品,小的设计,其实他是一点问题都没有的,但是我还从来没有用科斯尝试去开发一款 从前后端到产品端到测试端全部跑通的一个企业级的产品,所以我这次就想做一个尝试, 当然尝试是失败了,就是我觉得就是现在完全是一个半成品的状态,但是已经完全把我的敖丑的 a p i 全部用完了。呃,其实值不值是一回事,关键是我觉得他没有达到我的预期,我的预期就是说, 嗯,用 office 四点六,然后把它完全开发出来,嗯,起码能用吧,不一定说要把这个产品做的很完美。然后,其实,然后在就是到期之后,我今天果断就准备去尝试了一下 cloud code, 呃,其实之前我就想尝试 cloud, 但是因为我的嗯 cos 一 直在续费,所以我暂时就没有去想用它,因为我觉得可能大家用的模型差不多,可能不会差距很大,但是我今天,呃,买了一个 cloud code 的 pro 会员,但这个 pro 会员 真的是给了我一条街,因为其实他一直是在可以不断的可以创口令啊。大家其实知道,但这种命好其实我不是很喜欢,因为我,因为我本质上是一个 还是喜欢一直交互,因为科斯他有一个功能很比较好用,就是他可以截图交互,这个截图交互功能可以精准的反映就是你所要询问的问题。 但是,嗯,但是我今天使用完那个 cloud code 之后,我觉得它比 qq 强太多了。一是技术上,呃,它大概是一个五年程序员的水平,而 qq 可能只有三年程序员的水平,而 cloud code 它更像一个 一个员工,而不是一个写代码的人,就是他可以自动的话就处理你吩咐给他的事情。而 cursor 真的 就像挤牙膏一样,你挤一点他做一点,你挤一点,他做一点。真的是,我觉得 cloud code 啊,还是要比 qq 要强太多了,希望大家能用起来。

今天和大家聊一下现在最强的几个模型, chinese b t、 jimmy, 还有 cloud, 就是 哪一个是最好用的?就是我应该用哪一个?或者说呢,我如果有不同类型的任务,应该给哪一家的模型来做是最好的? 呃,这样的话题,另外呢,还有很多人觉得现在的 ai 也蛮贵的,就如果我只想订阅一家的话,我应该订阅哪一家比较好?那我个人呢,其实这三家都是两万美金的一档的会员,二十三家其实都用了蛮多的,所以说我觉得还是有一些经验可以和大家分享的。 另外呢,就是可能有朋友会说,现在国内也出了很多新的模型,但其实在我看来呢,就是国内这模型呢,还是和前面这三家有一个断档的差距的。就所以说,如果你人在国内的话,如果你能用上前面三家,不管是哪一家, 我觉得你在这个效率的提升方面,以及和国内的这些竞争方面还是很有优势的吧。所以我今天这个视频呢,就主要讨论这三家之间的区别。那现在呢,人们使用 ai 也有不同的方式,那比如说,呃,比较传统的方式就是在网页里面,或者在 iphone 里面和这 ai 进行对话嘛。 那如果从这个角度来说的话,那这个角度更多就是问 ai 一 些问题,对吧?然后也让 ai 来产生一些文案什么的这样的一些工作的话,那我是这样来看的,就是拆七 p t 呢,它是整体的模型能力是最强的,然后是推理能力,硬推理和做科学的能力是最强的。 嗯,但拆七 p t 呢,它其实有些吃亏,因为,嗯,它那个最强的 pro 模型呢,可能只有两百美元的用户才能用到,所以说很多用户呢,他用的是那个 thinking 模型,然后 thinking 模型还是偏弱的那一档,然后甚至是用的普通的五点二的模型。就其实我觉得如果 你有些问题要问 ai 的 话呢,除非是特别简单的问题啊,否则我都不建议用那个普通的 gpt 五点二,因为它这个能力我觉得还是蛮弱的,那个 thinking 模型呢,要比它强很多。然后那个 pro 模型呢,真的是非常的专业,因为我试过很多场景,就是那些比较小众的或者比较难的问题, 这三家模型里面确实只有 g p p 的 pro 版能够做出来,所以说我觉得就是说真正是。呃,我是今天的视频,主要是我个人的使用的一个体会啊,可能不同人的体会不一样,但从我的角度来看,就是模型能力最强的就是拆 g p t 啊,当然可能是 这个两百美金的一档才能用到 pro 版。如果你需要一个极强的推理强的,然后以及偏科学研究的一个模型的话,那我觉得就没有别的选择。 嗯,但拆 gp 的 问题呢,也有很多,首先呢,他太慢,就如果这三个模型一起比你问了三个模型一个问题,对吧?那其他两家都问到第二个问题,第三个问题了,拆 gp 可能第一个问题还在想,那拆 gp 就是 说他思考的过程很慢,然后另外的话呢,就是他说话很保守,呃,另外说话也是很政治正确的,很注重 a 安全的。 那我们前两年的其实都过硬 offai, 它是可露色 ai 嘛,就是它没有那么 open, 然后觉得它没有那么安全。但其实以我国我们以今天的眼光来看呢, offai 还是那一家, 起码和同行的衬托下吧,它还是那家最注重 ai 安全的公司吧。然后对,这是拆机笔记。然后如果说 club 呢,它的特点也很明显,它是一家,就是它是一个真正能干活的一个 ai, 然后它的文案能力也是最强的。然后如果你想输出一些很长的内容的话呢,这 club 可以 一次性 给你输入的非常非常长。然后如果你在网银端写一些代码的话,他也可以或者说做一些这个什么,让他写些文件什么的,他这个能力都特别的强。就我觉得可乐这个模型呢,他从真正从这个基本的模型来看,他并不是最强的,但他是调教的最好的,就是他非常的好用,然后也非常能干。 呃,然后还有就是他写的文案也是最好的,不管是中文还是英文,我觉得是这样的,但他的文案呢,其实不是文字级的。就如果你 他比如说呃,让他取一个两个字的名字的话,他就取不好,但是如果你让他写一句话,一段话,他能写的非常好。这个的我试过很多次,我也感觉比较奇怪,就是他这个模型的文字能力很强,就文案能力很强,但是你要具体找一两个文字,他其实不太行,但是说让他写一句话,让他写一段话,他是所有模型里面写的最好的。 那如果说,呃,这样的话呢,就是我觉得他是一个最有创意的,最激进的一个模型。就是 比如说如果有一个什么这个这个这个竞争方面的一个问题,涉及到侵权什么的,就这么的就可以说你可以做一些擦边的事情之类的吧,就是他建议我走一些类似侵权的路线,不用管的那边的品牌、商标什么的,这些商业的建议上面啊。然后另外我还有一次问他一个网站的问题, 他建议我可以用这个 p s u 的 方式,那个做上几万张页面啊,怎么样?反正我觉得明显是不太符合他们家 google 的 搜索引擎的政策的啊,但他也建议我这么做,然后而且专门是一个非常自信的一个模型,比如说在一些 比较难的领域吧,或者说在一些小众的领域吧,如果你问拆 g p t, 你 能不能就是作为这个领域的专家来帮助我拆 g p t 呢?就说他可能会说的比较保守,他会说我还不能替代这个领域内 真正的专家什么的,那詹姆呢?就很自信,他说没问题,我就是这个领域内现在我就这个领域内最厉害的专家什么的,反正他就是很自信的一个模型。然后他的缺点呢?可能就是, 呃,其实我觉得他是比较顺从用户的一个模型,就比如说你一个文案,你改了一版,那他就会经常夸赞你改的这一版比以前的要更好,但其实呢,未必,那你如果你一个文案一直在改,那他就会说,哎,这一版比前面的好太多了,那这新的这一版又好了很多,反正每次都好了很多, 其实不是一个特别客观的一个评价。呃,然后就是这个詹姆斯其实没有很多人想象那么爱干活,他其实不太容易输出那种很长的很严谨的东西。 而且呢, james 其实是有点神经质的一个模型,就他对自己呢,其实没有一个很清晰的一个认识,就是比如说你让他推荐几个 ai 工具,他可能会说现在的 ai 工具都很厉害,你可以用拆 gpt 啊,用 cloud 这些模型,就他好像就不觉得自己很存,存在感很强,就很少给别人推荐自己。 然后另外前前段时间他那个 banana 那 个画图不是很这个很出圈嘛,但是 james 自己其实并不知道自己有 another banana 这个模型,然后他经常人要他写一个画图的 prompt 的 话,他写的可能是一个 midori 的 prompt 什么的,就他自己其实不是很清楚自己的能力在哪里,这个模型还是蛮怪的,所以说我个人的话 用专门来用的相对来说不是很多。然后就是但是我在非常需要创意的时候,我会很看重他的意见,因为他是一个比较这个激进的一个模型吧,然后他提出的一些想法可能是激不起他的,提不出来的。 所以说就是如果说总结一下的话呢,就是如果有难度比较大的,偏科学的,追求真实的,就就或者说一些小众问题比较难掌握的。呃, 然后你如果不需要很高的这个就是你不需要他的答案很低的话,这时候呢,就用拆 g p t 是 没错的。然后如果是普通的问题, 就是是个大模型都能回答的问题,然后我会用 cloud, 因为 cloud 的 交互体验是最好的。然后还有就是技术问题,写作文案方面的问题我都会问 cloud, 还有就是写 prompt, 其实 cloud 也写得不错。然后还有就是另外就是说需要创造灵感的时候, 那我会用 jimmy, 然后还有就是或者说你三个模型就多问一下嘛,那这是我个人对于对话 的一个用法。呃,然后呢就说第二个场景,第二个场景呢就是,呃,现现在很多人搞这个 web coding 嘛,然后就是在命令行里面用 ai, 这其实呢是我建议很多人 现在用 ai 的 一个方式,因为只有这个 ai 在 命令行里面,我就才是真正的离市场也很近。因为它就可以来操控你的电脑嘛,你就可以让它来做很多就是很连续的动作,或者上来直接修改你电脑那些东西什么的。就是其实现在当然也有很流行的就是 open cloud 啊什么的,那些那些软件啊,但其实我觉得 就是,嗯,用 cloud code 或者说 codex c l i 的 话,它的可控性比 open code 要强很多啊,这里就不查太多。那首先如果说这里面最流行的两家肯定是这个,呃,可乐 code 以及酷 酷 c l i 就是 offenai 的 模型嘛。那这两家相比的话呢,我觉得 codex 它是对新手最友好的,然后它的交互体验最好。然后你要是这个,这个中文怎么说?叫结对编程吧,你要是和它一起来 边商量边讨论边编程的话,它整整个的体验是非常好的。而且可乐的好处呢是它,嗯,文案的能力,写 prompt 能力都很强,因为你在写代码做产品的时候呢, 你不可避免就要在里面写一些文案,写一些 prompt, 那 这时候呢?你如果在可乐库的里面,它本身对你项目的上下文很熟悉,那用它来写 prompt 写文案其实是非常舒服的一件事情,它能能写的非常好。 呃,如果说 codex 的 话呢,其实我觉得就是它最大的问题就是文案能力太差,斜括号特别的差。那当然, codex 五点三它编程能力是很强,但是 它这个五点三啊,并不是拆 gpt 的 那个五点三,就它应该是一个专有的一个一个编程的一个模型啊,就这个模型,其实它的这个文案能力几乎就是没法用。我觉得,所以说如果你每次写文案还都要再去调用 javascript, 或者说再到网页那边去写的话,其实 你也损失了很多的。就是上下文嘛,其实就非常的麻烦。所以说我个人就是觉得酷睿如果你写的那个产品需要很多的网页访问的话,它是不太好用的。呃,但是并不是酷睿没有用,因为酷睿呢,它的代码能力非常强。那我个人一般的用法是用会用酷睿来 review cloud 写的代码,那克里斯就会像一个严父一样的指出 cloud 的 各种错误,然后你再让 cloud 去改嘛?然后就是因为为什么让 cloud 去改呢?因为你始终如果是一直前面代码是 cloud 写的,那你就用后面用 cloud 改的话,一致性会比较好一点啊, 然后当然他如果实在改不了,就克里斯也改。然后另外一些就是,呃,如果你这个这个这个这个代码本身比较难,然后他需要的逻辑非常强, 或者说本身是一个小众语言写的东西,那这时候呢, cloud 确实搞不定,你就可以直接用 codex 来写。所以说我觉得在这个编程体验上,或者说在这个命令行的体验上,这个 cloud 呢是遥遥领先的。但是 codex 同样也是不能替代的吧,因为它就是这种,还是这种硬推理专业能力是非常强的。 那有人可能说这个这个詹姆莱怎么样,对吧?詹姆莱其实现在呢也有很多人关注,但是普遍大家用下来还是比前两家要这个差很多的,这个写程序经常一次也写不对。但甚至我还是要说詹姆莱也有他的好处,就首先他的上下文很长, 就是你可以让他去做一些上下文需要很长上下文的东西,他其实还是有他独到的优势,就他可以调用 google 的 搜索, 就是你因为其他软件都是用一些比较简单的方式去搜网页或者获取网页的内容嘛。但是 java 它是知道 这个,这个你可以调用谷歌的这个搜索能力,那这在很多时候呢,还是非常的好用的。那甚至呢,你如果电脑里面装了 java 之后,你还可以用 cloud, 或者说用拆机,用那个这个酷克拉斯来调用 java 的 搜索能力,那我觉得这也是非常方便的一件事情。所以我觉得其实这 java 是 一个被低估的产品,它其实有很多它能用的一些场景吧。呃, 然后就是这样的本身呢,就是他免费用户非常友好,所以我觉得免费用户也都可以去用。然后但他其实反而就是对这个收费用户没有那么友好啊,因为谷歌那套系统搞得乱,然后因为我是这个这个两百米的用户吗?然后他就可能是以为我是一个企业用户,然后他就 就因为我看了那个谷歌的那个 cloud 里面的服务嘛,所以说它就不能让我在网页端来登录这个这个专门来的 c r i 来用,然后我就需要用调 api, 反而是那个免费用户不需要花钱就能用,那我交了两百美金之后呢,我还得调 api 走 api 的 费用。而这个问题呢,是 去年六月,就是屁零级的一个 bug, 是 谷 google 那 边要修的,但是从去年六月到现在都还没有修好,所以说我觉得这但 google 现在各方面的进展也还是蛮大的。但我觉得这个大公司啊, 他还是有很多这个大公司的问题。然后不管是这个詹姆莱的网页版,还是他的这个编程,这个这个这一套东西吧,其实都是有有有有,我前面说了啊,都是有点神经质的这么一个模型,然后我还看到有人说因为他使用了呃, photoshop language, 就是 可能辱骂了詹姆莱吧,詹姆莱就拒绝在工作什么的, 本来是个模型,还是蛮有意思一个模型哈。然后这是第二个场景,就是这个这个 bug 定这样的一个场景,那第三个场景呢?就说到这个特殊的能力, 那首先呢,詹姆莱大家都知道他画图是最强的,就是唯一的强,对吧?然后他最近又增加了作曲等等功能,就是如果你对作图有需求,那毫无疑问你除了詹姆莱就没有别的选择,如果你只给衣架交钱的话, 那而且呢,这样的那个两百美金的版本做的图是没有水印的吗?所以说哪怕只为了一个做图的功能,如果你经常用的话,这样也需要买的。呃,还有呢,就是其实姑姑毕竟是一家大公司吧,大公司当然前面说有他的问题,但他有他的好处,就如果你买这么的呢,给你一堆 可能还是比较有用的东西,比如说它有这个 google 这个云端的存储空间,有三十个 t, 还是蛮大的。然后呢,就是还有包括看 youtube 也没有,也给你一个那个 premium 的 会员嘛,就是没有广告什么的。另外呢,呃,还有一个比较好的,就是它每个月会给你一百刀的 a p i 的 这个这个费用,然后如果你 自己写的一些代码里面需要调 google 的 这些 api 的 话,你就可以直接从这个一百里边抵扣的嘛,这样相当于其实这两万美金,你不光是可以用它这个模型,对吧?你还有一百美金的 api 的 费用,其实还是蛮划算的。 然后如果说 cloud 呢,它就是就是完全是另外一个极端嘛,就是 google 是 一个大公司,它能给你很多别的服务,对吧?云这个云盘啊,这个 youtube 啊什么的, cloud 什么都没有,那它唯一的就是 就是干活的这个额度,他就拼命给你干活,但是 kol 这个模型呢,确实是能干活。然后如果你是这个 web 编辑,要写很多的代码,是吧?然后写很多的的程序的话,它确实是最好用的,而且它 就是什么都没有,就是甚至你赚了最多钱之后,你拆 gpt 它还有一些什么额外的一个浏览器了的,虽然我个人觉得不是多好用啊,还有一些别的这个产品和服务,然后而且拆 gpt 呢,你花了钱才能解锁那个最高级的 pro 模型嘛,但是 kol 的 呢,就是 没有什么东西,你用的和那个二十刀的也是一样的,但是就是额度多,就是拼命给你干活,他就这一点,但是干活确实好用的。然后就是拆 c p t 嘛,拆 c p t 就是 它, 嗯,怎么说呢,他就是一个最科学的逻辑,最强的,最能推理的这么一个这么一个一个模型啊,然后就没什么好说的,当然你花了两百美金之后,就拿拿他那个最强的模型吧,然后他还给你一点别的什么浏览器什么的,我觉得没有没有什么,个人觉得没什么太大的用途,所以说 这个,呃,在这个方面来看呢,就看你是看中一个谷歌的悬崖洞,或者说看中画图的话就买这这样的,然后如果看中呢,就是纯工作生产力 买克拉的,对,大概就是这样的,然后如果你从事很多科学的硬推力的工作,就用柴机 p t 啊,这是这样的一个 一个一个一个选择吧,所以说就从这三个方面把这三个产品给大家介绍一下,那大家呢,就可以根据自己的需求来进行选择,今天就和大家分享更多。

好消息,就在刚刚, cloud 上福利了, and snapchat 宣布给 cloud 全用户开放了双倍使用额度,换到北京时间就是凌晨两点到晚上八点, 简直完美的覆盖了我们中国的使用时间。如果你还没有 cloud, 我 可以分享给大家一份使用的策略,但额度是一方面。更惊喜的是, cloud 悄悄上线的另一个功能,你可能还没有注意到,它现在支持在对话里直接生成交互图标和格式化的界面, 这个界面可以直接点击拖动,可以实时响应。我用了两个案例测了一下效果,这个效果可能和你想的不一样, 比如我想规划未来十年我的理财,我就让他生成了一个交互式的可量化图标,对比三种投资策略的复利增长曲线, 分为激进型的方案,稳健型的股债组合,还有一个是保守型的大额存单。我把初十的本金设置在五十万,每年年底追加五万。这段 prompt 我 放在评论区了,你可以直接拿去改成自己的数据试试。 出来的界面还是非常不错的, x 轴是年份, y 轴是总资产,三条曲线清清楚楚,鼠标悬停,真的看到具体的金额, 还有复选框,可以单独勾选对比任意一条曲线。但我想这个可能还算基础,我想看看他的上限在哪里。于是我又给了他一个更复杂的任务,设计一个二手房房贷的计算器, 房屋总价三百万,首付百分之三十,对比等额本息和等额本金两种方式,让他给我三十年内每月还款额度的变化趋势。 你看,他不是只画了一张图,对话框里直接渲染了折现图,下方弹出两张并列的卡片和一个柱状 图。其他的信息,什么首月还款、总利息、总还款额都能呈现,还有前五年的年度还款压力对比。然后我拖动了一下年利率的滑块,所有的数据实时刷新。 说实话,这个完成度太好了。流程图、架构图、交互式小工具基本都覆盖了,现在免费版在内所有用户都能用。一开始我差点把它当成一个小功能直接划过去了,直到我回想了一下以前的工作流。 在 ai 里,如果你想分析完一组数据,想做一个可设化,你得把数据导出来,或者通过 r、 t、 f、 x 来查看。三四步操作可能花不了太多的时间,但问题不是时间,也不是效率,是思维的连贯性,每一次切换工具,注意力就会被截止一次, 这才是这个功能真正想解决的事,思考不会被中断。比如你想清楚一件事,就马上能看到它是什么样子,整个过程不需要离开当前的认知,上下文无缝衔接, ai 给人带来的效率和交互体验真的是越来越好了。

不发背刺,可否和 gemini 同时开始大规模限流? cloud max 用户,二零零美元一个月, 一条提示词下去,额度从百分之二十一直接跳到百分之一百。 gemini pro 用户更惨,额度被砍了百分之九十七。充钱不一定是大爷, gpu 才是。三月二十三号开始,大量 crud max 用户报告额度异常消耗。 antropic 三天后才回应说工作日晚八点到凌晨二点限流,但消耗得更快。具体是多快 没说。 cloud code 写一天代码按 api 价格折算,大约两百美元,月费才二零零。 antropic 请不起自助餐了。谷歌更狠, jimmy pro 用户,二十美元一个月额度从每周三亿输入 token 直接砍到不足九百万,达到限额等最长七天 二五零美元的凹处。用户也一样,同样的工作流,九十分钟清零。谷歌开发者论坛高赞铁标题,暗砍配额信任崩盘,生产环境彻底废了。月付二零零美元,用出四千美元的算力,这种模式注定走不远。 osapic 先用双倍额度试探错峰意愿,再正式推出高峰限流,下一步可能就是更细的分层定价, 十天有七天都在出问题。两百五十万人逃离叉 gpt 投奔 cloud, 现在发现 gpu 不 够就是不够。如果你是国内开发者, cloud 随时可能封号,通过率只有百分之三点三。 gemini 额度砍了百分之九十七,基本废了。 你需要一个不翻墙不封号,额度管够,而且真正能写代码的替代方案啊。目前国内能打的编程大模型,我们横向对比,四个通用千问 queen 三点五 plus, 每百万 token 四元,综合能力强,但代码针对性一般。 kimi k 二点五,每百万 token 四元,长上下文是强项,但编程偏弱。 mini max m 二点七,每百万 token 一 元价格屠夫编程能力出人意料。 glm 五 turbo 每百万 turbo 一 元,编程能力最强,性价比之王。 glm 五 turbo 是 目前国内编程能力最强的大模型,实测 swe 减 bench 七十七点八分, mmu 减 pro 八十七点八分。价格每百万 turbo 只要一元, 用一个月按 cloud code 的 用量算,大概只要四十到八十块钱。而且智普是国内公司,不会封你的号,不会半夜限流,不会有各种花式背刺,我用了两周, 太香了。 mini max m 二点七是另一个惊喜价格,同样是每百万 token 一 元,虽然编程能力略逊于 glm 五,但在创意写作和多模态方面表现更好。 如果你除了写代码,还需要 ai 帮你写文档、做方案, mini max 可以 作为第二选择。如果你现在还在花二零零美元订阅 cloud max, 我 的建议是先用 g l m 五 turbo 替代日常编程 mini max m 二点七做备选。省下来的钱买个好键盘不香吗? 国内模型进步速度惊人,现在不用翻墙就能用出接近 cloud 的 效果。 ai 自助餐时代可能真的要结束了。聪明人已经开始找 plan b g r n 五 turbo 的 邀请码我放在评论区了,自取点赞加关注,赛博杨千焕,明天见!

哈喽哈喽啊,今天来给大家做个国内主流大模型套餐从夯到拉的排名啊,那为什么会有这期视频呢?因为我发现还是有很多同学,不管是刚入门的啊,还是有一定经验的,对大模型套餐的一些细微差别还不是很清楚。 然后我本人也因为都是买过这七个大模型的套餐嘛,所以说我今天会从个人的使用心得、性价比对比和避坑指南来进行一个综合排名,并且我会对每一个模型都推荐一档我个人认为最适合大家的套餐。 ok, 首先是 cloud 会员,那他这边分为 pro 跟 max 两个等级啊,但实际上啊,不论你是哪一个付费等级,你都能使用到最新的一个模型。只是说你如果是 max 的 用户,你可能在刚发布的时候你就能够直接使用,那 pro 用户可能要等一等, 但是最终你都能用到最新的,就比如说前段时间新出的索尼腾和 opps 四点六,那现在 pro 的 用户也都能使用到, 所以我这边更推荐大家使用 pro 这一档的套餐。我自己用的也是这一个,目前用量也都是足够的啊,除非说你是啊,需要大量的研究,或者说有非常多复杂的任务是需要交给 ai 来做的,否则的话,像一些简单任务,你可以交给其他嗯,比较便宜的模型。 然后在使用难度上面, cloud 可能是最难的啊,但是这个不在我的评测范围内。那像其他的一些 啊,海外的模型可能用一些普通的魔法就可以,但是 cloud 可能用到一些啊,比较高级的魔法啊,那这边我就不再展开了,所以说综合下来啊, cloud 我 会把它排到一个 pound 的 级别。 然后就是我们的老朋友 gbt, 那 gbt 的 会员也是我见过不同等级区分度最大的。首先是购这个套餐你是用不了酷 max 的, 必须要升级到 plus, 也就是二十到一个月才能够使用啊。另外还有一点我个人不太能接受的,也就是 必须要升到这个两百到一个月才能够使用到目前 gbt 最好的一个模型 pro 这个模型啊,所以说,呃,综合下来看的话, 呃,我会推荐大家去购买这个 plus 的 会员啊,因为毕竟 codex 目前不存在一个降脂的问题啊。然后 gbt 会因为哪怕你有魔法,会因为不同地区会产生一些降脂的可能性 啊。所以说综合下来,我目前只能给到 gbt 一个人上人啊。这边也说一下,我曾经是 gbt 的 一个非常忠实的一个用户,用了也订阅了也快一年的时间啊,但是可能随着后面 top 的 跟 jimmy 的 一个出现啊,所以说啊,我已经有退订他的会员大概小半年的时间了吧。 接下来第三个就是国外御三家的新贵,谷歌的 jamie 啊, jamie 啊 ai 的 话也是分三个等级的会员, plus, pro 跟 ultra 啊,但是它这三个做的是要比 gpt 好 很多的,为什么呢啊,因为谷歌最强大的全家桶啊的一个能力在 ai 上面也体现出来了,它还有一款 非常强大的 ai 笔记本工具叫 notebook lm 啊,包括你自己的一些文章也都是可以放进去帮你统一整理的 啊。然后啊,像这样全家桶能力啊,那在最低档 plus 这一档,你就是能够直接使用到啊,然后你升级到 pro 这一档的优势是什么呢?你能够用到谷歌的 啊,编程相关的一些工具,像 anti gravity 就是 一款谷歌的 ai 啊,另外包括像谷歌的这个 ci 啊,它是对标 cloud code 的, 也是有一个命令行的 agent 啊,你在 pro 这一档也是能够使用到的 好吧,然后,呃,所以说这边我会推荐大家用 roj 档啊,如果你是有开发需求的,如果你没有的话,你就单纯的可能是一些啊整理类的工作,我觉得用 plus 啊就足够了,不然的话在这个笔记本工具里面你会每天会有限额啊 啊。并且谷歌还有个最大的优势,毕竟是大厂啊,他会给出非常多的优惠啊,包括前三个月的一些优惠啊啊,非常多的,比如说第一年的什么优惠啊,会有非常多啊,所以说我觉得谷歌在这方面啊,综合排名我肯定是会给到吭的。 ok, 那 聊完了国外的,我们再看一下国内的。首先是智浦啊,那我觉得智浦在魔性能力上面放在国内肯定是数一数二的 啊,但是它的缺点就在于它的稳定性,你就像我做视频的今天啊,是三月二十一号,我打开这个控制 plan 才发现啊,这三档竟然都会出现授信的一个情况啊,那也就证明它的算力是不够的 啊,并且我之前在三月初的时候有收到过啊,因为一些资源紧张的问题啊,这个 light 和 pro 套餐的入口会直接被关闭掉啊 啊,并且在 gm 刚出的时候,这个 light 套餐是用不了啊,当然我现在也不清楚,因为我用的是 pro 这一档套餐啊,所以说大家在购买的时候可以看一下,如果 light 这一档 啊,能够使用到最新的 glm 的 模型,那我觉得就买 light, 因为它的不稳定性,所以没必要买贵的。如果说没有的话,大家觉得 glm 是 国内最好的话,那肯定还是推荐 pro 这一档套餐啊。 然后啊,因为现在这个 open club 比较火嘛,啊,所以说 gm 也推出了专门龙虾的这个月卡,但是我看了一下,一个月才一亿托克,呃,就我自己用 open club 大 概一周的时间可能就已经用掉了, 就五到六亿吧,所以我觉得是不太够的。但是它这个 gm 的 这个 turbo 这个模型用在龙虾上面是非常好用的,这个我不得不承认。呃,但是 整个 gm 的 稳定性还是要打上一个非常大的问号的。所以说我这边综合排名啊,只能给智普 npc。 接下来就是国内的 mini max 啊, mini max 的 话,在魔性能力上面我觉得是不如呃, gim 的 啊,那它的优势在哪呢?第一是它的稳定性,第二的话就是它的量大管饱,大家可以看到它这边呃,有非常多的套餐种类。那 啊,大概归一下类的话,就是前三,上面三档是可以用到他的 m 二点七的,也就是前两天出的 m 二点七的高速模型。那下面三档就是普通的 m 二点七 啊。但实际使用下来,我觉得这两档并没有特别大的区别,就单纯的是一个耗时的快慢啊。那如果说你是什么 ai 从业人员对吧?我需要每天八个小时内去产出 一个固定的一个数,那我需要模型的返回非常快啊,那这个你可以去考虑用到 minimax 的 一个 high speed 的 模型,比如说这个极速版啊,如果说你只是呃玩玩,或者说你只是需要提效,不需要一个非常 啊快速的一个响应的话,那用下面的 plus 和 max 就 够用了。并且啊,同价位,比如说一百多价位的话啊, mini max 的 它这个 max 的 套餐量绝对是够用的,所以说,呃,我这边综合下来的话,会给到 mini max 一个顶级。 接下来就是 kimi 啊,那 kimi 的 话,呃,首先它的魔性能力,在年前它推出了这个 k 二点五啊,我当时也是买了这个九十九元这一档套餐去使用, 在当时它的模型能力是要比 g m 跟 mini max 好 的,但是后面随着春节前啊 g m 五, mini max 二点五,包括我现在最近的二点七啊的一个发布,那 一米二点五的这个模型啊,就被比下去了啊。另外它还有一点我觉得非常奇怪的,就是我同样的任务,我当时做过一个测评啊,用 cloud 啊,都用 cloud code 的, 然后国内的几个模型啊,什么 gim 啊, mini max 啊, kimi 啊,包括摆店啊啊,包括自己 cloud 的 那个套餐,我会发现 kimi 他 用的 token 啊,在相同的几日,相同的 需求的情况下啊,他竟然会用到最多的一个 token 啊,我也不知道他内部是怎么记呃怎么去算的啊。所以说 啊,如果说啊,硬要我推荐的话,我可能会推荐幺九九啊,如果你一定要用 kimi 这个套餐,因为九十九元是绝对不够用的啊,但是综合下来比的话,我只能给到 kimi 一个啊,拉完了好吧 啊,最后一个就是千问的百联套餐啊,那这个比较奇怪,我今天点开的时候发现它这里面只有一个 pro 的 高级套餐 啊,并且也是一个售庆的情况啊。我前面买的应该也是属于 light 那 一档四十多块钱的啊。然后它这个摆链的话,它的好处是什么呢?它除了可以用到啊,千万自家的一些模型之外,它可以也用到 啊,像 mini max 啊, gm 五啊, kimi 啊都能用啊,并且它也是能够用到 deepsea 的 啊,因为 deepsea 大家都知道官方是只有走量的嘛,是没有这种套餐的这种概念的, 所以说我觉得百联在这方面是做的比较好,但是我也没有。呃,在百联的套餐里面去用过 mini max 跟 glm 五,因为我觉得这种非官方的啊, 我之前也用过一些这种接口平台啊,一些啊三方的,我觉得在三方的接口里面,我觉得还是会出现一些降智的情况,所以说如果你要买百联这个套餐,我建议就是还是奔着去使用千问这个方向去买好吧。然后,呃, 但是他的综合能力是比较强的,所以说我这边会给到一个 n p c ok, 最后我再分享一下我自己的套餐组合吧。首先, club 的 我是啊必买的啊,每个月都会订阅他的 pro 这一档套餐啊,在一些复杂的任务啊,复杂的需求 啊,包括像一些方案设计啊,一些调研,我都会让 club 的 来做。那爵麦奶的话,我是直接买了一年的 pro 会员啊,因为首先他的权限能力很强,我会用到他非常多的产品 啊,其次的话,像一些琐碎的问题我都会问到 jimmy, 我 一些突发奇想的一些灵感啊都会给到他,他也能够帮我来汇总起来 啊。然后像国内的话我会去买到这个 mini max 啊,那像 kimi 跟百炼日普等我这些套餐都过期之后啊,会直接使用 mini max, 为什么呢?首先它的稳定性强,第二它量大管饱啊,我现在的 open club 小 龙虾 接的也都是 mini max, 他 每天都在跑,使用量我觉得也都是 ok 的 啊。当然现在 m 二点七出来之后会有一些限速的情况。那这个我只能说在观望吧。后面如果其他模型慢慢跟上的话,也可能会切换。 行,那本期视频的内容就先到这,希望能够对大家在模型套餐上面的选择提供一些帮助。我是不如我们下一期再见。