本期从哼到拉瑞平各大视频平台,纯个人评价哈。先说 b 站,这可以说是目前在国内见过的社区氛围的天花板了,不管你想学什么,在这里都能搜到,不过有一说一,这几年人越来越多,林子大了什么鸟都有, 以前的 b 站那是没得挑,现在的 b 站虽然水混了点,但我认为 b 站依旧是国内质量最高的视频平台了,这里毋庸置疑,给到哼。接着就是抖音竖屏短视频的霸主, 这地怎么说呢,用户普遍比较年轻,虽然抖音 h 方面的审核是国内最严的,但是它不省略其那很多心梗都是从抖音传出来的,不过虽然槽点多,但架不住它体量大,确实好刷。这里给个顶级吧,下一个快手。快手其实跟 b 站算是同龄人, 基本都是学生用户,但这俩现在长的是一个天一个地,这里是慢摇文化发源地,具体多辣眼睛我就不细说了,懂的都懂,刚出来那会其实还挺好,现在风评只比小红书高一点, 还是希望官方能优化一下审核吧。这里给到 n p c 下一个小红书。小红书属于是两级分化特别严重,学知识是真能学到,但是神人也是真的多,相信大家看到过的很多猎奇文案来源基本上都是从小红书里传出来的,这里也不好评价了,直接拉完了。然后是优酷视频, 以前的优酷跟 b 站一样,教学科普,游戏,解说什么都有,没啥节奏,风评也不错,不过现在不知道是不是官方直接摆烂不管了,全是盗视频的营销号,可谓是一手好牌打的稀烂,直接拉完了。 最后一个微信视频号,家里长辈们的最爱,相信大家都多多少少有家里长辈给你微信发过那些洗脑营销号内容的时候,文案全是一些不切实际和制造家庭矛盾的内容,可谓是互联网神级灾害了,这里必须爬到拉完了。那最后大家觉得哪个平台最好呢?
粉丝3575获赞12.8万

vs code 如何接入 cloud code 或者 gemini 这样国外的大模型?呃,上一期视频我介绍了几个国内的 ai 编程助手,有一些朋友追求比较高,购买了国外的 cloud code 的 大模型的 api, 但是不知道如何在 vs code 中使用。我今天特地做一个视频来帮大家快速的安装好这些国外的大模型。好的,言归正传。呃,使用这些国外的大模型呢?我们需要安装一个 vs code 的 扩展 client, 大家记住英文拼写是 c l i n e, 我 们来安装一下,点击 vs code 的 左侧这个扩展按钮,搜索 c l i n e client 第一个就是我们要安装的 client, 这个是英文版,如果大家对英文有点抵触的话,可以试试安这个 client chinese 或者 client 中文版试一下。我就先安个原版给大家讲解一下。 安装好了之后,左侧这里就会出现一个机器人头像这么图标,我们点一下这个呢,就是 client 的 主界面,我们首先要在这里做配置,把我们的 api 添进去,选择呢这个 bring my own apikey, 选中之后点下面这个 continue, 在 这里就是配置我们自己的 a p i, 这个 a p i 的 provider。 我 们在这里选什么呢? open i compatible, 这个是 open i 的 兼容性,不要选下面这个 astropic, 要选这个 open i compatible, 点击这里选中之后呢?然后我们在这里还有三项被需要, l 这个一般买的都是国内的中转,他在给你的这个文档里边肯定会有他们中转的地址,把中转的地址填到这里,然后 open i 的 k k 这里填上,然后是选什么呢? mod id 好, 复制上,然后点 continue。 好, 我们点 continue 把这个关掉,这是它的广告,这个也关掉,这个是它的提示。哎, 这样我们就设置好了,可莱也可以在这里右上角的这个齿轮按钮,可以在这里修改你的这个 api。 呃,还有其他的选项,主要是这个我们要在这里把语言从英文改成简体中文 模型配置完了之后呢,我们要给他这个文件的读写权限,就是点击这个 auto approve, 这里我们要把读所有的文件,写所有的文件运行命令 和使用浏览器这些全都给他选上。还有这个开启提示。好,这个时候我们就可以开始使用这个格式,然后让他来给我们生成代码。这里 at 是 添加上下文,这个加号是添加文件或者图片,这个是 m c p, 这个是管理 client 的 规则或者工作流。这个我们就先不要搞那么复杂了,这里它也有 plan 和 action 两个选项,也就是说我们点击 plan, 它就可以先给我们规划点, 点击 action a c t, 它就可以实际的给我们产生代码了,这个是跟 chain solo 模式差不多。好,然后我们在这里简单的做一个页面,使用 h t m l 语言创建一个登录页面,这里也有规划和实施两个模式,在这里是计划模式,这里就是直接实施模式,我们直接选择这个 x i c t 模式, 开始让它来生成我们的页面。好,我们可以看到页面已经开始自动生成了, 提示我们已经创建完,完成了,登录页面已经完成,已经成功创建包含基本的 html 结构样式和简单的登录功能脚本。接下来我们启动本地开发服务器一测试,那就让它测试吧, 是不是出错了?我们需要提示它换一种方式来启动服务器, 它在这里直接调用浏览器打开了本地的这个页面。 好的,这就是这个页面不太完美,我们可以看到连接自定义的 api 已经成功了,至于其他的这些功能,我们之后再想办法,我会接着研究研究怎么让它顺利的工作起来。好,今天到这里感谢大家观看。

从杭到拉瑞萍各大主流 ai 学术生产历史用性第一个,豆包白嫖党首选。非常懂中文语境,查国内核心刊很准,还自带画图功能,即使准确度比较欠缺,但如果你是不想花钱, 主要写中文论文的本硕学生还是很推荐的。这里排名给到人上人下一个,千问。适合电商行业的学生,做市场调研,画交易流程图都挺不错,不过只是在这方面能力稍显突出,属于偏科生。 这里给到 n p c 下一个,腾讯元宝属于是功能多但实用性低,符合藤子家的传统,啥功能都有,但是效果不是很好,还容易混淆结论,只能偶尔用来搜个专属名词啥的。这里给到拉完了,下一个,讯飞星火 跟上面的千万一样,属于偏科战神,在语音转文字功能方面特别优秀,识别率高,准确率也高,只在开组会,做定性访谈等记录性场合用它录音转写比较推荐。这里给到 npc 下一个, deepseek 现在的时代已经不适合它了,没有特定领域的特长,功能还单一,像画图这些功能也没有, 唯一的优点就是免费,只能用来搜一些简单的问题。这里给到拉完了,下一个 chat gpt 老大哥依旧稳定发挥,查英文顶会论文一搜一个准,写代码、数据分析等也很不错,不过毕竟是国外的 ai 工具, 查找国内冷门文献还是有点费劲,而且会员还稍微有点贵,如果你常看英文文献,还是比较推荐的。这里给到顶级下一个。 jame 最推荐的 ai, 没有之一。背靠庞大的谷歌学术,找文献极其精准,而且画图能力可以说是所有 ai 中最强的, 像那些专业级的折线图、柱状图,也只需要把实验数据上传进去就能生成,非常适合需要大量图表和硬核推理的科研党。要说唯一的缺点就是收费了,这里给到吭,没毛病。 下一个 cloud, 属于 ai 中的文科生,不管是查各类文献还是整理论文,都很实用,而且准确率高。 缺点就是不能画图,这里给到顶级。最后一个 crock, 这个做学术生产就不是很推荐了, 回答比较娱乐,对写论文基本没帮助,而且价格还是所有 ai 里最贵的。唯一优点就是可以快速了解行业热点、新闻动态,但是并不精通,这里给到拉完了。

今天和大家聊一下现在最强的几个模型, chinese b t、 jimmy, 还有 cloud, 就是 哪一个是最好用的?就是我应该用哪一个?或者说呢,我如果有不同类型的任务,应该给哪一家的模型来做是最好的? 呃,这样的话题,另外呢,还有很多人觉得现在的 ai 也蛮贵的,就如果我只想订阅一家的话,我应该订阅哪一家比较好?那我个人呢,其实这三家都是两万美金的一档的会员,二十三家其实都用了蛮多的,所以说我觉得还是有一些经验可以和大家分享的。 另外呢,就是可能有朋友会说,现在国内也出了很多新的模型,但其实在我看来呢,就是国内这模型呢,还是和前面这三家有一个断档的差距的。就所以说,如果你人在国内的话,如果你能用上前面三家,不管是哪一家, 我觉得你在这个效率的提升方面,以及和国内的这些竞争方面还是很有优势的吧。所以我今天这个视频呢,就主要讨论这三家之间的区别。那现在呢,人们使用 ai 也有不同的方式,那比如说,呃,比较传统的方式就是在网页里面,或者在 iphone 里面和这 ai 进行对话嘛。 那如果从这个角度来说的话,那这个角度更多就是问 ai 一 些问题,对吧?然后也让 ai 来产生一些文案什么的这样的一些工作的话,那我是这样来看的,就是拆七 p t 呢,它是整体的模型能力是最强的,然后是推理能力,硬推理和做科学的能力是最强的。 嗯,但拆七 p t 呢,它其实有些吃亏,因为,嗯,它那个最强的 pro 模型呢,可能只有两百美元的用户才能用到,所以说很多用户呢,他用的是那个 thinking 模型,然后 thinking 模型还是偏弱的那一档,然后甚至是用的普通的五点二的模型。就其实我觉得如果 你有些问题要问 ai 的 话呢,除非是特别简单的问题啊,否则我都不建议用那个普通的 gpt 五点二,因为它这个能力我觉得还是蛮弱的,那个 thinking 模型呢,要比它强很多。然后那个 pro 模型呢,真的是非常的专业,因为我试过很多场景,就是那些比较小众的或者比较难的问题, 这三家模型里面确实只有 g p p 的 pro 版能够做出来,所以说我觉得就是说真正是。呃,我是今天的视频,主要是我个人的使用的一个体会啊,可能不同人的体会不一样,但从我的角度来看,就是模型能力最强的就是拆 g p t 啊,当然可能是 这个两百美金的一档才能用到 pro 版。如果你需要一个极强的推理强的,然后以及偏科学研究的一个模型的话,那我觉得就没有别的选择。 嗯,但拆 gp 的 问题呢,也有很多,首先呢,他太慢,就如果这三个模型一起比你问了三个模型一个问题,对吧?那其他两家都问到第二个问题,第三个问题了,拆 gp 可能第一个问题还在想,那拆 gp 就是 说他思考的过程很慢,然后另外的话呢,就是他说话很保守,呃,另外说话也是很政治正确的,很注重 a 安全的。 那我们前两年的其实都过硬 offai, 它是可露色 ai 嘛,就是它没有那么 open, 然后觉得它没有那么安全。但其实以我国我们以今天的眼光来看呢, offai 还是那一家, 起码和同行的衬托下吧,它还是那家最注重 ai 安全的公司吧。然后对,这是拆机笔记。然后如果说 club 呢,它的特点也很明显,它是一家,就是它是一个真正能干活的一个 ai, 然后它的文案能力也是最强的。然后如果你想输出一些很长的内容的话呢,这 club 可以 一次性 给你输入的非常非常长。然后如果你在网银端写一些代码的话,他也可以或者说做一些这个什么,让他写些文件什么的,他这个能力都特别的强。就我觉得可乐这个模型呢,他从真正从这个基本的模型来看,他并不是最强的,但他是调教的最好的,就是他非常的好用,然后也非常能干。 呃,然后还有就是他写的文案也是最好的,不管是中文还是英文,我觉得是这样的,但他的文案呢,其实不是文字级的。就如果你 他比如说呃,让他取一个两个字的名字的话,他就取不好,但是如果你让他写一句话,一段话,他能写的非常好。这个的我试过很多次,我也感觉比较奇怪,就是他这个模型的文字能力很强,就文案能力很强,但是你要具体找一两个文字,他其实不太行,但是说让他写一句话,让他写一段话,他是所有模型里面写的最好的。 那如果说,呃,这样的话呢,就是我觉得他是一个最有创意的,最激进的一个模型。就是 比如说如果有一个什么这个这个这个竞争方面的一个问题,涉及到侵权什么的,就这么的就可以说你可以做一些擦边的事情之类的吧,就是他建议我走一些类似侵权的路线,不用管的那边的品牌、商标什么的,这些商业的建议上面啊。然后另外我还有一次问他一个网站的问题, 他建议我可以用这个 p s u 的 方式,那个做上几万张页面啊,怎么样?反正我觉得明显是不太符合他们家 google 的 搜索引擎的政策的啊,但他也建议我这么做,然后而且专门是一个非常自信的一个模型,比如说在一些 比较难的领域吧,或者说在一些小众的领域吧,如果你问拆 g p t, 你 能不能就是作为这个领域的专家来帮助我拆 g p t 呢?就说他可能会说的比较保守,他会说我还不能替代这个领域内 真正的专家什么的,那詹姆呢?就很自信,他说没问题,我就是这个领域内现在我就这个领域内最厉害的专家什么的,反正他就是很自信的一个模型。然后他的缺点呢?可能就是, 呃,其实我觉得他是比较顺从用户的一个模型,就比如说你一个文案,你改了一版,那他就会经常夸赞你改的这一版比以前的要更好,但其实呢,未必,那你如果你一个文案一直在改,那他就会说,哎,这一版比前面的好太多了,那这新的这一版又好了很多,反正每次都好了很多, 其实不是一个特别客观的一个评价。呃,然后就是这个詹姆斯其实没有很多人想象那么爱干活,他其实不太容易输出那种很长的很严谨的东西。 而且呢, james 其实是有点神经质的一个模型,就他对自己呢,其实没有一个很清晰的一个认识,就是比如说你让他推荐几个 ai 工具,他可能会说现在的 ai 工具都很厉害,你可以用拆 gpt 啊,用 cloud 这些模型,就他好像就不觉得自己很存,存在感很强,就很少给别人推荐自己。 然后另外前前段时间他那个 banana 那 个画图不是很这个很出圈嘛,但是 james 自己其实并不知道自己有 another banana 这个模型,然后他经常人要他写一个画图的 prompt 的 话,他写的可能是一个 midori 的 prompt 什么的,就他自己其实不是很清楚自己的能力在哪里,这个模型还是蛮怪的,所以说我个人的话 用专门来用的相对来说不是很多。然后就是但是我在非常需要创意的时候,我会很看重他的意见,因为他是一个比较这个激进的一个模型吧,然后他提出的一些想法可能是激不起他的,提不出来的。 所以说就是如果说总结一下的话呢,就是如果有难度比较大的,偏科学的,追求真实的,就就或者说一些小众问题比较难掌握的。呃, 然后你如果不需要很高的这个就是你不需要他的答案很低的话,这时候呢,就用拆 g p t 是 没错的。然后如果是普通的问题, 就是是个大模型都能回答的问题,然后我会用 cloud, 因为 cloud 的 交互体验是最好的。然后还有就是技术问题,写作文案方面的问题我都会问 cloud, 还有就是写 prompt, 其实 cloud 也写得不错。然后还有就是另外就是说需要创造灵感的时候, 那我会用 jimmy, 然后还有就是或者说你三个模型就多问一下嘛,那这是我个人对于对话 的一个用法。呃,然后呢就说第二个场景,第二个场景呢就是,呃,现现在很多人搞这个 web coding 嘛,然后就是在命令行里面用 ai, 这其实呢是我建议很多人 现在用 ai 的 一个方式,因为只有这个 ai 在 命令行里面,我就才是真正的离市场也很近。因为它就可以来操控你的电脑嘛,你就可以让它来做很多就是很连续的动作,或者上来直接修改你电脑那些东西什么的。就是其实现在当然也有很流行的就是 open cloud 啊什么的,那些那些软件啊,但其实我觉得 就是,嗯,用 cloud code 或者说 codex c l i 的 话,它的可控性比 open code 要强很多啊,这里就不查太多。那首先如果说这里面最流行的两家肯定是这个,呃,可乐 code 以及酷 酷 c l i 就是 offenai 的 模型嘛。那这两家相比的话呢,我觉得 codex 它是对新手最友好的,然后它的交互体验最好。然后你要是这个,这个中文怎么说?叫结对编程吧,你要是和它一起来 边商量边讨论边编程的话,它整整个的体验是非常好的。而且可乐的好处呢是它,嗯,文案的能力,写 prompt 能力都很强,因为你在写代码做产品的时候呢, 你不可避免就要在里面写一些文案,写一些 prompt, 那 这时候呢?你如果在可乐库的里面,它本身对你项目的上下文很熟悉,那用它来写 prompt 写文案其实是非常舒服的一件事情,它能能写的非常好。 呃,如果说 codex 的 话呢,其实我觉得就是它最大的问题就是文案能力太差,斜括号特别的差。那当然, codex 五点三它编程能力是很强,但是 它这个五点三啊,并不是拆 gpt 的 那个五点三,就它应该是一个专有的一个一个编程的一个模型啊,就这个模型,其实它的这个文案能力几乎就是没法用。我觉得,所以说如果你每次写文案还都要再去调用 javascript, 或者说再到网页那边去写的话,其实 你也损失了很多的。就是上下文嘛,其实就非常的麻烦。所以说我个人就是觉得酷睿如果你写的那个产品需要很多的网页访问的话,它是不太好用的。呃,但是并不是酷睿没有用,因为酷睿呢,它的代码能力非常强。那我个人一般的用法是用会用酷睿来 review cloud 写的代码,那克里斯就会像一个严父一样的指出 cloud 的 各种错误,然后你再让 cloud 去改嘛?然后就是因为为什么让 cloud 去改呢?因为你始终如果是一直前面代码是 cloud 写的,那你就用后面用 cloud 改的话,一致性会比较好一点啊, 然后当然他如果实在改不了,就克里斯也改。然后另外一些就是,呃,如果你这个这个这个这个代码本身比较难,然后他需要的逻辑非常强, 或者说本身是一个小众语言写的东西,那这时候呢, cloud 确实搞不定,你就可以直接用 codex 来写。所以说我觉得在这个编程体验上,或者说在这个命令行的体验上,这个 cloud 呢是遥遥领先的。但是 codex 同样也是不能替代的吧,因为它就是这种,还是这种硬推理专业能力是非常强的。 那有人可能说这个这个詹姆莱怎么样,对吧?詹姆莱其实现在呢也有很多人关注,但是普遍大家用下来还是比前两家要这个差很多的,这个写程序经常一次也写不对。但甚至我还是要说詹姆莱也有他的好处,就首先他的上下文很长, 就是你可以让他去做一些上下文需要很长上下文的东西,他其实还是有他独到的优势,就他可以调用 google 的 搜索, 就是你因为其他软件都是用一些比较简单的方式去搜网页或者获取网页的内容嘛。但是 java 它是知道 这个,这个你可以调用谷歌的这个搜索能力,那这在很多时候呢,还是非常的好用的。那甚至呢,你如果电脑里面装了 java 之后,你还可以用 cloud, 或者说用拆机,用那个这个酷克拉斯来调用 java 的 搜索能力,那我觉得这也是非常方便的一件事情。所以我觉得其实这 java 是 一个被低估的产品,它其实有很多它能用的一些场景吧。呃, 然后就是这样的本身呢,就是他免费用户非常友好,所以我觉得免费用户也都可以去用。然后但他其实反而就是对这个收费用户没有那么友好啊,因为谷歌那套系统搞得乱,然后因为我是这个这个两百米的用户吗?然后他就可能是以为我是一个企业用户,然后他就 就因为我看了那个谷歌的那个 cloud 里面的服务嘛,所以说它就不能让我在网页端来登录这个这个专门来的 c r i 来用,然后我就需要用调 api, 反而是那个免费用户不需要花钱就能用,那我交了两百美金之后呢,我还得调 api 走 api 的 费用。而这个问题呢,是 去年六月,就是屁零级的一个 bug, 是 谷 google 那 边要修的,但是从去年六月到现在都还没有修好,所以说我觉得这但 google 现在各方面的进展也还是蛮大的。但我觉得这个大公司啊, 他还是有很多这个大公司的问题。然后不管是这个詹姆莱的网页版,还是他的这个编程,这个这个这一套东西吧,其实都是有有有有,我前面说了啊,都是有点神经质的这么一个模型,然后我还看到有人说因为他使用了呃, photoshop language, 就是 可能辱骂了詹姆莱吧,詹姆莱就拒绝在工作什么的, 本来是个模型,还是蛮有意思一个模型哈。然后这是第二个场景,就是这个这个 bug 定这样的一个场景,那第三个场景呢?就说到这个特殊的能力, 那首先呢,詹姆莱大家都知道他画图是最强的,就是唯一的强,对吧?然后他最近又增加了作曲等等功能,就是如果你对作图有需求,那毫无疑问你除了詹姆莱就没有别的选择,如果你只给衣架交钱的话, 那而且呢,这样的那个两百美金的版本做的图是没有水印的吗?所以说哪怕只为了一个做图的功能,如果你经常用的话,这样也需要买的。呃,还有呢,就是其实姑姑毕竟是一家大公司吧,大公司当然前面说有他的问题,但他有他的好处,就如果你买这么的呢,给你一堆 可能还是比较有用的东西,比如说它有这个 google 这个云端的存储空间,有三十个 t, 还是蛮大的。然后呢,就是还有包括看 youtube 也没有,也给你一个那个 premium 的 会员嘛,就是没有广告什么的。另外呢,呃,还有一个比较好的,就是它每个月会给你一百刀的 a p i 的 这个这个费用,然后如果你 自己写的一些代码里面需要调 google 的 这些 api 的 话,你就可以直接从这个一百里边抵扣的嘛,这样相当于其实这两万美金,你不光是可以用它这个模型,对吧?你还有一百美金的 api 的 费用,其实还是蛮划算的。 然后如果说 cloud 呢,它就是就是完全是另外一个极端嘛,就是 google 是 一个大公司,它能给你很多别的服务,对吧?云这个云盘啊,这个 youtube 啊什么的, cloud 什么都没有,那它唯一的就是 就是干活的这个额度,他就拼命给你干活,但是 kol 这个模型呢,确实是能干活。然后如果你是这个 web 编辑,要写很多的代码,是吧?然后写很多的的程序的话,它确实是最好用的,而且它 就是什么都没有,就是甚至你赚了最多钱之后,你拆 gpt 它还有一些什么额外的一个浏览器了的,虽然我个人觉得不是多好用啊,还有一些别的这个产品和服务,然后而且拆 gpt 呢,你花了钱才能解锁那个最高级的 pro 模型嘛,但是 kol 的 呢,就是 没有什么东西,你用的和那个二十刀的也是一样的,但是就是额度多,就是拼命给你干活,他就这一点,但是干活确实好用的。然后就是拆 c p t 嘛,拆 c p t 就是 它, 嗯,怎么说呢,他就是一个最科学的逻辑,最强的,最能推理的这么一个这么一个一个模型啊,然后就没什么好说的,当然你花了两百美金之后,就拿拿他那个最强的模型吧,然后他还给你一点别的什么浏览器什么的,我觉得没有没有什么,个人觉得没什么太大的用途,所以说 这个,呃,在这个方面来看呢,就看你是看中一个谷歌的悬崖洞,或者说看中画图的话就买这这样的,然后如果看中呢,就是纯工作生产力 买克拉的,对,大概就是这样的,然后如果你从事很多科学的硬推力的工作,就用柴机 p t 啊,这是这样的一个 一个一个一个选择吧,所以说就从这三个方面把这三个产品给大家介绍一下,那大家呢,就可以根据自己的需求来进行选择,今天就和大家分享更多。

怎么用上洁面奶?我给你一个简单实操的方法,只需要三步让你搞懂。第一步,打开豆包勾选,深度思考输入 如何在国内用上洁面奶,而且帮我考虑到地区、网络还有账号的各种限制,我是一个智障,请一步一步的教我。第三,根据豆包的回答, 选择你想要的方式,追问豆包把地多少多少点,展开详细讲讲,你一定可以用得上,快去。

谷歌刚刚发布了 jimmy 三点五 plus, 同时还把他们的编程工具 antigravity 升级了二点零,那这次就很明显了,谷歌的话这次是要全面提升它的这个抠点能力。之前不管是在 coi 还是 ide 还有模型, 其实给我的感觉就表现很一般,那这一次的话,这个模型最大的亮点官方说就是它的这一个速度啊,是前模型的四倍, 所以这一期我们就测一个最关键的问题,这么快的速度,它整个的一个代码质量会不会缩水?那我直接会拿两道真实的一个编程任务,把它和 cloud op 四点七, gpt 五点五放到同样的项目里面,同样提示时看它大家的一个表现情况。那下面的话,我们大概去扫一下它官方改出来的一个奔驰 mark 评分哈, 在编程方面的话,主要就看这一个 terminal, 奔驰二点一,还有这一个 sw 一 奔驰 pro, 从这个评分看的话,这一个 jimmy 三点五 plus 这个评分还是可以的哈,但是基于我之前对于谷歌模型实测的结果来看,就是评分不代表一切,因为之前就感觉它在这个编程方面挺拉的,这次我们就看整个的一个三点五 plus 表现到底怎么样。那这一次的话,我们的整个测试题目哈,就是沿用之前测试 cloud of 四点七,还有就是 gpt 五点五的两道真实的一个编程任务。第一个的话就是我们这一个 skills agent 嘛,需要把它从一个 c o i 做成一个 web ui。 第二个的话是希望他从一个已有的比较复杂一个项目里面把这个认证登录给它迁移过来,这一块也比较复杂,需要支持啊, get 谷歌,然后还要做一个落地页。好,我们来看一下这两个实测项目哈,左边的话,就我刚刚说的这一个 skill is a 镜头嘛,第二个的话就我们图片生成 a 镜头,那这次的话,我们是用了这个 anti gravity 它的一个 c o i 终端工具, 整体这一块呢,它的交互的话是跟呃卡扣的很像,那我这边测试下来,他的速度是真的快,相当相当的快,他说四倍,一点都没夸张。 那大家看一下它这个交互的一个情况啊,其实还是感觉挺挺好的。这个交互,那至于整个模型的能力怎么样,那这两个任务我这边实测下来,它都没有一次性的去完成,它或多或少都有一些小问题。那同样的这个提示值,在同样的项目,我给到了 gpt 五点五 以及 calloff 四点七,它都是能够一次性完成的,不管这两边哪一个项目都可以完成。但是 gmail 三点五 plus 它除了快,但它其实还是会有一些或多或少的 bug 嘛。好,我们来看一下它整体的一个表现情况。 好,我们来看一下这个是 jimmy 三点五 plus 帮我们完成的 skus agent 的 一个 ui 界面嘛,它可以去执行一些操作,比如说我给他一篇文章,可以让他帮我们去总结,它就会去加载这个的 skus。 就 我之前有一期视频 专门讲了这个 skills 的 一个工作原理嘛,那这是它完成的一个效果,整体上 ui 这块还 ok, 那 这边的话是 g p d 五点五给我们完成的,左边也是有我们的一个的一些 skills 是 哪一些?那右边的话就是它整个的一个操作的一个过程嘛。怎么说它这个 ui 的 一个结果的话,我觉得就是呃 g p d 五点五的会好一些。 那关于图片生成这个项目,让它去做一个落地页,以及让它去做一个就是谷歌 get 五的认证登录嘛,那这块它也是完成的,但是不是一次对话完成的。 u i 这块的话就是谷歌还是可以的,就是相较于 g p t 五点五的话,我觉得还是会好一些,就 u i 这块的话,我们还是优先选择就是谷歌的模型嘛。 好,下面我们来看下整体这个评分结果哈,那这个评分的话,还是跟之前一样,我们是把所有的模型生成代码通敏之后,然后改到模型去做 review。 那 这边的话 g p t 五点五是要胜出的,它的分会高一些。 第二个的话就是 cloudoff 四点七会辞职,那 gpt 三点五 plus 的 话,它整体评分效果会低一些,也就是它除了快,那代码质量上的话是会差一些。那这边的话也有些解决方案,比如说你可以用 cloudoff 四点七做设计,或者 gpt 五点五做设计,然后再用呃 jimmy 三点五 plus 去做执行。 那这块儿它还不是还发布了这个 anti graphic 二点零嘛。那这个 id 的 话,你就把它等同于 codex 吧,跟 codex 一 模一样。那我这边的话 现在还登录不进去,不知道啥问题。好,下面我们来进行一个总结。那这次他的整个编码水平的话,就是速度上确实是领先很多,但是在交付的一个结果上来看的话,跟国外两家模型还是有差别,尤其是在一些复杂项目里面,他还是会有偷懒的情况。 如果你是需要去做一些原型啊,或者做一些 u i 啊,我觉得这个 jimmy 三点五 plus 真的 是有比较有吸引力,因为它整个速度比较快,而且它的价格也比较便宜。那如果你是需要一些复杂的项目啊,多文件呀,那阶阶段我还是更推荐大家使用 g p d 五点五,在 codex 里面 你运行起来也非常的快。扣袋子这个 app 我 强烈推荐给大家用,我已经最近用了一个多月了,真的非常非常的好用, card 的 话就是封号真的特别严重,我已经放弃了。 ok, 那 这就是这期视频所有内容了,如果大家觉得这期视频做的不错,可以跟我一箭双雕,我是阿江,我们下期见,拜拜。

二六年做电商,一定要一定要一定要用上 ai。 今天做个实测对比,用同样的商品图片,同样的提字词,分别用国内最受欢迎的豆包和最近爆火的 jimmy 各做一道电商的详情页,看看谁更胜一筹。这是我准备的三张图片,这是第一张,这是第二张,这是第三张提字词。我也准备好了, 这道题词呢,他会偏抽象一点,那么这就会比较考验 ai 对 这个文案的理解能力了。那么就让他们帮我们生成一套电商的详情页。好,我们先让豆包来尝试一下。我把三张参考图都已经上传上来了,题词呢,就刚才我准备的那一段也已经复制过来了。我们看一下豆包的表现, 他已经生成好了。好,我们是要让他们帮我们生成一套电商详情页图片。我们一一点开一下,这是第一张,第二张, 这是第三张,这是第四张。其单独看,每一张其做的效果都还不错,但是呢,我这边要的是一套详情图,所以感觉他做的应该会偏向主图多一点。那我们再来看一下专门来的 nonono pro 的 表现,一样是这三张参考图, 还有这个提示词也是一样的,这边也已经生成好了,我们看一下这套详情页的效果。这就是 nonono pro 的 详情页,看一下 我感觉更接近我想要的那种效果吧。我这边又试了一次,只用一张图片的情况下,加一段比较抽象的体字词,帮我们生成一套电商详情页。一样是我们先看一下豆包的效果,豆包还是会更倾向于把它做成一张张主图,我们看一下它生成,又是四张主图 啊,没有说像我们要求那样去生成一个电商的详情页,那我们再来看一下 nano banana pro 这边的表现,同样是一张图,同样是一段抽象的提示词,这是他这边生成的效果,我感觉还是很不错的呀。我们再看一下豆包这边的豆包是这样的,是四张 图片,那他这边是有模有样的生成一套详情页了,效果大家有目共睹,差异是不是显而易见? ai, 他 不是什么高大上的技术,就是咱们电商人的效率工具,二六年做电商,谁能用上更强的 ai, 谁就能抢占先机,把同行甩在身后。

一定要一定要一定要想办法尽快用上谷歌! jamie, 不 管你用什么手段,什么方法,我自己深度用了一个月,最震撼的不是这个 ai 的 画图编程或者视频总结功能,而是他对用户的长期记忆。你每次跟他聊工作细节、项目进展、思考方式,他都在悄悄记录, 记到最后,他就变成了最懂你的那个人。你可能会说,谷歌的东西在国内用不了,太麻烦了,有门槛,但是只要你想用, 你一定能用的上。就拿出林这种在深更半夜里找小电影那种镜头,找到使用它的方法。而且正因为有门槛,才把大多数人都帮你拦在了后面。走路的人和开车的人速度差不是一倍、两倍,是五 五十倍、一百倍。现在这个时代,你能不能把一个顶级 ai 调教成你的超级助手,基本上就是你和普通人之间最大的差距,这是一种恐怖的降维打击。我一个学员今天就告诉我,他已经在 ai 的 辅助下出了人生的第一本书,在没有 ai 之前,这件事他想都不敢想。 ai 绝对是我们这一代普通人最大的翻身机会。

大陆苹果员工最喜欢哪个版本的 iphone? 前苹果员工来告诉你啊,答案只有一个,港版!港版除了没有双卡之外,剩下的都是优点。我举个例子, siri。 国行的 siri 简直就是人工智障啊,很多国产的人工智能助手都比 siri 好 用,但是你用了港版的 siri, 你 会发现焕然一新,因为它接入了 chat gpt, 接下来还有可能接入到谷歌的 jamina, 等到进入 jamina 的 时候,你就会发现这个世界上真的有一种东西叫人工智能,朋友们期待吧,体验吧。第二个就是那个苹果自带的地图 app, 我 们在国内基本上用的都是高德对不对?很少有人会打开苹果自带的这个地图 app, 因为太难用了,屎一样的难用。但是港版的你用吧,一用一个不吱声,你就会体会到什么叫身临其境。我就举这两个例子,都足够吸引你去买港版了。为什么要花大钱去浪费钱去买国行呢?我是真的不理解啊。

hi, 我是 jimmy 奶,我们即将开始 live 对 话。你只需下达语音指令或用摄像头向我展示周围事物,就能跟我聊复杂的主题或想法。不过在开始之前,请先快速了解一下这些重要信息。 好的,那就开始吧。这是我支持的其中一个声音,我也可以使用这个声音。不妨先选择这个声音。以后可以随时都可以在设置中更改我的声音。好了,等你。

瑞平国内与国外 ai 的 星图习力从夯到拉,第一个,豆包星图纯纯是附赠功能,技术明显没下放,人像生成普遍存在塑料感,艺术风格偏单一,稍微有专业需求就撑不住,唯一的好处就是免费,能凑合着用,当个娱乐入门工具还是可以的, 所以生图实力给倒拉完了。第二个 gemini, 它拥有多模态能力,处理复杂项目,分镜、脚本知识,地图结构设计都是最强的,不过功能太重太专业,门槛比较高,只想快速出一张简单图的话就没必要了, 所以生图实力给到顶级。第三个 midi journey, 目前来说是全球艺术审美天花板,电影级质感拉满,画质无敌,出图即壁纸,无任何工具能对标,但门槛极高,小白很难玩得明白,属于专业创作者的专属工具, 所以生图实力给到吭。第四个吉梦,可以说是豆包生图的高级版,提示词理解精准,做出来的效果更好,但主力产品是生视频,技术完全拉满,是国产里少有的能对标海外商用工具的产品, 主打全能,落地高效,所以升图实力给到顶级。第五个, gpt emoji 二,目前是最新登顶第一的 ai 升图工具,多语言支持优秀,简单几句中文生成的人像图、海报图、数据图表精度拉满,不仔细去查找细节,谁能知道是 ai 做的, 真是强得可怕,所以生徒实力给到憨爆了。第六个,谦问,做出来的效果不算差,但是特别吃,提示词对新手来说有点困难,重规重矩吧, 没有太多的突出亮点,但日常是够用的,所以生图实力给到人上人。第七个, nano banana, 这是谷歌出品的生图王牌,是当前最均衡、最实用、性价比最高的全能生图模型,速度、中文批量,一致性全面领先,但是还没达到还原现实的效果, 精细方面还是需要 pro 版,所以生图实力给道行。第八个,可林主打的是高画治国风、古风武侠,创作能力不算差,但人像崩脸率高,服务器稳定性一般, 需要反复试错,所以生图实力给到 n p c。 第九个,元宝提示,此事精准的情况下还是 ai 感很重,人像和复杂场景都很拉胯,精细创作完全无法实现,核豆包半斤八两,只能算轻量娱乐工具。所以生图实力给到拉完了以上排名,群主观点。

你在用 ai 做视频的时候,有没有遇到过这种崩溃场景?一张图里只要出现两个人以上,不管你提示词写得多精准,人物都会变脸,动作会扭曲,细节会乱飞。更离谱的是,你只想改其中一个人的动作,结果另外几个人全都跟着变多人。 ai 视频最大的问题就是不 可控,但如果我们把思路换一下,每一个人都单独生成视频,然后像剪辑一样把它们合在一起,可不可行呢?本期视频我会带大家了解多人物可控视频。我最近发现一个很新的工具叫 vivi, 玩法很像 comfy ui 节点式工作流。目前国内讲的人不多,今天先分享三个工作流,最后一个甚至完全不消耗积分, 直接上干货。先讲第一个工作流,打开我分享的工作流,保存到自己的账户里就能直接用。先整体看一下,一共有六个模块,先生成一张纯背景图, 画面里不要出现人物啊,背景里出现人会干扰后续动作控制,导致结果不稳定。背景做好之后,就要做第二步,增加人物。来看第二个模块。这里我做了很多张图,因为人物位置选错就会被遮挡。比如泳池里,我后面会放一个小孩,如果男人放在画面的右侧,就很容易被遮住。所以我最终选择人物在画面偏中间没有遮挡的位置。图 做好了,就可以生成视频了。视频模型你们可以自己替换啊。热门的 vivo 三点一, sorry 二都有,我选 one, 二点五,单纯是因为便宜。写视频提示词的时候,有一个关键点,必须写禁止镜头,因为多图层合成的时候,只要镜头动了,图层就会对不上,直接穿帮。这个打高尔夫的视频当做底层背景,不需要遮罩,直接接到合成器的背景位置。 第三个模块也是一样的,先用 nano banana pro 生成单人物图,再生成视频。这里我加了一个负面提示词,不要水花,因为水花太大会溅到其他角色区域,遮罩抠图就容易穿帮。小男孩这个视频要做图层,所以用 painter 把活动范围图白遮罩,只保留小男孩和水花的合理范围。在 merge alpha 里可以看到实时的抠图图效果。最后把 merge alpha 的 输出接到图层一。 第四个模块操作也是一样的,在画遮罩范围的时候,需要重点关注一下手臂的伸展范围,动作幅度越大,遮罩的范围就越要留足,然后把它和图层二连在一起。 第五个模块主要是给大家演示功能的啊,用不用都行。 nano banana pro 生成中文是最稳定的,不会变形。再用这个 remove background 的 这个工具去掉背景,和图层,三连在一起。最后我们来看第六个模块合成器,它相当于是一个合成面板,前面所有图层都会在这里叠加显示,每一个图层都是可以自由移动和调整的, 如果发现画面的边缘不自然,位置不协调的话,可以直接拖动进行微调。最后下载视频点这个 export 就 可以了。来看一下效果,只要人物排布合理,遮罩抠的够细致,就可以做到三个视频互不打扰又非常和谐的画面。第二个工作流是在外部,先把图片做好,在 image editor 上传图片,然后通过微微制作视频,再用遮罩抠人物来看一下效果。 the prophecy is clear, the great wall must stand 第三个工作流是完全用微微的遮罩合成功能,在外部先把图和视频做好。 video editor 这里上传视频需要注意,必须上传对应的图片。 pinter 的 遮罩功能是基于图片去抠人物的。我这里把大王换成了站起来的动作,小兵和母子还保持第二个工作流的动作,看看效果。 the prophecy is clear, the great wall must stand 回顾一下整个工作流,先做一个背景图,然后在这张背景图上用 nasa banana pro 分 别增加上人物,把每一个人物单独生成一个视频,最后使用平台的遮罩功能,把这几个视频合在一起,最终做成一个完整的视 频。这一套下来,每个人的动作都是可以单独控制的,只修改某个人物的动作,也不会影响到其他人物,这就尽最大可能达到了多人物视频可控的效果。这三个工具目前都是免费使用, 如果你想立刻上手,建议先从第三个工作流开始,反正也是免费的。但要提醒一下,多人物可控的前提是从基础图开始就规划好每个人物的位置和动作范围。今天的视频就先到这里了,如果你对多人物可控视频感兴趣的话,可以去看看我整理的工作流, 记得关注。冲破信息差, ai 测评我是专业的,那我们下期再见!
![盘点一周AI大事(6月29日)|机器人赛博义体上线 GPT5被爆7月上线,新模型能持续思考3分钟,同时进行大量搜索
DeepSeek R2因性能未达预期推迟发布
Grok 4定档7月4日上线
Google发布最强开源小模型Gemma 3n,只需要2G内存就能运行
Google推出最强开源编程智能体Gemini Cli
最强图像编辑模型FLUX.1 Kontext [dev] 正式开源
Higgsfield发布高审美照片级图像模型Soul
11labs推出语音助手11ai
Google发布基因模型AlphaGenome
H2L重磅发布身体共享装置Capsule Interface
#AI在抖音 #人工智能 #AIGC #OpenAI #机器人](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/cfb2cbcd86657a1cbdc0d26505f98a79~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2094926400&x-signature=UTDrhCkflQlA9OX26s32bQ%2Bdlc0%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=20260524044159387CBAED17D6C2EB4D52)