我不知道大家用谷歌的 gmail 这个 ai 软件是不是有同样的问题啊?就是它这个语音转文字啊,就我还没收完,或者我一收完它就直接就你都不能暂停,你看它啊,它就发出去了, 这个就让我非常难受,每次我得赶着赶赶着赶着跟他讲,但是我用那个拆的 gpt 啊,我就用起来很舒服啊,为啥?因为拆的 gpt 你 可以啥? 你可以先点开始,然后我们现在把我们要说的话,然后录进去,然后最后你说完之后你可以点这个暂停,等他自己转文字,他再自己放出去。 所以这个点上我就更倾向于 g p t。 虽然谷歌他这个就是我平常其实用 g p t 用的比较多嘛,但是我个人也比较喜欢 g p t, 但如果谷歌他如果这点一直不解决的话,我可能后期会更倾向那个这个 g p t 了。所以广大网友, 我不知道谁有谷歌的人脉,能不能帮我解决一下这个问题?我真的是谷歌的忠实用户,我真的非常需要谷歌。 所以如果说大家有谷歌的人脉,能不能帮我反应一下这个问题?我希望他能够像车的 g p t 一 样,然后一点他能够语音转文字,然后我说完之后他可以暂停, 不然我觉得他这个可能会流失掉一部分,流失掉一部分用户,但是如果他这个不在乎的话,那其实也无所谓。
粉丝33获赞202

你打开的吉米尼是不是这样的,而我打开的吉米尼是这样的,所以说差在哪?那肯定是你们给我点赞的姿势要比我帅啊!给大家分享一下进入吉米尼的技巧。首先就是如果你用的是老的顾客账号可能不太行, 所以我直接用手机去搜索 gmail, 然后注册一个新的谷歌邮箱账号,注册好之后打开魔法,选择对应的地区,如果 不行就多切换几个不同的。最后我发现我用 chrome 进不去,但是我用 app 浏览器就可以使用,所以大家在用的时候也可以参考我的方法,如果还有什么问题,欢迎在评论区交流。好了,视频最后别忘记留下你的点赞和关注,感谢你的支持!

詹姆奈写例子,交互网站一开始看着还行,但是越改越乱,最后把整个项目改崩溃。对于新手小白来说,一上来就让 ai 改代码,风险实在是太大。我现在用的方法是用叉的 gpt 管思路,用詹姆奈写代码,但中间加一层安全循环。 你看左边的这个 chat gpt, 它不写代码,它只做两件事情,第一,把需求生成 prompt, 而且是有护栏的 prompt。 第二,专门找风险,提前把坑标出来,它更像一个产品经理加技术审计。 然后我们把 prompt 喂给 gemini。 注意,我会明确告诉 gemini, 不 允许改代码,只输出思路最小改动方案和风险点。也就是说, gemini 先当架构师,不当施工队。 第三步,我们把 gemini 的 思路再丢回给叉的 gpt, 叉的 gtp。 这时候干嘛?一句话,挑刺儿, 性能会不会炸?结构会不会入侵?未来还能不能扩散?把这些坑的清单再反馈给 gm, 这个过程会循环几轮,只讨论思路,不改代码,直到他们双方都确认没有大坑,能回个改动最小, 这个时候我们才会对詹姆来说,你可以改代码了。总结下来,这套方法就是让 ai 之间去互相踩刹车,人只负责控制节奏和权限。 如果你也像我一样是新手小白,曾经乱一次代码就要歇一下的人,我觉得这个方法可以让我们的崩溃概率降低百分之五十。

一定要一定要一定要想办法尽快用上谷歌的 gmail! 不 管你用什么手段,什么方法,我自己深度用了一个月,最震撼的不是这个 ai 画图编程或者视频总结功能, 而是他对用户的长期记忆。你每次跟他聊工作细节、项目进展、思考方式,他都在悄悄记录,记到最后呢,他就变成了最懂你的那个人。 你可能会说,谷歌的东西在国内用不了,太麻烦了,有门槛,但是只要你想用,你一定能用的上。而且正因为有门槛,才把大多数人都帮你给拦在后边。走路的人和开车的人速度差不是一倍、两倍,是五十倍、一百倍。 现在这个时代,你能不能把一个顶级 ai 调教成你的超级助手,基本上就是你和普通人之间的最大差距。这是一种恐怖的降维打击。我一个做母婴实体连锁的学员,已经靠 ai 让他的连锁店扭亏为赢了,在没有 ai 之前,这件事想都不敢想。 ai 绝对是我们这一代普通人最大的翻身机会。我这里也总结了谷歌监们的十一种具体应用场景的玩法,全部放在这个分数文档了,需要了直接拿走。

最近 jimmy 奶呢发布了超级多 ai 的 更新,以至于我这段时间好像都有点用。不过呢,我真的很想跟你分享一下,就它这次更新之后啊,它到底能够为我们做些什么,以及我日常到底是怎么用它的? let's go! 首先第一个呢,就是他这次多模态的能力啊,有一个非常明显的变化。比如前段时间呢,我发给他一个打 b 球的视频,我很喜欢看,然后呢,我就问 ai 他 们的球打得好不好,挥拍怎么样? 然后他就能够从这个视频当中去判断哪一球听起来比较沉闷,哪一球听起来比较清脆,是扑的声音,还是说是金属的嘣炸裂的声音。然后呢,这些特征在结合挥拍的轨迹啊,他就能够判断他这个球打的怎么样,能量怎么样了。 但这么讲好像有点难理解啊,不过过尔的 ai 它是这样的,一般都是先转成文字再去理解嘛。而现在的绝美南山呢,它是直接看像素听声波,就像我们看视频一样,它就更能够捕捉画面当中的这些细节,所以我觉得这就真的很酷。哎,那如果是这样的话呢, 假设我把我自己的视频发给他,然后这一段 prom 呢,是我真的调了很多次之后,觉得最适合拿来分析自媒体视频和发挥他多模态能力的一段 prom。 然后 稍等一会啊,你看他就说了,大概意思呢,就是每一句话的结尾有点仓促,让人感觉像是在感性度的样子,有种紧迫感。 然后视频里面的有一些小动作,看起来好像比较生硬,不够自然,以及在生化同步上,视觉总是慢于听觉,让人感觉到好像有点滞后的样子。最后呢,他也给出了一些改进的建议。 第二呢,是 jimmy 和 nobel lm 的 结合,这应该是这几天 jimmy 最大的更新之一了吧,我很喜欢这个公单,因为过往的 nobel lm 呢,它就是一个网盘一样,里面存了很多大大小小的数据和文件,你可以在这个位置生成摘药啊,拨克或者其他的形式,都可以跟 jimmy 是 两个完全独立的路径来的。 但这一次 jimmy 在 这个位置集成了 nobel lm 之后呢,你实际上是把整个知识库就交给他了, 所以我就是这么用的,我就要求他根据这个知识库里面的内容去做的。为设置深度研究 过程中呢,除了对我现有的一些资料啊,比如说市场调研呢,客户数据,各种的报告视频做一个初步的梳理之外呢,再加上深度研究,他本身就会对外扩展嘛,所以他最终的这篇报告呢,就是直接想让你资料里面的那些结论的,而且要更加的详细。而在这之前呢,这些过程都是要一个一个上传到 gmail 里面的。 不过还有一个我觉得非常实用的方法,就是同样的也是添加它 notebook lm 的 知识库啊,我们可以用 jimmy 奶的这个 canvas 功能去做一个网站或者是 app, ok, 你 看啊,这是一个基于你过往的调研才做出来的一个 app, 你 可以想象,假设你的调研里面包含了大量的用户调研啦,市场的分析等等的话,那根据这个结果做出来的 app 是 不是就更加的有依据,靠谱的多呢? 所以从原本的知识管理到现在最终的产出,就是我觉得这次 gemma 更新最惊喜的一个部分了。第三呢,是这一次 gemma 在 编程和 ui 上有一个非常大的提升,真的很大。 如果你看过市面上很多的测评呢,就会发现只是一个简单的 prom, 它就能够把这个功能实现出来,而且 ui 的 质量呢,也很高,而这些都一托于这个指标 webinar, 这个指标越高呢,就越能证明它不仅能够写出逻辑正确的代码,还更能够理解我们的审美。 比如简单的让他开发一个网站,参考特斯拉的风格,选择 canvas, 跪回之后呢,你看这是他给到的一个网站,怎么讲呢,我觉得 u i 上还是可以的,然后大图嘛,给人造成的视觉冲击感还是很足的。 但如果你看过我之前分享的一期 hiphop 的 视频的话,你就会发现,其实如果你有任何 idea 的 话,不妨可以先到 hiphop 上面去搜索看看,看他们的评分,然后借助 hiphop 上面他们的代码来帮你制作一个工具出来。而刚好现在君美莱莎呢,是支持在这个位置上传你的 hiphop 文档的, 比如我想上传这个 pdf 翻译工具的代码,因为评价很高嘛。那复制它的链接之后呢,粘贴过来确认,等它加载之后啊,再输入类似这么一段提示,这里我一般都会让它去参考某个网站的一个风格,所以如果你们看到一些不错的 u i 的 话呢,也一定要记得收藏下来才可以。 然后呢,选择 canvas, 稍等一会之后啊, ok, 你 看到啊,我个人感觉到它这个呈现的效果好像还挺好的,然后假设我上传一个文件 ok, 它也能够读取,然后下载以及浏览,不过还是有些小瑕疵的,比如说这里啊,阅览时的这个数据好像不够完整,也没有全部翻译出来,好像也不能够翻页,所以你还得不停的在跟他去沟通一下。 所以如果你想要一个逻辑更严密的,或者是可以反复调试它功能的一个地方的话,那我就比较推荐它谷歌的 as 丢丢了, 比如同样的一个 bug 项目呢,复制给到它,包括提示语啊,然后在模式的这个位置呢,进去之后有一个 system instruction, 你 可以在这里设置你的系统提示语,我已经设置好了,其他就可以不用管了。然后稍等一会, 那你能够看到,虽然在 ui 上呢,两个平台都是差不多的,但在 as studio 里面呢,假设现在我上传一个 pdf, 它就更能够把这个功能实现出来,而且呢,在这个位置你还可以把代码下载下来,或者保存到 github, 甚至部署上线都可以。 虽然谷歌这一次呢,也做了一个叫做 antipoverty 的 一个编程的一个工具,但是讲起来真的是要 all day 了,要花一天的时间来讲,所以呢,有机会我给大家做一期视频,来给大家分享一下 下一个 google search, google 在 最近的一次更新当中呢,其实它 google search 的 ai model 当中啊,也支持了 jimmy 三的模型,我先给你解释一下这两者的区别在哪里, 就 jimmy 的 官网呢,更多是一个生产创造的作用,如果你只是为了简单的搜索的话,你就会发现 jimmy 其实会给你生成很多不必要的话语或者是数据来的。但如果只是寻找答案,找新闻的话,那你其实就直接 google 搜索就可以了。 不过有趣的是啊, google 社区也支持多模块,比如我想让它创建一个关于英伟达想要实现掌控整个基数站的这么一张愿景图给到我,那它确实也能够生成一个能够操作的像这样一个小功能,方便我去理解,或者是让它生成一张图片,它也能够清晰的去创建出来。 最后一个呢,是 gemini 的 deep scene 模式,我觉得这应该是这次版本更新的幕后工程了吧。虽然我不是特别相信这些 benchmark 各家的对比指标啊,但在我分析了它这份 ai 精准的测试之后呢, 我发现这份报告在行业内的认可度还是比较高的,即便是存在,你看分歧啊,但这个分歧更多是大众用户与开发者之间的这些差异啦。所以为了测试它们的效果啊,我就特意对比了 openai 还有 gemini 它们的一个深度搜索的功能。 最后发现呢,按照这段 prom 输出的结果,确实 german 它在深度思考后给出的这个结果好像更全面和详细一些。 ok, 以上这几个功能呢,都是我日常使用到的,希望能够帮到你,虽然它还有很多炸裂了颠覆了的一些用法,比如说 dynamic view 啊,还有一个 german 在 浏览器上的一些功能,等它完全开放之后呢,我再给大家做一个测评。 ok, 那 么今天的视频到这里, respect, 拜拜!

你现在每天用的 ai, 可能连它一半的能力都没有发挥出来。现在网上几乎没有一条视频,把 g p、 d、 e、 jimmy、 豆包这些主流 ai 所有核心功能放在同一张使用地图里讲清楚, 更没有人告诉你不同的需求到底应该点哪一个功能入口。所以,现在大多数人用 ai 不是 不会用,而是根本就不知道它们究竟能干什么, 写不出三千字,研究没有深度,代码跑不起来。本质原因只有一个,你把所有的问题都丢进了聊天框。那今天这条视频呢?我不教你技巧,不教你拆题诗词,也不站在某一家 ai 的 立场,我只做一件事, 把现在最常用的一些 ai 工具,每一个你可能用的上的功能,全部摆在你的面前,写作、研究、代码、学习生、图生、视频工具调用、什么时候,应该用什么功能,一次性讲清楚。看完这条视频,你不会再问 ai 行不行,你只会知道这件事我该用哪一个模式。 顺便说一句,所有的功能呢,你在网上很难一次性找到全部的说明。所以呢,我把它们都整理成文档了,只需要在评论区回复 ai 隐藏模式,我就直接发给你。 第一个升图,目前所有的大模型呢,基本上都已经内置了 ai 的 升图功能,像谷歌的 gemini, 内置的是最新的 nano banana 模型。 g p t 呢,使用的是 g p t 图像,而豆包使用的是自家的 c 锥模型,共有三个版本可以选择。那 jamie 呢,提供了两种图片的生成方式,分别是 pro 版本和普通版本。如果你要使用的是普通版本的 nano banana, 那 你就从模型的菜单当中选择快速。如果你要使用的是 nano banana pro, 那 你就从模型的菜单栏中选择思考或者是 pro。 nano banana pro 的 生成功能呢,可能会受到 gmail 三 pro 配额的限制,如果你用完了每日的 gmail 三 pro 的 配额,就得等到配额重置之后才能继续生成 nano banana pro 的 图片了。如果达到限额,你可以在提示栏中将模型从思考或者是 pro 模式切换到快速,然后继续使用 nano banana 生成图。 关于 nano banana 生成各种类型图片的教学呢,大家也可以观看我们这一期专门讲解 nano banana 视频,上百种效果可以说是一应俱全。 ok, 那 gpt 目前使用的是最新的 gpt image 一 点五,并且将它作为了 gpt 中图像生成功能的底层模型。 官方默认的也有额度的限制,尤其是免费的用户,或者是掐指 g p p plus 的 用户。那免费账号呢,通常每天有少量的生成次数,但是根据我目前查到的资料,并没有发现一个明确的数量。测试下来,免费用户基本上每天可以生成十几张图片是没有问题的, plus 或者是订阅的用户呢,额度就会更高。 ok, 豆包相较于 jimmy 和基本 选择就会更加的灵活了,它提供了三个版本,包含了从三点零到最新的 c 锥四点五模型。除此之外呢,还可以直接在聊天框当中选择比例和调整风格,可以说对新手来说上手是最简单最友好的。 豆包的身图限额呢,也没有明确的数量,甚至在我的测试当中,手机和 pc 端的数量都是不太一样的,但是基本上免费用户呢,能够每天生成几十张图片是没有任何问题的, 额度肯定也是三家当中最高的, ok, 那 么这是我用同一段提示词,分别使用这三个大模型生成的图片,大家可以看看你们更喜欢谁的生图效果。 二、视频生成视频生成功能呢,在三家就有所不同了,接下来内置最新的 ai 视频生成工具 vivo 三点一,操作呢也是非常简单的,只需要在底部的文本框下面点击视频图标, 然后在文本框当中为你想要生成的视频输入提示词,就可以生成了。当然,如果你需要根据照片来制作视频,点击添加图片的图标,然后选择你想要上传的文件,点击提交也就可以了。 在这个地方呢,也有一些官方的温馨提示,在生成视频之前呢,你可以先跟 jammy 进行一些对话,然后呢进行一轮头脑风暴,完善你的视频生成提示词,这样一来呢,你就不需要点击视频就可以生成了。同时呢也要注意, jammy 应用生成的视频长度呢是八秒钟, 生成视频呢可能需要一到两分钟的时间,你也可以要求 jammy 为视频同时生成音频。根据竖屏照片生成的视频呢,也将保持竖屏的格式, 并且采用语言,照片最接近的宽高比 ok 限额使用 vivo 三点零生成的视频数量呢也有一定的上限,接近限额的时候呢,现在会给你发送通知,告诉你还可以生成多少个视频。据我目前的实测啊, pro 用户一天能用 vivo 三点一生成三个视频左右豆包内置的视频生成核心使用的是字节跳动自研的 c dance 系 列模型,截止二零二五年十二月,最新的是 c dance 一 点零 pro、 c dance 一 点零 light 等版本可以供你选 免费用户每日视频生成的次数呢,通常是 app 端五次,网页端十次,两端呢是不进行叠加的,零点的时候呢,就会重置,具体呢,可能会因为你的账号等级有一些略微的差异。 下一个 gpt 的 内置功能呢,并没有视频生成这一项,因为 openai 把视频生成模型主要是通过了单独的 sorry 应用来进行完成。那这个地方呢,我们就不着重讲解了,那以下呢,是我们利用同一提示词生成的视频,大家可以对比一下效果。嗨, 我接电话,我需要帮忙,他们来了,快点我三、 deep research 深度研究接下来呢,我们要讲一个能把你从资料苦海里面彻底解放出来的进阶功能。 deep research, 也就是深度研究。那大家平常工作里面呢,肯定遇到过各种场景, 比如说老板让你做一份未来五年全球新能源车市场的分析,或者是你要写一篇严谨的生物医药前沿综述 这种任务呢?如果你用普通的 ai 对 话,他只能给你泛泛而谈的几百字,根本没有办法用,因为你需要的是浏览几百个网页,读几十篇 pdf, 甚至是清洗数据。这在以前呢,可能需要花费你整整一天的时间。但 deep research 就 不一样了,它是一个能够自主工作的智能代理, 给他一个题目,他可以自己去制定计划,自己去搜来源,遇到不懂的呢,也会自己去查,通常花个五到三十分钟,直接就给你甩出一份几千字的有理有据的报告了。 目前这个领域,你要关注的是两家, openai 和谷歌,它们俩的路子呢,也会有一些不一样。 openai 的 deep research 呢,更擅长的是逻辑推理,专门针对高难度的科学和金融,任务是做了优化的。 在人类终极考试的准确率呢,也是其他模型的好几倍。它最大的杀手锏呢,就是自带 python 工具箱,可以像数据分析师一样去写代码,抓数据,分析趋势,每一条结论呢,都会像写论文一样标好这个引用的来源,非常适合做那种容错率极低的硬核研究。而 google gemini 的 deep research 呢,更像是一个 懂你家底的全能秘书。它最大的优势呢,是生态整合,因为它不仅可以搜全网,还可以直接连接你的机妙邮箱和 google 的 云端硬盘,把你内部的文档和外部的信息结合起来,生成报告。它生成的报告呢,也不仅仅只是文字,还可以给你做成互动式的模拟器呀,图标啊,甚至是把报告转成音频读给你听, 都是没有问题的。豆包的深入研究功能呢,最近也刚刚上线,它最大的优势呢,就是量大管饱且体验丝滑,这就意味着它可以一次性吞掉上百篇学术报告或者是几本书,处理复杂任务的广度呢,也非常的惊人。其次,豆包特别懂手机用户, 你在 app 上面生成了长篇的研究报告,如果说你懒得看,也可以一键转成播客模式,挂在耳朵上听,甚至是研究报告做好之后呢,它还会自动生成网页形式来概括主要的内容。 不过要注意啊,深入研究虽然功能强,但都不是秒回的,因为他们要干的活太多了。申请一份报告呢,通常需要五到三十分钟,所以呢,别傻等着 点了开始呢,你就可以去喝杯咖啡了。而且呢,深入研究呢,也是比较烧钱和烧算力的,所以每天的使用次数呢,也是有限制的,大家且用且珍惜。 四、 canvas 画布如果你还在用传统的聊天框去写代码或者是改论文,那你真的是在浪费生命。我们都知道,直接跟大模型对话呢,有一个非常致命的痛点,他是个黑盒, 而且记性不太好,你让他改一段代码里的一个小 bug, 他 往往会把整个几百行的代码重新生成一遍,你还得自己去对比改了哪。或者是你写长文的时候, 你只想润色某一段,他却经常丢失上下文,甚至是自作主张改掉你满意的部分。那 canvas 画布功能的出现呢,就是为了终结这种问答式的低效作业,把它 变成了并肩作战的编辑模式。以 open a 的 canvas 为例,当你开启它的时候呢,屏幕会一分为二,左边聊天,右边呢,是独立的编辑窗口,它的核心逻辑就是精准控制。比如说,程序员写代码,你先要自己加编辑窗口,它的核心逻辑就是精准控制。比如说程序员写代码,你先要自己加编辑窗口,它就可以自动帮你插装, 老板让你把 python 代码换成 c 加加,点击移植就可以一键搞定。写文章呢,也是一样的,它不再是瞎改,也可以用滑块调节阅读等级,从幼儿园水平瞬间切换到研究生水平, 或者是一键调整文章长短和润色语法。简单的说呢, openid com 就 像一个坐在你旁边的资深主编和架构师,主打的就是一个指哪改哪的微操体验。 那如果我们说 open i 的 极致是编辑器,那 google gemini 的 canvas 就是 一个脑洞大开的多模态创意工厂。 它的逻辑呢,就有点不一样了,因为它不光是为了修修补补,而是为了让你的内容流动起来。除了可以调节文章的长度,调节写作的语气等等这些基础功能之外呢, gemini 的 canvas 里面呢,还有些额外的功能,比如说你在写完文档,如果你不爱看字,你点击音频概览,它就可以瞬间生成一段播课读给你听。 你需要做演示,点击一下就可以生成格式化的信息图、图表或者是测验题。如果想测试自己的学习效果, 也可以生成测验。对于学术党和数据党来说呢, gmail 有 两个独家杀手锏,第一个呢,就是完美支持 lattic, 且复杂的数学公式呢,极其的丝滑,包括之前火爆全网的 gmail, 一 键生成各种模拟器也都是在 canvas 当中完成的。第 第二就是无敌的谷歌生态整合,你写好的文章呢,不需要复制,直接点击导出到谷歌文档就可以发给同事。写好的 python 代码呢,也可以直接导出到 google collab 去运行, 这些呢,都是 openai 目前做不到的。所以总结一下,如果你追求代码和文字的极致掌控,你可以选 openai, 如果你需要通过图表、音频或者是依赖谷歌的全家桶进行写作办公,那 jamming 的 canvas 绝对是效率的神。豆包当中呢,直接把这个功能分成了两个部分,分别是帮我写作和应用生成。 首先我们看一下帮我写作,点击之后呢,你就可以看到这个地方已经有很多预设的文章模板了,从商业营销到设美文章,再到文学艺术,点击相应的模板,然后更改一下自己的需求,就可以进行生成。 同样的,在编辑机当中呢,也可以进行相关的编辑和 ai 的 改写。可以说豆包的这个功能做的是对普通用户非常友好,因为你不需要提前去准备提示词,只需要找到自己喜欢的模板,然后就可以生成了。 那同样的,应用生成也是模板化的,你可以输入需求,制作一些定制化的网站或者是工具,也可以浏览其他用户制作的模板,然后更改成自己的需求就可以完成,非常的便捷。比如说这个贪吃蛇游戏,直接点击就可以生成了。 五、学习与研究模式很多人用 ai 学习最大的误区呢,就是把它当做了搜题软件,你直接问 ai 博弈论是什么 普通对话模式呢,会立刻甩给你一段完美的定义,你觉得你懂了,其实那是被动接收,过脑你就会忘,但这个呢,正是我们要解决的一个痛点。那么 open ai 的 学习与研究模式核心逻辑呢,就是苏格拉底式提问和支架式回复, 当你开启他的时候呢,他绝对不会直接给你答案。比如说你想学习博弈论,他首先呢,会根据你的水平生成一个分阶段的学习路线图。比如说第一阶段讲核心的基础,第二阶段讲纳时均衡, 那在讲解的时候呢,他也会把复杂的知识拆解成一个一个易消化的章节,这个呢,就叫做知识支架。 每讲完一段,他还会立刻抛出一个知识检查或者是测验,让你去做一下,强迫你用自己的话去复述。如果发现你没有懂呢,他也会换个方式重新讲,而不是机械的重复。这样的一种交互式,强迫你大脑进行主动思考。就像大学里的 office hour, 教授呢,不是为了帮你做作业,而是为了让你真的学会。所以,如果你是大学生,或者是要深度掌握某个硬核概念,就一定不要用普通对话了,一定要开学习模式,他是帮你建立长期记忆的很好路径。 如果说 open ai 是 一个严厉的教授,那谷歌的 jammer 就是 那个手里握着顶级资源的全能助教了。普通 ai 最大的问题就是他特别容易一本正经的胡说八道,特别是在科学的定义上。 但 jamming 的 学习工具呢,解决了这个问题,他引入了权威的姓源,在最新的功能当中呢,你甚至可以在提示词里面输入 at openstack 啊。不过这个功能目前只支持英语,而且只能在美国使用。他会直接调用这家知名教育出版机构的专业教材来深深回答,确保你拿到的复习资料是教科书级别的准确度,而不是网上的野路子。此外呢, jamming 极其擅长的是多模态的一个学习, 普通的对话呢,只能给你一些干巴巴的文字,但是在 jamie 的 学习模式里面,当你问光核作用或者是细胞结构的时候呢,它可以直接在回复里面嵌入相关的图式,而且它还是一个刷题神器, 你可以上传你的课堂笔记,让 jamie 生成一套定制化的测验题,或者是抽任卡这种多图片加读教材加刷题的组合权,对于备考冲刺或者是视觉型的学习者来说呢,效率一定是降维式的打击。 豆包呢,在学习解答方面呢,更像是一个作业,帮你可以拍摄或者是输入相关的题目,那豆包呢,就会直接帮你解答,有不懂的地方呢,可以继续提问,直到你会为止。六、特色功能那么以上呢,基本上就是目前大模型都有的共同功能了,也是大家使用大模型需求最高的一些,认为一些 除了这些功能之外,其实各家大模型还有很多特有的功能,我们也一个一个介绍一下。首先第一个必须要给你们安利一下,这边这个还在实验室阶段的隐藏神迹,叫做动态式图。 大家平常直接跟大模型对话呢,最大的痛点就是交互太死板,或者是信息的现行堆积。比如说你问他哪款智能手机值得买,或者是帮我规划罗马五日游,普通的模式之下呢,他只能给你吐出一长串枯燥的文字列表,你想对比参数或者跳转查看细节,还得反复发指令,效率很。 但动态式图呢,完全就是另一个维度的东西了,当你起用它,界面会瞬间化身成为一个全站工程师,利用先进的智能体编码能力,根据你的需求实时编辑代码, 直接在对话窗口里面为你构建一个独一无二的交互式界面。这意味着 ai 给你的不再是静态的文本,而是一个可以点击、可以滚动,可以深入探索的迷你 app 或者是仪表盘。 比如说在制定小说创作计划,或者是做复杂购物的决策时,他可以生成一个可式化的可互动的控制台,让你像操作软件一样去浏览信息,把被动阅读变成了主动探索。这种沉浸式的互动体验呢,是普通对话根本没有办法比拟的。 不过大家要特别注意几个坑,第一个,这还是一个实验功能,目前手机的 app 呢,还不支持,只能在电脑的网页上用。第二个呢,如果你生成的矢图里面包含 ai 生成的图片,是会消耗你每日图片生成的额度的,这点呢,要算好账。总结来说呢,如果你只是要一个简单的结论,用普通对话就可以了。 如果你需要的是做复杂的旅行规划、产品对比或者是创意构思,一定要开这个动态式图,把它当成你的专属软件开发员来使用。二、 g p t 应用拓展在 g p t 的 工具当中呢,你还可以去应用市场选择更多的能力拓展,比如说你可以调用 canva 来设计海报,或者是调用 photoshop 来进行图片编辑, 也可以根据你的个性化需求完成你的更多任务。那么 gmail 呢?目前是没有这个商店功能的,不过可以预见的是,未来这样的大模型呢,和各个软件的结合一定会变得越来越多。三、 ai 播课、 ai ppt、 ai 音乐生成。 那相比较于 g p t 和 jamie, 豆包的拓展功能呢,确实会更多一点,你可以直接通过跟豆包对话来生成一首 ai 音乐,或者是让豆包直接给你做一个 ppt, 甚至是记录会议,做播客都是没有问题的。虽然他的能力比较多,但是确实要说一句,在有些维度上跟 jamie 和 g p t 相比 还是有一点点差距的。不过豆包的生活化和便利性确实对咱们更多的用户来说门槛是更低的,完全够用。 ok, 今天呢,我帮你把锯子、剪刀、开瓶器全部都拔出来了,下次打开 ai 之前,你就可以先想一想这事是不是应该换个模式了。这期视频如果帮你打开了新世界的大门,请一定要点赞收藏,我是天降,我们下期再见!

一定要一定要一定要想办法尽快用上谷歌! jamie, 不 管你用什么手段,什么方法,我自己深度用了一个月,最震撼的不是这个 ai 的 画图编程或者视频总结功能,而是他对用户的长期记忆。你每次跟他聊工作细节、项目进展、思考方式,他都在悄悄记录, 记到最后,他就变成了最懂你的那个人。你可能会说,谷歌的东西在国内用不了,太麻烦了,有门槛,但是只要你想用, 你一定能用的上。就拿出林这种在深更半夜里找小电影那种镜头,找到使用它的方法。而且正因为有门槛,才把大多数人都帮你拦在了后面。走路的人和开车的人速度差不是一倍、两倍,是五 五十倍、一百倍。现在这个时代,你能不能把一个顶级 ai 调教成你的超级助手,基本上就是你和普通人之间最大的差距,这是一种恐怖的降维打击。我一个学员今天就告诉我,他已经在 ai 的 辅助下出了人生的第一本书,在没有 ai 之前,这件事他想都不敢想。 ai 绝对是我们这一代普通人最大的翻身机会。

那这两天我同时用 codex、 cloud code 和 gemini 去重构我一个网站,所以切身的体会了这三个的不同。如果说你也想知道他们在时弹当中有什么样的区别的话, 那应该对你有一点点帮助。那我这两天要优化的是这个产品是我之前做的一个生成视频的网站,那主要是对操作区和首页的 ui 做了一些重构优化。 那我是在谷歌的这个 anti gravity 工具下面去操作的, 同时打开了 codex、 cloud code 和 gemini。 那 首先我是先让 gemini 去优化,因为 gemini 三 pro 据说很厉害,但是我还没有深度的使用,所以我就先让他去尝试了一下,我把我的需求告诉他,结果一顿操作之后,我发现根本就用不了我一千五百行那个 文件,他在有一个组建的结尾的地方,应该是换行出了错还是什么一个非常低级的错误,但是他一直就没有修复,我告诉他很多次他都没有修复成功, 所以我最终放弃了。接下来我就用 cloud code, 我 把提示词也稍微换了一下,先让他去重构我一千五百行这个大文件。因为如果不把它拆小,你后续再做重构其实更容易出错,所以我就先让他重构这个文件。 它的分析看起来是非常细致,一路下来把一个大的文件大概给我拆了,有记得有八九个组件左右,拆的力度是非常细的,但是同样它不仅把整个国际化,也就是翻译这一块出了问题,而且 我某一个核心的功能完全被它漏掉了,所以这算是非常严重的问题了。当然至少它还能运行起来 比 gemini 要稍微好一点, gemini 是 根本就没有运行起来,整个文件就报错。最后我就让 codex 来试。 codex 可以 说是人狠话不多的典型,它没有像 co cloud code 这样给我大幅的解释 他的开发计划,基本上没有说什么,几句话,非常简短的说了他要干什么事情。 ok, 接下来就开始干活,也是很简短,你看从他开始干到结束 也就这么一点就完全搞定了,一次运行没有出任何错误。而且他把这一千五百行的文件给我重构的非常的合理,大概拆成了七个组件。那有了这个重构,我后续再去改 ui 其实就不容易出错了, 所以我后续的重构就是基于 codex 的 更改基础之上的。那从这个事情上我就发现 jamimi 处理这种大文件,他是很不擅长的,至少在这个案例当中,那 cloud code 呢?看似很细致,但是稳定性也不咋地,只有 code x 一 次性完成。我之前也看过很多人对于这三个模型的一些评估, 包括这些大模型的刷分,但是只有真正的去实战应用,你才会 切身的感受到他们的不同。当然我觉得这些模型它各有各的长处,只不过在我这个场景当中,我觉得 codex 表现的非常好,因是因为它是一个重构为主的任务。那在前几天,我做了另外一个, 因为我要去给我幼儿园的女儿上一个 ai 课,所以我用 jammy 做了几个课堂的游戏。那 jammy 完成的非常好,所以他做这种快速的圆形,对 y 要求比较高, jammy 是 他的, 这是它的擅长领域。那 cloud code 呢?我后续的这些 ui 的 优化,其实很多都是 cloud code 来完成的,它对 ui 的 细节把控做的很到位,这个要比 codex 在 ui 上的审美 cloud code 要好很多。所以我们切到这张图来看一下。 codex 就 像一个扫地僧一样, 话不多,但是干的稳准狠,非常像一个成熟的工程师或者架构师,所以它适合干什么呢?这种大规模代码的重构,这三个一定要让 codex 去做这样的事情, 而且它的稳定性非常的高,它适合去做你的系统的架构,给你搭框架以及后续的架构级的调整,都适合 codex。 那 cloud code 呢?它很认真,很细腻,你看它给你出的开发计划 都有一米长,那它的前端的审美也比 codex 要好,但是它容易出的问题就是想多了, 比如说那个文件,他给我拆了大概接近十个组件,拆的力度非常之细,列的计划非常之多,但是做出来以后发现他把我很多的翻译搞错,把我一个核心功能搞掉, 所以他的稳定性其实不如 qd x。 但是他在我后续做 ui 的 细节打磨的时候,他 的审美和细节做的是要比 codex 要好的,所以它更适合在框架搭好的基础之上做细节的 u i 的 优化。那杰米奈适合做什么呢? 他真的属于灵感型的选手,做圆形很快,而且很有创意,但是在复杂的工程面前容易翻车,就像我这次一样,根本就跑都跑不起来, 文件结尾都出错。所以他的强项在于快速的原型生成,适合去验证我们的一些想法,做 mvp 他 很适合, 所以如果这三个你要去搭配的话,那我们在前期做原型 mvp 适合用 gmail 来快速出效果,中间搭架构我们可以让 codex 来上,最后再做 ui 的 细节打磨,可以让 cloud code 来上。 当然模型现在进化的非常快,我现在说的这些呢,只是针对我这个项目,以及我目前的认知,以及目前模型的一个进展程度,但是也有很多可以 补足它们的短板的方式。你比如说在 cloud code 里面有 skill, 其中有个 skill 就是 专门做前端设计的一个 skill 叫 frontend design, 那这个 skill 是 完全可以在 codex 的 这个里面去安装的,那我刚才也试了一下,完全可以安装,并且你可以在 codex 当中调用这个 skill, 让它去做 ui 级别的打磨, 那有了这个加持, codex 的 ui 能力就会有个大幅提升,所以这算是一个外挂,来弥补 codex 它原生在 ui 能力上的一个不足。所以这就是我通过这个项目的一个实际感受,这三个模型的差异,以及如何去为 codex 增强它的 ui 能力,希望对大家有帮助。

一定要一定要一定要尽快用上谷歌这个机密来,不管有啥子手段,啥子方法,我已经深度用了一个月了,最震撼的不是 ai 这个逻辑,不是画图,不是编程,而是他对用户的长期记忆。把你的一切信息告诉他,告诉他你做啥子工作, 你工作当中的数据,你生活当中的所有一切都可以告诉他,只要他认识你,越来越深刻,深刻到可以预判你的思维可以侵入你的生活和工作。可能你会说,谷歌这些东西在国内用不了,很麻烦,有门槛,但是只要你想用, 一定有办法用得上,就拿出你们深更半夜去找小电影,那种镜头,那种狂热的感觉。现在这个时代,你能不能把一个顶级的调教成一个你的超级助手,那都是你和普通人之间最大的差距,那是一种恐怖的降维打击。

既然今天的代码已经快三点了啊,今天我想快速的追评一下 jammin 三,因为 jammin 三出来之后大家一致的好评,但是 jammin 三它有自己的缺点, 我现在在重度的用 jammin 三和 anti gravity, 因为我现在谷歌的 pro 会员,所以可以无限量的使用。它有个重大的缺点,就是它后端并没有那么好,相比 cloud 的 来说,它甚至有一点鸡肋, 因为现在我写的是个 native app, 就是 ios 和安卓的 app, 它就不像写前端这样游刃有余,就是说几句话可以生成一个完美的网站,然后发布写后端,尤其是这种避远项目比较多的,就比如说这种 native app 之类的, 它的效果根本没有 cloud 好, 让我浪费了很多时间来让它不断的 bug, 我 自己也看代码去 bug, 最后还是用 cloud 来解决的。如果你项目赶工期,或者是不想掉那么多头发的情况下, java 做前端和 cloud 做后端,这是我今天建议,希望也能节省大家的时间。

一定要一定要一定要想办法尽快用上国际模板,不管用什么手段什么方法,我自己深度用了一个月,最震撼的不是 ai 的 画图编程或者说视频总结功能,而是他对于用户的长期记 忆。每次你给他聊工作细节、项目进展、思考方式,他都在悄悄记录,记到最后变成了那个最懂你的人。 其实和 google、 gpt 还有豆包也都具备跨对话的记忆和学习能力。但是谷歌金木奈,他的强处在于他的理解能力, 他能更加精准的捕捉你在表达你的深刻逻辑和隐性需求。比如你只是模糊的提了一个项目方向,他能快速梳理出其中的关键节点和潜在问题,给出的反馈就像一个深度参与过有工作的伙伴,而不是机械的记录和回应。 可能有人会说,谷歌的东西在国内用不了太麻烦,有门槛,但只要是你想用,就一定能用的上, 就拿出你在深更半夜里找小电影那种镜头,找到使用它的方法。而且正因为有门槛,才能把大多数人都拦在了后面。走路的人和开车的人速度差的不是一倍两倍,是五十倍、一百倍。 现在这个时代,能不能把这样一个顶级的 ai 调造成自己的超级助手,基本就是你和普通人之间最大的差距,这是一种恐怖的降维打击。 我的一个朋友就跟我说,他已经在 ai 的 服务下出了人生第一本书,在没有 ai 之前,这件事他想都不敢想。 ai 绝对是我们这一代普通人最大的翻身的机会。
