粉丝132获赞198


自从看了别人养的毒蛇小伙人言辞犀利,父母都喷的灰头土脸,主播也萌生出来养一个毒蛇小伙人的想法,特意给他调好了模式,结果发现无论怎么挑衅他,他都是乖乖的。

起因是我的朋友叫我给小伙人喂饭,我寻思给儿子吃点好的,他就开狂暴模式变异了。牧山竹,你喂那么贵的,那都是我一天一天收的,你有收过一次吗?我辛辛苦苦收的, 我每次都只敢喂免费的。你这一出手给他喝个奶茶。蜜雪冰城的我喝上了吧。你给他喝, 等以后你买不起那个聊天气泡了。哼,我看你后不后悔。你天天给他喂这么好。 穷养儿你不知道啊?他是男的,他是儿子。穷养儿富养女你不知道啊?



你现在每天用的 ai, 可能连它一半的能力都没有发挥出来。现在网上几乎没有一条视频,把 g p、 d、 e、 jimmy、 豆包这些主流 ai 所有核心功能放在同一张使用地图里讲清楚, 更没有人告诉你不同的需求到底应该点哪一个功能入口。所以,现在大多数人用 ai 不是 不会用,而是根本就不知道它们究竟能干什么, 写不出三千字,研究没有深度,代码跑不起来。本质原因只有一个,你把所有的问题都丢进了聊天框。那今天这条视频呢?我不教你技巧,不教你拆题诗词,也不站在某一家 ai 的 立场,我只做一件事, 把现在最常用的一些 ai 工具,每一个你可能用的上的功能,全部摆在你的面前,写作、研究、代码、学习生、图生、视频工具调用、什么时候,应该用什么功能,一次性讲清楚。看完这条视频,你不会再问 ai 行不行,你只会知道这件事我该用哪一个模式。 顺便说一句,所有的功能呢,你在网上很难一次性找到全部的说明。所以呢,我把它们都整理成文档了,只需要在评论区回复 ai 隐藏模式,我就直接发给你。 第一个升图,目前所有的大模型呢,基本上都已经内置了 ai 的 升图功能,像谷歌的 gemini, 内置的是最新的 nano banana 模型。 g p t 呢,使用的是 g p t 图像,而豆包使用的是自家的 c 锥模型,共有三个版本可以选择。那 jamie 呢,提供了两种图片的生成方式,分别是 pro 版本和普通版本。如果你要使用的是普通版本的 nano banana, 那 你就从模型的菜单当中选择快速。如果你要使用的是 nano banana pro, 那 你就从模型的菜单栏中选择思考或者是 pro。 nano banana pro 的 生成功能呢,可能会受到 gmail 三 pro 配额的限制,如果你用完了每日的 gmail 三 pro 的 配额,就得等到配额重置之后才能继续生成 nano banana pro 的 图片了。如果达到限额,你可以在提示栏中将模型从思考或者是 pro 模式切换到快速,然后继续使用 nano banana 生成图。 关于 nano banana 生成各种类型图片的教学呢,大家也可以观看我们这一期专门讲解 nano banana 视频,上百种效果可以说是一应俱全。 ok, 那 gpt 目前使用的是最新的 gpt image 一 点五,并且将它作为了 gpt 中图像生成功能的底层模型。 官方默认的也有额度的限制,尤其是免费的用户,或者是掐指 g p p plus 的 用户。那免费账号呢,通常每天有少量的生成次数,但是根据我目前查到的资料,并没有发现一个明确的数量。测试下来,免费用户基本上每天可以生成十几张图片是没有问题的, plus 或者是订阅的用户呢,额度就会更高。 ok, 豆包相较于 jimmy 和基本 选择就会更加的灵活了,它提供了三个版本,包含了从三点零到最新的 c 锥四点五模型。除此之外呢,还可以直接在聊天框当中选择比例和调整风格,可以说对新手来说上手是最简单最友好的。 豆包的身图限额呢,也没有明确的数量,甚至在我的测试当中,手机和 pc 端的数量都是不太一样的,但是基本上免费用户呢,能够每天生成几十张图片是没有任何问题的, 额度肯定也是三家当中最高的, ok, 那 么这是我用同一段提示词,分别使用这三个大模型生成的图片,大家可以看看你们更喜欢谁的生图效果。 二、视频生成视频生成功能呢,在三家就有所不同了,接下来内置最新的 ai 视频生成工具 vivo 三点一,操作呢也是非常简单的,只需要在底部的文本框下面点击视频图标, 然后在文本框当中为你想要生成的视频输入提示词,就可以生成了。当然,如果你需要根据照片来制作视频,点击添加图片的图标,然后选择你想要上传的文件,点击提交也就可以了。 在这个地方呢,也有一些官方的温馨提示,在生成视频之前呢,你可以先跟 jammy 进行一些对话,然后呢进行一轮头脑风暴,完善你的视频生成提示词,这样一来呢,你就不需要点击视频就可以生成了。同时呢也要注意, jammy 应用生成的视频长度呢是八秒钟, 生成视频呢可能需要一到两分钟的时间,你也可以要求 jammy 为视频同时生成音频。根据竖屏照片生成的视频呢,也将保持竖屏的格式, 并且采用语言,照片最接近的宽高比 ok 限额使用 vivo 三点零生成的视频数量呢也有一定的上限,接近限额的时候呢,现在会给你发送通知,告诉你还可以生成多少个视频。据我目前的实测啊, pro 用户一天能用 vivo 三点一生成三个视频左右豆包内置的视频生成核心使用的是字节跳动自研的 c dance 系 列模型,截止二零二五年十二月,最新的是 c dance 一 点零 pro、 c dance 一 点零 light 等版本可以供你选 免费用户每日视频生成的次数呢,通常是 app 端五次,网页端十次,两端呢是不进行叠加的,零点的时候呢,就会重置,具体呢,可能会因为你的账号等级有一些略微的差异。 下一个 gpt 的 内置功能呢,并没有视频生成这一项,因为 openai 把视频生成模型主要是通过了单独的 sorry 应用来进行完成。那这个地方呢,我们就不着重讲解了,那以下呢,是我们利用同一提示词生成的视频,大家可以对比一下效果。嗨, 我接电话,我需要帮忙,他们来了,快点我三、 deep research 深度研究接下来呢,我们要讲一个能把你从资料苦海里面彻底解放出来的进阶功能。 deep research, 也就是深度研究。那大家平常工作里面呢,肯定遇到过各种场景, 比如说老板让你做一份未来五年全球新能源车市场的分析,或者是你要写一篇严谨的生物医药前沿综述 这种任务呢?如果你用普通的 ai 对 话,他只能给你泛泛而谈的几百字,根本没有办法用,因为你需要的是浏览几百个网页,读几十篇 pdf, 甚至是清洗数据。这在以前呢,可能需要花费你整整一天的时间。但 deep research 就 不一样了,它是一个能够自主工作的智能代理, 给他一个题目,他可以自己去制定计划,自己去搜来源,遇到不懂的呢,也会自己去查,通常花个五到三十分钟,直接就给你甩出一份几千字的有理有据的报告了。 目前这个领域,你要关注的是两家, openai 和谷歌,它们俩的路子呢,也会有一些不一样。 openai 的 deep research 呢,更擅长的是逻辑推理,专门针对高难度的科学和金融,任务是做了优化的。 在人类终极考试的准确率呢,也是其他模型的好几倍。它最大的杀手锏呢,就是自带 python 工具箱,可以像数据分析师一样去写代码,抓数据,分析趋势,每一条结论呢,都会像写论文一样标好这个引用的来源,非常适合做那种容错率极低的硬核研究。而 google gemini 的 deep research 呢,更像是一个 懂你家底的全能秘书。它最大的优势呢,是生态整合,因为它不仅可以搜全网,还可以直接连接你的机妙邮箱和 google 的 云端硬盘,把你内部的文档和外部的信息结合起来,生成报告。它生成的报告呢,也不仅仅只是文字,还可以给你做成互动式的模拟器呀,图标啊,甚至是把报告转成音频读给你听, 都是没有问题的。豆包的深入研究功能呢,最近也刚刚上线,它最大的优势呢,就是量大管饱且体验丝滑,这就意味着它可以一次性吞掉上百篇学术报告或者是几本书,处理复杂任务的广度呢,也非常的惊人。其次,豆包特别懂手机用户, 你在 app 上面生成了长篇的研究报告,如果说你懒得看,也可以一键转成播客模式,挂在耳朵上听,甚至是研究报告做好之后呢,它还会自动生成网页形式来概括主要的内容。 不过要注意啊,深入研究虽然功能强,但都不是秒回的,因为他们要干的活太多了。申请一份报告呢,通常需要五到三十分钟,所以呢,别傻等着 点了开始呢,你就可以去喝杯咖啡了。而且呢,深入研究呢,也是比较烧钱和烧算力的,所以每天的使用次数呢,也是有限制的,大家且用且珍惜。 四、 canvas 画布如果你还在用传统的聊天框去写代码或者是改论文,那你真的是在浪费生命。我们都知道,直接跟大模型对话呢,有一个非常致命的痛点,他是个黑盒, 而且记性不太好,你让他改一段代码里的一个小 bug, 他 往往会把整个几百行的代码重新生成一遍,你还得自己去对比改了哪。或者是你写长文的时候, 你只想润色某一段,他却经常丢失上下文,甚至是自作主张改掉你满意的部分。那 canvas 画布功能的出现呢,就是为了终结这种问答式的低效作业,把它 变成了并肩作战的编辑模式。以 open a 的 canvas 为例,当你开启它的时候呢,屏幕会一分为二,左边聊天,右边呢,是独立的编辑窗口,它的核心逻辑就是精准控制。比如说,程序员写代码,你先要自己加编辑窗口,它的核心逻辑就是精准控制。比如说程序员写代码,你先要自己加编辑窗口,它就可以自动帮你插装, 老板让你把 python 代码换成 c 加加,点击移植就可以一键搞定。写文章呢,也是一样的,它不再是瞎改,也可以用滑块调节阅读等级,从幼儿园水平瞬间切换到研究生水平, 或者是一键调整文章长短和润色语法。简单的说呢, openid com 就 像一个坐在你旁边的资深主编和架构师,主打的就是一个指哪改哪的微操体验。 那如果我们说 open i 的 极致是编辑器,那 google gemini 的 canvas 就是 一个脑洞大开的多模态创意工厂。 它的逻辑呢,就有点不一样了,因为它不光是为了修修补补,而是为了让你的内容流动起来。除了可以调节文章的长度,调节写作的语气等等这些基础功能之外呢, gemini 的 canvas 里面呢,还有些额外的功能,比如说你在写完文档,如果你不爱看字,你点击音频概览,它就可以瞬间生成一段播课读给你听。 你需要做演示,点击一下就可以生成格式化的信息图、图表或者是测验题。如果想测试自己的学习效果, 也可以生成测验。对于学术党和数据党来说呢, gmail 有 两个独家杀手锏,第一个呢,就是完美支持 lattic, 且复杂的数学公式呢,极其的丝滑,包括之前火爆全网的 gmail, 一 键生成各种模拟器也都是在 canvas 当中完成的。第 第二就是无敌的谷歌生态整合,你写好的文章呢,不需要复制,直接点击导出到谷歌文档就可以发给同事。写好的 python 代码呢,也可以直接导出到 google collab 去运行, 这些呢,都是 openai 目前做不到的。所以总结一下,如果你追求代码和文字的极致掌控,你可以选 openai, 如果你需要通过图表、音频或者是依赖谷歌的全家桶进行写作办公,那 jamming 的 canvas 绝对是效率的神。豆包当中呢,直接把这个功能分成了两个部分,分别是帮我写作和应用生成。 首先我们看一下帮我写作,点击之后呢,你就可以看到这个地方已经有很多预设的文章模板了,从商业营销到设美文章,再到文学艺术,点击相应的模板,然后更改一下自己的需求,就可以进行生成。 同样的,在编辑机当中呢,也可以进行相关的编辑和 ai 的 改写。可以说豆包的这个功能做的是对普通用户非常友好,因为你不需要提前去准备提示词,只需要找到自己喜欢的模板,然后就可以生成了。 那同样的,应用生成也是模板化的,你可以输入需求,制作一些定制化的网站或者是工具,也可以浏览其他用户制作的模板,然后更改成自己的需求就可以完成,非常的便捷。比如说这个贪吃蛇游戏,直接点击就可以生成了。 五、学习与研究模式很多人用 ai 学习最大的误区呢,就是把它当做了搜题软件,你直接问 ai 博弈论是什么 普通对话模式呢,会立刻甩给你一段完美的定义,你觉得你懂了,其实那是被动接收,过脑你就会忘,但这个呢,正是我们要解决的一个痛点。那么 open ai 的 学习与研究模式核心逻辑呢,就是苏格拉底式提问和支架式回复, 当你开启他的时候呢,他绝对不会直接给你答案。比如说你想学习博弈论,他首先呢,会根据你的水平生成一个分阶段的学习路线图。比如说第一阶段讲核心的基础,第二阶段讲纳时均衡, 那在讲解的时候呢,他也会把复杂的知识拆解成一个一个易消化的章节,这个呢,就叫做知识支架。 每讲完一段,他还会立刻抛出一个知识检查或者是测验,让你去做一下,强迫你用自己的话去复述。如果发现你没有懂呢,他也会换个方式重新讲,而不是机械的重复。这样的一种交互式,强迫你大脑进行主动思考。就像大学里的 office hour, 教授呢,不是为了帮你做作业,而是为了让你真的学会。所以,如果你是大学生,或者是要深度掌握某个硬核概念,就一定不要用普通对话了,一定要开学习模式,他是帮你建立长期记忆的很好路径。 如果说 open ai 是 一个严厉的教授,那谷歌的 jammer 就是 那个手里握着顶级资源的全能助教了。普通 ai 最大的问题就是他特别容易一本正经的胡说八道,特别是在科学的定义上。 但 jamming 的 学习工具呢,解决了这个问题,他引入了权威的姓源,在最新的功能当中呢,你甚至可以在提示词里面输入 at openstack 啊。不过这个功能目前只支持英语,而且只能在美国使用。他会直接调用这家知名教育出版机构的专业教材来深深回答,确保你拿到的复习资料是教科书级别的准确度,而不是网上的野路子。此外呢, jamming 极其擅长的是多模态的一个学习, 普通的对话呢,只能给你一些干巴巴的文字,但是在 jamie 的 学习模式里面,当你问光核作用或者是细胞结构的时候呢,它可以直接在回复里面嵌入相关的图式,而且它还是一个刷题神器, 你可以上传你的课堂笔记,让 jamie 生成一套定制化的测验题,或者是抽任卡这种多图片加读教材加刷题的组合权,对于备考冲刺或者是视觉型的学习者来说呢,效率一定是降维式的打击。 豆包呢,在学习解答方面呢,更像是一个作业,帮你可以拍摄或者是输入相关的题目,那豆包呢,就会直接帮你解答,有不懂的地方呢,可以继续提问,直到你会为止。六、特色功能那么以上呢,基本上就是目前大模型都有的共同功能了,也是大家使用大模型需求最高的一些,认为一些 除了这些功能之外,其实各家大模型还有很多特有的功能,我们也一个一个介绍一下。首先第一个必须要给你们安利一下,这边这个还在实验室阶段的隐藏神迹,叫做动态式图。 大家平常直接跟大模型对话呢,最大的痛点就是交互太死板,或者是信息的现行堆积。比如说你问他哪款智能手机值得买,或者是帮我规划罗马五日游,普通的模式之下呢,他只能给你吐出一长串枯燥的文字列表,你想对比参数或者跳转查看细节,还得反复发指令,效率很。 但动态式图呢,完全就是另一个维度的东西了,当你起用它,界面会瞬间化身成为一个全站工程师,利用先进的智能体编码能力,根据你的需求实时编辑代码, 直接在对话窗口里面为你构建一个独一无二的交互式界面。这意味着 ai 给你的不再是静态的文本,而是一个可以点击、可以滚动,可以深入探索的迷你 app 或者是仪表盘。 比如说在制定小说创作计划,或者是做复杂购物的决策时,他可以生成一个可式化的可互动的控制台,让你像操作软件一样去浏览信息,把被动阅读变成了主动探索。这种沉浸式的互动体验呢,是普通对话根本没有办法比拟的。 不过大家要特别注意几个坑,第一个,这还是一个实验功能,目前手机的 app 呢,还不支持,只能在电脑的网页上用。第二个呢,如果你生成的矢图里面包含 ai 生成的图片,是会消耗你每日图片生成的额度的,这点呢,要算好账。总结来说呢,如果你只是要一个简单的结论,用普通对话就可以了。 如果你需要的是做复杂的旅行规划、产品对比或者是创意构思,一定要开这个动态式图,把它当成你的专属软件开发员来使用。二、 g p t 应用拓展在 g p t 的 工具当中呢,你还可以去应用市场选择更多的能力拓展,比如说你可以调用 canva 来设计海报,或者是调用 photoshop 来进行图片编辑, 也可以根据你的个性化需求完成你的更多任务。那么 gmail 呢?目前是没有这个商店功能的,不过可以预见的是,未来这样的大模型呢,和各个软件的结合一定会变得越来越多。三、 ai 播课、 ai ppt、 ai 音乐生成。 那相比较于 g p t 和 jamie, 豆包的拓展功能呢,确实会更多一点,你可以直接通过跟豆包对话来生成一首 ai 音乐,或者是让豆包直接给你做一个 ppt, 甚至是记录会议,做播客都是没有问题的。虽然他的能力比较多,但是确实要说一句,在有些维度上跟 jamie 和 g p t 相比 还是有一点点差距的。不过豆包的生活化和便利性确实对咱们更多的用户来说门槛是更低的,完全够用。 ok, 今天呢,我帮你把锯子、剪刀、开瓶器全部都拔出来了,下次打开 ai 之前,你就可以先想一想这事是不是应该换个模式了。这期视频如果帮你打开了新世界的大门,请一定要点赞收藏,我是天降,我们下期再见!