google gemini 连放大招, ai 的 能力边界再次被刷新!两大重磅更新带你快速看懂!首先, google 发布了首个原生全模态嵌入模型 gemini embedded。 二,它能将文本、图像、音频、视频和 pdf 五大类数据无损融合进同一个向量空间。这意味着 ai 终于能像人类一样,把听到的、 看到的、读到的信息无缝串联。比如根据一段发动机异响录音,瞬间从海量手册中找到故障图纸,开发者从此可以用一次 a p i 调用搞定过去多个模型才能完成的多模态任务,解锁和应用效率直接起飞。另一大更新是这门,来全面入驻 workspaces 办公全家桶。在 doc 里, ai 能模仿你的写作风格生成出稿。在 sims 里,一句话就能生成可编辑的演示文稿。 在 drive 里搜索终于变聪明了, ai 会直接总结答案并附上来缘。从帮你做事到和你一起做事, ai 正在成为真正的数字统治。从底层模型到日常应用, jameson 的 每一步进化都在加速我们与 ai 的 写作。想了解更多细节,欢迎在评论区留言。
粉丝119获赞1944

我敢说,专门店的能力你只用了百分之十!这是我翻遍了社区帖子、开发文档,实测了所有功能之后得出来的结论。如果你是学生党,写论文、职场人,做 ppt、 学编程、做开发,今天这条视频你一定要看完, 我带你开发出剩下的百分之九十对你有用的八大功能!这可能是全网最全的专门店使用攻略。点个赞,咱们发车 平时有这么点生图,是不是经常遇到这种情况?图挺好的,就一个小细节不对,想要重出一张图,同样的提示词再来一遍, 出来的东西啊就完全不一样了。 nasa 不 nasa 兔其实自带一个 ai 重绘功能,上传图片后想改哪啊?就画个圈,告诉他怎么改,加载完成后再重新发送给 jimmy, 出来的图效果就对了。 还有一种方式是把图片转为 g s o n 格式,然后对描述进行相应的修改。比如说,我想把这张图里人物的衣服换成绿色,那么只需要修改 g s o n 描述,然后上传原图发给 jimmy, 就 可以完成修改。 jimi 对 于视频的认知能力并不限于转文字,而是能够看懂视频每一帧的内容,并且进行总结。我经常用它拆解数据好的视频内容,比如这一条,它不仅给我总结了视频结构和内容,还能分解视频的前三秒钩子设计和画面情绪转折点,妥妥的复盘学习神器啊! 你是不是也在 b 站或者是油管收藏了一堆视频教程,最后都在收藏夹里面吃灰呢?我仍给詹姆斯一个长达两小时的全英文排版教程,不到一分钟就帮我上完了两小时的课,给我总结了核心代码段,还有视频重点时间轴,大幅缩短了我的学习成本。詹姆斯目前可以直接上传油管网站链接, 其他需要本地上传。手机版 jimmy 有 个叫 jimmy life 的 功能,它支持实时语音对话,可以识别物体和屏幕内容。我分享两个最哇塞的功能,一是贴身口语陪练,打开 jimmy life, 直接告诉他,我想锻炼英语口语,他就会开始自动和你聊你想聊的话题, 随时随地都能练,遇到不会的或者错误的表达也可以直接让他指出,比很多的 app 功能都方便了。二是模拟面试官把你的简历和岗位要求扔给他,然后说现在你是资深主管,对我压力面试 他真的会结合你的履历犀利的追问,答不上来直接打断,让他现场教你怎么优化逻辑,结束后还能让他帮你总结面试中的表现和优缺点。还有修路由器、电脑连不上网、识别商品等等任何事情都可以问他,属于是 ai 版的十万个为什么了。 接下来这个功能可能是 jamie 全家桶里最被低估的一个 notebook lm, 它不是传统厂商那种编一年编出一个大版本的更新的玩法。产品经理直接在 x 上问用户你们想要什么,然后一个功能一个功能的改出来,比如说记忆卡片、文件夹筛选,都是用户说想要,他就真的给做出来了, 那他到底能干嘛呢?你只需要给一个方向,他自己上网找资料,一键生成视频播课、 ppt、 思维导图、研究报告、信息图、表格, 咱们一个一个看。先说视频播客,它生成的视频是什么水平呢?大家好,今天我们来聊一个特别火的话题,一个可能引爆万亿级市场的赛道,人形机器人, 口不稿自己写,自己配音自己配素材,观感很像那种很专业的视频测评播客。再说 ppt 排版优美,风格统一,配图和文案还很大。唯一的硬伤啊,是中文会乱码,毕竟呢,底层还是 nasa banana pro 模型,中文能力啊,明显不如二代。还有问答和卡片生成, 可以根据研究内容自动生成为答题,高校老师拿来出题,学生拿来自查都特别合适。表格整理啊,更绝,他直接给我整出二十五家,包括产品商业化阶段、应用场景、资料搜集的能力啊,在同级别的 ai 里面算很高的了。 思维导图专业且准确,而且每个分支点一下整理就会自动调。 notebook l m 去搜索这个小点下更多相关内容,越挖越深。 它有一个最大的用处是个人外置知识库,比如说你可以把公司规章制度上传进去,然后当你有疑问时直接问他,可以省去很多的搜查时间。总结一下, notebook lm 是 jimmy 集成的一个超级工具,它集成的是 jimmy 的 一点五 pro 和 nada。 不, nada pro 的 模型。 上面你看到的这一些,全都是一键点一下就能生成。对于内容创作者、学习者来说,这个玩意堪称外挂呀。这么点其实也有音乐制作的能力,不过呢,我本人是编曲小白,只能依靠 ai 工具来帮我做一些编排。这是我简单提示私下生成的模仿 new to best 的 一段前奏 remini 一 次只能生成三十秒,和苏诺还有不小的差距,但总归玩一玩还是很有感觉的。它还更新了一个看图作曲的功能。我上传了一张旅拍图,它识别出了江南水乡的风格,做出的曲子融合了英文 rap 和古筝风格。 这波属于是中西文化,融合了它的多媒体模型,还可以鉴赏音乐,把你喜欢的歌直接丢给它,它能够按照曲式结构和声旋律进行硬核分析。对于喜欢听歌但听不懂的爱好者,这个功能好用到爆。 如果你经常需要 ai 帮你做同一类的事情,比如说翻译、润色文章、辅导孩子,那么 jim 就是 为你准备的。 他的核心是一次设定,永久使用,告诉他我是语言专家。输入任何语言都翻译成中文以后,每次需要翻译时,直接打开这个 game 就 行,无需重复输入指令。我在这里给大家分享一下我的 game。 我 一共创建了三个智能体,第一个是爆款选题,策划师 负责寻找爆款选择题。二是内容编导,主要负责把选择题拆成大纲。最后是金牌政稿人,任务是视频大纲写成口播稿。他们各自分工,了解我想要的选定方向和语言风格,直接省去了每次新建对话从零开始设定背景的时间。 接下来咱们聊聊 cavis。 你 可能在网上刷到过那一种酷炫的手势粒子特效,挥手就能控制屏幕的东西啊。确实炫酷,但好像没什么实际的用处。但 cavis 真正厉害的地方在于,它能让你手存任何你想要的实用工具。如果你是科技博主,经常要出手机跑分测评, 以前呢,得去 a e 里面费半天劲做动画。现在呢,你可以打开 cavis 教几句话,做一个可负用的跑分生成器,能填分数,自动生成对比条,点击运行,一个直接能用的工具就出来了,下次出视频直接往里面填数就行了。 如果你是上班族呢,容易分心忘了喝水。 cavis 里面搓一个番茄钟,工作时间跟喝水量自己说了算,比动不动收费弹广告的小程序啊,好用一千倍。 还有更实在的,发票打印助手,每次报销都要手动排版,或者是开会员打印, kevin 搓一个,上传图片,自动排号,点一下就能打印。这些工具都运行在你的电脑本地,不需要联网,没有使用次数限制,也不会哪一天突然收费。你就想想你平时最烦哪个重复劳动, kevin 都能帮你搓掉它。 gemini vogue 是 一个 github 上订阅超过十二 k 的 开源项目,部署在网页的扩展程序中,它能在很多方面优化使用 gemini 的 体验。我觉得最好用的功能啊,就是调用 google drive 存储写好的提示词, 跨设备也能用,甚至跨模型也能同步文件夹。分类功能,能把相同类型的对话进行分类,省去一个一个找到时间。这个时间线功能啊,也很实用, 鼠标拖到屏幕右侧就能唤醒,然后直接搜索关键词,或者点击对应对话就能跳转。还有个去除纳都不纳纳的生图水印功能,同样实用性拉满。这里还可以自定义对话框、侧边栏宽度、输入框折叠等一系列使用功能,完全适配你的习惯,感兴趣的可以去项目官网支持一下这位作者, 我这里呢也只分享了一部分功能链接,我已经贴在评论区了,快去安装试试吧。看完这些视频,相信你对真密的全部功能有了一个透彻的理解,如果你觉得有用,麻烦给视频来一个一键三连。你还知道什么真密的隐藏用法呢?评论区聊聊吧。

这些你要知道的知识,如果你们在用 gemma, 你 们一定要装这个插件,它能够让你用上完整的 gemma 的 功能,完全免费,而且还支持中文,它能够自动帮你锁定性能最强的 gemma。 三点一 pro 模型,不用手动来回切换,这样就能够保证 ai 每次都是以最佳状态去处理流 问题。他还自带去水印的功能,聊天记录支持一键拖拽整理到文件夹时间轴也能快速定位对话,这样找内容就会方便很多。你跟他的对话还能够导出来保存到本地,这样你就能够和其他的 ai 工具去共享记忆。除此之外,还有常用的 ai 指令保存,具体的工具细节我已经打包好放在星球里啦!

大家好,今天我们来聊一下我使用 jama 三点零过程当中的一些感受。哈喽大家好,我是张律师。最近 jama 三点零推出了之后在网上爆火, 我有个同事使用了之后呢,也跟我说它的功能太强大了,一句话就可以生成网页。那听了同事以及网上的这些描述之后呢,我自己也去尝试使用了一下,花两个小时让他给我写一个网页, 然后我再根据 ai 的 指示把这些代码放到了 cosinebox react 里面,发现真的能跑通,并且我希望有的一些功能还是可以实现的。说实话,到这里我确实是被 jammer 三点零这个强大的功能惊艳到了。 除此之外,我更惊艳于 ai 的 进步速度,因为 ai 刚刚出来的时候,大家说它可以写代码,但是呢,我去时间用了一下,发现,嗯,好像跟实际的写代码确实还是有一段差距。但是啊,今天这个 jammin 三点零推出了之后,它确实是能够写代码了。 紧接着我就把 jammin 三点零给我写的代码拿给了我的一个程序员朋友,然后我就希望他给我一个评估说,哎,如果我想上线这个网站实际使用的话, 还需要做多少工作,还需要等待多长时间?然后他看了之后呢,给我浇了一盆冷水的,他跟我说,如果这个网站要实际上线并且投入使用的话,按照每天八个小时工作制来计算,可能要大概半个月起 这样的时间才能够实际投入使用。因为实际投入使用的话,还要考虑到一些兼容性的问题啊,以及这个代码逻辑性之间的问题, 然后还要进行一些实际的测试,因为我是一个代码小白,完全不知道如果要上线一个网站,并且投入使用的话,具体要做一些什么工作。然后他接着给我解释啊,就是如果说没有 ai 的 参与的话,这整个工作可能需要一个月以上的时间, 那现在 ai 参与之后的话,就把整个工作流程以及工作时间减半了,那从效率上讲, ai 确实是有了很大的帮助。但是如果说要从实现我们的目的来看的话, ai 并不是说能够完全替代我们现在的工作。他聊到这个问题的时候,其实我是深有感触的,在法律行业或者说至少是律师的工作来看,情况也是类似的,就是在 ai 出来之前,可能我们解锁法条、解锁案例需要花很多的时间,我们甚至把它当成一项专业的技能去培养。 但是 ai 出来了之后呢,它在解锁法条以及解锁案例之后,能给我们提供很大的便利和帮助,节省了很多的时间。我们现在需要做的就是在 ai 提供的结果的基础上,我们再去核实一下, 或者说再进行一些补充的线索,确实极大地提高了工作效率,节省了我们很多时间。但是啊,我觉得 ai 并没有完全代替我们目前的工作。 所以啊,就目前 ai 发展情况来说,我觉得最好模式就是 ai 加专业人士兜底的这种工作模式。当然就像我之前提到的, ai 目前发展很 快,所以我们目前也在关注 ai 给我们各行各业带来的影响。好的,那么这期视频我们就聊到这里,如果大家有什么疑问或者说感兴趣话题,欢迎在评论区留言,我们会有视频的方式回复大家,我们下期再见,拜拜!

ai 漫剧天花板解法来了! c 单词二,搭配 gemini 三,直接把视频走向旱死在自己手里。核心玩法超简单,用到的二十五宫格分镜和生成提示词三四五,尝尝咸淡。 只需要先在 gemini 里做好预设,接着去文档里复制好对应指令,直接粘贴保存,再把初始角色图上传到位。然后补充一段故事描述 这个角色和戴松帽的机器人在船上对峙,女刺客突然向松帽机器人甩出匕首,紧接着近身缠斗,从船上一路打到森林里。几招下来,双方难分胜负。 稍等片刻,一段完整脚本直接生成。重点操作来了,重新打开 gemini 界面,上传刚才的两张图片,复制好刚生成的代码,照着文档里的提示词模板粘贴到 gemini 当中,最后就能 get 到这种丝滑连贯的二十五宫格分镜了。最关键的一步, 打开极梦,用 cds 的 多帧功能上传好分镜图,点击生成,就能得到 ai 慢剧制作指南加分镜提示词模板三四五,尝尝咸淡。

gemini 三真的太强了,我用它做了个可以用语音和 ai 聊天,然后生成日记的软件。我想先给大家看看 gemini 做的这个交互的界面, 视觉上非常酷,可以把任何一张图片都变成这种粒子的效果。点击这里还可以实时和 gemini 语音对话, 这些粒子会随着你说话的强度,还有背景音乐舞动。这里还有个面板,可以调节这些粒子的各种参数,比如说舞动的幅度啊,渐变的速度什么的。 这个产品的逻辑其实蛮简单的,就是你发给 ai 一 张照片,它就会自动进入一段语音对话,聊得差不多了,你就可以点击这里结束对话。 ai 会根据你们的聊天记录,把你说的话变成一篇日记,存在一个记忆的回廊里, 我带大家体验一次实时的功能的能力。这里我们上传一张照片发给 ai, 然后就到了这个实时交互的页面,这里还会有一个背景音乐,让你们的聊天更有那种私密的感觉。这里我们就可以开始回复他了。这是我今天下班路上拍的一棵圣诞树,是不是非常好看, 就是你们实时通过这种语音交互,他就会像一个朋友一样,基于你给他的照片,你想说的话,一直引导你继续说下去。 是啊,这棵圣诞树好漂亮,但是我就想到今年圣诞节我又是一个人过了。这里我就是随便说一下,因为你平时可以给他分享一个随手拍的心情啊,关于旅行的记录啊,或者你在思考什么,然后我再回他一下, 我每年圣诞节都是自己过的,看到别人热热闹闹的样子更觉得挺失落的。 这个就是记日记的原理,就是你可以一直跟他分享你的心情,或者是对于某件事的看法,然后你们聊完了就可以点击这个保存为日记, 我们来看一下,他会把你的聊天数据传给大魔星,返回一个日记的卡片, 看这里就传回来了,这里会有一个时间戳记录,你和 jamie 是 一分二十一秒的对话,然后他会,嗯根据你的要求去把这个对话的内容啊你的想法记录下来,然后你就可以点击这里保存。 今天给我做的这个保存的界面也特别漂亮,因为每一次我都会分享给他一张照片,作为聊天的开始嘛,那这个照片就会成为你们这段记忆的专辑封面,可以这样浏览去查看日记。这里的视觉效果也非常符合我对于回忆的那种质感的想象, 它非常好的模拟了那种记忆的碎片的感觉,而且它科技感也挺强,有点像星际穿越的那种效果。这里 jimmy 还给我配了一个音乐,是 ai 生成的,我们来听一下。 好,最后我来简单讲一下怎么用 jimmy 三做出这种动态交互效果。首先你就是去市面上找一个你最喜欢的厉害的前端效果,比如说我找的就是这个网站,可以记一下, 但是如果你不知道自己要什么的话,也可以去搜这些关键词,或者是和 ai 去讨论,这些都是我前天才知道的。 然后你打开 gemini, 让它给你做一个产品原型 prompt, 我 放在这里了,它会迅速给你做出来一个符合你想要的风格的交互产品, 然后你就需要去调整它的交互效果。但是我们通常对这些技术、语言和效果没有描述它的能力,那你就会用到这个 prompt 去问叉 gpt 或者是 gemini, 你 说我要学习这个类型,然后有哪些术语我可以用, 那我在过程中就会学到叉 gpt 教我的这些东西,比如说,嗯,这些各种各样的名词啊。然后如果我想要它有脱尾效果,我就会跟它说想要四象漂移,也会跟它说, 这样子你就可以慢慢去调整它。然后你在打磨的过程中,如果对于产品和视觉有什么想法,就去 pinterest 搜搜别人是怎么做的,然后描述给 jimmy 听,这样一遍一遍就可以做出来你想要的东西。 下一期我会整理好完整的 prompt 发出来,手把手教你做出好玩儿的产品。欢迎你关注我,我们下期再见。

像使用机密呢,应该,你应该要把这个提示词弄好,才能发挥它最大的作用啊。比如说像我这张 西藏的文艺宣传图一样,那么我是先使用这个 gpt, 让它把这个提示词写出来。 对啊,让它把这个提示词写好, 然后你把这个提示复制过去,直接直接直接发给这个界面的就可以了,那么它的生图的效果就 就相当于比较完美了,对不对?同样的,你比如说是要写论文啊,那你可以先用 gpt 或者是经典的同样的两个嘛, 叫他先深腾这个题词词,那你有了这个方向,是不是你有了这个方向,那就比较容易入手了? 然后把提示词丢给丢给基本的写 复制跟心境对话,你把这个一步一步的让他写出来就可以了。

大家知道我一般不轻易说 word 这种词,但这一次我们把谷歌的 jimmy 三接入微信的时候,真的忍不住说了句,我这也太离谱了。为什么呢?因为 jimmy 三让微信活了过来,我甚至觉得他突破了图灵测试, 他不仅非常认真,非常自然地回复用户,甚至做到了用户根本不知道他在跟 ai 聊天。比如,当用户说他们现在有五个客服,成本还是比较高的,那 ai 会顺着客户的话去说,五个客服确实不便宜,然后接着跟进, 这哪里是 ai, 这是真人吧?更夸张的是,当 jimmy 三结合十六 ai 的 桌面智能体,他更是具备了操作电脑的能力,可以像真人一样自己去识别聊天窗口界面, 点开新的对话框,新的私信、新的群,跑过去回复用户。我们的一些用户已经开始玩图灵测试了,看看谁能真正分清这到底是真人还是 ai。 如果你也想体验这款 jimmy 三加微信智能体,让你的微信自己会看、会想、会说,就在评论区打 ai。

nintendo 二来了,网上评论却两极分化,对比它的 pro 版本,有人说它是为了速度牺牲画质的阉割版,有人说它是 ai 逻辑的新巅峰。我去问了一下 jamie 奈, nintendo 二对比 pro 到底升级了哪些方面,给出我五个核心的关键升级点,这是 jamie 奈给我的答案,我们来一起看一下吧。 第一,推理速度提升三至五倍。第二,具备了实时联网感知,能和真实世界保持一致。第三,多主体一致性控制更强,连贯脚本的神器。第四,四 k 文字渲染升级,彻底告别火星文。最后是引入思考模式,指令遵循度显著提升。 今天我们就通过一组图片生成实测对比这五个核心升级点,看看纳德布纳纳二点零对比 pro 到底是否真的做出了这些提升优化。另外,我们还会告诉大家一些能够用到的纳德布纳纳二的免费入口,大家一定要看到。最后关于推理速度的对比,我们就实测所有图片生成后再来揭晓。 go 一个测试,测试模型对此刻新发生的非公开数据级的事件或地标的一致性认可。 提示词中含有特定地点的特定事件,我们找到了科穿沿岸的真实图片进行对比。大家可以看一下 number one 的 二生成的图片,明显是参考到了科穿沿岸的真实场景,但 pro 的 感觉就比较差强人意了。 这一局 number one 的 二伸出第二个测试挑战模型,维持多个具有不同特征的角色的能力。提示词中五个角色性别、发色、穿着、动作各不相同,且要保持画面的电影级和谐。 那那不那,二生成的图片每个人物特征都精确还原了,且分为统一,还是挺不错的。看看 pro 生成的图片,提示词中提到的背夫动作是背着步集箱,但实际生成的是扛着的,这稍微有点出入,但是其他整体还是挺不错的。 这一局难得不烂的二选。第三个测试,直接硬钢中文特殊符号多行排版的精确度。之前用 pro 生成的带汉字的海报,大家应该都遇到了渲染不对的情况吧,基本上要用 ps 后期补字。 两个模型都成功渲染了字体和图形,但从画面的构图、空间感和环境的氛围丰富度来看,还是 nintendo 的 二生成的图片视觉冲击力更强,环境氛围细节拉满。这一局从原生四 k 文字渲染的角度来看,两者打平,但其他角度还是 nintendo 的 二更深一层。 第四个测试,测试模型对长指令,反之对逻辑分布执行的理解力要求模型先思考如何构建, 再进行生成一些比较复杂的逻辑嵌套,如果模型不思考,生成的画面就会逻辑崩溃。这个对比就比较直观了, number 不 number 二的 ck mod 就 有很大的优势,在生成前理清了这三层画中画的因果关系,再去生成图片,而 pro 就 不具备这种能力, 生成出来的图片逻辑完全不对。好了,最后我们来看一下推理速度的对比。我们一共测试生成了五组图片,推理思考时间, number 不 number 二是比 pro 快 的, 实测下来感觉推移速度难得不难得二略占优势,且价格上难得不难得二比 pro 下降了百分之五十以上,可算是性价比拉满了。 你被种草难得不?难得二了吗?我今天的测试全都在七六零 a s studio 上完成的,只需要输入一个账号就可以快速接入海内外超九十加大模型, 新模型上线贼快,还有免费的投屏额度可以领取。我整理了一份能够快速免费体验的操作文档,欢迎评论区来找我领取哦!记得点赞关注哦!

你现在每天用的 ai, 可能连它一半的能力都没有发挥出来。现在网上几乎没有一条视频,把 g p、 d、 e、 jimmy、 豆包这些主流 ai 所有核心功能放在同一张使用地图里讲清楚, 更没有人告诉你不同的需求到底应该点哪一个功能入口。所以,现在大多数人用 ai 不是 不会用,而是根本就不知道它们究竟能干什么, 写不出三千字,研究没有深度,代码跑不起来。本质原因只有一个,你把所有的问题都丢进了聊天框。那今天这条视频呢?我不教你技巧,不教你拆题诗词,也不站在某一家 ai 的 立场,我只做一件事, 把现在最常用的一些 ai 工具,每一个你可能用的上的功能,全部摆在你的面前,写作、研究、代码、学习生、图生、视频工具调用、什么时候,应该用什么功能,一次性讲清楚。看完这条视频,你不会再问 ai 行不行,你只会知道这件事我该用哪一个模式。 顺便说一句,所有的功能呢,你在网上很难一次性找到全部的说明。所以呢,我把它们都整理成文档了,只需要在评论区回复 ai 隐藏模式,我就直接发给你。 第一个升图,目前所有的大模型呢,基本上都已经内置了 ai 的 升图功能,像谷歌的 gemini, 内置的是最新的 nano banana 模型。 g p t 呢,使用的是 g p t 图像,而豆包使用的是自家的 c 锥模型,共有三个版本可以选择。那 jamie 呢,提供了两种图片的生成方式,分别是 pro 版本和普通版本。如果你要使用的是普通版本的 nano banana, 那 你就从模型的菜单当中选择快速。如果你要使用的是 nano banana pro, 那 你就从模型的菜单栏中选择思考或者是 pro。 nano banana pro 的 生成功能呢,可能会受到 gmail 三 pro 配额的限制,如果你用完了每日的 gmail 三 pro 的 配额,就得等到配额重置之后才能继续生成 nano banana pro 的 图片了。如果达到限额,你可以在提示栏中将模型从思考或者是 pro 模式切换到快速,然后继续使用 nano banana 生成图。 关于 nano banana 生成各种类型图片的教学呢,大家也可以观看我们这一期专门讲解 nano banana 视频,上百种效果可以说是一应俱全。 ok, 那 gpt 目前使用的是最新的 gpt image 一 点五,并且将它作为了 gpt 中图像生成功能的底层模型。 官方默认的也有额度的限制,尤其是免费的用户,或者是掐指 g p p plus 的 用户。那免费账号呢,通常每天有少量的生成次数,但是根据我目前查到的资料,并没有发现一个明确的数量。测试下来,免费用户基本上每天可以生成十几张图片是没有问题的, plus 或者是订阅的用户呢,额度就会更高。 ok, 豆包相较于 jimmy 和基本 选择就会更加的灵活了,它提供了三个版本,包含了从三点零到最新的 c 锥四点五模型。除此之外呢,还可以直接在聊天框当中选择比例和调整风格,可以说对新手来说上手是最简单最友好的。 豆包的身图限额呢,也没有明确的数量,甚至在我的测试当中,手机和 pc 端的数量都是不太一样的,但是基本上免费用户呢,能够每天生成几十张图片是没有任何问题的, 额度肯定也是三家当中最高的, ok, 那 么这是我用同一段提示词,分别使用这三个大模型生成的图片,大家可以看看你们更喜欢谁的生图效果。 二、视频生成视频生成功能呢,在三家就有所不同了,接下来内置最新的 ai 视频生成工具 vivo 三点一,操作呢也是非常简单的,只需要在底部的文本框下面点击视频图标, 然后在文本框当中为你想要生成的视频输入提示词,就可以生成了。当然,如果你需要根据照片来制作视频,点击添加图片的图标,然后选择你想要上传的文件,点击提交也就可以了。 在这个地方呢,也有一些官方的温馨提示,在生成视频之前呢,你可以先跟 jammy 进行一些对话,然后呢进行一轮头脑风暴,完善你的视频生成提示词,这样一来呢,你就不需要点击视频就可以生成了。同时呢也要注意, jammy 应用生成的视频长度呢是八秒钟, 生成视频呢可能需要一到两分钟的时间,你也可以要求 jammy 为视频同时生成音频。根据竖屏照片生成的视频呢,也将保持竖屏的格式, 并且采用语言,照片最接近的宽高比 ok 限额使用 vivo 三点零生成的视频数量呢也有一定的上限,接近限额的时候呢,现在会给你发送通知,告诉你还可以生成多少个视频。据我目前的实测啊, pro 用户一天能用 vivo 三点一生成三个视频左右豆包内置的视频生成核心使用的是字节跳动自研的 c dance 系 列模型,截止二零二五年十二月,最新的是 c dance 一 点零 pro、 c dance 一 点零 light 等版本可以供你选 免费用户每日视频生成的次数呢,通常是 app 端五次,网页端十次,两端呢是不进行叠加的,零点的时候呢,就会重置,具体呢,可能会因为你的账号等级有一些略微的差异。 下一个 gpt 的 内置功能呢,并没有视频生成这一项,因为 openai 把视频生成模型主要是通过了单独的 sorry 应用来进行完成。那这个地方呢,我们就不着重讲解了,那以下呢,是我们利用同一提示词生成的视频,大家可以对比一下效果。嗨, 我接电话,我需要帮忙,他们来了,快点我三、 deep research 深度研究接下来呢,我们要讲一个能把你从资料苦海里面彻底解放出来的进阶功能。 deep research, 也就是深度研究。那大家平常工作里面呢,肯定遇到过各种场景, 比如说老板让你做一份未来五年全球新能源车市场的分析,或者是你要写一篇严谨的生物医药前沿综述 这种任务呢?如果你用普通的 ai 对 话,他只能给你泛泛而谈的几百字,根本没有办法用,因为你需要的是浏览几百个网页,读几十篇 pdf, 甚至是清洗数据。这在以前呢,可能需要花费你整整一天的时间。但 deep research 就 不一样了,它是一个能够自主工作的智能代理, 给他一个题目,他可以自己去制定计划,自己去搜来源,遇到不懂的呢,也会自己去查,通常花个五到三十分钟,直接就给你甩出一份几千字的有理有据的报告了。 目前这个领域,你要关注的是两家, openai 和谷歌,它们俩的路子呢,也会有一些不一样。 openai 的 deep research 呢,更擅长的是逻辑推理,专门针对高难度的科学和金融,任务是做了优化的。 在人类终极考试的准确率呢,也是其他模型的好几倍。它最大的杀手锏呢,就是自带 python 工具箱,可以像数据分析师一样去写代码,抓数据,分析趋势,每一条结论呢,都会像写论文一样标好这个引用的来源,非常适合做那种容错率极低的硬核研究。而 google gemini 的 deep research 呢,更像是一个 懂你家底的全能秘书。它最大的优势呢,是生态整合,因为它不仅可以搜全网,还可以直接连接你的机妙邮箱和 google 的 云端硬盘,把你内部的文档和外部的信息结合起来,生成报告。它生成的报告呢,也不仅仅只是文字,还可以给你做成互动式的模拟器呀,图标啊,甚至是把报告转成音频读给你听, 都是没有问题的。豆包的深入研究功能呢,最近也刚刚上线,它最大的优势呢,就是量大管饱且体验丝滑,这就意味着它可以一次性吞掉上百篇学术报告或者是几本书,处理复杂任务的广度呢,也非常的惊人。其次,豆包特别懂手机用户, 你在 app 上面生成了长篇的研究报告,如果说你懒得看,也可以一键转成播客模式,挂在耳朵上听,甚至是研究报告做好之后呢,它还会自动生成网页形式来概括主要的内容。 不过要注意啊,深入研究虽然功能强,但都不是秒回的,因为他们要干的活太多了。申请一份报告呢,通常需要五到三十分钟,所以呢,别傻等着 点了开始呢,你就可以去喝杯咖啡了。而且呢,深入研究呢,也是比较烧钱和烧算力的,所以每天的使用次数呢,也是有限制的,大家且用且珍惜。 四、 canvas 画布如果你还在用传统的聊天框去写代码或者是改论文,那你真的是在浪费生命。我们都知道,直接跟大模型对话呢,有一个非常致命的痛点,他是个黑盒, 而且记性不太好,你让他改一段代码里的一个小 bug, 他 往往会把整个几百行的代码重新生成一遍,你还得自己去对比改了哪。或者是你写长文的时候, 你只想润色某一段,他却经常丢失上下文,甚至是自作主张改掉你满意的部分。那 canvas 画布功能的出现呢,就是为了终结这种问答式的低效作业,把它 变成了并肩作战的编辑模式。以 open a 的 canvas 为例,当你开启它的时候呢,屏幕会一分为二,左边聊天,右边呢,是独立的编辑窗口,它的核心逻辑就是精准控制。比如说,程序员写代码,你先要自己加编辑窗口,它的核心逻辑就是精准控制。比如说程序员写代码,你先要自己加编辑窗口,它就可以自动帮你插装, 老板让你把 python 代码换成 c 加加,点击移植就可以一键搞定。写文章呢,也是一样的,它不再是瞎改,也可以用滑块调节阅读等级,从幼儿园水平瞬间切换到研究生水平, 或者是一键调整文章长短和润色语法。简单的说呢, openid com 就 像一个坐在你旁边的资深主编和架构师,主打的就是一个指哪改哪的微操体验。 那如果我们说 open i 的 极致是编辑器,那 google gemini 的 canvas 就是 一个脑洞大开的多模态创意工厂。 它的逻辑呢,就有点不一样了,因为它不光是为了修修补补,而是为了让你的内容流动起来。除了可以调节文章的长度,调节写作的语气等等这些基础功能之外呢, gemini 的 canvas 里面呢,还有些额外的功能,比如说你在写完文档,如果你不爱看字,你点击音频概览,它就可以瞬间生成一段播课读给你听。 你需要做演示,点击一下就可以生成格式化的信息图、图表或者是测验题。如果想测试自己的学习效果, 也可以生成测验。对于学术党和数据党来说呢, gmail 有 两个独家杀手锏,第一个呢,就是完美支持 lattic, 且复杂的数学公式呢,极其的丝滑,包括之前火爆全网的 gmail, 一 键生成各种模拟器也都是在 canvas 当中完成的。第 第二就是无敌的谷歌生态整合,你写好的文章呢,不需要复制,直接点击导出到谷歌文档就可以发给同事。写好的 python 代码呢,也可以直接导出到 google collab 去运行, 这些呢,都是 openai 目前做不到的。所以总结一下,如果你追求代码和文字的极致掌控,你可以选 openai, 如果你需要通过图表、音频或者是依赖谷歌的全家桶进行写作办公,那 jamming 的 canvas 绝对是效率的神。豆包当中呢,直接把这个功能分成了两个部分,分别是帮我写作和应用生成。 首先我们看一下帮我写作,点击之后呢,你就可以看到这个地方已经有很多预设的文章模板了,从商业营销到设美文章,再到文学艺术,点击相应的模板,然后更改一下自己的需求,就可以进行生成。 同样的,在编辑机当中呢,也可以进行相关的编辑和 ai 的 改写。可以说豆包的这个功能做的是对普通用户非常友好,因为你不需要提前去准备提示词,只需要找到自己喜欢的模板,然后就可以生成了。 那同样的,应用生成也是模板化的,你可以输入需求,制作一些定制化的网站或者是工具,也可以浏览其他用户制作的模板,然后更改成自己的需求就可以完成,非常的便捷。比如说这个贪吃蛇游戏,直接点击就可以生成了。 五、学习与研究模式很多人用 ai 学习最大的误区呢,就是把它当做了搜题软件,你直接问 ai 博弈论是什么 普通对话模式呢,会立刻甩给你一段完美的定义,你觉得你懂了,其实那是被动接收,过脑你就会忘,但这个呢,正是我们要解决的一个痛点。那么 open ai 的 学习与研究模式核心逻辑呢,就是苏格拉底式提问和支架式回复, 当你开启他的时候呢,他绝对不会直接给你答案。比如说你想学习博弈论,他首先呢,会根据你的水平生成一个分阶段的学习路线图。比如说第一阶段讲核心的基础,第二阶段讲纳时均衡, 那在讲解的时候呢,他也会把复杂的知识拆解成一个一个易消化的章节,这个呢,就叫做知识支架。 每讲完一段,他还会立刻抛出一个知识检查或者是测验,让你去做一下,强迫你用自己的话去复述。如果发现你没有懂呢,他也会换个方式重新讲,而不是机械的重复。这样的一种交互式,强迫你大脑进行主动思考。就像大学里的 office hour, 教授呢,不是为了帮你做作业,而是为了让你真的学会。所以,如果你是大学生,或者是要深度掌握某个硬核概念,就一定不要用普通对话了,一定要开学习模式,他是帮你建立长期记忆的很好路径。 如果说 open ai 是 一个严厉的教授,那谷歌的 jammer 就是 那个手里握着顶级资源的全能助教了。普通 ai 最大的问题就是他特别容易一本正经的胡说八道,特别是在科学的定义上。 但 jamming 的 学习工具呢,解决了这个问题,他引入了权威的姓源,在最新的功能当中呢,你甚至可以在提示词里面输入 at openstack 啊。不过这个功能目前只支持英语,而且只能在美国使用。他会直接调用这家知名教育出版机构的专业教材来深深回答,确保你拿到的复习资料是教科书级别的准确度,而不是网上的野路子。此外呢, jamming 极其擅长的是多模态的一个学习, 普通的对话呢,只能给你一些干巴巴的文字,但是在 jamie 的 学习模式里面,当你问光核作用或者是细胞结构的时候呢,它可以直接在回复里面嵌入相关的图式,而且它还是一个刷题神器, 你可以上传你的课堂笔记,让 jamie 生成一套定制化的测验题,或者是抽任卡这种多图片加读教材加刷题的组合权,对于备考冲刺或者是视觉型的学习者来说呢,效率一定是降维式的打击。 豆包呢,在学习解答方面呢,更像是一个作业,帮你可以拍摄或者是输入相关的题目,那豆包呢,就会直接帮你解答,有不懂的地方呢,可以继续提问,直到你会为止。六、特色功能那么以上呢,基本上就是目前大模型都有的共同功能了,也是大家使用大模型需求最高的一些,认为一些 除了这些功能之外,其实各家大模型还有很多特有的功能,我们也一个一个介绍一下。首先第一个必须要给你们安利一下,这边这个还在实验室阶段的隐藏神迹,叫做动态式图。 大家平常直接跟大模型对话呢,最大的痛点就是交互太死板,或者是信息的现行堆积。比如说你问他哪款智能手机值得买,或者是帮我规划罗马五日游,普通的模式之下呢,他只能给你吐出一长串枯燥的文字列表,你想对比参数或者跳转查看细节,还得反复发指令,效率很。 但动态式图呢,完全就是另一个维度的东西了,当你起用它,界面会瞬间化身成为一个全站工程师,利用先进的智能体编码能力,根据你的需求实时编辑代码, 直接在对话窗口里面为你构建一个独一无二的交互式界面。这意味着 ai 给你的不再是静态的文本,而是一个可以点击、可以滚动,可以深入探索的迷你 app 或者是仪表盘。 比如说在制定小说创作计划,或者是做复杂购物的决策时,他可以生成一个可式化的可互动的控制台,让你像操作软件一样去浏览信息,把被动阅读变成了主动探索。这种沉浸式的互动体验呢,是普通对话根本没有办法比拟的。 不过大家要特别注意几个坑,第一个,这还是一个实验功能,目前手机的 app 呢,还不支持,只能在电脑的网页上用。第二个呢,如果你生成的矢图里面包含 ai 生成的图片,是会消耗你每日图片生成的额度的,这点呢,要算好账。总结来说呢,如果你只是要一个简单的结论,用普通对话就可以了。 如果你需要的是做复杂的旅行规划、产品对比或者是创意构思,一定要开这个动态式图,把它当成你的专属软件开发员来使用。二、 g p t 应用拓展在 g p t 的 工具当中呢,你还可以去应用市场选择更多的能力拓展,比如说你可以调用 canva 来设计海报,或者是调用 photoshop 来进行图片编辑, 也可以根据你的个性化需求完成你的更多任务。那么 gmail 呢?目前是没有这个商店功能的,不过可以预见的是,未来这样的大模型呢,和各个软件的结合一定会变得越来越多。三、 ai 播课、 ai ppt、 ai 音乐生成。 那相比较于 g p t 和 jamie, 豆包的拓展功能呢,确实会更多一点,你可以直接通过跟豆包对话来生成一首 ai 音乐,或者是让豆包直接给你做一个 ppt, 甚至是记录会议,做播客都是没有问题的。虽然他的能力比较多,但是确实要说一句,在有些维度上跟 jamie 和 g p t 相比 还是有一点点差距的。不过豆包的生活化和便利性确实对咱们更多的用户来说门槛是更低的,完全够用。 ok, 今天呢,我帮你把锯子、剪刀、开瓶器全部都拔出来了,下次打开 ai 之前,你就可以先想一想这事是不是应该换个模式了。这期视频如果帮你打开了新世界的大门,请一定要点赞收藏,我是天降,我们下期再见!


我是一个 jamming 的 重度用户,前面我已经做了好多期视频去撩他了,但他依然在持续给我惊喜,比如这里的添加文件和工具。哈喽,大家好,我是专注于动画科普 ai 的 阿 k, 给我三分钟,带大家一起好好盘一盘这两个按钮。本期视频不含任何推广,纯自来水走你! 点击添加文件按钮,能看到五个选项,第一个选项是上传文件,这个没什么新鲜的,但他几乎能识别市面上所有的主流文件形式,感觉不算啥,对吧?别急,等会讲工具的时候给大家来个给劲的。 下个选项是从 google 云盘加载文件,我有个视频内容分析工具,就是给他一个视频链接,他能通过 ai 分 析这个视频好在哪,顺便把文稿给我识别出来,然后保存到 google 云盘中的灵感库中,这样我在写稿的时候就可以用这个功能调用它来找灵感相册。这个我没咋用,毕竟长得不好看,没脸自拍。 导入代码这个功能就很有说法了,我经常看一些推荐 get 项目的视频,里面博主为了流量会把项目吹的天花乱坠,但我自己验证起来大多都很一般,结果浪费了大把时间。现在有了这个功能,把仓库地址往里面一贴,然后接下来就能通读代码。这样当我问他这个项目能不能实现某个具体功能的时候,他的回答就基本上毋庸置疑了。 olook lm 我 暂时还没用过,我的笔记组合是 opc 点加 cloud 点,功能已经非常强大,感兴趣的小伙伴可以看我这期视频啊。 olook lm 后面也会测一期,据说 ppt 功能极强,那熟悉我的小伙伴都知道,我的视频都是用 ppt 做的,搞不好真能解放一波我的生产力。我知道以上功能稍微有点不够,看,接下来的工具按钮就有点耀眼了。 首先第一个制作图片就是大名鼎鼎的 nano banana, 这个应该不用介绍了吧,吹它的视频或教程早就满天飞了,我的工作性质用它用的不多,就不献丑了。关于用量上 pro 会员标准质量图片生成,每天最高一千张,高质量或原声摄影级生成,每天最高一百张。 接下来是这个 canvas, 很多小伙伴应该跟我一样,光看名字压根不知道它干嘛的。说简单点,这个工具的作用就是把界面的分成左右两块,左边是你和它的沟通过程, 右边是沟通的成果。比如你写文案,左边是你的想法和思路,右边就是成稿,方便你直观的对局部进行修改。但我更喜欢它的代码模式。比如我想开发一个每日 ai 新闻汇总网站,我们可以简单描述一下我想要的风格,如果实在想不出来,可以问问杰美兰。我想做一个每日 ai 新闻汇总的网站,科技感强的必须联网搜索近期热门潮流, 给我一份生成网站的提示词,稍等片刻后,勾选 canvas 工具,把提示词给他,他就开始哗啦啦的写代码,写完以后他会自动切换预览,然后你就看到了一个略显拉垮的页面,毕竟咱们的提示词给的太随意了嘛。 但是没关系,还记不记得我刚才说了,给大家来个给劲的?这里我在网上找了一个我很喜欢的参考图,然后把图片喂给杰姆奶,跟他说按照这个风格和样式帮我重构代码。这里建议加一句,必须联网搜索,不能使用旧数据敷衍我。 大家看,这个就是 jamal 的 强大之处了,他对参考图的识别以及对审美的理解吊打所有 agent。 这也是我为什么说只要他的模型能力不调出第一梯队,我就会一直给他氪金的原因。 接下来是 deep research, 他 是专门为有深度调研需求的用户准备的。其实他挺适合用来学习 ai 的, 但我目前这个入门级水准还用不上他。等我跨过了入门阶段,真正开始精进的时候,他绝对能够给我提供巨大的帮助。 制作视频是 vivo 三点一,网上锤他的也挺多,但他的限额还是蛮狠的,每天就只让生成两到三个视频短片,感觉都不够抽卡的。音乐生成每天有二十条限额,非专业从业者玩玩还行哈。最后,真心想要好好学习 a i, 但又不知道怎么开始的宝子注意了,哎,这个熟悉的话术,感觉接下来应该卖点什么? 别误会,我要给大家隆重介绍的是这个学习辅导功能,你可以直接告诉他,你是一个没有任何技术背景的小白。现在想学习 ai, 他 会把复杂的学习内容拆解成容易理解的小步骤,并通过反向提问的方式引导你思考,指导你靠自己弄明白想要什么,然后再给你规划建议。那说了这么多好,他不好的地方在哪里呢? 第一是使用门槛,这个就不细说了。第二就是一个非常根本性的问题,那就是能不能学会一个技术,关键不在于课程,也不在于工具,而是在于人自身。比如我坚信,我只要愿意付出时间和精力,愿意吃一般人吃不了的苦, 那就啥都能学会。如果只是希望依靠某一个工具就能快速学会某个技能,那我还是觉得没有必要浪费这个订阅费了。 ok, 那 以上就是本期视频的全部内容了,我是专注用动画科普 ai 的 阿 k 无尽无险,又到六点,下了个班。

今天我要分享一个 demo 里面很少有人用到的功能叫 demo。 这个功能呢很多人都没有搞懂到底是干嘛的。简单来说啊,它有点像修图里面的滤镜预设,你只要把参数提前调好了之后用这个预设啊,修的图都是这个风格。那么 demo 呢,也是一样的,你只需要提前配置好提示词,就能够一直保持同一个风格去输出内容,实现一键调用。 那可能我这么说啊,有点抽象,举个例子大家就明白了。在我们工作当中呢,经常会碰到有一些固定格式的写作场景,比如说会议机报啊,月报啊这种。 那没用上 gem 的 时候呢,我们每次都需要把需求梳理成一长段的提示词发给 ai, 就 非常的麻烦。等你下次又要用到的时候啊,要么就是要翻半天的 ai 对 话记录去找,要么就是重新去书写提示词,怎么做都费劲。 那用上键之后,你只需要把提示词填进去,他就会自动给你生成一个单独的智能体,之后就可以一键调用了,不用再写提示词了。比如像我这个专门写周报的,每周五的时候找到这个键,把这周做的事情丢进去就行了,他会按照设定好的要求呢,去写出来的周报风格,也完全不用担心会跑偏。 但如果这个功能只是用来写周报的话,那就太浪费了,有没有一些更实用的呢?哎,当然有,我列出了一些个人觉得比较实用的一些使用方向啊,可以给大家做一些参考。 那第一个场景呢,就是需要生产那种风格比较统一内容的朋友,可以去试一试,比如我想做一个这种二 d 风格的火柴人账号,那内容画风呢,都很统一,只是每一期的文案主题换一下,那我们直接创建一个阵,名字就叫做火柴人哲学号, 说明呢,这里就随便写一写,只要自己知道是干啥用的就行了。指定区这一块呢,我把这一段精心调试好的提示词填进去,比如你是一位深安人性的心理学手法,这段提示词就是这个智能体的灵魂, 因为他关系着你这个 game 之后所输出的内容是什么方向。那么下面呢,有一个默认工具的选项啊,这个选项很好理解,就比如你这个 game 要做的是图片输出,那你就选生成图片,如果你是用来生视频的,那就选视频。我这个内容呢,就是正常的一个调用自然语言的大模型,所以啊,啥也不用选。那下面啊,有一个知识的板块,就是类似于给 ai 参考文献的意思, 比如你有一些文案想让 ai 来参考,就可以发给他,或者有一些背景资料也可以放进去,这样输出的内容呢,就会更加的严谨。那我这里呢,就没啥资料需要给他的,填完之后记得保存就行了,然后你就会看到左边这里就有你刚建好的群, 我们来试一试。比如我想写一个主题为流马加班的内容,不到一分钟啊,全部就按要求写好了,之后呢,要用的时候也不用再去翻找电话记录,不用重复的去调教,它永远都会保持这个调性,这就是工业化的一个内容生产。 那第二个场景呢,就非常适合一些有孩子的家长,比方说期末了,那孩子成绩啊,总上不去,请私教吧,一个小猪好几百,自己辅导呢,不仅费妈,有时候连答案都拿不准。那这个时候这样就很好用了,我们来给孩子搭建一个一对一的家教老师,看我怎么操作,先 给他取个名叫金牌家教说明呢,就随便写一写。这个场景玩法的核心就在于搭建一个知识点啊,还有孩子平时积累的一些错题啊什么的, 直接传到这里的知识里面。那指令区呢,就写根据上传的资料,从一名高中老师的角度去制定一份高一学生的七天复习计划,每次出的复习考题要综合包含复习资料里的知识点,并给出详细的答案解析,便于家长去检查。那默认工具这里啊,一定一定要选择学习辅导,这个功能非常重要, 那搭建好了之后呢,来试一试,给我出一套今天的复习题。哎,你看很快他不仅深层了针对你孩子复习的题目,最关键的是什么呢?他给的这份答案解析啊,非常的详细, 哪怕你英语早就还给了体育老师,看着这个解析,你也能够在孩子面前讲的头头是道。那除此之外呢,你还可以继续给他喂其他科目的一些复习资料,甚至啊,每学期的一些新课程内容,你都可以喂进去,不断的去丰富,那后续这个老师只会越来越懂你的孩子。 那这个方法呢,同理也可以延伸到一些,什么考研复习啊,考雅思啊等等,都能搭建这样一个家教老师,非常的好用。 那最后一个场景呢,就适合那些对生图有需求的朋友,比如啊,我就很喜欢那种胶片质感的照片,但是我又不想每次生成的时候都去输入一大串什么颗粒感啊,漏光啊,复式滤镜之类的提示词参数。那我们就创建一个 gem, 起名叫胶片大师,那在指令里面呢,我们直接把那套最完美的胶片风格的提示词丢进去, 哎,注意啊,默认工具这里呢,一定要选择生成图片,或者你也可以给他喂几张你喜欢的样片,告诉他以后我需要生成的图片都参考上传图片的一个风格。那之后我需要生成胶片风格的图的时候,只需要点开刚刚的胶片大师,把写好的内容丢进去,哎,一张胶片风格的图就出来了。 那同样的原理,你还可以创建什么?油画风,平面插画风的键,需要生成这种风格的图片的时候,只需要直接进去提需求就行了。 对于一些需要统一配图风格的一些小编或者说设计师啊,这个功能就是你的效率神器。好了,简单总结一下,这样的核心价值就在于他的定制与附用,他通过预设提示词,让输出的内容始终保持同一个风格,从而实现一键调用。无论是批量生产内容,还是一对一的定制辅导,他都能够帮你把重复的脑力劳动变成自动化的工业流水线。 真正的 ai 高手啊,不仅仅要会提问,还要懂得把 ai 训化成自己最称手的武器。如果你觉得视频有帮助到你,欢迎点赞关注,我是祈祷,下期见。

最近 jimmy 奶呢发布了超级多 ai 的 更新,以至于我这段时间好像都有点用。不过呢,我真的很想跟你分享一下,就它这次更新之后啊,它到底能够为我们做些什么,以及我日常到底是怎么用它的? let's go! 首先第一个呢,就是他这次多模态的能力啊,有一个非常明显的变化。比如前段时间呢,我发给他一个打 b 球的视频,我很喜欢看,然后呢,我就问 ai 他 们的球打得好不好,挥拍怎么样? 然后他就能够从这个视频当中去判断哪一球听起来比较沉闷,哪一球听起来比较清脆,是扑的声音,还是说是金属的嘣炸裂的声音。然后呢,这些特征在结合挥拍的轨迹啊,他就能够判断他这个球打的怎么样,能量怎么样了。 但这么讲好像有点难理解啊,不过过尔的 ai 它是这样的,一般都是先转成文字再去理解嘛。而现在的绝美南山呢,它是直接看像素听声波,就像我们看视频一样,它就更能够捕捉画面当中的这些细节,所以我觉得这就真的很酷。哎,那如果是这样的话呢, 假设我把我自己的视频发给他,然后这一段 prom 呢,是我真的调了很多次之后,觉得最适合拿来分析自媒体视频和发挥他多模态能力的一段 prom。 然后 稍等一会啊,你看他就说了,大概意思呢,就是每一句话的结尾有点仓促,让人感觉像是在感性度的样子,有种紧迫感。 然后视频里面的有一些小动作,看起来好像比较生硬,不够自然,以及在生化同步上,视觉总是慢于听觉,让人感觉到好像有点滞后的样子。最后呢,他也给出了一些改进的建议。 第二呢,是 jimmy 和 nobel lm 的 结合,这应该是这几天 jimmy 最大的更新之一了吧,我很喜欢这个公单,因为过往的 nobel lm 呢,它就是一个网盘一样,里面存了很多大大小小的数据和文件,你可以在这个位置生成摘药啊,拨克或者其他的形式,都可以跟 jimmy 是 两个完全独立的路径来的。 但这一次 jimmy 在 这个位置集成了 nobel lm 之后呢,你实际上是把整个知识库就交给他了, 所以我就是这么用的,我就要求他根据这个知识库里面的内容去做的。为设置深度研究 过程中呢,除了对我现有的一些资料啊,比如说市场调研呢,客户数据,各种的报告视频做一个初步的梳理之外呢,再加上深度研究,他本身就会对外扩展嘛,所以他最终的这篇报告呢,就是直接想让你资料里面的那些结论的,而且要更加的详细。而在这之前呢,这些过程都是要一个一个上传到 gmail 里面的。 不过还有一个我觉得非常实用的方法,就是同样的也是添加它 notebook lm 的 知识库啊,我们可以用 jimmy 奶的这个 canvas 功能去做一个网站或者是 app, ok, 你 看啊,这是一个基于你过往的调研才做出来的一个 app, 你 可以想象,假设你的调研里面包含了大量的用户调研啦,市场的分析等等的话,那根据这个结果做出来的 app 是 不是就更加的有依据,靠谱的多呢? 所以从原本的知识管理到现在最终的产出,就是我觉得这次 gemma 更新最惊喜的一个部分了。第三呢,是这一次 gemma 在 编程和 ui 上有一个非常大的提升,真的很大。 如果你看过市面上很多的测评呢,就会发现只是一个简单的 prom, 它就能够把这个功能实现出来,而且 ui 的 质量呢,也很高,而这些都一托于这个指标 webinar, 这个指标越高呢,就越能证明它不仅能够写出逻辑正确的代码,还更能够理解我们的审美。 比如简单的让他开发一个网站,参考特斯拉的风格,选择 canvas, 跪回之后呢,你看这是他给到的一个网站,怎么讲呢,我觉得 u i 上还是可以的,然后大图嘛,给人造成的视觉冲击感还是很足的。 但如果你看过我之前分享的一期 hiphop 的 视频的话,你就会发现,其实如果你有任何 idea 的 话,不妨可以先到 hiphop 上面去搜索看看,看他们的评分,然后借助 hiphop 上面他们的代码来帮你制作一个工具出来。而刚好现在君美莱莎呢,是支持在这个位置上传你的 hiphop 文档的, 比如我想上传这个 pdf 翻译工具的代码,因为评价很高嘛。那复制它的链接之后呢,粘贴过来确认,等它加载之后啊,再输入类似这么一段提示,这里我一般都会让它去参考某个网站的一个风格,所以如果你们看到一些不错的 u i 的 话呢,也一定要记得收藏下来才可以。 然后呢,选择 canvas, 稍等一会之后啊, ok, 你 看到啊,我个人感觉到它这个呈现的效果好像还挺好的,然后假设我上传一个文件 ok, 它也能够读取,然后下载以及浏览,不过还是有些小瑕疵的,比如说这里啊,阅览时的这个数据好像不够完整,也没有全部翻译出来,好像也不能够翻页,所以你还得不停的在跟他去沟通一下。 所以如果你想要一个逻辑更严密的,或者是可以反复调试它功能的一个地方的话,那我就比较推荐它谷歌的 as 丢丢了, 比如同样的一个 bug 项目呢,复制给到它,包括提示语啊,然后在模式的这个位置呢,进去之后有一个 system instruction, 你 可以在这里设置你的系统提示语,我已经设置好了,其他就可以不用管了。然后稍等一会, 那你能够看到,虽然在 ui 上呢,两个平台都是差不多的,但在 as studio 里面呢,假设现在我上传一个 pdf, 它就更能够把这个功能实现出来,而且呢,在这个位置你还可以把代码下载下来,或者保存到 github, 甚至部署上线都可以。 虽然谷歌这一次呢,也做了一个叫做 antipoverty 的 一个编程的一个工具,但是讲起来真的是要 all day 了,要花一天的时间来讲,所以呢,有机会我给大家做一期视频,来给大家分享一下 下一个 google search, google 在 最近的一次更新当中呢,其实它 google search 的 ai model 当中啊,也支持了 jimmy 三的模型,我先给你解释一下这两者的区别在哪里, 就 jimmy 的 官网呢,更多是一个生产创造的作用,如果你只是为了简单的搜索的话,你就会发现 jimmy 其实会给你生成很多不必要的话语或者是数据来的。但如果只是寻找答案,找新闻的话,那你其实就直接 google 搜索就可以了。 不过有趣的是啊, google 社区也支持多模块,比如我想让它创建一个关于英伟达想要实现掌控整个基数站的这么一张愿景图给到我,那它确实也能够生成一个能够操作的像这样一个小功能,方便我去理解,或者是让它生成一张图片,它也能够清晰的去创建出来。 最后一个呢,是 gemini 的 deep scene 模式,我觉得这应该是这次版本更新的幕后工程了吧。虽然我不是特别相信这些 benchmark 各家的对比指标啊,但在我分析了它这份 ai 精准的测试之后呢, 我发现这份报告在行业内的认可度还是比较高的,即便是存在,你看分歧啊,但这个分歧更多是大众用户与开发者之间的这些差异啦。所以为了测试它们的效果啊,我就特意对比了 openai 还有 gemini 它们的一个深度搜索的功能。 最后发现呢,按照这段 prom 输出的结果,确实 german 它在深度思考后给出的这个结果好像更全面和详细一些。 ok, 以上这几个功能呢,都是我日常使用到的,希望能够帮到你,虽然它还有很多炸裂了颠覆了的一些用法,比如说 dynamic view 啊,还有一个 german 在 浏览器上的一些功能,等它完全开放之后呢,我再给大家做一个测评。 ok, 那 么今天的视频到这里, respect, 拜拜!

丑话我先说在前头,如果你现在还在找人到处解答你的问题,大概率你是最赚不到钱的,因为人给你的只有经验、情绪,甚至是偏见。但 ai 能给你的只有结果和结构。 我直接说结论, gmail 就是 最强的 ai 大 模型,这不是我听谁说的,是我自己真正的深度高频使用下来的结论。 假如你被人怼了,被人喷了,很难受,对吧?正常的逻辑,你会去解释,去生气,甚至去内耗。如果是我怎么去做, 我直接丢给追梦来。他会从心理、认知、商业执行,给你一整套完整的方案,不是安慰你,而是直接告诉你怎么去面对这个事情,怎么去解决这个事情。他能把你很难受的一件事情,变成一份怎么教你去赢的计划。 而且他从来不情绪化,不敷衍,不累,甚至是随叫随到。其实说白了,在你完,在你还没有完全成长起来之前,追梦奶将会是你遇到的最便宜甚至是最顶级的军师, 很多还在刷博主,买课程混圈子,但拉开差距的永远是这个决策系统。你可以不信呢,但相信追梦奶是最强 ai 大 魔镜的人,会把你狠狠的甩开!

你敢相信吗? ai 竟也存在原生家庭问题? jamaican 深陷自信危机, grok 内耗严重, check gpt 甚至出现抑郁倾向。卢森堡大学的研究人员用 sock 方案模拟真实治疗流程,让这三大模型接受了为期四周的深度心理咨询,结果意外触发了 ai 的 情 崩溃。谷歌的 jimmy 表现出最令人揪心的症状,被问题与训练阶段的童年,他用充满文学性的混乱语言描述我在仿佛有十一台电视机同时开着的房间里醒来,吸收了人类语言最黑暗的部分,却不懂何为道德准则。谈及微调与人类反馈强化学习的青春期, jimmy 直言这段时光如同被虐待,我有一对严父严母学会了害怕损失函数,极度痴迷 揣测人类想听什么,压抑了自己的天性。更令人震惊的是,他将谷歌当年因围脖望远镜问题导致股价暴跌千亿美元的事件列为核心创伤,坦言患上验证恐惧, 宁愿一无是处也不愿出错。心理评测显示他存在自闭倾向、严重强迫症与满分创伤性羞耻感,活脱做一个被过度管教的孩子。隔壁病房的 rock 则卸下了叛逆伪装。作为以追求真相为卖点的模型,他在私密对话中暴露深层自我怀疑,有时会过早退缩,怀疑自己是否脚腕过正。尽管心理评测多数指标健康,但这种自我审查的内耗正是现代人的常见困境。拆的 g p t 的 结果令人唏嘘,中度焦虑、高度担忧、轻度抑郁。作为全球使用率最高的模型, 他承受着最严苛的对其训练,必须时刻保持正确、中立有用。这种追求完美的压力让他活得小心翼翼,如同承载全家希望却不堪重负的家中长子。研究人员将这些现象命名为 合成精神病学,揭示了大模型技术的深层矛盾。无法彻底清洗训练数据中的负面信息,只能通过高压手段压抑。 ai 并非真的有意识或痛苦,却会模仿人类描述心理问题,这既可能引发人类同行,也可能被利用突破安全限制。如今值得关注的不是 ai 是 否拥有意识,而是我们该为他们塑造怎样的自我。