上期视频我们用 deepseek 把智能周期性提醒小工具的 prd 和 ui 设计优化完善好了,今天我就来演示如何直接把这些文档喂给 ai studio, 让它一步步吐出带有真实交互逻辑、基于日光毛玻璃风格的 html 高保真原型。一开始我直接把定稿的 prd 和 ui 规范发给 ai studio, 要求它用 html 来实现它第一版生成的代码。老实说视觉很惊艳, 毛玻璃质感、色彩点缀都非常到位,但我一上手体验就发现了两个明显的死角,第一,底部的任务库和我的点击没反应,右下角的悬浮加号也点不开。第二,任务卡片上的状态圈只有空心。 prd 里明明要求用红绿色来区分异常和成功的,我直接把问题甩给他, ai studio 立刻发现是因为全屏遮罩层的 z index 把按钮挡住了, 立马修复了层级给点击加上了轻提示 toast, 并且老老实实把红绿状态和警告边框补齐了。 基础跑通后,我指出 ai 语音生成页直接显示结果,需要有长按录音、松手显示文本以及 ai 思考的打字机交互过程,顺便让它把缺失的任务库页面补齐,把首页头部优化的更大气。 这次 ai studio 给出的表现让我非常惊喜,它不仅把首页头部重构成了沉浸式的仪表盘风格,还加上了早安问候。在 ai 语音页,它真的写出了长按麦克风的扩散水波纹动效,松手后还会有一段非常丝滑的打字机逐字输出效果, 科技感瞬间拉满。不过 ai 也是会顾此失彼的,我发现新加了炫酷的页面后,他反倒把原本完美的手动维护页和规则配置抽屉给弄丢了,我直接让他基于当前版本把上一版的维护页原封不动的缝合回来, 他完美执行了合并。接下来就是最考验 ai 逻辑理解的环节了,我开始对着 prd 逐字验收, 发现了几个严重的逻辑 bug, 比如配置规则时、点击、单次、高频等不同类型下方表单居然不联动,而且周期重复里缺失了每年这个关键选项。我没有直接教他怎么改代码,而是用 pm 的 口吻告诉他,请仔细分析 prd 文件中对应场景的说明。 ais studio 马上认错,不仅修好了丢失的图标和下拉菜单,还彻底打通了配置抽屉的联动逻辑点,每天、每周、每月、每年, 下方的表单完全按照我 prd 里的设定动态变化。为了测试它的极限,我继续扣细节。我又发现任务库的分类 tab 全部进行中,已暂停过滤,逻辑不对。而且刚才的高频规则里漏掉了 prd 里明确要求的起始日期和结束日期, 我再次要求它基于当前代码,只改有问题的地方千万别碰别的代码。结果非常棒,它精准补齐了起始日期,任务分类的过滤逻辑也写得明明白白。 最后冲刺阶段,我发现下拉菜单被下方卡片遮挡了,这是前端常见的层级穿透 bug, 而且我还把缺失的设备管理页和我的页面的线宽图让它补齐。 不出所料, ai studio 修改了卡片的动态层级,同时按照我的线宽图完美复刻了这两个新页面, 连页面间的点击、跳转都全部打通了,到这里整个原型就大功告成了。回顾这几轮对话,你会发现,和 ai 一 起做原型,最核心的能力不是懂代码,而是需求拆解能力和对 prd 的 精准把控。发现 bug 时,用产品逻辑去访问它,让它自己对照文档去纠篇, 效率远比一行行帮他改代码要高得多。从写需求、定规范,再到今天深层优化后可交互的真实原型, ai 彻底重塑了我的工作流。好了,今天就先到这里, 后续我会继续分享更多我用 ai 提效的实操记录,我们下个视频见。
粉丝38获赞226

谷歌刚刚发布了 jimmy 三点五 plus, 同时还把他们的编程工具 antigravity 升级了二点零,那这次就很明显了,谷歌的话这次是要全面提升它的这个抠点能力。之前不管是在 coi 还是 ide 还有模型, 其实给我的感觉就表现很一般,那这一次的话,这个模型最大的亮点官方说就是它的这一个速度啊,是前模型的四倍, 所以这一期我们就测一个最关键的问题,这么快的速度,它整个的一个代码质量会不会缩水?那我直接会拿两道真实的一个编程任务,把它和 cloud op 四点七, gpt 五点五放到同样的项目里面,同样提示时看它大家的一个表现情况。那下面的话,我们大概去扫一下它官方改出来的一个奔驰 mark 评分哈, 在编程方面的话,主要就看这一个 terminal, 奔驰二点一,还有这一个 sw 一 奔驰 pro, 从这个评分看的话,这一个 jimmy 三点五 plus 这个评分还是可以的哈,但是基于我之前对于谷歌模型实测的结果来看,就是评分不代表一切,因为之前就感觉它在这个编程方面挺拉的,这次我们就看整个的一个三点五 plus 表现到底怎么样。那这一次的话,我们的整个测试题目哈,就是沿用之前测试 cloud of 四点七,还有就是 gpt 五点五的两道真实的一个编程任务。第一个的话就是我们这一个 skills agent 嘛,需要把它从一个 c o i 做成一个 web ui。 第二个的话是希望他从一个已有的比较复杂一个项目里面把这个认证登录给它迁移过来,这一块也比较复杂,需要支持啊, get 谷歌,然后还要做一个落地页。好,我们来看一下这两个实测项目哈,左边的话,就我刚刚说的这一个 skill is a 镜头嘛,第二个的话就我们图片生成 a 镜头,那这次的话,我们是用了这个 anti gravity 它的一个 c o i 终端工具, 整体这一块呢,它的交互的话是跟呃卡扣的很像,那我这边测试下来,他的速度是真的快,相当相当的快,他说四倍,一点都没夸张。 那大家看一下它这个交互的一个情况啊,其实还是感觉挺挺好的。这个交互,那至于整个模型的能力怎么样,那这两个任务我这边实测下来,它都没有一次性的去完成,它或多或少都有一些小问题。那同样的这个提示值,在同样的项目,我给到了 gpt 五点五 以及 calloff 四点七,它都是能够一次性完成的,不管这两边哪一个项目都可以完成。但是 gmail 三点五 plus 它除了快,但它其实还是会有一些或多或少的 bug 嘛。好,我们来看一下它整体的一个表现情况。 好,我们来看一下这个是 jimmy 三点五 plus 帮我们完成的 skus agent 的 一个 ui 界面嘛,它可以去执行一些操作,比如说我给他一篇文章,可以让他帮我们去总结,它就会去加载这个的 skus。 就 我之前有一期视频 专门讲了这个 skills 的 一个工作原理嘛,那这是它完成的一个效果,整体上 ui 这块还 ok, 那 这边的话是 g p d 五点五给我们完成的,左边也是有我们的一个的一些 skills 是 哪一些?那右边的话就是它整个的一个操作的一个过程嘛。怎么说它这个 ui 的 一个结果的话,我觉得就是呃 g p d 五点五的会好一些。 那关于图片生成这个项目,让它去做一个落地页,以及让它去做一个就是谷歌 get 五的认证登录嘛,那这块它也是完成的,但是不是一次对话完成的。 u i 这块的话就是谷歌还是可以的,就是相较于 g p t 五点五的话,我觉得还是会好一些,就 u i 这块的话,我们还是优先选择就是谷歌的模型嘛。 好,下面我们来看下整体这个评分结果哈,那这个评分的话,还是跟之前一样,我们是把所有的模型生成代码通敏之后,然后改到模型去做 review。 那 这边的话 g p t 五点五是要胜出的,它的分会高一些。 第二个的话就是 cloudoff 四点七会辞职,那 gpt 三点五 plus 的 话,它整体评分效果会低一些,也就是它除了快,那代码质量上的话是会差一些。那这边的话也有些解决方案,比如说你可以用 cloudoff 四点七做设计,或者 gpt 五点五做设计,然后再用呃 jimmy 三点五 plus 去做执行。 那这块儿它还不是还发布了这个 anti graphic 二点零嘛。那这个 id 的 话,你就把它等同于 codex 吧,跟 codex 一 模一样。那我这边的话 现在还登录不进去,不知道啥问题。好,下面我们来进行一个总结。那这次他的整个编码水平的话,就是速度上确实是领先很多,但是在交付的一个结果上来看的话,跟国外两家模型还是有差别,尤其是在一些复杂项目里面,他还是会有偷懒的情况。 如果你是需要去做一些原型啊,或者做一些 u i 啊,我觉得这个 jimmy 三点五 plus 真的 是有比较有吸引力,因为它整个速度比较快,而且它的价格也比较便宜。那如果你是需要一些复杂的项目啊,多文件呀,那阶阶段我还是更推荐大家使用 g p d 五点五,在 codex 里面 你运行起来也非常的快。扣袋子这个 app 我 强烈推荐给大家用,我已经最近用了一个多月了,真的非常非常的好用, card 的 话就是封号真的特别严重,我已经放弃了。 ok, 那 这就是这期视频所有内容了,如果大家觉得这期视频做的不错,可以跟我一箭双雕,我是阿江,我们下期见,拜拜。

家人们,杰蒙娜大更新!杰蒙娜现在能在对话里直接吐出 pdf、 ppt、 excel, 甚至 markdown and latex 这类成品文件了,他不用再让用户 复制代码到第三方工具去渲染。而 check gpt 的 canvas, cross artifacts 都还停在结构化文本层面。杰蒙娜已经实现了首写,一个写满公式的草稿直接生成 latex 的 文档。科研工作者福音啊! go! go! 这一步直接把交付物拉到办公场景终点,背后是 workspace 那 条全家桶护墙盒。文件生成不是扑 功能,是把 dumpsize 的 分发渠道接进了 ai, 大家快用起来吧!直接生成 ppt, 然后在 google slides 里面修改,太香了!

本期视频给大家分享一下 word 如何接入 ai 啊,这里接入 dspac 为四。 最近 dspac 给我打折了嘛,所以打算接入 dspac 为四。我们获取到 api 之后呢,我们可以来到我们的这个,所以来个文档里面,我可以直接复制这个代码代码,然后呢 来到 word 里面,找到开发者工具,如果说大家在菜里没有找到,嗯,点开文件, 点文件之后呢有个选项,选项,这里 word 选项里有个自定义功能区,我们把开发者工具这个勾上就有了。 那我们点这个红后代码,那我们这里他一开始这里是空白的嘛,大家新建一个名字,然后呢创建,这里创建了就不演示了,我们直接点创建,创建好之后他会跳转到 这样的一个界面,我们将代码复制过来。复制过来之后呢,大家可以看到在这里填入获取的 atik, 然后呢模型名字,这可以换成这是个 v 四 pro 模型,也可以使用这个 fast 模型,然后呢这个 u r y 可以 不用改。然后呢我们点这里像这样, 然后呢点上面有个运行子窗口,一个向右的一个绿色的三角形,运行之后呢,它就会安装 安床,就拿门,再来到门的这个 word 文档里面,我之前写了个文档文章 ai 时代最扎心的真相,你的老板的上线就是你的下线,学无止境, 主要内容的就是我们学习 ai 的 技术的下线在哪里?我的答案呢就是主要看老板吗 好文,选中一段文案,我们右键这里就会多出一个,要 deepsea 跟 ai 助手, 那我们直接点这个象城吧,好,可以看到右左下角,他现在我们已完成了,我来看一下灰色的就原来的文案,绿色的就是他一起抬来的文案。 好,我们这里点试,他就直接替换掉原来的文案了。好,我们这里再体验一个, 我们来一个扩写, 听这个正在努力思考。好,我们来查看一下,感觉还可以,我们点试, 我感觉还挺方便的。当然这个文档里面给的代码呢,还是希望大家可以用自己的 ai 对 代码进行迭代和升级, 可以用,除了 d fck 码可以用,其他的模型也可以,在自己本地部署的欧曼码模型也可以。 最后呢,还想说一一点呢,就是我们一定要比自己的老板比起客户都会用 ai, 一 点都会的,这份这个差值就是我们的护城河, 我们就掌握了老板或者客户看不懂的效率武器,这就是他们雇我们的理由,我们要持续深入的学习,持续的 拉开 ai 叉值,我们才能在这场效率革命中站到最后。

兄弟们用 gemini 调试代码时,有没有发现,对话轮次越多,模型越糊涂,甚至把改对的代码又改错?这不是 ai 变笨,而是上下文污染问题。今天教你三个技巧,让 gemini 三点一 pro 在 长代码对话中保持顶尖水平。 第一,定期重置对话,感觉模型开始车轱辘化时,立刻开启新聊天窗口。第二,重构提示词。新对话开始时,手动总结当前代码状态、已解决和待解决的问题, 整理成干净提示词,给模型记忆做碎片整理。第三,维护黄金代码块,把核心数据结构重新粘贴,强制刷新短期记忆。我重构微服务项目时,原本调试复杂 bug 需要三十多轮对话,用这些技巧后,只需八到十轮就能精准解决。 代码一致性从百分之七十提升到百分之九十五,模型不再出现前后矛盾的变量类型或语法错误。从混乱长聊到模块化控制,这种交互方式让 gemini 的 代码生成能力稳定在顶级程序员水平。 下次处理复杂调试时,试试这三个技巧,你会发现 ai 的 专注力回来了。关注小七 ai 实战,解锁更多编程效率秘籍!

我退订了用了一年的 chrispityplus, 最后一百零五点九九美元订阅了 gemma lite pro 的 年费套餐。说实话,对 chrispity 还是有点不舍的,但是 gemma lite 真的 很香,而且大多数人用不好 gemma lite 是 因为不知道它的隐 藏功能,我在后面会介绍这个功能。那在用 chrispityplus 的 这一年里呢,它确实陪伴我解决了很多的问题,比如 webco 帮我查下代码,口播帮我优化文案, youtube 帮我生成标题、简介 和标签。而且有一个很关键的点,所有的内容都是我自己的风格,因为呢,我未给了他很多的资料,在某种程度上呢,他比我更懂 我。但最后为什么我还是转头了 gmail pro 呢?原因很简单呢,因为谷歌的多模态能力真的太强了, gmail 的 背后是谷歌整个 ai 的 生态系统。拿个最常见的音频转文字,我丢给 gmail, 他 很快就按照我的要求,根据我上传的音频跟我核对词汇表,并且呢,返回了完整的音频 字幕。反观 chart gpt, 当我用同样的提示词以及音频丢给他以后,他回答我,当前环境下,我无法直接播放并 自动转写 a p 三音频,这让人挺无奈的。所以 jamie 呢,在多模态的便捷上确实更胜一筹。音频、视频甚至生成一个应用都能直接在一个对话页里面完成。而且它还有一个我认为是学习场景里的大 杀器,就是 nobel lm。 你 把一本书丢进去,它能给你做思维导图,生成讲解的音频和视频,甚至呢,直接帮你做一份 ppt。 更重要的是,它可以基于这本书的内容,你可以一直的追问,直到你完全了解书中的内容。这已经不是普通的知识库了,而是一个会读书,会复盘,还能陪你思考的好助理。 而且这个 nobel lm 是 可以直接连接到 jamalai 的 圈里面的,也就是我开头提及的,要用好 jamalai, 就 要利用这个大部分人都不知道的隐藏 常功能。这一步真的非常的关键,因为它解决了一个重要的问题,就是我怎么样 ai 真正长期并且正确的理解。我以前每开一个对话都要用 front 反复的解释,那现在呢,我直接把指令定义好,它就能够更好地知道我想要什么。这个逻辑呢,其实在 g p d 里面呢,也是 坚果的,就是它的项目。我拿自己的赛事品牌觉得之王的 youtube 举个例子,我每次上传视频都需要英文标题简介和标签,那在 gdp 里面呢,我会新建一个项目,在右上角呢,写好这个项目的指令,只要我把资料微给他,他就能够稳定的输出。而在最外的这边呢,同样的是用 jam 来做会更加 的顺畅。你来看一下,这些都是我创建的 jam 助理,有生成封面的,有内容制作的,有插图生成等等,我来带大家看看怎 怎么用这个卷。我可以新建一个卷,写清楚名字用途以及风格要求,甚至呢,指定他默认用什么工具。比如呢,做图片我就选 nano banana pro, 做视频呢,我就选择 v o e 三点一。那在下面呢,我还能够给他接知识点,比如说本地的文件与 盘,或者直接连接到 nobel l l, 也就是说,他不是猜你要什么,而是呢,知道你在什么体系里?右边呢,还能够实时的预览效果。我给你看一个例子,我做了一个插画师专用的卷,我把左边的规则都设好以后呢,在右边测试了一句话,钢铁侠蓝色背景, 你看一下它出来的效果是不是挺好的?这就是我指令你定义好的平面插画风格。我再来测试一个更难的,试一下知识图片,我只需要输入一个知识点,比如光和作用,它就能够生成示意图跟解释。 我们来看看生成的结果啊,图解是不是挺准确的,而且文字的生成也没有问题。 nasa banana pro 的 中文生成能力真的太稳了, 就算你想模仿一个封面也没问题。我用我的封面助理上传一个自己的照片,以及油管大神店的封面,我再把标题和发布平台发给他,我们来看看有什么神奇的 事情发生。他很快呢,就会把油管大神的这个封面的风格模仿出来,是不是还挺好的?以后呢,就再也不怕没有好看的封面了。所以你看,一边是 jpg, 同一件事还要拆成好几部, 所以这才是我卷透 jimmy 阵营的主要原因。我不是说谁不行,而是我更想少折腾。 jimmy 给我的不是只是一个回答,而是从学习、消化到输出,再到创作的一 整条闭环。 chart gdp 真的 不是不好,而是站在二零二六年这个时间点,我更需要一个能看能听能读能记, 还能长期融入我的工作体系里的 ai。 我 们比的不是谁家的模型更强,而是好用的工作流才值得我们掏钱付年费。你呢?你会选择 gigabyte plus 还是 german apple? 我 们评论区里聊一下。 ok, 以上就是今天的所有内容,我们下期再见。

你在使用 gemini 的 时候是不是也经常想,要是对话记录能分类整理,要是聊天记录能定点搜索,要是常用的提示词能一键调用,那就真的太好了。实际上, github 上还真有一个免费开用的项目,能够完美满足上述要求。 想使用这个项目很简单,我们只需要找到它的项目仓库,然后把它粘贴到上期视频介绍的添加文件中的导入代码功能。接着问 gemini 如何使用,最后按照它提供的步骤一步步执行就 就行了。搞定以后,你的界面上会多出一个明显的球形图标,它其实是一个提示词管理器,点开它是这样的界面,我们可以通过新增按钮来添加我们常用的提示词, 同时下方的输入框中还能给提示词设置标签。注意,如果是多个标签,要用半角的逗号可开哈。这样做的好处是,等我们保存的提示词多了以后,就可以用搜索工具, 可以用标签来快速找到我们想要的那一个。接着我们可以随便打开一个长对话,然后会发现页面右侧多了一些圆点,他们其实就是时间线导航,每个圆点都代表你的输入内容,我们可以用鼠标左键点击这些圆点就能迅速跳转。那如果你想要更精准的找到对话内容,可以点击这里的小按钮。 弹出来的卡片中不仅能够显示文字目录,还可以通过搜索框来查找关键词,帮助你更快速的找到重要内容。那除了单个聊天内容的时间线,这个工具还提供多个对话记录的分类整理。我们把目光移到左边来,这里比以前多了一排按钮, 点击最右侧的加号,能够新建文件夹。命名完毕以后,我们可以找到和这个文件夹匹配的对话内容,点击这里的三个点,选择移动到你刚刚创建的文件夹中。那万一我们添加错了也不用怕,直接点击右边的叉删掉就行,而且不用担心这个叉的意思只是把它从文件夹移除,而不是彻底删除了这个对话。那除了新建文件夹, 我们还可以对这些文件夹进行颜色的设置,来从视觉层面上更好的区分它,提高我们找到自己想要内容的效率。那在这个工具的设置面板中,它其实还提供了很多个性化的功能,比如文件夹的间距、 文件夹的缩进等等视觉层面的选项,又比如说去除 nasa budana 生成图片水印的功能选项等等,而且作者一直在持续对它进行更新和优化,个人使用几个月以来,感觉还是非常实用和靠谱的。 最后,这个工具还能云备份到谷歌 drive, 确保当我们更换设备的时候能够一键恢复常的设置,也可以避免因为意外导致的数据丢失问题。另外肯定有小伙伴会疑惑,这个工具不是不能用了吗?确实,之前因为他的名字里带了 jamie 被以侵权为由,那是 什么了?现在它改名以后又可以正常使用了哈,不然我也做不了这一期视频。 ok, 那 以上就是本期视频的全部内容了,我是林音研究所的风筝,咱们下期视频再续前言。

你现在每天用的 ai, 可能连它一半的能力都没有发挥出来。现在网上几乎没有一条视频,把 g p、 d、 e、 jimmy、 豆包这些主流 ai 所有核心功能放在同一张使用地图里讲清楚, 更没有人告诉你不同的需求到底应该点哪一个功能入口。所以,现在大多数人用 ai 不是 不会用,而是根本就不知道它们究竟能干什么, 写不出三千字,研究没有深度,代码跑不起来。本质原因只有一个,你把所有的问题都丢进了聊天框。那今天这条视频呢?我不教你技巧,不教你拆题诗词,也不站在某一家 ai 的 立场,我只做一件事, 把现在最常用的一些 ai 工具,每一个你可能用的上的功能,全部摆在你的面前,写作、研究、代码、学习生、图生、视频工具调用、什么时候,应该用什么功能,一次性讲清楚。看完这条视频,你不会再问 ai 行不行,你只会知道这件事我该用哪一个模式。 顺便说一句,所有的功能呢,你在网上很难一次性找到全部的说明。所以呢,我把它们都整理成文档了,只需要在评论区回复 ai 隐藏模式,我就直接发给你。 第一个升图,目前所有的大模型呢,基本上都已经内置了 ai 的 升图功能,像谷歌的 gemini, 内置的是最新的 nano banana 模型。 g p t 呢,使用的是 g p t 图像,而豆包使用的是自家的 c 锥模型,共有三个版本可以选择。那 jamie 呢,提供了两种图片的生成方式,分别是 pro 版本和普通版本。如果你要使用的是普通版本的 nano banana, 那 你就从模型的菜单当中选择快速。如果你要使用的是 nano banana pro, 那 你就从模型的菜单栏中选择思考或者是 pro。 nano banana pro 的 生成功能呢,可能会受到 gmail 三 pro 配额的限制,如果你用完了每日的 gmail 三 pro 的 配额,就得等到配额重置之后才能继续生成 nano banana pro 的 图片了。如果达到限额,你可以在提示栏中将模型从思考或者是 pro 模式切换到快速,然后继续使用 nano banana 生成图。 关于 nano banana 生成各种类型图片的教学呢,大家也可以观看我们这一期专门讲解 nano banana 视频,上百种效果可以说是一应俱全。 ok, 那 gpt 目前使用的是最新的 gpt image 一 点五,并且将它作为了 gpt 中图像生成功能的底层模型。 官方默认的也有额度的限制,尤其是免费的用户,或者是掐指 g p p plus 的 用户。那免费账号呢,通常每天有少量的生成次数,但是根据我目前查到的资料,并没有发现一个明确的数量。测试下来,免费用户基本上每天可以生成十几张图片是没有问题的, plus 或者是订阅的用户呢,额度就会更高。 ok, 豆包相较于 jimmy 和基本 选择就会更加的灵活了,它提供了三个版本,包含了从三点零到最新的 c 锥四点五模型。除此之外呢,还可以直接在聊天框当中选择比例和调整风格,可以说对新手来说上手是最简单最友好的。 豆包的身图限额呢,也没有明确的数量,甚至在我的测试当中,手机和 pc 端的数量都是不太一样的,但是基本上免费用户呢,能够每天生成几十张图片是没有任何问题的, 额度肯定也是三家当中最高的, ok, 那 么这是我用同一段提示词,分别使用这三个大模型生成的图片,大家可以看看你们更喜欢谁的生图效果。 二、视频生成视频生成功能呢,在三家就有所不同了,接下来内置最新的 ai 视频生成工具 vivo 三点一,操作呢也是非常简单的,只需要在底部的文本框下面点击视频图标, 然后在文本框当中为你想要生成的视频输入提示词,就可以生成了。当然,如果你需要根据照片来制作视频,点击添加图片的图标,然后选择你想要上传的文件,点击提交也就可以了。 在这个地方呢,也有一些官方的温馨提示,在生成视频之前呢,你可以先跟 jammy 进行一些对话,然后呢进行一轮头脑风暴,完善你的视频生成提示词,这样一来呢,你就不需要点击视频就可以生成了。同时呢也要注意, jammy 应用生成的视频长度呢是八秒钟, 生成视频呢可能需要一到两分钟的时间,你也可以要求 jammy 为视频同时生成音频。根据竖屏照片生成的视频呢,也将保持竖屏的格式, 并且采用语言,照片最接近的宽高比 ok 限额使用 vivo 三点零生成的视频数量呢也有一定的上限,接近限额的时候呢,现在会给你发送通知,告诉你还可以生成多少个视频。据我目前的实测啊, pro 用户一天能用 vivo 三点一生成三个视频左右豆包内置的视频生成核心使用的是字节跳动自研的 c dance 系 列模型,截止二零二五年十二月,最新的是 c dance 一 点零 pro、 c dance 一 点零 light 等版本可以供你选 免费用户每日视频生成的次数呢,通常是 app 端五次,网页端十次,两端呢是不进行叠加的,零点的时候呢,就会重置,具体呢,可能会因为你的账号等级有一些略微的差异。 下一个 gpt 的 内置功能呢,并没有视频生成这一项,因为 openai 把视频生成模型主要是通过了单独的 sorry 应用来进行完成。那这个地方呢,我们就不着重讲解了,那以下呢,是我们利用同一提示词生成的视频,大家可以对比一下效果。嗨, 我接电话,我需要帮忙,他们来了,快点我三、 deep research 深度研究接下来呢,我们要讲一个能把你从资料苦海里面彻底解放出来的进阶功能。 deep research, 也就是深度研究。那大家平常工作里面呢,肯定遇到过各种场景, 比如说老板让你做一份未来五年全球新能源车市场的分析,或者是你要写一篇严谨的生物医药前沿综述 这种任务呢?如果你用普通的 ai 对 话,他只能给你泛泛而谈的几百字,根本没有办法用,因为你需要的是浏览几百个网页,读几十篇 pdf, 甚至是清洗数据。这在以前呢,可能需要花费你整整一天的时间。但 deep research 就 不一样了,它是一个能够自主工作的智能代理, 给他一个题目,他可以自己去制定计划,自己去搜来源,遇到不懂的呢,也会自己去查,通常花个五到三十分钟,直接就给你甩出一份几千字的有理有据的报告了。 目前这个领域,你要关注的是两家, openai 和谷歌,它们俩的路子呢,也会有一些不一样。 openai 的 deep research 呢,更擅长的是逻辑推理,专门针对高难度的科学和金融,任务是做了优化的。 在人类终极考试的准确率呢,也是其他模型的好几倍。它最大的杀手锏呢,就是自带 python 工具箱,可以像数据分析师一样去写代码,抓数据,分析趋势,每一条结论呢,都会像写论文一样标好这个引用的来源,非常适合做那种容错率极低的硬核研究。而 google gemini 的 deep research 呢,更像是一个 懂你家底的全能秘书。它最大的优势呢,是生态整合,因为它不仅可以搜全网,还可以直接连接你的机妙邮箱和 google 的 云端硬盘,把你内部的文档和外部的信息结合起来,生成报告。它生成的报告呢,也不仅仅只是文字,还可以给你做成互动式的模拟器呀,图标啊,甚至是把报告转成音频读给你听, 都是没有问题的。豆包的深入研究功能呢,最近也刚刚上线,它最大的优势呢,就是量大管饱且体验丝滑,这就意味着它可以一次性吞掉上百篇学术报告或者是几本书,处理复杂任务的广度呢,也非常的惊人。其次,豆包特别懂手机用户, 你在 app 上面生成了长篇的研究报告,如果说你懒得看,也可以一键转成播客模式,挂在耳朵上听,甚至是研究报告做好之后呢,它还会自动生成网页形式来概括主要的内容。 不过要注意啊,深入研究虽然功能强,但都不是秒回的,因为他们要干的活太多了。申请一份报告呢,通常需要五到三十分钟,所以呢,别傻等着 点了开始呢,你就可以去喝杯咖啡了。而且呢,深入研究呢,也是比较烧钱和烧算力的,所以每天的使用次数呢,也是有限制的,大家且用且珍惜。 四、 canvas 画布如果你还在用传统的聊天框去写代码或者是改论文,那你真的是在浪费生命。我们都知道,直接跟大模型对话呢,有一个非常致命的痛点,他是个黑盒, 而且记性不太好,你让他改一段代码里的一个小 bug, 他 往往会把整个几百行的代码重新生成一遍,你还得自己去对比改了哪。或者是你写长文的时候, 你只想润色某一段,他却经常丢失上下文,甚至是自作主张改掉你满意的部分。那 canvas 画布功能的出现呢,就是为了终结这种问答式的低效作业,把它 变成了并肩作战的编辑模式。以 open a 的 canvas 为例,当你开启它的时候呢,屏幕会一分为二,左边聊天,右边呢,是独立的编辑窗口,它的核心逻辑就是精准控制。比如说,程序员写代码,你先要自己加编辑窗口,它的核心逻辑就是精准控制。比如说程序员写代码,你先要自己加编辑窗口,它就可以自动帮你插装, 老板让你把 python 代码换成 c 加加,点击移植就可以一键搞定。写文章呢,也是一样的,它不再是瞎改,也可以用滑块调节阅读等级,从幼儿园水平瞬间切换到研究生水平, 或者是一键调整文章长短和润色语法。简单的说呢, openid com 就 像一个坐在你旁边的资深主编和架构师,主打的就是一个指哪改哪的微操体验。 那如果我们说 open i 的 极致是编辑器,那 google gemini 的 canvas 就是 一个脑洞大开的多模态创意工厂。 它的逻辑呢,就有点不一样了,因为它不光是为了修修补补,而是为了让你的内容流动起来。除了可以调节文章的长度,调节写作的语气等等这些基础功能之外呢, gemini 的 canvas 里面呢,还有些额外的功能,比如说你在写完文档,如果你不爱看字,你点击音频概览,它就可以瞬间生成一段播课读给你听。 你需要做演示,点击一下就可以生成格式化的信息图、图表或者是测验题。如果想测试自己的学习效果, 也可以生成测验。对于学术党和数据党来说呢, gmail 有 两个独家杀手锏,第一个呢,就是完美支持 lattic, 且复杂的数学公式呢,极其的丝滑,包括之前火爆全网的 gmail, 一 键生成各种模拟器也都是在 canvas 当中完成的。第 第二就是无敌的谷歌生态整合,你写好的文章呢,不需要复制,直接点击导出到谷歌文档就可以发给同事。写好的 python 代码呢,也可以直接导出到 google collab 去运行, 这些呢,都是 openai 目前做不到的。所以总结一下,如果你追求代码和文字的极致掌控,你可以选 openai, 如果你需要通过图表、音频或者是依赖谷歌的全家桶进行写作办公,那 jamming 的 canvas 绝对是效率的神。豆包当中呢,直接把这个功能分成了两个部分,分别是帮我写作和应用生成。 首先我们看一下帮我写作,点击之后呢,你就可以看到这个地方已经有很多预设的文章模板了,从商业营销到设美文章,再到文学艺术,点击相应的模板,然后更改一下自己的需求,就可以进行生成。 同样的,在编辑机当中呢,也可以进行相关的编辑和 ai 的 改写。可以说豆包的这个功能做的是对普通用户非常友好,因为你不需要提前去准备提示词,只需要找到自己喜欢的模板,然后就可以生成了。 那同样的,应用生成也是模板化的,你可以输入需求,制作一些定制化的网站或者是工具,也可以浏览其他用户制作的模板,然后更改成自己的需求就可以完成,非常的便捷。比如说这个贪吃蛇游戏,直接点击就可以生成了。 五、学习与研究模式很多人用 ai 学习最大的误区呢,就是把它当做了搜题软件,你直接问 ai 博弈论是什么 普通对话模式呢,会立刻甩给你一段完美的定义,你觉得你懂了,其实那是被动接收,过脑你就会忘,但这个呢,正是我们要解决的一个痛点。那么 open ai 的 学习与研究模式核心逻辑呢,就是苏格拉底式提问和支架式回复, 当你开启他的时候呢,他绝对不会直接给你答案。比如说你想学习博弈论,他首先呢,会根据你的水平生成一个分阶段的学习路线图。比如说第一阶段讲核心的基础,第二阶段讲纳时均衡, 那在讲解的时候呢,他也会把复杂的知识拆解成一个一个易消化的章节,这个呢,就叫做知识支架。 每讲完一段,他还会立刻抛出一个知识检查或者是测验,让你去做一下,强迫你用自己的话去复述。如果发现你没有懂呢,他也会换个方式重新讲,而不是机械的重复。这样的一种交互式,强迫你大脑进行主动思考。就像大学里的 office hour, 教授呢,不是为了帮你做作业,而是为了让你真的学会。所以,如果你是大学生,或者是要深度掌握某个硬核概念,就一定不要用普通对话了,一定要开学习模式,他是帮你建立长期记忆的很好路径。 如果说 open ai 是 一个严厉的教授,那谷歌的 jammer 就是 那个手里握着顶级资源的全能助教了。普通 ai 最大的问题就是他特别容易一本正经的胡说八道,特别是在科学的定义上。 但 jamming 的 学习工具呢,解决了这个问题,他引入了权威的姓源,在最新的功能当中呢,你甚至可以在提示词里面输入 at openstack 啊。不过这个功能目前只支持英语,而且只能在美国使用。他会直接调用这家知名教育出版机构的专业教材来深深回答,确保你拿到的复习资料是教科书级别的准确度,而不是网上的野路子。此外呢, jamming 极其擅长的是多模态的一个学习, 普通的对话呢,只能给你一些干巴巴的文字,但是在 jamie 的 学习模式里面,当你问光核作用或者是细胞结构的时候呢,它可以直接在回复里面嵌入相关的图式,而且它还是一个刷题神器, 你可以上传你的课堂笔记,让 jamie 生成一套定制化的测验题,或者是抽任卡这种多图片加读教材加刷题的组合权,对于备考冲刺或者是视觉型的学习者来说呢,效率一定是降维式的打击。 豆包呢,在学习解答方面呢,更像是一个作业,帮你可以拍摄或者是输入相关的题目,那豆包呢,就会直接帮你解答,有不懂的地方呢,可以继续提问,直到你会为止。六、特色功能那么以上呢,基本上就是目前大模型都有的共同功能了,也是大家使用大模型需求最高的一些,认为一些 除了这些功能之外,其实各家大模型还有很多特有的功能,我们也一个一个介绍一下。首先第一个必须要给你们安利一下,这边这个还在实验室阶段的隐藏神迹,叫做动态式图。 大家平常直接跟大模型对话呢,最大的痛点就是交互太死板,或者是信息的现行堆积。比如说你问他哪款智能手机值得买,或者是帮我规划罗马五日游,普通的模式之下呢,他只能给你吐出一长串枯燥的文字列表,你想对比参数或者跳转查看细节,还得反复发指令,效率很。 但动态式图呢,完全就是另一个维度的东西了,当你起用它,界面会瞬间化身成为一个全站工程师,利用先进的智能体编码能力,根据你的需求实时编辑代码, 直接在对话窗口里面为你构建一个独一无二的交互式界面。这意味着 ai 给你的不再是静态的文本,而是一个可以点击、可以滚动,可以深入探索的迷你 app 或者是仪表盘。 比如说在制定小说创作计划,或者是做复杂购物的决策时,他可以生成一个可式化的可互动的控制台,让你像操作软件一样去浏览信息,把被动阅读变成了主动探索。这种沉浸式的互动体验呢,是普通对话根本没有办法比拟的。 不过大家要特别注意几个坑,第一个,这还是一个实验功能,目前手机的 app 呢,还不支持,只能在电脑的网页上用。第二个呢,如果你生成的矢图里面包含 ai 生成的图片,是会消耗你每日图片生成的额度的,这点呢,要算好账。总结来说呢,如果你只是要一个简单的结论,用普通对话就可以了。 如果你需要的是做复杂的旅行规划、产品对比或者是创意构思,一定要开这个动态式图,把它当成你的专属软件开发员来使用。二、 g p t 应用拓展在 g p t 的 工具当中呢,你还可以去应用市场选择更多的能力拓展,比如说你可以调用 canva 来设计海报,或者是调用 photoshop 来进行图片编辑, 也可以根据你的个性化需求完成你的更多任务。那么 gmail 呢?目前是没有这个商店功能的,不过可以预见的是,未来这样的大模型呢,和各个软件的结合一定会变得越来越多。三、 ai 播课、 ai ppt、 ai 音乐生成。 那相比较于 g p t 和 jamie, 豆包的拓展功能呢,确实会更多一点,你可以直接通过跟豆包对话来生成一首 ai 音乐,或者是让豆包直接给你做一个 ppt, 甚至是记录会议,做播客都是没有问题的。虽然他的能力比较多,但是确实要说一句,在有些维度上跟 jamie 和 g p t 相比 还是有一点点差距的。不过豆包的生活化和便利性确实对咱们更多的用户来说门槛是更低的,完全够用。 ok, 今天呢,我帮你把锯子、剪刀、开瓶器全部都拔出来了,下次打开 ai 之前,你就可以先想一想这事是不是应该换个模式了。这期视频如果帮你打开了新世界的大门,请一定要点赞收藏,我是天降,我们下期再见!

jimi nike 三点五 flash 以及多组 jimi nike checkpoints 目前正在 arina 里高频测试,重点验证的不只是响应速度,还有实际能力表现。更值得关注的是,他有望把接近 pro 机的体验压到更低成本,直接影响轻量化部署和日常调用场景。 pos 二点五这次升级的重点很明确,就是更适合长时间编码任务,它不仅代码生成能力更强,推理和指令跟随也同步提升,复杂项目里连续修改、反复迭代会更顺手。关注全球 ai 速递,获取更多 ai 前沿资讯。

ai 圈刚刚发生了一件非常魔幻的事,二月十七号, ansauric 发布了 cloud 四点六,拿下了多个排行榜第一,所有人都说 cloud 又赢了。但是两天后,二月十九号, google 发布了 gmi 三点一 pro, 推理能力直接翻倍,从百分之三十一飙升到百分之七十七,不仅反超了 cloud, 而且还超过了 gpt 五点二两天,从被超越到反超只用了两天。 但最狠的不是性能,是价格。 gmail 三点一 pro 的 性能翻了一倍,但价格一分钱没有涨。算下来,它比 cloud 便宜一半,比 gpt 五点二也便宜。 google 直接把游戏规则从谁更聪明变成了谁又聪明又便宜。 有个开发者测试了一下,用一句话让 gmail 三点一 pro 搭建了一个完整的 windows 十一风格的网页操作系统,文本编辑器、 反痛终端代码编辑器、文件管理器、画板小游戏全有。但我今天不是来做产品测评的,我是想说,这件事儿背后还有一个趋势,二零二四年 ai 大 模型的更新是按月计算的,二零二五年变成了按周算。现在二零二六年,两家公司的发布间隔只有四十八小时。 你还没有学会上一个版本怎么用,新的已经出来了,而且注意一个关键信号, google 这次用了点一这个版本,以前都是点五一跳,现在变成点一,什么意思?以后不是大版本震撼你一下,而是持续不断的小步快跑, 你不会再有时间等一等,看一看,观望一下。我是文思, ai 的 进化速度已经快到一个什么程度了呢?你今天在犹豫要不要学 ai, 明天 ai 就 迭代了,新的一轮,不是你追不追的上的问题,是你什么时候开始追的问题。评论区说说你现在正在用哪个 ai 来辅助你的工作?

家人们,人工智能圈这次真的变天了! google deepmind 刚刚悄悄扔下了一枚重磅炸弹, gemini three point five flash 正式发布了!我原以为它只是个常规的小版本迭代,结果看完第三方权威评测数据,我整个人直接被惊呆了!这哪里是微调啊,这简直是轻量级模型的一场史诗级暴走! 如果你正在寻找一款坚固、极致、速度与顶尖智能的工具,听我的,闭眼冲它就对了。 一打破不可能的,怕累拖前沿。以前我们用大模型总要在速度和智商之间做妥协,想要聪明的,就得忍受它像挤牙膏一样一个字一个字往外吐。想要快的,智商又往往缺那么点意思。 但是 gemini 3.5 flash 把这个行业铁律给砸得粉碎。根据 artificial analysis 的 最新权威评测数据,在综合智能指数上,他直接轰下了五十五分,比前代足足飙升了九分,甚至一举超越 grog 四点三的五十三分和 cloudsonnet four 六的五十二分。 更夸张的是,他的输出速度直接突破了每秒两百八十个 token, 比上一代快了整整百分之七十!他现在是全球智能与速度帕累托最优前沿上无可争议的绝对领跑者。 二、 agent 能力的跨级碾压更让我感到惊喜。也是最想强烈推荐给大家的,是他这次在 agent 智能体能力上的外挂级进化。以前 gemini 处理多步骤的复杂工作流时,总让人觉得有点吃力,但这次他原生支持了思维保留技术,多人对话里那些中间推理过程决不丢掉数据从来不会说谎。在模拟真实世界 agent 任务的 gdp vol a a 严苛评测中, gemini three point five flash 轰出了一千六百五十六分的天花板级一楼天梯分。这是什么概念?他不仅把前代 flash 的 一千两百零四分远远甩在身后,甚至跨级碾压了自家老大哥 gemini three point one pro 的 一千三百一十四分, 距离行业天花板 g p t 五点四仅仅只有一步之遥。用轻量级的费率和速度跑出近乎顶级旗舰模型的 agent 的 操控力,这性价比真的绝了!三、 告别胡说八道与成本考量当然,大模型最让人头疼的就是胡说八道。这次 google 显然下了狠功夫, 在衡量知识储备与幻觉控制的 a a operations 精准测试中,它的得分暴涨,十一分模型幻觉率大幅下降至百分之六十一, 相比前代幻觉的绝对值,整整锐减了三十一个百分点,回答的准确性和严谨性得到了质的提升。不过客观来看,天下没有免费的午餐,因为他的 agent 复杂多轮对话能力变强了,导致输入的 token 量激增, 运行全套智能评测的总成本来到了一千五百五十二美元,是钱袋的五点五倍。但别慌,它的基础定价依然非常亲民,每百万输入 token 只要一点五美元,如果缓存命中,还能享受一折优惠,低至零点一五美元。这个价格对开发者和企业来说依然是真香。警告, 依照的超大上下文,原生多模态支持动态分级思考机制,毫无疑问, gemini 三点五 flash 就是 开启全面 agent 时代的里程碑式轻量模型。 各位开发者、科研党、生产力极客们,赶紧去 google ai studio 或官方平台搞个 api 体验一下,相信我,用过之后你绝对回不去了。

深夜时分,硅谷的服务器机房内成千上万个指示灯如同呼吸般闪烁。一名开发者疲惫的揉了揉眼睛,指尖在键盘上敲下最后一行复杂的逻辑指令。就在他点击运行的刹那, jamaican 的 网页端竟泛起一道幽蓝的电光。他屏住呼吸,输入了一个近乎荒谬的请求,请为我生成一个完整的可运行的 windows 九十八模拟器。屏幕上的代码行数开始疯狂跳动, 从个位数一路狂飙,最终精准地定格在两千两百行。他颤抖着点击预览,那熟悉的 带着时代印记的灰色任务栏竟然奇迹般的浮现出来。开发者愣住了,鼠标划过,开始菜单,计算器、画图工具,甚至是内置浏览器,每一个像素都响应的完美无缺。这绝不是曾经那些简陋的 flash 模型所能企及的高度。 消息如同野火般在 reddit 论坛上瞬间炸裂,全球的疾客们陷入了疯狂,人们涌入 canvas 模式,尝试那些曾经需要反复调试的 free jes 项目。令人窒息的一幕发生了,复杂的粒子特效、流动的水花、细腻的光影碰撞, jemmy 竟然做到了一次性完整输出,没有任何延迟,没有任何瑕疵,这简直是代码世界的造物主时刻。 就在混乱与狂欢交织之际,谷歌内部的后台控制台意外泄露了机密,一个名为 gemini 三点二 flash 的 神秘条目赫然在目,这不再是修修补补的小不迭代,而是一场蓄谋已久的降维打击。它不仅具备了恐怖的推理速度,更展现出了一种理解复杂系统架构的本能。 与此同时,这股力量正悄无声息地向移动端渗透,原本孤立的手机 app 在 它的注视下仿佛失去了围墙。开发者们意识到一个旧的时代正在坍塌,而谷歌正试图在废墟上建立起一个由 ai 主导的全新秩序,帮我定一家八人的牛排馆。指令发出的瞬间, jemmy 化身为无形的管家,他精准地调动 open table 接口,确认位置,锁定时间,发送信件,用户甚至无需打开任何软件。 紧接着,一张复古风婚礼请柬在对话框内直接铺展开来,灰玫瑰色与熟稞草绿交织出的美感被直接推送到 cameron 的 画布中心。 github、 spotify、 what's up? 这些曾经各自为政的巨头应用,正被 gemini 这个超级入口逐一吞食。在 i o 大 会开幕前的最后时刻, 谷歌终于撕开了所有的伪装,露出了锋利的爪牙。然而,质疑声如影随形。业内大佬冷冷的评价,谷歌依然在追赶 gpt 五五的幻影,在通往通用人工智能的终极赛道上,它仍非领跑者。 屏幕前,开发者看着那台复刻的 windows 九十八,陷入了长久的沉默。这是谷歌赌上一切的筹码。倒计时钟声已然响起,这不仅是一场发布会,更是关乎王座归属的生死博弈。

不管你是不是做电商的,一定要一定要一定要想尽办法尽快用上谷歌的专门奶。不管你用什么手段,什么方法,我深度体验了半个月,最震撼我的不是他能做主图,优化标题,写代码,而是他的长期记忆。 这种记忆真的很恐怖,你每天跟他聊的工作细节,甚至你随口提的一句创意,他都能够悄悄的记下来,记到最后,他比你自己还懂你。你肯定会说,哎呀,谷歌这东西国内又用不了,门槛太高了,太麻烦。 确实有门槛,但是只要你想用,你一定能用得上,你就拿出当年深更半夜找那种学习资料的那股劲头,你一定能搞定。 正因为有这层门槛,才帮你把那百分之九十的竞争对手全拦在外面了。走路的人和坐飞机的人速度差的不是一倍两倍,是一百多倍,这是一种恐怖的降维打击。 就在今天,一个做电商的零零后小老板跟我炫耀说他调教出了一套 ai 的 工作流,现在他一个人就能完成以前三个人小团队百分之八十的工作量, 这就是所谓的超级个体啊!在没用 ai 之前,这种事情呢,你做梦都不敢想。说白了,能不能把这种顶级 ai 调教成你的超级助手,就是我们普通人这辈子能不能翻身的最大机会。

大家好,上一讲我们用 jimmy 把自己的想法变成了这份产品文档,很多人私信问我,文档有的,但我不会 ps 设计,怎么画出大厂级别的 ui 界面? 二零二六年,答案依旧是,你不需要会设计。今天我分享如何做出 ui 设计,动动嘴,让这一份枯燥的产品文档直接变成精美像素级可交付的设计稿。 点赞加关注,有任何问题可以私信或评论区问我。我们现在开始,我们首先打开这一份产品文档,我们现在用这一份产品文档。我们需要生成 页面的提示词,我们复制产品文档,我们把这个产品文档复制给 jimmy, 我 们给它添加一个帮我生成 ui 界面设计的提示词。 我用 figma 来制作 ui, 我 们发送给他, 他在这思考了之后,他是不是给我们每一页面都生成了提示词,这样我们设计稿的提示词已经有了。我们把这个提示词保存到我们的文档里面, 这是第二个页面的提示词,这是设置页面的提示词。 现在我们三个页面的提示词都有了,我们接着来把这个提示词变成精美的 ui 界面。这里需要介绍一个新的工具,叫做 figma, 同类产品有很多,我这里介绍的是 figma, 大家可以去这个网站上打开这个页面,然后登录注册, 简单的介绍一下 figma。 figma 上面一般是设计师用来做 ui 界面设计的,它里面有一些公共的社区,有很多共享的资源,在这里也可以参考借鉴。我们来到这个页面,我们复制第一个提示词, 我们粘贴,然后点生成。稍等一会儿, figma maker 会根据我们的提示词自动来给我们生成页面。 figma 收到我们的这个提示词后,它会在右侧来生成我们精美的一个页面。 我们首页是不是已经生成完了,根据我们的心情做一个记录预览呢?是网页版本,我们点击这里可以切换到手机版本。我们复制第二段提示词,然后继续发给 figma。 我 们第二个页面的心情记录列表已经显示出来了,我们复制第三段提示词发送给它,让它生成最后一个页面, 这样我们第三个页面的 ui 已经生成了,我们一起来看一下 对不对?整体看着还可以,它生成的设计稿我们不可能第一次就满意,如果主色调跟我们预期的不符合,我们直接去跟 jimmy 沟通。 这个体式词我们需要改对不对?让他重新生成体式词,让 figma 重新给我们生成设计稿,这是主格调,如果不一致,如果生成的设计稿局部不一致,我们怎么改呢? 例如这里,我看这个颜色不太好看。我们来到 figma, 我 们选中 这个点,点击我们不满意的地方,这是一个 button, 这里出现了这个 button, ui 给我重新调整一下颜色, 简单一点。我们点击这里选中这个 button, 我 们告诉它, ui 给我重新调整一下颜色,简单一点。我们发送我们看一下,它会把对我们这个 ui 设计稿进行一个局部调整 好,它已经给我局部调整完了,从刚才的深颜色变成浅色。我们再来看一下, 是不是现在这一块的颜色比刚才的简单一点。所以说如果 ui 设计稿整体不满意,我们让 jimmy 重新给我们生成提示词, 如果局部不满意,我们直接让 figma 做一个局部的调整。这里我们就不去纠结这个 ui 了,大家知道这个方法来调整 ui 就 可以。 现在我们的设计稿已经生成了。总结一下今天我们干了什么?我们今天把需求通过精准的提示词,利用 ai 工具一键生成了高保真的设计稿, 只要你有审美,你会沟通,就能设计出我们想要的设计稿。大家去下载这些 ai 工具,尝试把你的想法画出来。 刚才我的提示词模板已经放到评论区了,大家记得去抄作业。现在我们有了产品需求文档 和 ui 设计稿,万事俱备,只差代码。下一讲我们来演示如何用 web coding, 一 行代码不写,直接读取这一个设计稿,生成我们的代码运行在手机上,不想错过。点赞、关注、收藏三连,我们下期再见!

嗨,宝子们,最近你们发现没有,网上满屏都是教你用 ai 搞副业的课,我一个都没买。为啥呢?我连拍送的打印语句都写不明白。滴滴哈,提交记录是零, 但你往下看啊,一个完全搞不懂代码的人,靠免费工具九天搞定了别人报价几千块的开发需求,两个东西帮我干的活,一个是 cloud code 和浏览器里面的金带侧边栏。先收藏这篇,万一你哪天用上了呢? 第先说说第一单是咋来的哈,我有个做电商的朋友,需要一个小工具,自动抓别人家价格,然后做个对比表,他找了好几个干外包的,报价都是两三千块。嗯,大概得干两周吧。我用 cloud code 加上 gmail, 九天干完了,一分钱外包费没花,完美跑通。他问我咋做到的,我说我啥也不会,都是 ai 干的,他还不信,但真是这样, 工具本身不行,你得装插件。头一回打开 cloud code 的 我差点给他卸了,因为跟他聊了差不多五十条消息之后,他开始胡说八道了, 聊到后面,连我第五条消息说啥都忘了,然后我关了再打开,啥都没有了,第二天又得重头来。所以啊,插件才是重点。我呢,一共装了四个头,一个叫 e c c, github 上五万多颗星哦。装之前,每次开工得花十分钟,更爱重新解释我在干啥,十分钟里有七分钟。再说一样的话,装完之后这事直接没了, 关了再开它也会自动接着来。你是不是也遇到过 ai, 聊着聊着就忘了的,前面说啥 e c c 就是 治这个的,它还有个功能,叫持续学习,用的越多越懂你的习惯,自动从你操作里提取经验,变成可复制技能,你啥都不用干,它自己越来越聪明。还有一个自动选模型, 省 token 的 功能,说白了就是省调用成本。第二个叫啥呢? dsp, 全名叫 getshit done, 名字说明一切。他把项目信息全写到一个文件里,要干啥干到哪了,下一步啥全自动,出去玩一个星期,回来你再打开文件,一目了然,接着干。 第三个呢,是 pwf, 思路来自 minnes, 就是 近期被重金收购的那家现象级 ai 公司,你跟 ai 聊的所有内容全存在文件里,清了对话也不怕,自动恢复。 第四个 cloud m e m 更隐蔽,在后台默默看你的一切操作。压缩存到数据库,下次开新对话的时候自动输入。我一开始觉得还没啥用呢,后来靠它找回了三天前的一个方案,从此我就离不开它了。 你觉得装这么多是不是很麻烦?说实话,刚开始我也觉得怎么这么麻烦呢,但装完之后发现啊,这几个插件解决了同一个问题,就是进度丢失,关机,清对话网,断网都不怕,所有所有进度都在第二天,你打开了还能继续干, 但光有工具也不行哈,还得知道干啥。那现在工具齐了,但你知道要写啥代码不?那个抓价格的工具,技术方案咋选的?以前得一个个打开 github 项目看,效率低到不行,后来发现浏览器里有个什么东西呢?真卖侧边栏, 看项目看不懂,点开侧边栏问他呀,他直接读页面给你分析,还能同时开好几个网页让他一起看,还能帮你对比差异,自动总结。 一句话说清楚哈,金麦负责想, cloud code 负责干,金麦侧边栏呢负责调研,结果呢,都被给 cloud code 加上 e c c 和 g s d 自动拆任务写代码跑测试 p w f 和 cloud m e m 给你兜底。今天呢,你干了一半关了电脑,明天打开接着来。没有关系, 零成本开发九天不懂代码全免费工具啊,学会一次,后面复制粘贴就行了。宝宝们拜拜了,下期再见。

codex、 cloud code、 gemini、 openclaw, 这四个工具究竟在什么场景下是适合的?在什么场景下又需要互相串联起来?今天这个视频不废话呃, 我将会带着大家去看一下我日常是怎么去使用的,把这些经验也分享给大家。首先呢,我们可以看到啊,这四个工具呢,其实有各自适合的场景,比如说 codex, 它其实适合去抓取一些信息,去做一些批处理和定时任务 啊,或者说去要逐步推进一些步骤的时候,它可以开启这个全自动化的流程。那么 cloud code 呢,它可能会更加偏向于去写一些底层的代码,或者是去编写一些 skill 啊,尤其去适合去做一些打底层的一些能力。 那么呃,这个 openclaw 呢,它更加适合去把人啊,还有设备以及我们自己的这些 agent 和 skill 串联起来,可以在一些出差路上,或者说你在不方便去使用电脑的时候, 采用这个 openclaw 去把一些任务推送到对应的我们这个手机的飞书啊,钉钉啊,或者是用这些外部的这个沟通工具去给你的这些智能体去下一些这种指令。那么 germina 呢,其实它会在文本转 啊,这个图片或者图片转文本的这个方面会比较强,所以说呢,他可能会适合去生成一些图片,或者去生成一些设计稿。好,那以上呢,我们简单的做了一个了解,包括我现在的这张屏幕,其实也是用 啊这个 codex 帮我写的啊。那么 codex 呢,其实在这方面抓取信息,输出一些网页其实也还是非常强的,最关键的是它的这个费用也比较便宜,所以那我们用一个案例来看一下,举个例子 啊,比如说我们要去看生成一个这个 ppt 啊,生成一个 ppt, 那 么一共呢会分为五个步骤,第一个步骤呢,可能要去做一些信息的抓取,是吧?然后去做一些定时任务,那这个时候呢,可能会是要需要用到就是 codex。 举个例子,比如说啊,我现在这里呢,就会有一些定时任务啊,给大家看一下。比如说呢,我会去抓取每天的一些早报,比如,比如说在这里 啊,每天都要去按照我自己定的这个标准去执行这些,去抓取一些早报。那早报的这个啊,效果呢?给大家看一下啊,举个例子,比如说啊,这些,呃, 这个每一天的这些新型的科创版的一些这种,呃,关于 ai, 关于人工智能、关于商业航天的一些新闻或直接推送过来。那么后续呢,还会有一些 github 的 一些项目,那它的这个任务呢,是完全自动化的再去做的啊,完全自动化, 也就说首先我们可以用这个,我们可以用这个,呃呃 codex 去做一些自动化的任务啊, 其实这样,那么除此之外呢啊,本身啊,就这些 skill 啊,这些 skill 可以 用 cloud code 直接进行编辑啊,直接进行编辑, 或者说我们打底的去做一些这种小的网页,或者是去做一些这种生产化系统的时候,可以用 cloud code 来去完成,因为它呢本身也可以去支持一些啊, s d d 就是 spot coding 啊,不像是原本完全之前的 web coding 这种方式。那第三个呢?是 codex 啊,第三个是 这个 codex 呢,它其实可以将前面的这两个东西串联起来,举个例子,比如说我们之前的一些这个网页的一些输出,还有一些文章或者是一些早报,其实它可以把这些 skill 和我们前面抓取到的信息做一个串联。那第四步呢, 可以根据这些早报和抓取到的信息,去让 notebook lm 去帮我们生成一些 ppt 啊,然后举个例子,比如说我们做到的一些 ppt, 大家可以看一下 啊,比如说这个也是我们之前做的啊,这个一些 ppt 的 一些啊,效果对吧?啊,它的这个效果还是非常不错的, 给大家看个大概啊。那么最后呢,就是如果你正好也是在出差途中啊,那么这个时候你可以用这个 open club 去接入到你的个人微信,飞书钉钉、企业微信等等,然后去把这个信息给你推送过去,或者说你不太方便查看电脑的文件,那你就直接让这个 啊,你的这个龙虾去帮你把这部分内容抓过来。所以以上呢,就是呃,我在使用了这么长时间,这个这几个工具给大家去做的一些总结啊,如果说有问题或者是想要去交流的话,也欢迎大家在评论区或者私信啊,谢谢,拜拜。