大家好,我是麦麦。最近 openclaw 很 火,如果你安装了,但是不知道怎么用,那你一定要赶紧去 github 直接输入 awesome openclaw skills, 这里有一千七百多种 openclaw 的 玩法, 包括网页开发、视频制作、数据分析、智能家居、电子商务等等,存下来总有一天用得上。用之前记得先丢给 ai 做个安全体检,以防万一。
粉丝6355获赞9.4万

如果你最近也给你的 codex 或者 clockwork 装 skills, 很 容易掉进一个坑,就是你被推荐了几十个甚至上百个 skills, 但是真正开工的时候还是不知道该选哪一个。所以说这一期呢,我也不做大而全的清单,也不讲复杂的安装, 我只按普通小白最容易遇到的六类任务去挑六个 skills。 新手先认识这些就够用的一些 skills, 它们能够分别帮你去解决任务,先问清楚想法,先变方案,知识库能调用,重复流程能沉淀网页结果能验证和各种文件都能够转化成 ai 好 读的这种材料。 ok, 大家好,我是 fred, 专注从普通小白的视角去分享怎么从零开始用 ai 和 web coding 提升自己的生活和工作效率。 那第一个 skill 就是 大家已经耳熟能详的东西啊,就是 using superpowers, 就 它的核心作用是能够让 ai 在 开始做事之前先停下来,把任务问清楚。 就很多时候很多人用 ai 的 痛点不是说 ai 不 会写,而是它太快开始写了,就是你一句话发给他,他可能马上能够给到结果,结果做完了之后才发现说你的目标边界格式和验收的方式都不对。 那这个 skill 所做的事情就是让 ai 先理解任务再计划,最后再验证。所以说它特别适合那种长任务,包括你的需求模糊的时候,以及你经常让 ai 做完又返工的这种场景,那这个 skill 那 就非常适合。 第二个是我非常常用的 skill, 就是 brainstorming, 就 它解决的就是想法,当你还没有想清楚的时候,可能就着急开做的这种问题, 很多人找 ai 去做东西,一上来就说,哎,帮我做一个网页,哎,帮我写一个方案。但其实当你的目标用户,你的内容重点,你的功能边界都没有定的时候,那这就体现了 brainstorming 的 价值, 它会让 ai 先跟你把想法聊清楚,再给两到三个不同的方案,并说明每个方案的一个取舍。比如说你要做一个内容栏目,一个页面,一个工具,一个产品的 demo, 它会先问清楚做给谁看,解决什么问题,哪些功能要不要做, 然后再把你的模糊的想法整理成可执行的这种设计。所以说它适合新项目开头,包括内容策划的开头或者功能设计的开头。 第三个也是我经常会用的一个 skills, 就是 obsidian skills, 就 如果你在用 obsidian, 或者你有大量的笔记资料网页的这种摘要,那这个我觉得就非常值得去收录啊, 就它不是简单地帮你去多存一些笔记,而是让 obsidian 里面的这种 markdown 的 文本,这种 bases 或者 canvas, 或者你的网页资料能够变成 ai 可以 重新组织的这种工作材料 就很多人的知识库最大的问题就是资料一直在往往往里面堆啊,然后真正写文章的时候,做研究的时候,包括你复盘项目的时候,就很难够重新再调动出来用。 所以说这个是会更适合内容创作者、研究型的岗位和那种顾问啊,或者长期的学习者,他的价值能够帮你把长期积累的变成一个可持续输入的一个资产。 第四个我相信是一个所有人都一定会用到一个 skills 啊,就是 skill creator, 它的作用就是帮你去生产你的 skills, 那 它解决的是你的一些重复流程的问题,比如说呢,你每周都会让 ai 写周报,那每次都要重新去讲格式、口吻,保留字段,或者一些审核的一些标准, 或者你反复让 ai 去帮你整理资料,改一些发布的文案,或者检查网页,那这些事情如果我每次都重新解释,去写一些 prompt, 写一些提示词,那本质上就是没有把这些 流程给沉淀下来。那 skill creator 的 价值就是帮你把每一次的对话变成一个可附用的 skills, 它适合做一些固定的格式,然后重复的流程,以及你希望以后能够把自己和团队都能够稳定使用的任务沉淀下来。 第五个呢,是 pay write, 其实它不是一个 skills 啊,就它更像是一个呃,浏览器自动化的能力 就是它可以让 ai 真正地去打开网页,去读取里面的页面的状态,点击按钮,包括说填写表单,截图,检查做网页或者落地页这种后台表单产品 demo 的 时候呢,这个非常非常有用啊,就因为很多时候 你只看代码是看不出来的,比如说按钮点不了,或者文字溢出,或者移动端变形,对吧?或者表单提交失败,这些都是要真正打开浏览器才知道。所以说 playwrite 的 价值就是让 ai 不 只是生成结果,还能帮你验收结果。 最后一个呢,就是 mock it down, 它的作用是能够把各种文件转成 ai 更好读的 mock down 的 这种文本,比如说把 pdf, 你 的 word, ppt, excel, 甚至网页 html, 一 些 csv 或者 jason 图片甚至音频, 都可以转成结构化的文本。为什么这个重要呢?就因为很多时候 ai 总结不准,其实并不是它模型弱啊,而是输入的这种文件结构太乱。比如说文件里面有表格,有分页,有图片,有格式, 那 ai 直接读就很容易漏掉一些重点。所以先用 markdown 这个 skills 把材料变干净,再去总结提取和改写,那结果通常就会变得稳定很多。 所以说呢,这六个 skills, 你 可以把它们理解成 using superpowers, 帮你先问清楚。 brainstorming 帮你用好知识库。 skill creator 能够帮你沉淀重复的流程, 而 playwrite 能够帮你去验证网证网页的结果,或者帮你去爬取一些网页的数据。而 markdown 能够帮你把文件变成 ai 好 读的这种材料。所以说你也不用一口气全装啊,也可以一开始呃,慢慢的一个一个去选,先知道它们分别能帮你做什么,后面可能遇到一些 对应的问题,然后再去用一些对应的 skills。 ok, 我是 fred, 后面我会持续帮你去猜普通人怎么把这些能力用进自己的真实的工作流。 ok, 评论交流你现在最想解决的一个 ai 问题,我会在评论区里面去回复,我们下期再见。

如果你最近开始用 ai 工具,一定会越来越常看见一个词,就是 getop, 就 别人给你发一个开源项目教程,让你去 getop 上面去下载 ai, 也经常让你看 readme, store issue。 很多时候很多人打开一开始就懵了,这不是程序员看代码的地方吗? 所以说这期我不会讲一些 getme, 也不会讲怎么写代码,我只想讲普通小白怎么用最简单方式去看懂 getop。 ok, 大家好,我是 fred, 专注从普通小白的视角分享怎么从零开始用 ai 和 web 口令提升自己的工作和生活的效率。 你会越来越常看到 github, 是 因为很多的 ai 工具插件,包括自动化脚本和开源的软件,都会把说明、下载、更新和问题反馈在这里。 对于普通小白而言,你可以把 github 理解为四件事,就是一个是找工具的入口啊,别人做好的工具 以及项目的说明书和使用前的这种判断的材料。所以说你要看的不是说哎这个项目代码写的有多厉害,而是这个东西有没有人维护,要不要账号,要不要权限,会不会碰到你自己的文件和数据。这样理解就比一个所谓的代码网站要好,理解非常多。 就很多人怕吉他,是因为他第一眼确实看起来很不友好,全英文的网站对吧?英文的文件名、按钮、标签、技术词就一下子全部堆在你面前。但是实际上你不用从代码开始看啊, 就更简单的方式,你把 github 当成一个工具的详情页,就像你看一个工具之前,你会先看它是干什么的,怎么用,别人有没有反馈,以及最近有没有更新, github 也是一样,所以说你不一定要会照这个工具, 但要会判断是它是不是你想要的,值不值,是,然后以及能不能让 ai 帮你先读懂。就如果用大白话来讲, github 就是 一个公开的一个项目主页,一个 github 的 仓库就是一个项目页面, 你要你先不用把它想成一堆代码,也不用着急去下载,而是把它当成一个工具和这一个项目的主页,它会告诉你这个项目叫什么,想解决什么问题,谁在维护,以及最近有没有更新, 所以说这一页只需要记记住这个理解就 ok 了。就仓库不是一个神秘的文件夹,它就是一个项目的页面, 而当你打开一个 excel 的 一个主页啊,其实就长这个样子,第一次打开这个项目,就你不用试图把所有的文件去读完啊,你就少这四个地方。第一个就是项目的名称 啊,然后一个一计划的简介,确认它到底在解决什么问题。第二,你可以看 readme 的 这个文件,它就是你的这个项目的使用的说明。 第三,你可以看它的 star, 就是 有多少人给他点赞啊, fork 就是 有多少人复制出来,以及最新的一些更新的时间,知道有没有人关注,以及最近是不是还在更新和改动。 然后第四个就是你可以看它的 issues, actions 和 release, 就是 看有没有问题的反馈,运行的记录和一些稳定的版本。就大家要注意的就是就 starts 很 高,只能说明它热度高,但不一定代表就它真的很安全,或者不一定代表它真的适合你, 然后呢?刚刚那一页解决的是看哪里?那我们这一页解决的就是要不要试的问题,你可以直接问三个问题,就是第一它到底有没有解决我的问题? 第二就这个项目到底有没有日常在更新一个二三年的项目,你可能完全不需要再去参考了。比如说第三,那就是我能不能先用一些测试的文件去小范围试一下, 如果前两个问题都解释不清楚,那就不用再花时间了。如果第三个问题也说不清,那就不要直接拿一些真实的文件,真实的账号或者一些重要的数据去跑, 这样你去看 guitar 的 时候就不是在去学一些技术的名堂,而是在做一个普通人的一个使用的一个判断, ok。 然后我觉得现在真正去降低 guitar 门槛的一个地方就是在于大家可以用 web coding, 因为你不用自己去硬读这种英英文的文档啊,你可以直接让 codex 去帮你把 guitar 翻译成你能够看得懂的一些话, 比如说你可以这样问,就是我不是程序员啊,就能帮我去 github 上面去找一些能够批量整理 pdf 表格的工具, 然后以及让它不要只给我链接,能够帮我去判断说它到底能做什么,怎么安装和使用它的 star 数,更新时间和依据,说明什么,然后会读取什么文件数据,有没有一些联网或者权限的风险,然后以及怎么去验证。 所以说这样子 ai 给到你的就不是一堆项目的链接,而是一个能不能用,怎么用,以及哪里需要小心的这样一个判断报告。 然后这里还有一个关键点就是你不要一开始就去搜很多的技术词,就很多小白会直接说,哎,帮我去找那种拍摄的爬虫,或者帮我去找一些什么项目,但实际上你完全不需要懂这些。更好的顺顺序是先说你想要批量整理 pdf 的 表格, 我要把视频转字幕,我要自动汇总一些公开的网页信息,然后让 ai 去找后选项目,然后让他去读懂 readme 和一些视例,然后再最终用一些测试的文件和脱敏的数据去跑一个小样,跑通之后再考虑自己要不要接入自己的工作流。 然后呢, github 也不只是可以放代码,就比如说之前我自己做了一个 store map 就是 门店信息的这种项目啊,就本质上就是把门店数据整理出来,再变成一个前端的看板。 那这种项目就可以在 github 上面去管理, pages 去发布页面, action 是 可以定期的更新, issue 是 去记录问题, release 去记录稳定的版本。所以说 github 也不是是程序员的一个代码仓库,它完全可以是我这样一个小白做这种清亮的项目的一个管理和发布的入口。 所以说最终总结一下,第一,把 gitap 当成一个项目的主页,不用先被这种代码啊去吓住。第二就是你可以看一些项目的名称, read me, 更新时间,然后再决定要不要试。 第三呢,就是你可以让 code 去帮你翻译成你能看懂的话,然后再用一些测试的文件和托米的数率数据去去验证。 最后呢,就是非常想强调一个点,就是免费开源就不等于它可以直接去运行,如果涉及到一些敏感的文件啊,账号啊,你的 api key 啊,或者一些权限啊,一定要让 codex 或者 cloud code 帮你解释清楚它会做什么,再决定要不要继续。 ok, 我是 fred, 后面我会持续用一些真实的案例告诉大家怎么把 ai 用到自己的工作流,我们下期再见。

面对全网热捧的 web coding 和 openclaw, 没编程经验的普通人到底能用 ai 编程做些什么?本期视频我会站在一个普通人的角度来聊聊这个问题,而且我还用 open ai 的 codex 做了一个试例,希望本期视频能帮大家打开一些思路。 我个人认为, ai 编程对普通人最有价值,也是最容易真正用起来的,就是提高工作效率。比如我平时会给游戏公司做广告素材提交出稿的时候,对我来说就是一个非常典型的重复劳动,单纯浪费时间。有这个时间我可以多写一个脚本,或者多做一个选择题。 刚开始我也想过在网上找现成工具,但很多这类工具都会压缩画质,完全达不到我的要求。我就想能不能直接用 ai 来帮我写一个批量加水印的工具呢?今天我主要使用的是 open ai 的 codex, codex 是 前段时间新推出的 ai 编程工具,目前 plus 会员和 pro 会员都可以免费使用。进入 excel 主页之后,点击这个 codex 就 会跳转到它的主页。我个人建议啊,最好把 codex 的 应用下载到本地,用起来更方便。打开应用之后,点击 add new project, 这时候就会弹出文件窗口,在电脑里找一个空间大的盘创建文件夹。比如我这儿新建了一个 test 一 之后, codex 写的代码文件都会保存在这里。因为我这个水印工具已经做好了,所以就直接带大家来看一下我前面是怎么一步一步把它做出来的。 一开始我只用大白话提了一个需求,我想做一个批量给图片增加水印的工具,水印位置可以设置,他思考后呢,给了一版初稿,我测试就发现了第一个 bug, 没办法选择本地文件,所有电脑里的图片不管什么格式都选不了。我又发现了第二个 bug, 选好原图和水印图之后呢,没有预览图, 这个是很重要的,因为没有预览图,我就不知道水印放的位置和效果怎么样,我直接就截图发给他。处理完之后,这个图片水印工具就可以用了。我们先来看一下成品,这里可以选择原图和水印图,选完之后,右边就会出现预览,这里可以调整水印的位置, 比如说什么右下角、左下角、中间等等,选项很多,这边呢还可以调整水印的大小,透明度也可以修改。而且 codex 还考虑到边距问题了,就是水印离图片边缘的距离也能调。最后再选择输出文件夹,点击开始批量处理,它就会直接把处理好的图片输出到你指定的位置。那如果我手动处理六张图,至少也得两三分钟吧, 现在有了这个工具,几秒钟就能搞定。有了这个图片水印工具之后,我就开始思考,在给游戏公司制作素材的时候,还有哪些步骤可以让 ai 编程帮我解决。 然后我就给 codex 补充了三个新的需求。第二个需求是批量处理图片尺寸和大小,因为很多广告平台对于图片尺寸和文件大小都有要求。第三个需求是把一张一比一的图片拆成九宫格,这种形式大家在平台上应该能经常看到。第四个需求是批量给视频增加水印, 连图片出稿都要加水印,那视频出稿肯定也是需要的。这三个新增的需求主要目的也都是为了帮我节省时间。我让 codex 把这四个需求整合成一个工具箱网页,首页要有四个按钮,点击就能跳转到对应功能。我测试后发现了一个共同的 bug, 四个工具都没有预览图, 而且都不能选择下载路径,我就截图反馈给他,他发现确实是同一个问题,然后就都修复了。我继续测试,发现视频水印工具还有一个问题,没有办法输出视频,接着反馈,接着修复,最后我就得到了一个完美符合我需求的工具箱网页,一起来看一下效果。首先可以看到首页有四个按钮,分别对应着我四个需求。这个页面排版其实挺好看的啊,整体是很简洁的风格,而且它还做了一些细节, 比如这个鼠标悬浮上去的时候,卡片会有轻微浮动的效果,这种小设计我觉得还是挺加分的。图片水印功能和刚才给大家演示的一样,就不重复演示了。接着看图片尺寸处理功能,我这里选了一张一比一的图和一张十六比九的图,页面里同样会有预览,还会告诉你输出规格和预估文件大小。选择输出文件夹之后,点击批量处理,它就会直接导出, 检查一下尺寸和文件大小都没有问题啊,非常不错。再来看九宫格功能,选一张一比一的图片之后,我们在预览区就能看到他已经把九宫格切好了,而且文件名也做了排序规则,方便后面发图的时候按顺序排版,这一点考虑的其实挺稀的,下载下来看一下 没有问题,每张图的尺寸和大小都符合要求,而且文件名都自带序号。最后来看一下视频水印功能,逻辑和图片水印差不多,也是选择原视频水印图,再调整水印参数。下载下来看一下。视频水印没问题,但视频没有声音,我在需求里是写了保留原视频音轨,我实际测下来,他目前还做不到完整保留音轨 判断,可能是浏览器本身对阴鬼捕获知识有限啊。不过作为出稿工具,我觉得问题不大,很多游戏推广内容的出稿重点是先让对方确认画面,所以这一点我个人是可以接受的。最后顺面对比一下 codex 和 jimmy 奈分别给我做的图片水印工具。在用 codex 之前,我也用 jimmy 奈写过同样的需求, jimmy 奈给的是原生的 html 代码,需要我自己把代码复制到文本文档里,再 另存为 html 文件功能。虽然没问题,但是从最终呈现来看,我觉得 codex 的 ui 确实更好,整体完成度更高。而且在制作的过程中,不需要我手动去处理代码,我只需要跟 codex 沟通就可以了。所以我觉得如果你没有编程基础,只是想解决一个自己真实存在的问题, codex 会更友好一些。而且最近 openai 更新了 g p t 五点四模型, codex 对 自然语言的理解能力更强了,大家真的都可以去试一试。 ai 编程对普通人来说,不一定是让你去做一个多么复杂的产品,也不一定是让你突然学会写代码,它更现实的意义可能是把你工作里的那些重复琐碎、浪费时间的环节想办法自动化,哪怕只是帮你省下半个小时, 长期来看价值都非常大。也许你做不出一个 app, 也未必要做一个什么很厉害的平台,但只要你能做出一个真正解决自己问题的小工具,那它就已经很有意义了。今天的视频就先到这里了,记得关注冲破新衣叉 ai 教学我是专业的,那我们下期再见。

当年人人嫌他碍眼,今天他成了 ai 时代的超级入口,今天啊,就来看一下如何手搓一个你的专属电子形象怎么走。 其实呢,在二十年前就有一个叫瑞星小狮子的东西了,不过呢,现在玩 ai 的 主力军啊,大多都是零零后了,如果你是八零九零后,看到最近这个扣带子悬在桌面上这个电子形象,脑子里会不会闪回这个老朋友呢? 那个时候啊,瑞星狮子呢,是常驻桌面会动,会提醒你,但很多人呢,并不喜欢他,对,我也不喜欢,我就觉得他很碍眼,甚至啊,有点烦,他还会打呼噜。 可现在呢,有意思的是呢, ai 时代呢,大家居然又重新爱上了这种桌面前置浮窗。这次啊, codex 更新了一个可以悬在屏幕上的小入口,把一个原本很抽象的功能变成桌面上一个活着的东西。 来这里,我给大家演示一下入口在哪里,这里的设置,点击设置外观最下面宠物这里啊有官方默认的形象,还有很多自定义形象好,如果大家自己感兴趣的话呢,自己就网上找就可以。 然后现在我新开个对话,让他来干个活,帮我在桌面上建一个文件夹,名字呢就叫电子宠物,然后帮我去找几张自定义的 q d x 宠物形象的图片,放在这个文件夹里。 我们看到这个小宠物呢,就在干活了,他会把工作进度显示在最外层,让你知道呢,他没有在偷懒。 其实这个我觉得还挺有用的,有时候因为一忙起来就会忘记他在干活,那有些工作呢,往往是需要你手动去审批权限的啊,一个不注意呢,直接就是一个下午时间浪费掉了。现在我们只需要点一下他,他就会快速的打开 pos。 好 啊,他应该在最后任务结束的时候会提醒我一下。好,我们看啊,已经完成了提醒你回来看看结果,这确实是一个有痛点的提醒功能。 我来看看他帮我搜了什么形象啊,有这个公主还有董王还是蛮有意思的。哈喽,接着我们继续啊,给大家看一下如何自己做一个电子宠物形象,也很简单,全程啊,跟 codex 进行对话就可以了。 首先啊,就是要先安装一个 skill, 叫 hatchpad, 我 跟 colex 确认一下这个插件是不是自定义的宠物,他说是的啊,那就 ok 直接叫他安装啊,我给了他一个明日香的形象, 这个图片啊,真的是做的不错,和我想象中的是一样的。接下来他竟然说还要制作九组动画姿态,那根本想也不用想,直接就是 ok。 继续, 这里我插一句, codex 的 能力啊,你们自己看吧,工作流程显示的很清楚,自己检查自己叫对他现在发现自己做的不合格,还在叫对,我们再等等 好了,已经完成了,我们再去设置里面看一下。 好,已经有了,我们选择然后唤醒一下,效果呢,还是不错的,测试一下这个宠物的工作状态, 整体还是不错啊,动态效果什么的都还做的非常好,其实他还是可以有更多的功能的,有兴趣呢,大家可以自己去研究一下。 其实啊,现在想来啊,当年小狮子大家不喜欢,也未必是桌面橱窗这件事本身大家讨厌呢,其实是一个能力不够强,却总想刷存在感的东西,特别是这个形象,如果不是自己喜欢的,那就是非常的不满意。我讨厌嘟嘟,怪你 以前的小狮子啊,霸屏打呼噜,今天的 ai 宠物呢,是真的要成为一个超级入口了,同一种外形,同一种拟人化思路,换了一个技术底座,用户的感受啊,就彻底变了。好了,那今天就说到这里,希望这次内容对你有所帮助,我是阿月,下期再见。

gbt 五点五被认为是目前最强大的模型,那对普通人来说,究竟能用它来做什么呢?所以我深度使用了几天,整理了四个超级实用的玩法。今天这条视频就来分享给大家,我们直接开始 第一个做产品调研。对产品经理来说,社交媒体上的用户反馈其实很重要,因为很多真实的吐槽往往不是出现在正式问卷里,而是出现在评论区 ready 的 这些地方。产品经理最怕闭门造车,但问题是这些反馈如果人工一条条捞回来, 分类总结起码一天起步。 gpd 五点五发布之后, cloud 官方发了一篇推文,解释了 cloud code 降至的原因,并做了改进说明。但官方的说法是一回事,用户买不买账是另回事。我特地把 cloud 这条推文下面的评论,以及 reddit 上一些用户的反馈都整理起来, 让 gpt 五点五帮忙判断用户到底在抱怨什么,下一步应该改进什么。可以看到 gpt 五点五的分析非常详细,它把内容分成了用户反馈、代表性评论、问题归因、信任评估、 行动清单这些大类,每个类别都给了对应的场景、应对方向和下一步动作。我们以前做这样一份表格,可能要花上两三天,或者是找第三方调研公司,但现在只要有足够的信息给到 gpt 五点五, 再结合 context 这个 open ai 自己出的 a 站的工具,相当于 gpt 五点五的手,它就可以帮你梳理的非常详细和系统化。第二个用法,做汇报 ppt。 以前我们用 ai 做 ppt 的 时候,主要看它排版好不好,审美够不够,但往往忽略了一个更重要的一点, ppt 真正发挥作用的地方不是好看,而是能不能推动决策。 毕竟 ppt 往往用在职场中一些非常重要的场合,比如转正报告啊、晋升答辩啊、年度总结。所以,仅仅美观是不够的,我们还需要一个聪明的大脑,帮你把背景、问题、方案、风险以及希望领导拍板的地方讲清楚。我 这次试着让 gpt 五点五模拟一个产品负责人的视角,做一个把 ai 客服系统延期三周的汇报。他直接生成了一个有审美、有内容,而且风格非常专业严谨的 ppt。 它不仅能够在你提供的信息技术上提炼出核心要点,而且所有内容,包括色块、字体、数据都可以进行二次编辑。 当然了哈,这个 ppt 肯定不能直接当做最终稿,但它提供了一个非常完整的框架,我们可以用它来梳理思路,然后再调整优化。第三个用法是制作动态科普。 现在 ai 的 概念越来越多,其中还有很多非常抽象的概念。有时候我们需要向朋友、同事或者非技术团队解释某个概念,口干舌燥说了一大堆,还是很抽象。所以用这种能看见、能操作的交互网页会更有帮助。我让 gpt 五点五制作了一个解释上下文窗口概念的网页, 他在左下角用一句话解释了上下文窗口的重点。 ai 不是 无限记忆,在一次对话里,他能记住内容是有限的,还形象的做了一个上下文占用比例的进度条。 我试着把指令文件、聊天记录这些拖进去演示,可以看到,当上下文占用量超载之后,原先的那些指令和文件就都被压缩,最后甚至被挤出去了,这比我们用抽象的文字去表达要直观的多。这个思路还可以延展 其他的 ai 概念,或者说是物理、数学概念,也可以让他做出来,比如让他讲清楚复利业变换或者背页式定义,这些都很方便学习。最后一个玩法是办公培训。以前企业要开展 ai 培训,通常是从外部找机构定老师, 老师需要根据企业的实际情况梳理课间,尤其是给行政、市场、销售、人事这些非技术部门做课间,然后再开展一到两天的封闭式内训, 这个过程既耗时又耗财。所以我就用 gpt 五点五做了一个通用的企业内训 skill。 当你输入需求,它可以自动生成一份系统且具体 可交付的企业 ai 内训包,里面有培训方案、培训课件、 ai 工具、应用表、学员练习册、培训测试题以及课后七天行动计划。 创建第一版 skill 大 概只用了十来分钟,让 codex 安装并测试之后,我发现两个问题,第一个是它生成的全部都是 markdown 文档,还需要转换格式。第二个是在整个培训方案中涉及到工具的部分,讲的比较泛,所以我把问题反馈给他,让他优化升级。 第二版改好之后,我就丢了一句,帮我生成一个 ai 办公室提效记录训练营的内训包,没给行业,没给员工画像,但它生成的文件清单是多样的,有 ppt、 excel、 word 和 markdown 内容。我们也来看一下。首先最核心的培训课间,他直接列了这样一个框架, 你可以按照这个框架填充具体内容,也可以再提供行业、企业背景信息,让 gpt 继续细化 ai 工具应用场景表,把市面上主流的文字、图像、视频模型都放进去了, 还匹配了适合的岗位任务场景提示词。在这个记录上,你再根据要培训的部门稍微二次加工一下,就能直接用了。实战比讲课更重要,所以在学员练习册中,他也把一些工作中的高频场景放了进来,比如整理会议基奥、分析常文档、改写邮件。 课后七天行动计划,按照学习难度和上路顺序做了一个任务表,第一天选择任务,第二天拆解任务,第三天写题词词,循序渐进。我觉得这个培训包有两个明显的优点,第一个是非常系统化, 你不用从零到一去想内训究竟要策划成什么样子,而是可以直接用这个框架来细化内容。第二个是延展空间很大,拿到这个初步方案之后,你可以再把脱敏之后的行业信息、企业资料以及员工现阶段的痛点、难点 丢给 gpt 五点五,让他去细化这个培训班,我认为他至少能省掉前期规划的工作量。那剩下的呢?就按企业实际的情况往里面填充具体内容。以上就是今天分享的四个深度玩法, gpt 五点五我觉得确实好用,能听懂话、会说人话、能干活。这四个玩法可能不像网络上一些演示那么炫酷,但根据我的经验呢,他们是比较能够结合实际工作去应用的方法。那今天的分享就到这里,下期再见。

如何给咱们自己的喷可露安装技能啊,也就是 skill 啊,就会列出很多很多的这个技能啊,也就是它的这个 skill 的, 然后这边每一个都是啊,每一个都是,然后咱们随便点击几个进去啊,这用它的名字还有它的介绍啊, 然后好多人他说想安装一个天气的,或者想安装一个 excel 的、 ppt 的、 办公的等等的查找啊, 查找的话大家可以看到啊,这边有一个搜索框,大家可以根据自己的需要去查找啊,比方说弄一个 api 的 输入以后,它会去自动搜索啊,技能啊,大家可以看一下啊,如果你在里面找到了你想要的技能啊,那你就点击进去啊,然后点击进去,它里面有名字还有介绍, 可以再详细看一下。如果你想安装了,想安装了以后,然后你往下翻,翻到底部,你看见这边有个文件啊,这边有一个文件,然后你点击 这个是什么文件呢?这个就是这个 skill, 也就技能文件的说明文档啊,这里面有他的名字叫这个,然后还有他的描述,有这些啊,这些,然后这个名字你要记住了,因为你一会要安装的时候需要用的这个名字啊,有需要用的这个名字,那咱们安装怎么安装呢? 然后打开你的终端,然后粘贴后边这个,后边有个就监控号,这个这个 sku, 这个你把它给删掉, 然后这个呢就是刚才你那个,就是说你那个技能的名字,也就这个,为什么说让大家记住这个名字,就这个名字,然后你复制一下, 然后你再粘贴,然后你按一下回车,这个时候他就可以啊,就是可以在这个给你安装了,这个时候就是安装了。好了,今天视频就给大家分享到这里啊,如果大家有疑问的话可以下方留言,喜欢我的视频也可以点点关注啊,最后谢谢大家观看。

这是我用 codex 做的动态图标,这些也是像这样的效果,我们现在不需要 ae, 也不需要 p r, 用 codex 就 能实现。那今天我把这个教程分享给大家,用到的工具是 codex 和一个叫 hyperframes 的 插件,点击左边栏的插件,在这里搜 hyperframes, 然后你会看到这个插件的详细信息,点进去再点击,在对话中试用。这里大家记得先添加好项目文件夹,确定好模型,智能等级和速度,然后就可以把题词放进去。比如帮我做一个 codex 和 cloud code 的 功能对比的分析,视频时长十五秒, 尺寸是横版十六比九,视觉风格是苹果简约高级风,需要增加一些动态效果的展示。 这里写错了哈,因为我用的是 ai 语音工具,完全是口喷的,有些词语可能会识别错误,直接改一下就行, 然后点击发送,让他开始做。你看他先是查了一下官方资料,确保这两个工具的信息是最新的,然后他还会去看 hyperframes 的 要求是啥,确定下来视觉身份,然后再去写 html, 他会主动在我们看不到的地方用网页去搜索资料,那整个的思考过程跟我们人类是一样一样的。他还会单独创建一个文件夹,因为我这个目录里面啊,其实是有其他项目文件的,所以他知道不能碰到别的。我把左边的边栏隐藏掉,现在整个页面都是我们的视频制作过程 他很快就确定下来,主画面用冷白、石墨黑、微蓝和暖金做出高级感。我觉得如果大家有更具体的风格,也可以直接在刚才提示词里面告诉他,那整个过程他会自己产出内容,然后检查有没有问题,再自行更正。这些你都可以看到, 如果不想管,就让电脑开着,让扣贷自己干活。那做这样一个视频大概花了十来分钟,然后文件的位置,他参考了哪些资料,最后都会告诉我们。来,我们看一下它的效果。 大家注意看,这只是第一版哦,我觉得已经非常惊艳了,完全没有预先做任何模板,已经可以拿去用了。那不管是发布在社交媒体上,还是工作汇报,都很顶。 实际上呢,它不仅是可以做这种图表,还可以做产品介绍。比如这个辣条的产品视频,你丢给 codex 一个网页,让它做产品或者品牌的介绍,也可以做一个像 open ai 这样的业绩表,那放在 ppt 里面简直是开挂。 你甚至还能让它做这种 logo 散落的视频,或者是宋代山水风格的 ai 发展史, 你给他一段提示词,也不用特别复杂,让他开干就可以了。一般来说啊,十来分钟左右就能做出来,那如果对效果不满意,再沟通几轮, 那到这里大家可能会觉得,哎,这好像没有什么难度啊,很简单,每个人都可以做。那我再分享几招进阶的方法。 第一个呢,如果视频中涉及到图片类的素材,像 logo 啊,或者人像,建议自行上传。或者呢,可以先让 cloud code 整理出这些 logo, 然后再把这个文件夹打包到项目里,这样失误会更少。第二个是关于审美和风格,如果不指定风格,他做出来的大概率就会比较大众化, 像科技风很容易就做成那种已经用烂了的蓝紫色,所以最好是提前指定风格。那我这里也列了一些,大家可以直接拿去用。 最后是音乐和音效,可以让它生成简单的音效,但是背景音乐呢?大家可以用 solo 生成原创的背景音,或者直接在剪辑工具里面把音乐库的素材放进去,最后我再补录一个哈。很多时候我们做动效视频会需要信息的专业性和准确性。 那对于科研、生物科学、生命科学这些领域来说,我比较推荐 bell render 这个插件,它能够把这些领域的一些复杂概念进行可适化。那结合 paperframes 它们两个就能把一些科研领域专业绘色的信息用非常动态的形式表达出来。 比如说我让他做一个 an apple a day keeps the doctor away 这句谚语背后的一个科普回答, 他就会给到我这样一个视频,我们可以看一下效果。 那我们今天的分享就到这里,我们下期再见。

今天我想分享一下我的 open cloud ai 分 身系统,它能够把你和龙虾的任何对话和任务,所有你感兴趣的文件、文本和网站,都自动地,智能地沉淀为 skills, 真正做到龙虾越来越懂你,越用越好用。借助 opd, 你 可以可以看到和修改所有沉淀的知识,让每次对话,每一个收藏都变成有价值的内容和知识体系。 那么这个视频我们会首先看一遍完整的效果,看一个个真实的输入是如何一步步变成长期的记忆以及 skills 的。 然后呢,我会说一下它如何安装,如何使用,最后我们一起说一下它背后的工作原理和如何定制好的。废话不多说,我们开始,接下来我们看一下完整的效果。 这套记忆系统有两个完整的入口来进行输入,第一个入口就是不论你用任何的聊天软件和你的 open cloud 的 日常对话和给他的所有任务。 第二个入口就是这个桌面上的盒马,我们呀,可以把文件拖进去,也可以直接复制粘贴一段文本或者一个网站的网址,它呢就会帮我们存到我们这个系统里面去, 所以我日常跟 open class 对 话都会推荐到系统里面去,比如这里我让它总结啊 serbian 这篇文章,那么这是第一个入口,第二个入口就是这个张开嘴巴的盒马,你可以给他 pdf, 可以 复制过去一段文本呢。这里呢,我给他一个网页的链接,就是我视频一直用的思维导图软件, 复制网站的链接之后给他,他就会吃掉这个内容,进入我们的系统,我们可以看到思路啊,是来自于 jobbox, 只不过我们是进入自己的系统,而不是去上传到云端了。而这一步非常重要,因为啊,真实的工作不只有对话,很多高价值的信息是来自文本、网页和收藏,这也就是这个盒马存在的目的。 看到会一直在我们的屏幕的这个角落,你可以调到他的位置,也可以关掉他。不论是在浏览器工作,还是在别的软件工作,都可以随时随地把资料给他。整个系统的记忆啊,分为好几层,在我们和 open call 对 话完之后,或者你把文件网址给到盒马之后呢,这些文件资料或者是对话就会来到第一层, 来更好地查看和编辑所有 macdunk 文件。这里我用了 obsidian 这个开源的笔记软件,你没有用过没关系,因为所有的操作 obsidian 的 操作都是 agent 来完成的,我们只是用来看和改。我还专门做了这样一个 welcome 欢迎页面,里面有着我们日常使用的时候需要看的几个网页,其实也不多, 从上到下就是我们整个系统慢慢沉淀的过程。系统的最上层啊,就是这个 main take 页面,这也最简单,用来收取信息,刚好未进去的这些资料啊,就会被系统首先接到。这里 可以看到系统已经把这些输入分成了 task 任务, decision 决定 content candidate 用来做内容,一些材料, its, research, material, 参考资料等等不同的类型, 也就是说它不是原样的堆砌,已经开始做第一次的分流了。比如这里,我们可以看到刚才给河马的网页链接和我们刚才 open cloud 的 对话,它总结的内容 main take 仅仅是接触信息不等,已经变成长期的知识了,里面的东西呢,很多还是原材料,比如刚才我们说的分类度还比较散, 那么从 maintake 出发,系统会判断它到底值不值得继续往下沉淀。如果值得,它通常会被挂到更正式的 markdown 文件里面去。比如这里我们展示的这个内容数的 project decision 和 content angle 的 下面的所有的 markdown 文件,它们呢,都是真理国的正式页面。 然后大模型会从这些更有价值的页面里面挑出真正值得长期保留的部分,提炼成后选的基液。这些后选基液啊,首先会被显示在 mainmemory distillation queue 等待内容的蒸馏。先说明一下,这里的蒸馏不是大模型训练里面的模型蒸馏各像是一种内容的提炼。我们来到这个页面,这个页面呢,就是把之前整理过的正式内容,刚才也说了,再往下压一压,提炼成更短更清楚,更适合长期保留的后选基液。 对这一页的内容都是后人,我们还要经过下一步的蒸馏和筛选。那么你可以看到这里有不同的内容。这里呢,你可以手动的审批,有四种选择,分别是你同意合并和其他的之前已经有的长期的一些记忆进行合并 升级。所谓的就是覆盖之前有的旧内容,用这个新的内容进行覆盖,或者是直接丢掉。那么如果你什么都不做呢,系统会自动判断,这也不用担心 这些内容啊,一旦审批通过,就会进入后面的长期记忆系统,但是呢,进入长期系统并不代表着这个记忆会变成最终的 skills, 只有系统发现某一种做法反复出现,反复有效的时候,才会把它升级成我们 open cloud 里面可以反复使用的 skills。 那 养出来的 skills 可以 在 main skill pack 这个页面里面看到也可以看到啊。这里列出来的都是系统已经比较稳定的会做的几类的事情, 比如说内容蓝图的生成啊,项目审查与证据回路啊等等。你可以看看每一个能力呢,都会说它可不可靠, 主要解决什么问题,以及什么条件下能够触发这个 skills。 那 最重要的是,这些能力还不只是停留在 obsidian 里面, 它呢还会继续被发布成 openclaw 原生的 skills。 刚才我们也说到了,比如这里,我们直接去 openclaw 的 文件夹,然后在 skills 目录下面可以看到,比如这 comptube 这个我制作内容的蓝图,这个 skill 已经在我日常和 openclaw 对 话过程中自己养出来了。那这里呢,我们就真正地把知识变成了 openclaw 能调用的行动能力。 最后,这套系统也是可以定制的。为此你并不需要专门先理解整个内部的结构,你只需要告诉它五件事情, 第一,你最希望他帮你处理哪些事情?第二,你最希望他长期留下哪些内容?第三,你最不希望他老记住哪些内容?第四,你现在最常做的重复工作以及最后。第五, 你希望他以后越来越擅长什么。我也准备了这样一个专门的提示词,把这几项填进去,就可以让系统慢慢的往自己想要的方向去沉淀和生长。 最后我说一下就是 macos, 你 要是用这个项目的话,所有的功能你都可以用,但是 linux 这个桌面的盒马,这个桌宠,这个入口你现在是不能用的,还不支持。那么欢迎大家去 t e 秀和 pr, 那 么我们这期就到这里,我们下期再见。

给大家分享三个特别实用的 skill 技能,用好它们能够大大提高你使用 cloud code 的 效率。对了,本期视频的文档版我会放到评论区。第一个 superpowers, 严格来说它不是一个 skill, 而是一个 skill 技能包里面集成了一整套开发需要用到的 skill, 它最大的作用就是帮你规范化开发流程。具体来说,它会把一次开发拆成几个阶段,就拿我前两天用它开发了一个浏览器翻译插件的例子来说。第一步是需求确认,当我给他说出一个大致需求的时候, 它会自动调用 brainstorm 技能,连续问你几个问题来确认具体的需求,你就像做选择题一样回答就行。需求确认完之后,就来到了第二步技术选型,它会给你列出几套技术架构方案,并给出采纳建议,如果你没有特别偏好的话,直接选它推荐的就可以了。第三步是写文档,技术方案确认之后, 它会写两份文档保存到你的项目里,一份是设计文档,一份是技术实现方案,这两份文档里已经包含了项目结构和核心代码的规划。第四步才开始写代码开发方式,可以选择普通模式,也可以选择 sub agent 的 模式。 sub agent 的 模式会同时派发出多个 agent, 并行开发速度更快。 每完成一个任务都会做代码审查,也就是 code review 全部完成之后还要整体审查,同时它会给你自动提交 get 仓库,总之装上它就再也离不开了。第二个是 cloud s u d, 它的作用很简单,就是在你使用 cloud code 的 时候,在终端底部加一个状态栏, 实时显示你当前最关心的信息。比如说这个会展示你当前对话的上下文额度还有多少,这个展示的是你五个小时之内还剩余多少调用量,这个展示的是你一周之内还剩余多少调用量。同时还会展示你当前用的什么模型,订阅的是什么套餐等信息。它的实际价值在于, 可以防止你稀里糊涂的把额都用完。当你看到上下文快满了的时候,可以主动使用 compact 命令及时清理。总之,用 claret code 不 装这个的话,你就等于是闭眼开车。第三个是 skill creator, 它是 claret 官方推出的一个用来创建 skill 的 skill。 你 可能会问,为什么需要自己创建 skill 呢? 原因很简单, claret code 本身的能力是通用的,但是你的工作流程是个人的。比如说你每次写公众号文章都要润色排版,调整风格。 与其每次都跟 cloud 解释一遍你的要求,不如直接做一个专属的 skill。 你 只需要告诉 cloud code 使用 skill creator 技能创建一个公众号文章排版的 skill, 目标是把 markdown 格式的文章排版成可以直接发布的公众号文章。他首先会问你几个问题,确认一下需求之后,他会按照规范 帮你把这个文章排版的 skill 创建好。后续想要使用这个 skill 的 时候,你只需要告诉 cloud code 帮我对这篇 markdown 文章排版,不需要告诉他怎么排版, 拉拉扣的就会自动调用这个含有固定排版样式的排版 skill, 帮你把 markdown 文章改造成可以直接复制到公众号发布的文章。好,以上就是本期视频的所有内容,如果对你有一点点帮助的话,别忘了点赞、收藏加关注,我是阿仲,下期再见。

ok, 重头戏来了,这一期主要给大家讲一下怎么使用 codex 和其他工程软件连接,然后完成一些工作。首先的话是 thirdworks, 我 们可以看一下它的工作流,可以看出 thirdworks 不 需要接 mcp 的, 它是会调用 thirdworks com 口,然后通过 vbs 脚本进行建模。也就是说我们只需要给它工程图或者描述我们自己的需求就行, 它自己也能打开 thirdworks, 但是我们自己打开的话会省很多启动时间。第二个的话去 matelab, 我 们看一下它的工作流, matelive 也不需要接 m c p, 我 们也只需要描述自己的需求就行。第三个的话就是 ency, ency 是 需要接 m c p 的, 但是我们可以让他自己接好,就是我们给他说一下,给 ency 接一下 m c p 就 行, 他就会自己接好。接好 m c p 之后,我们就可以通过脚本仿真求解了。当然以上这些操作,包括想要达到我在视频中展示的一键全自动生成,都是给他开放的完全访问权限不, 如果开放这个完全访权限也有一定的风险,大家可以根据自己的需求选择开不开。呃,当然也可以开这个默认权限或者是自动审查,这样的话他会在一些关键操作的时候征求你的同意,就很安全了。或者我们让他在指定文件夹工作,这样的话也很安全。

朋友们,今天我们主要来讲解一下,当你已经写完一篇刊刊论文或者毕业论文的方法结果以及结论,而对于整体的背景以及小棕树却无从下手。 接下来我将使用拆了 gpt 五点四以及 codex 对 整体的步骤进行一个完整的讲解。 首先我们要把我们目前已经写好的方法、结果和结论整合成一个完整的 word 文档。这里我选择了上传一篇我已经发表的 其他论文,将其讨论以及背景部分都全部的删除,仅留下了方法、结果一、结论。这时候我们要打开柴的 gpt 五点四的深度研究功能, 输入我们第一个指令。第一个指令主要是利用深度思考,深度研究去对我们目前的方法、结果、结论进行一个整体的分析总结,然后搜寻大量的相关文献,对前期的引言以及相关工作以及小综述进行一个初步的量化。 最后在完成相应的工作之后,深度研究会反馈我们一个 pdf 以及 word 文档。这时候我们把相关的引言部分单独摘出来,复制到我们的论文当中, 再将我们的论文作为第二个附件。这时候我们要采取第二个指令,调动 china gpt 五点四 thinking 大 模型。 这一步的步骤主要是通过五点四 thinking 对 我们整体前期完成的一个引言,一个初步的评判工作,并且要系统解锁我们的真实文献,并且尽可能地下载可获得的 pdf 全书。 这时候我们可以对前期深度研究所给的相应的小综述进行一定的判断。然后在我们第二步的指令当中一定要补全我们的研究方向,例如到底是电力电子电力系统还是相关的控制等等, 补足我们的论文主题以及我们相应的目标刊刊,如果合适的话,我们也可以在这里上传几篇,我们觉得比较满意,可以仿照 参考他的格式以及整体的背景写的格式的论文作为参考。这时候我们需要对我们已经写好的前期的 word 文档进行进一步的修改,补足相应的文献。随后我们要将我们的所有的文献都下载下来, 这时候可以进行第三步。第三步就是我们相应的先找文献,但不马上重写, 有可能前两步他给的文献质量并不是很高,这时候我们就可以先不写正文,先只对我们的研究论文引言以及相关的工作部分所需要的文献检查进行一个整体的筛选以及下载工作。最后可以进一步的提炼我们所需要的参考文献。 这时候我们就已经完成了使用拆的 gpt 的 主要步骤,但是经过我大量的书写,发现其实拆的 gpt 五点四 thinking, 它给的相应的参考文献以及写的小宗数可能会存在文献错乱,就例如它 就例如我们会发现我们看这篇文档像这样的相应的句子,它会引用长达多篇甚至数十篇文献, 但我们经过仔细的发现,其实它这时候引用的文献与我们的实际内容并不相符。这时候我们就需要使用 codex 进行进一步的文献的修改以及追踪。 这时候我们需要在 codex 当中先新建一个任务,然后在任务文件夹当中把我们所有的参考文献按着一二三四五六七八的顺序按着 引用的顺序标好,然后这时候我们再次使用柴德 gpt 五点四去给 codex 写相应的指令, 这时候我们主要的作用是让 codex 去阅读我们文件夹当中的参考文献,然后一一相应地去侦查它给 在我们 word 当中它给的参考文献的顺序以及内容是否正确,然后再让我们的 codex 去一步步的替代。 这时候我们会使用我们的第四个指令,这个指令主要的作用是先让 先要把这个指令给拆了 gpt 五点四,然后同时之后让拆了 gpt 五点四,输出可以直接复制给 codex 的 相应指令,这时候我们使用 codex 直接改我们的相应的论文,让它直接替代我们的 已经标错的参考文献,并最后让它标出来。同时最后这一步 codex 也会 输出相应的表格,就如同我们所示,他会其实会对我们每一个参考文献进行非常详细的总结。这一步在前期的文献调研工作的时候也可以尝试使用,我们会发现他对我们每一篇参考文献都 针对于方法和结论都对了非常详细的改革,并且对可信度都有了一个非常 客观的评价,同时它也会对于我们哪一条要真正的使用修改也会进行标注, 最后它会反馈我们一个新的文档,这时候我们发现对比两者不同的部分,新的使用 codex 修改之后的 word 文档,其参考文献与真实的文献内容可以对应, 这时候我们的小棕树就可以采用并进行最后的润色修改并使用发表。


你看啊,这张图不就全部帮你拆成 ppt 了吗? gpt 加酷 max 目前啊,是我认为最有效的 ai 工具组合了,不要总想着去订阅一堆工具,才能提高你的工作效率。欧本 ai 现在已经非常全能了, 做 ppt, 做插画,剪动画素材,做编程,还能养养电子宠物,基本上啊,还盖了你在工作中的大部分场景。那废话不多,先来看看做 ppt 到底有多简单。我们出发 ppt 这个东西啊,肯定是属于我们都市牛马的必备技能了。当我们需要做一个全新的 ppt 时,第一个难题就是要找个模板先参考一下,要不然啊,总感觉很难下手。好,那这个好解决啊,我们直接上手就用 ai 来搭建一个模板,一切问题啊,迎刃而解。 先到网上找一张自己觉得满意的风格图片,直接贴给扣带斯,让他根据图片的风格设计一个 ppt 模板,我们来看看他的分享, 深空星河、暖色地平线、山脉剪影、精细型典风格拆解啊,都很到位,要你自己来说啊,这话你可能还描述不出来,毕竟啊,现在 g p t 的 识图能力和作图能力已经是第一题对的了,绝大部分风格啊,都是手拿把枪。其实呢,现在也有很多 ai 工具啊,都可以做 ppt, 我 自己啊,也有试过一些,但是呢,总感觉差点意思。好的啊,这里啊,他已经完成了,我们来打开看一下怎么样, 这个风格啊,是不是比较简约?时间线啊,逻辑线啊,也都是比较清晰的,其中的任意元素如果有什么需要调整的,都可以手动来调。当然啊,如果通用的模板你还觉得不够用的话,我们就再给他升级一下难度, 把这个 ppt 模板改成更适合题案,而且适用于新品上市的投放计划。或者还有更简单粗暴的方法,直接跟他说出你的需求,要调研什么,达成什么目标。如果你没有思路的话,就跟他聊,聊出你想要的内容之后再让他生成 ppt, 一 气呵成。 好,我们来看一下成果,依旧是这个简洁的风格,注意看啊,投放计划的元素都有保留哦,包括人群、场景、节奏,必要的元素啊,全部都有了,怎么样?就这么两三句空话就搭出一个 ppt 模板,老板还满意吗? 那么接下来啊,我们来说一下做 ppt 的 第二大痛点,引用和借鉴。平时我们在做 ppt 的 时候啊,看到一个不错的内容,或者说啊,做的不错的模板,想引用借鉴一下的时候啊,却发现这是一个 jpg 或者 pdf 文件,没办法编辑,这个时候的心情啊,往往是崩溃的, 还我没事,现在我们来试着解决看看啊,先去网上找一个复杂的 ppt 样式,就拿这个图为例吧,我们使用一下这个 skill, 跟他说帮我拆成 ppt, 你看这不就搞定了吗?每个元素都是可以编辑的,这样是不是省事多了?当然啊,关于图片转 pdf 这件事啊,有很多工具都是可以办到的,并不算稀奇,但是呢,可能需要收费,或者就是要你看一段讨厌的广告。 那既然如此啊,还不如直接就用 codex, 因为叉 gpt 实在是太全能了。没想到除了编程能力以外,别的啊也是样样精通,不管任何需求,全部大白话跟他讲就可以了。 那总体来说啊,这个 ppt 功能就已经让你省心省力,提高工作效率了,基于提升生产力的消费投入都是智慧票价的。好,今天就分享到这里,大家还有什么想知道的评论区留言,我来帮大家试试。我是阿月,我们下期再见。

这临近过年,我们的国产模型真的太猛了。前面我做过两期视频,用同样的 prom, 同样的真实项目任务实测,对比了 cloud office 四点六, gpt 五点三、 codex mini max 二点五。 那期视频做完之后,评论区就有人让我测试一下质朴新发布的模型 gom 五,咱也是加班加点的干出来了,而且据可靠消息,过两天还有 deepsea 微视版本的发布,到时候也给大家带来一期真实项目的一个编程实测。 求一个一箭三连不过分吧?在这里要插播一下,当我准备去测 gm 五的时候,我去官网去订阅它的 cooling plan, 直接受庆了,就我的套餐买不到。哇,那如果按 ipa 计费的,我目前也没有找到。他们可以用 insulate 的 一个协议来测试 gm 五, 所以我就用了 ppl 他 们家的去测试,他们是非官方首发部署的 gm 五,一个开源模型的一个权重,那兼容安斯罗比的一个协议接到可拉扣的里面也非常方便,因为我之前的评测的话,都是用可拉扣的去做的嘛。所以说为了保证公平公正,我们也是用同样的 工具方的编程任务去做实测。好,我们先去创建个 api k, 这里我就写 gm 五 确认,点击复制好,我们开始进入真实项目的一个编程实测环节,也是同样的 prompt。 哈,那第一个任务的话,是把 我们另外一个项目里面完整的一个用户认证体系,包括邮箱、谷歌认证登录、 github 登录迁移到我有一个新的图片生成 a 级的项目里面,同时让它去做一个落地页, 需要考验它的一个代码理解能力,架构适配能力,一个工程规范。这个任务还算比较复杂,之前用 mini max m 二点五去测的时候,它花了三轮对话才完成的,那 op 四点六跟 gpt 五点三 colex 的 话,它们一轮对话就完成了。 那第二个任务的话是我本地有一个 skills agent, 它是一个终端 ui 交互的,我们把它做成一个外部聊天页面,让它保留 syncing 工具,调用流逝输出。这个任务主要考验它全站开发, 流势输出以及 u i u x 的 一个交互能力。之前测试的话, off 四点六跟 g p d 五点三 codex 他 们一人赢了一局,那下面我们就开始做 g o m 五的一个测试。 这两个项目现在都是开启了一个沙杯进者的模式去探索已有的代码。那右边的话,它弹出来一个让我选择想用的框架以及 u i 主键库,我就按我一个常用的方式去选好,它提示已经成功了。 好,我们打开了他给我们写的这个 y y, 哈,他把这个 skills 是 放在右边的,就展示我已有的一些项目,来测试一下它可用吗? 好,我们开始让他去总结这篇文章,看一下他有没有去做到加载这个 skills, 然后加载完了之后去执行一些脚本去做爬虫,然后再去做总结。可以看到这边他已经加载到这一个 skills 了,下面去执行一些命令 总结出来了哈。整体的话完成度还可以的,就是他这个 ui 上稍微会差一点点,相较于那个 gbt 五点三 codex 的 话,这个完成的没有 gbt 的 好。 左边这个窗口就是 cloud off 四点六写的,这个 ui 上确实会差一些。右边的话是 gbt 五点三 codex 写的,当时我是把票投给了他,那么同时去可以看一下刚刚那个任务,他们俩其实都没什么太大问题,不是特别难,后端也就 thinking, 然后做工具调用, 可以看到都是 ok 的, 没有什么太大的问题。好,下面我们去看一下那一个纹身图 agent 用户认证体系那块它完成的怎么样了? 可以看到它这个已经完成了哈,可以看到这个代码它已经写完了,我们先看它能不能一次性去启动,之前 mini max m 二点五这一块是没有做到一次性启动,我们先开新开一个窗口去测一下。好,我们可以看到 g m 五的话,它目前启动是没有什么问题啊,我们再看一下它实际的一个表现, 我们看一下它整个 ui 表现哈, ui 还行,那我们看它的那个认证功能可不可以用。我们先试谷歌登录,谷歌登录的话,它这块放了一个小 bug 啊,它把那个毁掉的端口弄错了,我们改一下。好,我们继续。 好吧,登录失败了,这边还是有些问题,你看到它登录的时候认证失败了,应该是数据库的表结构那块有点问题,从这么看的话, gbt 五点三 codex 跟 op 四点六还是要猛一些哈,就是它们没有这些问题。 好,我们再来选择谷歌登录,刚让它修复了一下, 好,他终于可以了。哎,有个问题,他登录成功之后没有回,没有进到我们的那个主页面,登录成功之后没有进到我们 agent 里面, 这个算第二轮对话吧,看他第二轮对话能不能搞定好,我们点击登录选择谷歌, 他还是没有修复成功,他还是要再刷新一下,看没有再刷新一下,进来再给他描述一下吧。现在还有个小问题,当我们认证之后,他先跳转了到首页,我再刷新页面,他才进到了 a 镜的里面。 在他这是第三轮了,就证明他在这个方面其实跟 mini max m 二点五差不太多,他们俩再点登录。 我靠,跟这个问题杠上了,他还是修复不了啊,还是有问题,你能不能好好深入去修改一下,去思考一下。 这是我们第四次对话,让他去修改这一个小问题哈,这个表现呢,就有一点不是特别好了,我们再来,如果他再再进不去,我就不撤了,这个就默认他四轮吧。 好,我放弃了。这个问题我不测了,他修他,我跟他一直对话,他修不了。我们之前测 gbt 五点三跟 colorof 四都是一轮。 ok, 我 们下面来看一下评分,整体的一个打分标准是第一个,我人为的去检测他们的一个功能完整性以及 ui 的 一些情况。那代码架构,工程规范,我都是把他们所有的代码给到 gbt 五点三, codeof 四点六,让他们分别去 review, 然后去打分。 它现在结果是这样子的, off 四点六,在第一个项目用户认证里面,它是表现最好的,它在功能完整度以及 ui 落地上是表现的比较好,并且是一轮就完成任务了。但是它的代码架构跟工程规范会有一些小问题, gpt 五点三扣贷 x 的 话,它的代码架构以及工程规范会比它好,而且是这四个模型里面最好的。那它的功能完整度呢?因为它漏了一个谷歌登录的一个前端,所以说这个评分稍微低一点,那它 ui 落地页的话也会稍差一些。 上一期视频测试 mini max m 二点五这一边的话,他是花了三轮对话去完成了这个任务。那智普这边的话,刚刚你也看到了,其实四轮对话完下来之后,他还有一些小问题,所以说评分的话,他俩其实差不太多吧,我个人感觉哈, 我们来看第二个,把这个 skills agent 做成一个外部 ui, 那 这个项目的话就是 gpt 五点三 codex, 它在业务完成上逻辑错误控制以及 ui 代码质量工程实现都是最好的。那剩下这三个的话,大家表现的都差不多吧,大家有优势的地方也有他劣势的地方。 好,下面我们开始进入 agent 的 实测环节,把 gm 五模型接入到我这一个真实的一个 agent 的 项目里面去,它是做自媒体视频拆解的, 主要需要去看他的一个速度,拆解深度以及表达一个真实感。那整个 a 型的工作内容的话,就是先去下载视频,做音频提取,转文字,然后去做内容的结构化分析,爆款元素的提取,最终输出一个拆解报告。好,我们下面开始吧。好,右边也完了, 我们来简单看一下哈,他们两边格式上会有一些差异。在拆解上我们看他这个结构拆解这块,他这个时间出其实是有问题的,他做的不对,因为我这个是十二分钟的,他是做了 十四分钟到十五分钟,那 g m 五这边的话,它也有讲一个时间戳吧。啊对,你看它有二十分钟,还有三十到三十五分钟都来了,所以说我感觉它在整个 a 帧的表现里面不是特别好啊,它这个拆解的深度也不太够,我感觉相较于昨天我测那个 mini max m 二点五的话会稍微差一些。 好,我们下面总结一下。把 gm 五接到这一个自媒体视频拆解的 a 帧里面,它的一个表现情况哈,整体上的话速度偏慢,就响应速度不算快,可能跟当前用户量大有关系,因为都知道它这个套餐都卖的受庆了。第二个的话,它的拆解深度的话相较于 mini max m 二点五会有一些稍稍不足。 第三个的话,它的一个真实感稍微偏弱一些啊,这是整体的一个表现情况。好,下面我们进入整个的一个总结环节,在编程方面的话,一句话,在我的这一个测试项目里面, gbt 五点三 codex 表现最好,比 off 四点六会好一些。 glm 五跟 mini max 它们的体感接近,都是开源的嘛,并且它们的成本非常低,所以说 对于一个高性价比的一些开发任务的话,我觉得这两模型都非常不错。好,这就是这一期视频的所有内容了,如果你觉得这期视频做的不错,一定记得给我一键三连哦。那下一期视频的话大概率是做 deepsea 微四,有可能是在过年那一天发布,我猜测哈,据可靠消息。好,那视频就到这里了,大家拜拜拜拜拜拜拜拜。

腾讯这次太有诚意了,把大龙虾做成和普通应用程序一样,双击安装就能运行,免去了所有的配置过程,连模型都不需要你再配置了,甚至每天还送你四千万的 top。 兄弟们,你们要是还没有装龙虾,赶紧收藏起来,我现在就给你们演示腾讯的龙虾到底有多方便。 首先啊,我们在 qq 的 官网下载软件,接下来啊,就把它当做普通软件一样,双击安装就可以了, 安装完以后就进入工作台了,什么都不用配置,而且还集成了一键微信登录好,我们进行登录 好,我们点击默认大模型,可以看到,除了他自己的模型,还提供了市面上主流的大模型,什么 kimi 啊, deepsea, 质朴千问啊等等都支持,你可以按照自己的需求接入啊,当然,如果你只是尝鲜的话,就用他的模型就行了,每天还有免费的额度赠送。 点击设置看一下啊,可以看到 token 的 用量,每一次的对话都有详细的统计,这样你也知道做一件事情到底需要消耗多少 token。 再看技能管理啊,官方默认已经给你集成了非常多的技能,包括云备份、邮箱文件整理、规则配置、腾讯文档等等,甚至还有小红书。 再看远程通道,这里可以快速绑定手机 app, 方便手机直接操作。我们绑定微信, 弹出二维码,只要用微信扫码就绑定好了,完全不用什么开放平台啊,什么 secret key 的 配置啊什么的,就是一个扫描,简直对我们普通用户太友好了。好,我们扫码扫码绑定, 如果你还不知道龙虾能用来干什么?官方还给你提供了一个虾灵感的功能,我们探索一下灵感广场啊,这里提供了非常多的灵感供你参考, 比如啊,日程安排啊,创业点子啊,市场调研啊,学习规划等等等等,大家也可以评论区说说你最想用龙虾来帮你干什么?回到主页啊,顶部有一个工作室的按钮,这个非常的好玩,我们点进去 可以看到你的龙虾正在烧烤啤酒,是不是太悠闲了呀?这必须得给他安排起来,先跟他说你好 好的,龙虾已经开始干活了,第一次对话吧,龙虾希望跟你相互认识一下,让我给他取个名字,还有他的工作风格。嗯,那我就叫他一号员工,让他正经一些 好了,用不了多久就配置完了,龙虾已经建立好了持久的档案,养虾的旅程就可以正式的开启了,是不是很有意思,而且非常的方便啊。 兄弟们,你们有没有每天需要重复做的事情,评论区里说一说,大家一起给你支招,怎么用龙虾来解决你的重复工作,反正龙虾是真的解放了我很大的重复工作啊。后续我也会持续的介绍我是怎么用龙虾来帮我高效干活的。好了,有兴趣的小伙伴可以关注一下,拜拜拜。

前两天我做过一期视频,用同样的 prompt, 同样的真实项目任务实测,对比了 cloud ops 四点六和 gpt 五点三 codex 那 期视频做完之后,评论区有人问 国产模型能不能也拉进来比一下,这次机会来了,这一期视频我要做两件事情,第一个,把上期那两道编程题原封不动的丢给 mini max m 二点五,看看它在同一张考卷上能拿多少分。 第二个的话,我有一个自己一直在用的自媒体 agent 的 项目,之前跑的是 mini max m 二点一,这一次直接升级到 mini max m 二点五,看看他在真实的一个生产电路里面升级到底带来了什么。看过我视频的人都知道哈,我做评测比较关注模型,他在一个真实任务里面的一个表现。 好,我们正式进入编程实测环节,我直接附用之前的两道题, prompt 一 字不改。第一道题的话,是把一个项目里面完整的一个认证用户体系 直接迁移到我有一个图片生成的一个 agent 的 项目里面去,同时再让它做一个落地页,需要考验它对于另外一个项目的一个代码理解能力,架构适配能力以及一些工程规范。 那第二个项目的话,我以本地有一个 skills agent, 之前是做的是终端 ui 的 一个部分,那这一次的话,我希望把它升级成外部 ui, 并且它要保留 string 工具调用流逝输出的一个完整链路,这个就考验它的一个全栈开发能力,以及它的 sse 流逝输出,还有 ui 方面的一些交互。 上期的成绩是 cloud op 四点六和 gpt 五点三勾代码各赢一局,那这一次我们把 mini max m 二点五加进来,看一看它的结果怎么样? 好,开始测试,两个一起弄,可以看到右边这个它识别到我们要做的是一个全单元 y, 它去加载的那个 front designer 这个 skill, 那左边这个项目的话,他发现他是需要去探索已有的项目,去找到那边是怎么做 get up 登录,怎么做谷歌邮箱登录的。先去探索嘛,先去开 saf 界面的探索, 可以看到他这边已经构建成功了,现在在进行一些后端跟前端的验证,整体这个过程测试下来的话,他会遇到一些变异问题,他也自己去修复了。待会等他测试完之后,我们来看一下他跟 cloud 四点六以及 gpt 五点三 codex 同样的代码,同样的提示词完成了一个效果怎么样? 那左边的话先让他一直跑,左边这个任务要重一些,可以看到这个地方他说项目已经启动了,然后他还专门创建了一个简单的启动脚本,来方便我后续去使用。之前我在测试 mini max m 二点一的时候, 有一些开发任务,前端后端写完之后,我需要手工让他去给我写一个 start 点 s h 的 脚本,这一次让你可以看到他在这个过程他自己去发现的这个行为,这一点点赞。现在他说已经完成了,我们现在开始去测试一下 这个就是他把那个终端 ui 变成了一个外部 ui 的 一个版本啊,可以看到左边他已经把我们已有的一些 skill 加载出来了,这个是没有问题的,下面我们来测试一下,给他一个任务,看他能不能去做到加载对应的 skill, 然后工具调用 simi 以及流逝输出都没有问题。好,我们开始 这个申请的过程,看起来没有问题,加载技能也还行,那看他执行命令 ok, 他 也调了对应的工具,只不过这里的这个图标他刚刚是有些问题的,这个状态是有些问题,有个小 bug。 那 整体的话,这一个过程其实已经把我们终端 u i 想要展示的东西已经展示出来,只不过有些小瑕疵。那之前那期视频的话, 也测了 cloud op 四点六跟 gpt 五点三 codex 嘛,左边是 cloud 的 模型,右边是 gpt, 当时我是把票投给了 gpt, 不 管它是从 ui 交互还是它整个功能交互上,明显 gpt 五点三 codex 要优要好一些。我们也可以来测试一下,直接给他一个链接吧,看他怎么怎么搞。 他也在申请,他也在加载技能,那明显能看到 gpt 五点三 codex, 他 做错做的要好一点,对不对? 好,下面我们开始去看他做的那个用户认证那个项目,那做用户认证迁移这个项目的话,其实比我们刚刚看到的任务其实要复杂一些,因为 他需要从另外一个项目去探索,找到想要的东西。其次他还得在这个项目里面去,在各种代码里面去找到他要在哪个地方去修改,前段是要修改哪些,后段是需要修改哪些,所以整体上他的复杂度要高一些。也可以看到他其实并没有一次性去完成这个任务,中间也报错了,我也跟他去沟通交流了, 那最终的话是跟他对话了三轮,他才把这个任务完成了。那这个任务在之前 op 四点六以及五点三 codex 测试的时候,他们是能一次性通过, 跑的时候没有问题,项目也能起起来。那 mini max m 二点五这边的话是有一些问题,我对话了三轮,然后把这个任务搞定了,我们来看一下他的一个表现。 好,我们先看左边,左边是之前 call 四点六写的落地页嘛, 光看 ui 其实没什么难度,因为这个项目主要是考察他去另外一个项目里面把后端代码找到,把对应的数据库找到,找到了之后再放到另外一个项目里面。所以说整体是需要看它的代码实现的功能,比如说这个 get up 登录可不可以,谷歌登录可不可以, 以及它的代码实现的怎么样,因为涉及到登录嘛,肯定安全性这些要考验。下面我们来看一下 mini max m 二点五它这个 ui 写的还可以的,比这两可能稍微会好一点, 那它的这一个谷歌登录跟 get up 登录的话也是 ok 的。 好,我们来试一下它这个谷歌登录 好,可以看到它,其实谷歌登录是 ok 的, 那我这个其实就是一个纹身图的一个 a 帧嘛,那它整体完成度啊,也还可以,但它不是一轮完成的,它中间有一些包的导入错误,还有些细节性的问题没有做的很到位。好,我们来一个整体的一个评分对比。 关于这个纹身图的 a 帧的项目的话, call 的 off 四点六表现优异一些,得分是八点二,那 gpt 五点三 codex 它因为漏了一些功能,所以说它评分要低一些,但是它的整个代码价格、工程规范是这三个模型里面完成的最好的。 那 mini max m 二点五这边它的得分就稍微要差一点,整个的功能完成度还 ok, ui 的 话会比它俩会好一点,但是它的代码架构跟工程规范会偏弱一些。好,下面我们开始做 agent 的 实测,把 mini max m 二点五放到 我已有的一个真实 agent 的 项目里面去,它是做自媒体视频拆解的,之前接的是 mini max m 二点一,这一次升级了, 我们重点看三件事情,第一个是速度,第二个是他的一个拆解深度,第三个的话是表达一个真实感。好,我们现在准备两个窗口,左边的话我准备用来测试 mini max m 二点一,右边的话我们测试 mini max m 二点五。 好,我这边找了一期我之前做 skill 原理讲解的视频,我们同时去点击看左边跟右边他的一个整体的一个速度以及拆解的深度,再看他的一个其他的表现。开始好,这边有点慢,但没关系,我们来看一下, 我们把这个展开,这个也展开,从这个可以看得到,它其实右边会稍微快一些哈,但是这个先不管,因为这个部分的话是跟 a 镜头没有关系,去做语音转,文字是本地的一些模型去转,等他把这些字幕内容提取到之后,我们再看他们的一个速度。 好,现在开始了,大家能明显感觉到吗? mini max m 二点五的是不是快的特别多? 这边已经做完了,这边就是还在,还在做, 那在速度这一块,他现在提升真的非常的明显,特别快,那他最终输出这个结果,我们要怎么去做评测呢?到底是左边的好还是右边的好? 我不能以我主观的去选择哦,右边好,左边好。所以说我找了两个模型去做评测,我们把任务给到它以及它的产出字幕内容全部给到两个模型,第一个是恰当的 gpt, 第二个是谷歌的界面,来去看这两个模型到底哪一个分析的这一个深度, 以及他的一个真实感更强,最终得出的结果。我们来讲一下,那整体的一个结果的话是 m 二点五肯定是提升的蛮多的,第一个是速度变快了,第二个是他拆解的更稀了,第三个的话是他的一个真实感更强了。好,下面我们来做一个总结。 一句话的话就是当前我们这个任务的评测的话,在编程这一块 codex 要领先一些,那 off 四点六要辞职, mini max m 二点五的话更适合做一些速度优先以及你追求性价比的快速落地的一个场景。好,这就是这期视频的全部内容了,熬了一个通宵做的,如果觉得这期视频做的不错了,记得给我一箭三连,大家拜拜。拜拜。