啊,趁着五一假期,我全程用大白话提示词啊,深度适用了腾讯的 codebody 和智捷的翠森这两款 ai 的 编程工具。嗯,说实话哈,我能感受到普通人能轻松做开发的惊喜,这时也发现了一些短板和糟点啊, 这次测完啊,我必须告诉你啊,不是所有的 ai 编程工具都适合你,那选错了反而浪费时间。那今天啊,我就把我试用的真实的上手感受分享给大家。 嗯,先说说 codebody, codebody 是 腾讯出的 ai 的 编程助手,是国内的产品,它的中文支持比较的好。 那他有这么几个优点啊,第一是真的能看得懂中文的需求,你可以直接用中文告诉他啊,请帮我做一个登录页面,他就能帮你写出来。那不用学英文提示词,也不用懂代码的语法,说人话就可以了。 那对于零基础的人来说,这一点太友好了。那优点二就是啊,腾讯云生态打通, 那如果你以后想把做好的东西直接部署上线,那 cloud 八 d 和腾讯云是直接互通的,不用折腾服务器配置,几步就能上线,省了很多的麻烦。当然啊,它的弊端也非常的明显,那复杂需求它就容易跑偏哈, 我测试了一个稍微复杂一点的功能,让他做一个带数据统计的后台管理页面,那他给出来的代码逻辑上就有问题,而且改了一处,另另外一处又出错了。那对于零基础的人来说呢,这种情况很难自己排查。 那还有一个弊端,就是他的免费额度比较有限,那用多了会提示额度不够,需要充值。那如果你只是偶尔用用,问题不大, 但是如果你想靠它来做项目啊,成本是要算进去的。那我们再说说这个吹声音,声音是字节调动公司出的, 那那声音的版本是专门针对国内用户优化的,那用的是国内的大模型,那他有第一个优点,就是上手门槛非常低,那界面设计非常简洁,打开就能用 啊。我让一个完全不懂代码的朋友试了一下啊,十分钟就能做出来一个非常简单的网页啊,这个速度啊,放在以前根本是不可能的。那还有一个优点就是对话式开发体验。好,那崔新他支持你一边聊一边改 啊,比如你说这个按钮颜色我不喜欢换成蓝色,那他直接就去改,不用你找代码在哪里改。 对于零基础的人来说,这种交互的体验是非常的自然的。它还有第三个优点啊,它是完全免费的,目前催生是免费使用的,没有额度的限制。那对于刚入门的人来说,这是最大的一个优势,可以放心的折腾,反复试错。 但它也有弊端啊,它的弊端就是复杂的项目,它的稳定性不够。那我测了一个需要连接数据库的项目啊,崔森中途出现了几次理解的偏差,需要反反复复的来纠正。那简单的项目没问题啊,复杂一点的项目 啊,你需要有自己的判断能力才行。那还有一个弊端就是生态还不太完善。那相比于这个 code 八代呢? 腾讯云生态,翠森在部署上线这一步,还需要自己来折腾。那对于完全零基础的人来说啊,这一步 可能就是个坎。那到底选哪个呢?我的建议很简单啊,如果你是一个完全零基础,想低成本试水 ai 编程的,你选翠森,免费易上手,对话体验也比较好, 先把感觉找到,再考虑其他的。那当然,如果你有一些基础,想做完整的项目,考虑上线部署,那可以选 codify, 腾讯云生态打通,省去了后续的非常多的麻烦,长期来看可能会更省心一些。 那真正的强大不是用最贵的工具,而是用最适合自己当下阶段的工具。 那最后再说一句啊, ai 编程工具它不是魔法棒啊,它能帮你写代码,但不能帮你想清楚你想要什么。那在用工具之前呢?先想清楚你要解决什么问题,那工具只是手段, 想清楚目标才是真正的起点。我是分享,做了十七年的程序员,现在专注 ai 应用实战。那如果你也在学 ai 的 工具,那点关注,我会持续的分享真实的测评和实战经验。
粉丝454获赞1224

自从有了 ai, 咱们做 ppt 似乎都变得更加简单了,各大 ai 大 模型呢,也都推出了一键生成 ppt 的 功能,不过想靠 ai 一 键生成省事,还是经常会遇到各种各样的限制。 今天呢,给大家推荐的这款是我们本地部署的全自动 ppt 神器,在 github 上面拿到了三点二 k 十大啊,解决了所有的痛点,咱们新手也能一分钟搞定。那接下来大家跟着我一起来操作,咱们去到 codebody 这个网站点下载去安装它,咱们打开 codebody, 点击克隆仓库,接着在我们的 github 上面把我们这个项目的仓库链接直接复制到这个窗口里面,他就会自动下载,都看到这里的请帮忙点一个关注,这对我真的很重要。 下载完之后呢,打开在右边用自然语言告诉他,帮我们检查相关的依赖,没有的话就帮我安装啊。接着他就会依次的去帮我们检查对应的需要的内容, 然后将你要做的 ppt 的 参考内容直接给到他,可以是你自己的文稿,也可以是微信小红书等等的链接,根据提示操作,咱们最后就会得到完整的 ppt 内容。 那么这款工具呢,也是 ai 驱动的 svg, 也是文稿生成系统,本地部署超级安全,生成的 ppt 不 仅能够编辑模板,颜值也是拉满的, 内容生成更加的贴合需求。我们来总结一下整个操作全程只用到的 id 工具,加我们 get 仓库,纯自然语言的交互,没有任何复杂的代码,一分钟就能完成我们的部署和使用。 掌握这个思路,以后做 ppt 再也不用熬夜了,还能解锁更多的 ai 办公技能,效率直接拉满。那么今天内容就到这里,我们下期再见!

挑战,每天讲透一个 ai 知识点,今天是 work party 制作 qpt 文档,一般我是不建议就是去操作啊,所以这个里面大家需要注意一下啊,就是要对内容做一个精简啊, 不要上传什么几百兆啊,什么一个 g 的 文件,这样的话整个上下文 token 可能就消耗比较大啊,这个积分可能一下就用完了,所以大家可以注意一下,然后把之前的这个啊关一下 啊,然后你看他会去生成各种各样代码啊,这里面大家有些内容可能看不懂,没关系啊,他其实是在帮你去这个写了一段 python 脚本啊,他是用程序化的思维帮你去解决问题的, 所以,呃,这个 workbook 里为什么这么智能呢?就是因为他可以去写代码的方式帮你去处理文件,相当于他帮你开发了一个软件,这个软件现在在帮你干这些事情,所以他为什么这么智能,是因为大模型收到你的需求之后, 它会帮你返回一些 python 脚本,那这个 python 脚本由 workbody 去拿到大模型返回了代码之后,在本地新增这些文件,然后就执行这些文件啊,执行出来的结果就是大家想要看到的这个文档, 所以这个是它的一个工作逻辑啊。那最终跑出来的一个结果是什么呢?大家看这个就是最终跑出来的一个结果啊,就是啊,我们可以看到它生成了这么一个 ppt 的 一个文件,是吧?在这个地方 大家看这个是我之前生成的一个效果啊,大家每次呢生成的效果可能都会存在一些不一样的地方啊,就是就看到的,就大家具体看最终生成的是什么啊?每次效果都不一样,包括这个风格可能也不太一样,大家也可以提具体的需求,让他去改这个模板的风格啊。 好,然后针对这个场景我给大家提些建议啊,就是我们肯一定要说清楚这个目标啊,不同的读者,他决定了文档语气的这个内容还有深度。然后就是,呃,要一次性说清楚结构啊,就大家尽量第一次提问的时候就把需求说清楚,比如说 ppt 的 页数、章节,还有必须包含的这个模块, 然后修改时直接说出差异,与其重写的话,不如直接明确的提出,哪里需要补充增这个删减或者调整风格啊,这是他一个建议。

hello, 下班了,今天跟大家分享一下我日常是怎么用 codebody 的, 那么我前两天也说过,就是 codebody 是 腾讯的一个 ai 工作台,那这两天也相距推出了像 workbody 这样的产品,那么我也分享一下每一天我都是在怎么进行我的工作。 首先呢就是 workbody 或者是 codebody, 我 们常用的哈,其实它就是一个 ai agent 工具,但是呢它是一个在你电脑里面住着的一个助手,那你可以给他指定一个文件夹,那这个文件夹就是他工作的一个目录, 这个文件夹就是跟你电脑的文件夹一样的,所以你登录上这个 word body 之后呢,实际上你就可以给他指定一个文件夹,比如说这个项目的名字就是这个文件夹的名字,然后呢你就可以开始工作了。怎么工作呢?就是用自然语言去跟他聊天, 比如说举个例子,我要写一篇文章,我要写一篇调研报告,然后这个时候呢就会涉及到他的一个搜索功能, 它怎么能够搜索呢?当然原装的它可以有一些 m c p, 那 么这个 m c p 呢,又是一个新概念了,叫 model context protocol, 就是 相当于你用了一个标准的协议去对接到网络上的一些资源,相当于你 把本地跟网上的信息联系起来。我最近常用的叫 super s e r p e r 这个 m c p, 它是可以用谷歌的搜索,那这个非常重要,因为你用了这样的搜索,你就可以提高信源的质量,这是第一个。 然后我日常的工作状态是什么样子呢?就是首先我上班的时候会跟 ai 说今日规划,然后 ai 就 跟我说, ok, 启动这个 daily focus 的 skill, 这个是我提前预定好的一个 skill, 那 啥叫 skill 呢? skill 就是 技能包的意思,那么怎么做一个技能包呢?就是你可以跟 ai 说啊,我要做一个让我聚焦每天工作优先级的一个 skill 啊技能包,那你要帮我去做一下,但是我现在还不是特别清楚这个过程是怎么样的,然后你来问我一些问题,这样我可以告诉你我的需求,然后就可以开始启动这个 skill 的 制作。 ok, 等到 ai 写代码写,写了好多东西以后啊,然后把这个文档 skill 的 文档写好之后,你就可以开始每日工作规划了。然后大概能做到的呢,就是让你每天先把脑子里想的所有东西都倒出来,然后它就根据你的优先级进行排序。 那当然这个优先级可能就会涉及到记忆系统,那这个记忆系统可能又是另外一件事情,那这个稍后再跟大家说,然后你就可以开始根据你的优先级排好今天的任务,然后你看看是不是要这样规划。 相当于我有一个秘书就每天都帮我在做任务规划,然后每天我完成工作的时候,我跟他说总结一下今天的情况,就帮我生成了一个 今天工作规划和完成任务的一个文档,我今天的文档就是应该是三月十号吧,对,这就是我今天的一天的工作回顾。 有的时候呢,我会用另外一个 skill 叫深度研究,对我这个深度研究就跟他讲的就是他可能去网上搜很多信息,帮我搜一些报告回来,然后帮我去做一些系统化的梳理,这个过程中呢,你可以参与,也可以不参与, 你不参与呢就等着他给你报告之后你再审查就可以了。如果你参与呢,就是过程中你其实是可以看到他每一项任务,他在怎么 怎么执行,搜了哪些文献,做了哪些总结,这个过程你是全程可以看到的。这个时候你跟他说 你现在搜的这个方向不太对,你要去搜一些英文的文章,最新的论文等等,你会可以跟它去调整它的搜索的方向,然后搜回来你就可以去再做新一轮的调整和校对和审查,这是一个协同 工作的一个过程。当然这个深度研究也是一个我提前定义好的 skill, 那 这个 skill 里面除了搜索之外,除了总结文章之外,我还给他提供了一些建议。比如说你搜完之后,你首先要批判一下 你搜的这些内容,你要从不同的角度来去看一下他是不是合适。那比如说你从一个严谨的逻辑学家的角度,从一个演化经济学家角度,从一个创新专家的角度,从啊一个历史学家角度,都分别给我一些建议, 对这个文章进行一个评论,然后你再去重新校对和输出一轮,看看有没有事实错误,看看有没有严格的这种逻辑问题。然后这个时候你再把成果输出成一个文档给我, 那因为 codebody 和 wordbody 就是 都在你本地电脑中工作,它是可以把一些文件的内容写到你电脑中去的,就变成了一个 markdown 文档,那这个时候你就可以基于它的产出再继续工作,继续干活。 所以我每天上班的状态就是打开 codebody, 然后跟它对话,然后现在的对话呢,之前还是打字,现在完全不用打字了,都是在说话。 然后我接入的是微信输入法的语音功能,就是在微信下面有一个开关,你可以设置一个快捷键,然后按住那个快捷键,你现在在输入,他就可以变成文字。那这个好处呢,就是说话比打字是快很多的,然后你在他说完以后,基本上就是通过嘴指挥电脑干活。 然后我们现在日常上班就出现一种很有意思的状态,就是我跟我的同事,大家两个人都在非常小的在在在说话,指挥电脑,所以这个也是一个常用的能力。当然我还有一个最常用的就是这个会议就要转写, 或者是录音的转写,然后这个呢,我之前呢都是在网上用腾讯会议来去做文字的转录,后来呢,我发现可以本地装一个模型,在本地就完成这个会议内容的转写,这样呢其实它更可控一些,而且就都完全存在本地, 相对来说更私密一些,所以就又下载了一个模型,每次有新的语音进来之后,我就跟 coldbody 说,你帮我进行一个转写,当然这个转写也是一个 skill, 就是 他提前提前跟他说好的,每次遇到这种情况,你该怎么处理,用什么脚本,他已经都固定好了,规划好了 好,这是几个常用的给我的能力。另外还有像我刚才说的记忆系统,这个之前我也有一期视频专门跟大家讲过,就是怎么搭建你的记忆系统,其实并不复杂,然后很多朋友说想看看具体是怎么搭建的,但实际上就是你跟 ai 对 话,你就跟他说我要搭建一个记忆系统,你的目标是什么?你就是想把 你的日常的偏好,就使用 ai 的 偏好,或者是日常跟它对话的记录,以及它提炼出来你的核心特征, 到底你希望他记住你的是什么,你就跟他说就好了,他就可以帮你写一个记忆框架。然后这个时候呢,你再跟他说,你要去网上帮我找一找有没有其他非常好的记忆系统的推荐,他就会给你一些推荐,然后你就说那参照这个来写一下吧, 对,就完成了。那这个记忆系统的好处就是每次我打开的时候,他都会优先的去调一下我的记忆系统中,最近我在帮我排一些优先级,所以整个的工作流程现在 就对我这么一个屁人来说非常的灵活好用。对,因为今天的 workbody 的 上线呢,就是非常的火爆哈,然后包括我们今天上午的云服务器都挂了,用户量太大了, 所以就是也是跟大家分享这些这些这些小的方法,就核心其实就是把它作为一个你电脑中的一个工作助手,让他帮你去 读文章,写文章,修改文章,跟他去讨论,做一些思维的互动。然后整个这个过程中,其实第一个阶段还是人在环中,它跟 openclop 不 太一样,就是还是希望你要参与到整个工作流程中, 当日后等你的工作流打磨的熟练之后,可以用一系列的 skills 把这些工作流串起来,这样的时候你就再把这个自主性更多地给到 ai。 对,所以其实我们跟 workbody 的 团队合作非常的密切,然后之前也一路看着他们的这个产品成长起来,我们给他提了很多建议,包括我这个带货哈,就经常给他,他们家这个产品啊带货我们也一路打磨,就觉得还是非常好用的,目前的一个状态,所以大家不妨去下载一个 workbody 去试一试。 刚才我讲到的很多 skills 听起来很复杂,但是你只要跟 ai 说你帮我做一个什么什么什么 skill, 它就可以帮你完成, 所以其实一点都不难,然后动起来和真正用起来是最难的一件事情。然后过两天我们继续在研究院和腾讯的官网上会有直播,大家说周四晚上,到时候大家可以看一看,拜拜。

大家好,我是手软猫咪。今天这期视频,包括你现在看到的每一页画面,都不是用剪映、 pr 或者任何传统剪辑软件做的,它是 ai 写的一堆网页代码,然后直接渲染成了 mp 四,没有时间轴,没有关键帧,没有拖拽素材。 整个过程我只做了三件事,写文案、录音频,把东西丢给 ai。 可能你会问,这有什么意义? ppt 谁不会做?意义在于这套流程一旦跑通 以后,出同类视频的编辑成本几乎为零,换个文案,换个音频,同样的风格,同样的质量,几分钟就能再出一条。接下来我把整个流程完整拆给你看。先说整体思路,就四步。 第一步,写文案,就是你现在听到的这些话,先把要讲的内容写出来。第二步,生成音频,你可以自己录,也可以用 ai 配音,录完之后用剪映之类的工具把气口和停顿剪干净。现在这句话就是我用阿里的 cosy voice 训练的自己的声音, 听起来我觉得还是挺不错的。导出一个干净的音频文件。第三步,生成字幕,把音频丢进剪映或者其他语音识别工具,导出 s r t 字幕文件, s r t 里面会标记每句话的起止时间,精确到毫秒,这个时间信息是后面的关键。 第四步, ai 生成画面,把 s r t。 字幕文件丢给 ai 编程工具,比如 color code 的 或者 open code 的 这些模型用什么都行。 这期就是用 deepsea 生成的,效果一样好,告诉他按照这些时间戳每句话,生成对应的 html 页面。最后用 hyperframes 这个开源工具把 html 渲染成 mp 四的视频, 核心逻辑就是 s r t。 字幕充当了画面和声音之间的桥梁。如果你不需要这么精确的音画对应关系,比如你只想快速出一版概念视频或者内部演示,那 s r t。 的 不用直接把文案大纲丢给 ai 就 可以 让它自己安排节奏。这里单独说一下 hyperframes 这个工具,因为它是让整套方案成立的关键一环。 hyperemax 是 high end 开源的一个项目,完全免费商用,也没有任何限制。他做的事情是你给他一个 html 文件,他用无头浏览器逐帧截图,然后拼成视频。你可能会说,我自己用录屏工具录 html 页面不也一样吗? 不一样,录屏的问题是时间不好把控,你手动翻页,手动触发动画节奏很难精准。而 hyperremax 是 精准到毫秒的, 每一帧在什么时间显示什么内容,完全用代码决定,不需要人工介入。这意味着效率提升了一个量级。理论上,你一晚上可以批量产出一百期同等质量、同等美术水准的视频。 所以所有你能在网页上实现的效果, c s s 动画 g s a p 动效 three g s 三 d 场景都可以变成视频。而且因为是逐帧渲染,同样的代码永远产出一模一样的结果。 对于我们这个场景来说,最重要的一点就是它天然适配 ai, 因为代元模型最擅长写的就是 html, 你 让 ai 去操作视频剪辑软件的时间轴,它做不到,或者说很难实现。但让它写 html, 这是它训练数据里最多的东西之一。 至于 hyperframes 具体怎么安装,怎么调用,这些你完全不需要知道,你只需要知道它是干什么的,能做到什么程度就够了。把 hyperframes 的 项目仓库地址丢给 air 编程工具,告诉他用这个工具来渲染, 剩下的它自己搞定。我全程没有手动超过任何一条 hyperframes 的 命令,现在一步步看实际怎么操作。文案这一步没什么特别的,你可以自己写,也可以让 ai 帮你列大纲,然后自己调整,重点是确定好每个段落要呈现什么内容。文案就是你整个视频的骨架,音频部分 录音用任何你顺手的工具都行,录完后用剪映把气口和长停顿剪掉,让语音听起来连贯。不想自己录的话, ai 语音合成现在的质量也完全够用了。最终你需要的是一个干净的音频文件。 s r t 字幕。我自己是用剪映 把音频导入剪,应用语音识别功能自动生成字幕,然后导出为 s r t 格式。每一条字幕都有编号时间戳和对应的文字,这个文件就是你丢给 ai 的 核心输入。 最后是 ai 生成 stml, 打开你的 ai 编程工具,把 stml 文件丢进去,然后告诉他你想要什么样的视觉风格。 ai 会生成一整个 stml 文件, 里面的每句话都对应一段内容,时间轴全部绑定好了,预览一下效果,不满意就让 ai 继续调,满意之后让它渲染成 mp 四,再和你之前的音频合到一起,视频就完成了。 到这里你可能会想, ai 每次生成的风格都不一样怎么办?今天是赛博朋克,明天变成了水彩风,没法形成系列感,这确实是个问题,但解决方法很直接。先打磨一套模板,你先花时间跟 ai 反复调一版你满意的 html 模板 配色、字体、动画、节奏、布局方式都调到你满意为止。这个过程可能会来回好几轮,这是一次性的投入。 调好之后,你把这个模板文件保存下来,下次做新视频的时候,开一个新的 ai 对 话窗口,把两样东西丢给他,你的模板文件和新的 s r t 字幕或文案大纲,告诉他参照这个模板的风格和结构来生成新的内容。 这里要说一下为什么是给参照物,而不是写一份详细的设计规范文档,也就是所谓的 skill, 让 ai 去遵守。 原因很简单, skill 是 文字描述,每次生成都会受大模型随机性的影响,同样的规范文档,跑十次可能出十个稍有差异的结果,很难做到完全一致。但如果你给的是一个实际的 html 文件, ai 是 在看着具体的代码去仿照, 颜色值、间距、数值、动画参数全都是确定的,付现的精度高得多,所以这个用模板做参照物的步骤不可替代。最后聊一个观点, 在做这种 ai 生成的 ppt 或者视频画面的时候,瓶颈不再。模型能力在美术参考现在不管是 deepsea cloud 还是 gpt, 写 html 和 css 等能力都够用了。能不能做出好看的东西,差别在于你给他看了什么。 你跟 ai 说帮我做一个好看的 ppt, 他 只能给你一个泛泛的、不好不坏的结果。但你如果给他一张苹果发布会的截图,说按照这个风格来, 或者给他一个现成的设计稿,说参照这个配色和布局,结果就完全不一样。所以我的建议是,平时看到好看的画面就截图存下来,不管是网页、 app 界面、别人的视频截图、海报,甚至游戏 ui, 这些都是你的弹药库。 但要注意,截图只是参考,它的作用是帮你明确自己想要什么方向,真正落地的时候,还是至少用 ai 做出一个 demo, 调到满意为止。这个 demo 就是 我前面说的模板, 它既是你的美术标准,也是后续批量生产时的一致性锚点。总结一下今天的流程,文案、音频、 s r t 字幕、 ai 生成, html、 hyperframes 渲染成视频。整个方案的核心价值是可复制性。第一次跑通这个流程可能需要几个小时去摸索,但一旦有了满意的模板,后面每一条视频的制作成本就非常低了。 hyperture 是 完全开源免费 ai 编程工具,现在也有了很多免费或低成本的选项,感兴趣的话可以自己动手试一下。我是手仁猫咪,我们下期再见。

新的一周开始了,让我们看看小李如何带着办公新伙伴 workbody 处理一天的工作。 周一早上九点三十八分为读邮件、领导催进度、客户问报价、 hr 要表格,每一封都不能漏。以往光是看完都要半小时,现在从 workbody 从邮箱批量提取的邮件清单丢给 workbody, 让其分四类给草稿,稍等片刻就处理完成了。 他先帮我分了堆哪些必须亲自回,哪些助理带回,哪些仅知会,以及哪些可忽略,一清二楚。然后挨个写好了回复草稿,连领导那封方案进度如何都对应上了昨天的工作记录,审核无误后即可让 work buddy 自行发送。原来一小时的开机仪式,现在五分钟搞定。 但邮件的难不只是多,真正让人头疼的是那些写不出口的邮件,尤其是发给海外客户的那种,外貌人都懂,海外客户压价邮件能看懂回复写不出中文都难措辞,何况要翻成地道商务英文。 现在我把客户原邮件合作背景我方立场写在一个文档里,丢给 workbody, 要中英双版,中文版先出来方便老板审。英文版语气拿捏的很准,底线守得住又有余地。椒盐通过后,就可以让 workbody 自行回复了。 从早高峰的三十八封内部邮件,到深夜里那封要反复斟酌的英文回信, work body 把邮箱从消耗时间的地方变回了推动业务的地方。老板群里说,下周汇报,先给我份 q 二复盘, 一百八十条数据,三个维度手写,一下午起步。现在我把业绩 xl 直接丢给 workbody, 让他出一份带亮点、带问题、带建议的 word 报告, workbody 会自动解读我们上传的 xl 文件,并输出为我们想要的格式, 稍等几分钟,整体达成。城市排名、品类、亮点、渠道问题 q 三,三条建议结构完整,数据准确,下载就是 dos 文档格式,连排版都帮你做好了。 workbody 支持多种文档格式的处理,例如我们还可以让其再输出为网页格式。 可以看到 workbody 很 擅长处理网页版格式,排版效果还是很不错的。 通过 workbody 以往需要几个小时来处理的文档写作需求,现在几分钟搞定,且支持高质量多形式交付,再也不用担心老板催着写文档了。下午二点, ppt 还没动,手里有生成的 word 报告都要做成十二页汇报,三小时打底, 不用担心。现在我们把报告文档丢给 workbody, 召唤一个 ppt 专家,一句话生成所需的 ppt 文档。 workbody 内置的专家和技能非常丰富,我们按需索取即可, 等待一段时间即可得到 ppt 格式的文档。我们可以在输入时制定我们的偏好、风格和特殊要求。 如果有公司特定的模板,也可以发给 workbody 作为参考,得到符合模板风格的 ppt 文档。可以看到新生成的 ppt 就 参考了我们上传的模板,在微调格式后即可汇报使用, 也可以发消息让 workbody 二次调整三小时的活儿,八分钟还能再调几个细节就交稿,这才叫 ai 接力。下午四点,老板临时加活二十四家门店,六十天销售,明早 deathsport 一 千四百四十条数据, xl 透视等怀疑人生,不用担心原始流水 xl 上传告诉 workbody, 我 要看趋势排名占比预警,稍等片刻即可处理完成。 四分钟,一个交互式 dashboard 就 出来了。折现图看趋势,横道图看门店排名,饼图看品类,红色标签直接预警异常,门店鼠标一悬停,明细数据全有, 不会写公式,不会画图,没事把数据给 workbody, 他 替你当数据分析师。下午五点半,老板在群里催前天的会议纪要,邮件发给我,安排下一场跟进会议。一百二十分钟多人格多一体光听,即便录音都不够, 问题不大。我们使用手机联通 workbody 语音发送消息,让 workbody 把前天的会议纪要梳理好发送出来。很快, workbody 会检查腾讯会议的联通性,如果未联通,则会给出链接指引、配置基本信息。如果已经联通,则会直接把会议纪要发送到微信当中。 接着,我们可以让他处理我们的会议纪要。比如,我们让 work buddy 将会议纪要写到企微文档中。同样的, work buddy 会检查连通信,并通过企微的 skill 写入到企微文档中。此外,我们还可以让 work buddy 给我们预定跟进会议,并 将刚才输出的会议信息和企微文档链接发送到老板的邮箱当中。 workbody 梳理好后会反问我们进行确认,涉及到发送邮件这样相对敏感的步骤, workbody 会二次确认,我们语音回复确认发送,可以看到邮件已经发送成功, 并且所有链接都是准确无误的,均可在企微中查看。 workbody 便捷打通微信,串联会议文档、邮件,高效协同办公 work buddy, 你 的的新时代 ai 智能办公助手!

挑战,每天讲透一个 ai 知识点,今天是 codebody 插件介绍,已安装,接下来给大家讲一下 codebody 插件的一个使用。首先我们来看一下啊,就是插件的话,它其实可以让我们通过自定义技能代理钩子和 mcb 服务器的这种方式来拓展 codebody 的 一个功能。 那么首先的话我们给大家讲一下啊,就是这个插件应该怎么来使用啊?第一种的话就是,哎,我们怎么样去下载这个插件啊?一个是我们可以用官方的一个插件,那等下的话我要给大家去讲,我们怎么自己去开发一款插件啊?好,那么插件的话,这里面 它有几种方式啊,就是什么时候去使用这个插件呢?这里面有一个场景啊,就是我们想为单个项目去定制 code 啊,就是针对这个项目的一种 场景啊,配置是个人的,不需要共享,也就说只只你自己去用,也不需要给其他人去,然后再打包插件啊,为这个之前的一个实验啊,就是我们做一些 scale 或者这个钩子的时候这种场景,然后就是需要简短的一些什么技能名称,比如说像 hello 啊, deploy 啊,就是你自己用的独立的一个场景啊,那你就可以针对当前项目 个人的一个这个啊,目录里面去做一个处理。那如果说你需要使用到这个比较复杂的一个场景哎,比如说你需要与团队跟社区做一个共享,需要在多个项目中去使用相同的技能代理的时候,大家就可以用插件这种方式,就你甚至可以把你的这个插件发布到这个公共市场里面去,让所有的开发人员都可以去用, 所以它有两个级别啊,一种是我们自己本地去用啊,用一些 scale, 用一些这个命令是吧?然后用一些这个工具,那么还有一种就是我们可以用插件的这种方式,让所有人都可以去附用这些工具啊。 好,那么接下来我就给大家讲一下这个插件市场啊,就官方给大家提供一个插件市场,那这个在哪里呢?大家可以打开这个 codebody 的 一个 id 页面啊,那在这个里面的话,我们可以点开这个右上角,在这个里面有个设置,然后我们找到一个叫做这个插件啊,一个叫插件市场的地方。 那这个插件市场的话,其实有很多啊,可以看到啊,官方给大家提供了很多的插件,有两块啊,一块是 codebody 这个 啊,这个官方的一个插件,比如说你看有一个 find skill 是 吧?还有这个 agent bloser 啊,还有 word 文档啊是吧?转换啊,包括 ppt 转换啊等等,各种插件都有啊,就大家可以通过官方的插件市场去下载。 那么还有一个是这个 code body 啊,就是 team 啊,就团队给大家提供的一些这个整个的一个 skill 啊,包括一些数据管理啊,然后包括一个这个 skill correcter 是 吧? 就是有两块,但大家也可以去添加更多的一个市场啊,比如说有其他第三方提供了一个市场的话,你也可以连接到那个市场,相当于就是咱们去下载一个应用的时候,我可以去多个应用市场里面去下啊,有不同的应用市场可以下载到不同的 app 啊,就这个同样的一个意思。 好,那我们就首先给大家先下载一个这个插件,给大家验证一下,看一下效果啊。就是我们怎么样安装官方的一个插件呢?嗯,比如说我这边随便找一个吧,找一个这个,嗯, 然后这边找一个案例啊,嗯,就找一个 and scale, 找一个大家最熟知的吧,比如说 ppt。

大家好,我是海洋,欢迎来到海洋 agent 的 空间。然后今天咱们要聊的话题是这个 humulus 还有 cloud code 是 不是要二选一,因为网上大家都在讨论这个哪个大模型好用,其实我的终极解法就是让你的龙虾去自己进化,去分别去学习 cloud code 和这个 humulus 合为一体, 然后让你的龙虾对它们取长补短,形成一个终极进化就可以了。然后下面给大家看一下我的操作, 大家可以看一下我现在是用的 workbody, 也就是腾讯的龙虾,然后腾讯的龙虾其其实是集成了这个底层,就是 openclaw 的 开源模型。然后现在呢,我是让这个 腾讯龙虾去执行这个专属的任务,去学习这个公开的 cloud code 的 这个完整源代码,然后内化架构与工作逻辑,完成自我进化重构。然后以后都以全程就以 cloud code 的 这个范式去进行执行任务。 然后你给他指令的时候就说明一下,让他学习这个 cloud code 源码的时候,只学习这个公开的合规的这些, 呃,工程结构了,泄露的代码了,核心的模块的逻辑了,不做侵权搬运就可以了。然后让他去生化拆解并内化这个 cloud 的 一个底层架构代码,理解逻辑,全站的工程思考方式 和这个多文件的关联项目决策流程,完全内化成一个自身的底层能力,不是简单模仿,而是重构自己的工作逻辑。 然后要基于 cloud code 圆满的这个标准架构和规范自我进化,淘汰原有的低效的思考模式, 完成学习内化自我进化,永久的固化新的工作模式,后续我下达的所有任务,它都需要拆解,全部默认用 cloud code 的 思考逻辑和标准来去执行任务。 然后这个我的 workbody 收到我的任务,它就开始进行一个自我学习,自我进化了,这个我在前面的视频中也有讲到这个怎么让它去学习自我进化,还是你要需要不断的训练你的龙虾, 然后这个 workbody, 这不是,这就说 cloud code 工程范式内化重构完成,然后交付了这些报告,学了这种五十万行代码的这个文件,然后深度学习,进行了一个自我净化。 后面就是行为,从现在起我下达的所有的开发产品架构编码项目任务,他都会默认采取这种九步管道标准的流程执行呃,上下文稀缺性原则,管理信息密度,然后拒绝优先安全姿态, gather gather art murphy 循环验证结果并行 agent 编排加速复杂任务结构化工具调用替代模糊操作。深蓝 v 二点零已就位,因为之前它一直 我给它命名就是深蓝一点零嘛,现在变成了深蓝,它自我进化成深蓝二点零啊。然后后面我又听说这个 hummers 比较火嘛,就那个爱马仕的龙虾, 然后我也给他了一个场景,让他去进行这个爱马仕的一个终极进化,我给他指令就是说你现在要进入终极的终极的进化模式,核心目标就是根据爱马仕 openclaw 这些公开的开源的数据源码,全面学习吸收 爱马仕的全部优势和和你自身的这个 workbody 的 这个稳定性、本地安全中文适配能力相融合,形成三合一的最强智能体, 具备持续自我进化能力。然后第一点就是学习并吸收爱马仕的核心优点,它的核心优点目前就是长期记忆自我进化,对吧?深度反思和主动优化。 然后第二点就是学习并吸收 opencloud 的 一个核心优点, opencloud 的 核心优点就是强兼容性、多工具调用、任务拆解、企业级适配,这块是 opencloud 的 优点。然后我要保留这个 workbody 的 一个自身优势,就是本地优先、隐私安全, 企业级的稳定、中文的深度优化,然后以及这个原生集成。然后 最后就是让他自我进化永久生效,每次任务启动必须执行对比这些优点,然后根据这些优三合一的智,以这种三合一智能体的这个姿态去做以后的每一个任务。然后我的这个龙虾呢,就开始自我进化 他,他会去自己搜索这些其他龙虾的公开的资料,然后进行一个 代码获取,然后进行一个自我进化,你看这边都已经获取了他们的这个完整的架构信息,现在要融合框架。最终 最终进化体三点零完成了,现在是深蓝,相当于一点零是他本身, 然后二点零是集成了这个 cloud code 的 一些一些优点,然后现在深蓝是相当于是 v 三点零版本了,已经完成超级终极进化了。 然后你看已吸收了核心 hums 的 核心优点,五层记忆系统 g e p a 自动化,自动的 q 集成生成用户的建模 f t s 五权威搜索。然后吸收了 open cloud 的 这些优点,二百一十九个技能,生态多 a 阵的编排, 然后全工具链任务拆解,企业的适配,保留了咱们这个 workbody 的 一个核心优势, 然后这个机制他就告诉我,你现在拥有一个越用越强的智能体,每次任务我都会学习沉淀计划,记住你的习惯,习惯和偏好,跨绘画永久生效,开始用我吧,我会越来越强。然后这就是我给大家说的,大家遇到这种,比方说 你们一直在想这个模型好还是那个模型好,哪个模型好的时候,你不用纠结,你直接让你的 work party 去学习不同的模型的优点。根据网上公开的数据,因因为这些原码都有大神去公开这些原码,所以 这是对我们的龙虾进化来是非常有利的。下面大家就去试一试吧!今天的视频就录制到这,下期再见!拜拜!

用 html 来做 ppt 应该是 ai 时代人人都需要掌握的一项技能了,比传统 ppt 更高级,更好看,还能用 ai 来一键生成这期视频,应该是目前全网最完整的教你用 html 做 ppt 的 零基础教程。 我会从安装 skill 开始,到生成 ppt, 编辑文字,插入图片视频,再到最后打包分享和部署上线,从零到一,带你走完全流程。并且还会免费给你分享一个我自己开发的 html 编辑工具,帮助你格式化调整 ppt 里的字体和 图片大小。话不多说,我们直接开始。在首先开始之前呢,我们需要有一个 agent, 我 这里演示用的是 call code, 如果你没有 call code 的 话,可以去看我主页的上一期视频,零基础安装 call code。 当然如果你 用的是 codex, 还有 openclaw 或者国内的一些 agent 的 工具,用法都是一样的。用 html 做 ppt 之前呢,我们需要下载两个 skill, 第一个 skill 叫这个 fronted slides, 这 个 skill 在 github 上其实已经有一万七千多的星了。然后这个 skill 呢,是教你的 agent 怎么样去用 html 做出好的 ppt 来。第二个 skill 呢,其实是叫 beautiful html templates, 这个都是一个博主 zara 做的。然后这个 skill 呢,它就集合了非常多比较好看的有设计感 的 html 模板。那么我们首先要去给我们的 agent 去安装这两个 skill, 安装的方式非常简单,你只需要把这两个项目的链接发给你的 agent, 帮你安装这个 skill, 还有这个 html 的 模板其 就可以了, ai 就 会自动的帮你完成整个安装流程。如果就是你的电脑没有办法访问 github 的 话,我这里也准备了一个方式,可以通过我的链接去下载这两个项目的文件,然后你解压之后呢,把这个文件夹发给你的 agent, 让你的 agent 帮你安装就可以了。我这里演示一下, 当你下载好之后,你会得到两个压缩包,你解压完之后呢,会得到这两个文件夹,然后我们只需要把这个拖到我们的 curl code 里面去,然后我们告诉他帮我安装这个, 然后呢你的 agent 呢,就会自动地去帮你安装好这个 skill, 我 这里因为已经安装好了,我就不演示了。当我们安装好了这个 skill 和这个模板的项目之后呢,在使用之前,我们需要修改一下这个 fronted slide 这个 skill, 让这个 skill 呢可以直接去调用第二个项目里面的 模板。修改的方式也非常的简单,我们直接按一下这个斜杠,然后我们调用这个 fronted slide 的 这个 skill, 然后我跟他说就是帮我修改一下这个 skill。 生成 ppt 时要用直接把刚刚下载的另外一个项目就 beautiful html templates, 然后这里头的模板,然后这里头会有一个文件叫 agent dmd, 然后我们把它拖到 call code 里 头来,让它生成 ppt 时调用这个里面的模板。我们只需要把这个发给你的 ai, 它就会帮我们去修改这个 skill, 然后让这个 skill 它在生成模板的时候, 就能够去调用另外那个项目里面那些比较好看的那些模板了,不然的话就是这两个 skill 是 分开的,你要先用第一个去生成 ppt, 然后再用第二个里面的模板去改,其实就比较麻烦,所以这就是我们在用的时候可以去针对它做一些自己个性化的定制,包括你从网络上下载的各种各样的 skill, 其实你都可以通过自己的方式去修改这个 skill, 更符合你自己的需求。接下来呢,我们修改完这个 skill 之后呢,就可以进入正式的 ppt 的 这个创作了。建议大家就是做 ppt 的 时候,我们可以单独建一个项目作为它的工作的文件夹,如 果你是 call 的 话,我们直接打开终端,直接就输入 cd, 然后摁一下空格,接着呢把我们创建好的文件夹拖进来,拖到这个终端里,然后我们再摁一下回车,这个时候呢,它这个终端其实就以我们刚刚创建的文件夹作为工作目录了,然后我们再输入一个 call, 这样的话我们在做 ppt 的 时候,它就会以我们现在的这个 ppt, 演示我刚创建的这个文件夹作为工作目录,然后我所有新创建的 ppt 的 文件,各种内容都会在这个文件夹下。接着我们就直接来开始做 ppt 了,同样的直接输入这个斜杠,然后我们调用这个 round 的 slides 这个 skill, 我 这里直接把我的一个短视频的文案发给他,然后让他帮我做一个演示的 ppt, 一下是我的短视频文案,帮我做一个演示的 ppt, 这里直接去粘贴我的那个文案,大概二十行,然后我发给他,等待他调用 skill, 然后开始工作。这个 skill 呢会先问我们几个问题, 就是你想做多少页的换登篇,我就选择一个八到十页吧,你需不需要在这个浏览器中去直接编辑文字,因为我后面会有一个我自己做的工具来编辑,会比这个更好用,所以我这里就显示不需要,希望观众看完 ppt 有 什么感受,就你选择风格,然后专业有新福利,冲击性,清晰易懂,然后我我就选这个清晰易懂吧, 你还可以多选,我就选这个清晰易懂,然后提交提交答案。这个是有非常好的一个点,就是他在正式给你做 ppt 之前,他会先给你做三张不同的页面,然后你去选一个风格,就是比起你全做完了,你对这个风格不满意,他 会先一开始就给你做一个一页的 ppt, 然后用三种不同的风格让你选一下,可以看到就是 ai 现在给我做了三个风格的标题页,然后让我来选一下第一个,这是第二个,然后 这是第三个,我喜欢简约一点的风格,我就选第二个吧,他会直接跟我们提问,就选第二个蓝色的风格吧,然后我们直接点击确认选择风格之后呢,他就会根据这个风格帮我们把所有的 ppt 的 内容就一次性就做完了,我们就等着就可以 aj 呢,已经帮我们把 ppt 给做完了,然后也帮我在这个浏览器打开了,我们来看一下整体的效果,我们摁住这个空格就能换页,我觉得是还挺 不错的,就是基本上是一个比较可用的一个状态。接下来教大家怎么样去调整字体的大小跟图片,这里呢我自己做了一个工具,直接打开这个网页,这个就是我做的一个编辑工具,然后这个网页工具呢能帮助你去编辑调整这个 di 做出来的 html ppt。 直接来看这个编辑工具是怎么用的,下载好之后你直接打开它就是个网页的工具,然后我们打开文件夹,这个 ppt 演示呢,就是我们刚刚创建的 那个文件夹,然后我直接选择这里会让你显示一个是不是允许点击允许,这样呢,我们就在这个编辑工具里打开了我们刚刚做好的这个 html, 我 们就可以在这里去进行编辑了。你选中任何一行字,你都可以给它放大缩小,比如我觉得这太小了, 给它放大,然后包括说这里你可以直接去输入我两倍太大了,一点五吧,我想让它变大,包括我想调整,比如说把这个问号改成感叹号,就是你都可以去调整的,然后包括我觉得这太小了,因为你会发现就是 ai 做出来的东西呢, 其大致上是够用的。但是 ai 它就总喜欢把这个字体的大小弄得是比较的小,因为它没有视觉,或者说它有视觉,它不像我们人类能够实时的去预览。所以说我做出来的 ppt, 基本上我会用我自己的工具再去做一下微调,主要是调整一下字体还有大小的。 包括这个工具呢,能够帮我们去插入图片,接下来我讲一下怎么插入图片,比如说这个万能片是第三页,我想在这里去插入一张图片,然后我们回到刚刚的 coco 的, 直接跟他说,我想在 p 三插入一一张图片,图片的内容是头肯凹好嘴要写字数的 变化读对。这个时候呢,如果说你用的是 cloud 模型,或者是你用的 codex, 就 你的模型有读图片的能力的话,就可以直接把你的图片拖到这个 cloud code 里头去,然后它就能够帮你添加另外一种方式呢,如果你用的模型它不能读取图片,比如说你用的是 deepsafe 或者是国产的 g r m, 它没有办法读图片,那么你一定不能在 cloud code 的 里面 把图片给粘贴进去,因为他读不了图片的话,会造成这里的 token 的 一个爆炸。如果说你的模型不能读图,我们怎么样给我们的 ppt 插入图片呢?方式也很简单,我这直接演示一下,你用图片占位符来替代就可以了, 包括就是我们去插入视频也可以这么去操作,比如说我让他在第四也在帮我插入一个视频, p 四帮我插入一个视频,然后也用视频占位符来替代 发送给 ai, 之后呢, ai 就 会帮我们编辑好,然后接着你再用我的那个编辑的工具把图片跟视频替换进去就可以了。那 ai 给我们改完了,加上了两个图片跟视频的占位符,我们 直接打开看一下,第三页这加了一个图片,然后第四页这里加了一个视频的战略服。接着呢我们就要用我的那个编辑的工具,我们把这里的图片跟视频替换成我们的素材,这里点击打开文件夹,同样选择我们 html 所在的这个目录,你看我们 html 文件,在这里选择它的上一层的这个文件夹,然后就会把这个打开,然后 我们来看一下,你会发现这里图片有一个插入图片的选项,然后我们直接点击这里的插入图片,把你的素材给替换进去,你可以看到这里我就替换了我的这个图, 然后呢我还可以去调整它的大小,我觉得这么大就差不多。接着我们再来看一下视频,视频的话,我们也是他留下了一个视频战略服,我们直接在这个工具里面,我们点击这个插入视频,你可以看到这个,这里就有了个视频,然后这个视频的大小也是可以去调整的,比如说我想让这个视频大一点,那就这么大,让它小一点, 然后就这么小,这个视频呢都是可以播放的。接下来我们改完之后呢,就要把这个 html 进行保存,点击这个覆盖原文件,就会直接在我们原来的那个文件上进行一个修改,点一下覆盖原文件,它就已经覆盖了。然后我们再打开我们的这个 html, 去看一下我们的图片跟视频是不是弄好了,我们打开 这就是我刚刚插入的图片,刚刚插入的视频就这样插入成功了,这样你的 html 其实就已经做好了。接下来讲我们做好的 ppt 怎么分享给别人, 那么有两种方式分享,第一种是文件的方式分享,第二种是以链接的方式分享,那么先说用文件的方式分享,如果你的 html 没有用到图片啊,视频这样的其他的素材,那你直接把你的 html 文件发给别人,他就能够用浏览器打开就能预览了。那么如果你的 html 用到了额外的素材,比如像我们这里用到了图片,还用到了视频, 我们就需要把这个文件夹打包一起发给别人,这样他打开这个 html 才能正常显示里面的图片跟视频。比如说像我们这里的话,我就把这两个,比如说也给他新建叫 打包,然后呢我就把这个文件夹发给别人,然后别人打开之后呢,他再去打开这个 html, 它里面就会有我的图片还有视频这 些素材,然后你在别的电脑上就也能去正常的去观看了,这是以文件的方式去分享,然后接下来讲一下怎么样以链接的方式去进行分享。首先呢就是你要把你的 html, 也就是一个网页去转成链接,你需要把它部署在云服务器上,如果你是传统的去买服务器域名备案,就这个流程特别的复杂麻烦。就如果你不是要把这个网页去提供大规模的访问服务的话,你 分享给你身边的朋友同事,那你就用这个 netify 这个免费的网站就可以了,这个网站转成的链接在国内也是可以打开的。然后呢方式也很简单,你打开 netify 之后,登录之后注册一个账号,我们直接来演示一下,像这里我用 的这个 netify, 然后你可以看到其实我已经部署了两个项目了,然后我们直接点击这里,你可以看到它可以上传文件以及上传个文件夹,就是如果你只有一个 html 文件的话,你就选择这个,如果你涉及到图片素材的话,我们就选择一个文件夹,比如像我这里这个 ppt 就 用到图片还有视频,我就要选择这 文件夹,你可以看到,哎,就是我刚刚创建的这个打包的这个文件夹,然后这里头就会有我的 html, 然后有我的这些素材,我就选择这个文件夹上传,选择 上传,选择这个左边这个就可以了,它就会把我们的内容去进行一个上传部署,我们等一下就可以了,这个时候呢它就把我们的内容已经上传部署完了,我们要改一下我们这个链接的名字,我们点击这个按钮,在这里去填写一下你的名字,因为像这的话,其实就是我们最终分享的链接随便写个名字,因为像这的话,其实就是我们最终分享的链接随便写个名字,然后我们点开这个这个网页,打开的内容就是我们的 那个 ppt 了,然后你就可以直接在顶部去复制这个网页的链接,然后分享给你的朋友去在别的电脑上去访问就可以了。希望这个视频能够帮助你从零到一,学会用 html 去做 ppt。 因为像现在随着 ai 模型能力的发展的话,其实用 html 做 ppt 会变得越来越方便,越来越好用, 包括你使用熟练之后,你就可以去定制你自己的好看的 html 的 ppt 模板,如果这个视频对你有帮助的话,也可以去定制你自己的好看的 html 的 ppt 模板,如果这个视频对你有帮助的话,也可以分享干货,我们下期见。

我敢说现在 codex 加 image 二加 presentation 这个 skill 就是 当前 ai 做 ppt 的 最佳解。 以前我对于 ai 做 ppt 是 很不屑的,就因为我自己对于 ppt 的 要求很高,排版格式、字体间距以及整体的审美。我觉得 ai 之前做了很多时候就非常的怎么说 ai, 尤其是中文的内容,就特别像那种二十年前的排版。 但是我最近用下来啊,我觉得像 codex 做 app 已经能够符合我当前的一个预期了。今天我就跟大家分享一下实操到底怎么做。哈喽,大家好,我是 fred, 专注从普通小白的视角分享怎么从零到一,学习 ai 和 web coding 来提升自己的工作和生活效率。 我觉得这套组合啊,强的地方啊,就不是说帮你去生成几页 ppt 这么简单。它强在可以通过 codex 把整个流程串起来。第一步就是 codex 可以 把大纲定清楚,比如说它的主题,受众页数,每页讲什么,整体确认下来。 第二步可以用 image 二去生成一整套整套的一个页面的总览图,不是只生成一个封面,而是把每个页面大概长什么样子,放什么内容,整体的风格是什么都合在一张图里面去看清楚。 第三步的话,就可以通过啊这种 presentation skills, 然后去把它编成一个整个可编辑的 ppt, 能打开,能改造、能换图,才适合我们真正工作。里面的演示和交付我给大家实际演示一下哈, 我们打开我们的 codex 这个呃对话,比如说我就先让他帮我生成一个介绍 codex 这个实业的 ppt, 然后让他帮我生成一个大纲和内容,不用做 ppt 的 直接执行,那他就会花这个时间去,比如说生成十一页,每一页的内容是什么,讲解要点是什么 啊?然后这个时候我就会让他调用 image 进这个 skills, 它背后的底层其实就是 image 二啊这个模型, 然后帮我输出三个不同的风格的 ppt 图片,包含这十页 ppt 的 实际内容,我们就可以看到啊,它能够输出三个不同风格的,白色的、黑色的,然后还有一个是相对 p l 卡通的。 那下一步你应该做什么呢?很简单,就是帮我把这个第,比如说我就选第三个方案,帮我把这个第三个方案生成一个 ppt 文件,然后去调用 presentations 这个 skills, 那 ok, 很 快它就能够直接输出一个可编辑的这个完整的 skills, 我 们把它整个打开, 虽然说他长得跟刚刚那张图没有特别像,但是我觉得现在已经完完全全符合我的要求的,就是他整个的排版,包括他的这里格标题的整个的,呃, 字体大小排版啊,主见啊,包括这些内容我觉得已经非常非常成熟了, 就基于这个 codex 加 image 二,加上 skills 呃, presentation 这个 skills 三句话深层的这样一个内容,我就已经完全符合当前。我觉得对于普通学生而言也好,或者说普通打工人而言也好,完全可以呃,满足大家工作和生活的需求。 ok, 我是 fred, 呃,下一期我会持续给大家分享更多 ai 实操的工作流,我们下期再见。

小伙伴们大家好,今天感冒了,声音有点奇怪,最近聊了好多期腾讯的小龙虾。 coldbody 和 workbody, 其实是一个产品的两个版本,好多粉丝跟我说用它完成了不少以前不敢想的事,后面我可能也会请他们来分享各行各业的案例, 但也有不少人说根本什么都做不出来。今天我刚刷到一个做三 d 打印的博主,特别典型,他让 coldbody 帮他建一个三 d 打印用的汽车模型,结果搞了一坨像肥皂一样的东西,他就录视频说产品太差。 我今天就以这个为例,还原一下我是怎么用 codebody 从踩同样的坑到最终做出来,再把整个流程沉淀成一个可费用的 skill 的。 先说那个博主的核心问题,他跟 codebody 说了一句,给我设计一个铃木维特拉汽车的三 d 打印模型,并把 s t l 文件发给我,然后 codebody 就 开始干活了。 我也是一样这样操作的。酷狗八的会怎么干?他不是三 d 建模师,他是程序员,他的本能反应是找一个可以用代码驱动的建模工具。我这边选 open s c a d 开源的 三 d 建模软件,纯代码写模型,不用鼠标拖来拖去,这个选择有没有问题呢?理论上没有, open s c a d 确实能做三 d 打印模型,业内也有人用它做机械零件。酷狗八 d 很先是很认真的做了一份工作,计划从车身到轮毂、车窗、灯组、保险杠,一路排下来,像模像样的。自己上网搜了维特拉的各种细节尺寸,还生成了几张 ai 参考效果图。 接下来就是写代码,核心思路就是画三十图的轮廓,然后把这三个轮廓各自拉伸成三 d 实体,然后用波尔计算去交集。理论上交集的部分就应该是车身的形状了。听起来挺合理的,结果一渲染出来,我都 起效了哈。三个二 d 轮廓本身就很抽象,侧面像条鱼,顶面像个棺材板,前面像半个鸡蛋。三个一交集出来的东西确实像块肥皂,轮,轮子还是横着的。这就类似那个博主看到的东西,到这步为止呢。那个博主说的是对的,确实做不出来,但问题是那个博主停了,他下了个结论,走了, 我没走,扣对不对?还不死心,继续在这个肥皂上加轮毂,加后视镜加天线,结果更离谱了,所以一定要变形。失败的大巴 问题不是 code body 不 行,是这条路不通。 open s c d 的 中交交集法本质上就很难做出光滑曲面,这个汽车的曲面需要的是 nervous 或者吸粉曲面。 open s c d 连这个概念都不支持,那它做汽车就像用 excel 画油画,工具选错了, 那正确的工具是什么呢?其实有两条路,第一条是用 m c p 接管专业建模软件,现在已经有 blender m c p 这种项目了。就是,哎,通过 m c p 协议去操纵 blender 这种专业三 d 软件,用自然语言指挥它建模画图 啊。如果你追求的是精确的参数建模,那像机械零件,工业设计,这肯定能实现。但我没走这条路。为什么?因为我 做了一个经验判断,三 d 打印的车模土生,三 d 一 般就够了。你想三 d 打印出来东西本身就有曾玩巴掌大的车模,你用 blender 轻雕细琢,和土生三 d 两分钟出来的模型打印出来,肉眼根本没区别,投入产出比 完全不在一个量级。所以我选了第二条路,直接调腾讯会员三 d 的 api。 会员三 d 有 个功能,叫土生三 d, 你 给他一张图片,他给你生成一个完整的三 d 模型。 而且这个 api 现在有免费使用额度,我直接把 api key 贴给 codebody。 当然过程也不是一帆风顺,图片、 传餐的格式、文件解压之类的坑还是有一些的。但好在 codebody 踩完坑能立刻改代码重试,整个调试在对话里就闭环了,不用我自己去折腾,我也不会。搞定 api 之后呢,它先生成了一张维特拉的参考图,红车身、黑车顶的四分之三视角提交给会员三 d。 两分钟以后,模型就下来了。 这个火山、大灯轮、后视镜这些细节都很清楚,有些地方因为角度问题有些误解,所以我就让他重新生成了一遍,换了张银色侧面的效果图做参考图第二版,整体更匀称,细节也更到位。从那个肥皂块到这个完整的车模呢,核心区别就一个,换了条路径。 那这一步其实也可以交差了,但我多做了一步,把整个流程沉淀成了一个 codebody 的 skill 技能包。那什么是 skill 呢?可以理解为一个经验包啊。把我踩过的所有坑,写好的所有脚本,总结的所有注意事项打包成一个可附用的模块。下次再做任何物体的三 d 打印模型, codebody 就 可以自动加载这个 skill, 不 会重新踩坑,也不用每次再把生图、接口、地址、 api 这些重新配给它。 所有的东西呢,跟具体的车型就无关了,你给他一张椅子,他也能生成三 d 打印模型。为了验证呢,我当场又做了一个我家的这个标志,五零零八,从生成参考图到最终拿到 s t r 文件,全程是给我自动执行,不到十分钟, 最后还让库德贝里做了一个对比,网页单页面的这个腹部流滚动,五个版本一次排开,每个版本都能三 d 交互浏览,都有对照图可以展开看。所以回到开头,聊几个我觉得很重要的事。 那个博主的问题呢,不是 codebody 不 行,是它的用法不对接。这个案例呢,我想总结几条用 agent 的 心得。第一呢,有了 agent, 人不是没价值了,你让他反复去尝试收 token, 他 大概率早晚能给你做出来。小龙虾就是这个逻辑,但实践成本和 token 成本会非常高。 而我在这个过程中做了什么呢?我看了一眼 open cad 渲染出来的轨道,立刻就知道这条路有问题,不尔交集,做不出来。为什么?我知道?因为我二十年前学建筑的时候学过画画几何,熟悉三 d 建模,了解三 d 打印和图上三 d 的 基本逻辑和术语,看得出来问题在哪。一句话把方向纠正了, 所以对人的要求变了,不是要你技能全面,什么都会做,而是你要有通俗性的了解,知道这个领域大概有哪些工具,哪些路径,哪些坑。你不用亲手写代码,但你得看得懂方向对不对。 你的认知决定了天花板 a 阵子的效率,决定了完成速度。第二,遇到问题别问我,问 code buddy。 这段时间好多朋友用 code buddy, 遇到问题会来问我,说实话,我给的答复基本都一样,你把问我的这段话直接发给 code buddy, 不是 敷衍你吧?他是一个对话式的工具,你跟他说这里报错了,这个效果不对,换个方案他能理解,而且他比我懂的多啊,很多时候你觉得他不行,其实就是你没跟他说清楚。 第三,是把 ai 当成一个新来的同事,这个这个很重要,他能力很强,学东西很快,但他是新来的,他不知道你工作的具体细节,所以一开始你要有耐心得花时间跟他磨合。 但一旦他学会了一件事沉淀成 skill, 下次再做同样的事,他就非常高效了。就像这次,第一辆折腾一个多小时,第二辆十分钟就搞定了。而且一定要从简单的事做起。 我见过很多人有两种心态,简单的事觉得用不着他,我自己干,复杂的事觉得跟他说清楚太麻烦,还不如自己做。这两种想法加在一起,你就永远有理由不用他。 但如果你从简单的事干起呢?先了解他的能力、边界和脾气,慢慢加满,你会发现他能接触的事越来越多。说到底,那个博主如果不是看一眼就走,而多说一句换个方法,结果可能完全不一样了。也欢迎大家分享自己用 what 的 角度看懂未来的方向。

挑战,每天讲透一个 ai 知识点,今天是 copy 插件使用,然后我们现在可以发起一个对话啊,比如说调用插件 帮我创建一个 生成工作日报的 skill 啊,就是我可以用这个插件让他帮我写一个 skill 啊,因为这个插件本来就是用来去创建这个 skill 的 嘛,所以你看他现在就要用这个。呃,插件啊,这个插件里面其实也是一个 skill 啊, 只是说它是用插件的方式给你封装起来,然后这个里面会加上各种各样的一个交互啊,你看工作日报需要包含哪些内容, 比如说项目进展跟完成情况,然后,呃,我要想用这个 markdown 的 格式吧,然后今日工作总结完成,我们把这些要求丢给他之后,他接下来就会帮我去创建一个这样的一个 skill, 专门的就可以去帮我去生成整个的一个啊, 一个日报的这么一个 skill 啊,基于对话方式,熟悉基于对话方式吧,你看它这个还挺详细的,是吧? 个人开发完成它这个问题还挺多的。所以说整个一个这个插件里面啊,它的对话是交互做的很好啊。

大家好,屏幕上是 open slide 自动生成的自我介绍换灯片,那 open slide 到底是什么呢?简单说就是你用自然语言告诉 ai 你 要做什么。换灯片, ai 帮你写 react 代码, open slide 负责把它渲染成可以演示的换灯片,整个过程你不需要打开 powerpoint, 不 需要拖拽排版,甚至不需要自己写代码。它有三个核心概念,第一,每一页换灯片就是一个 react 组建,不是什么模板引擎, 不是 markdown 转换,就是真正的 react, 你 想怎么写就怎么写。第二,固定画布,所有页面都渲染在一个一千九百二十乘一千零八十的画布上,框架会自动帮你缩放,适配不同屏幕,你写的时候就当屏幕就是一千九百二十乘一千零八十,用像素值就行。 第三,它是专门为 ai agent 设计的项目,初使化的时候就自动带了一套 skills 文件, agent 读了就知道该怎么写。换灯片来看一下它的架构,其实非常简单,整个项目就三层,左边是脚手架,就是你跑 npxinet 的 时候用的。 它帮你生成项目模板和那些 skills 文件,中间是核心,运行时包括一个 vita 插件、换灯片查看器、检查器和演示模式。右边就是你的内容,也就是 slides 目录下的文件,你只需要关心这里就行了。 那 vt 插件具体干了什么呢?就四个勾子, ctrl 设置开发环境 resource id 声明虚拟模块 logo, 生成换灯片的加载逻辑, ctrl server 监听文件变化处发热重载。然后它生成三个虚拟模块,分别管理换灯片列表、配置和文件夹结构。 接下来看怎么用。左边是工作流,四步循环。第一步, innit 一 行命令生成项目。第二步,在 aint 里输入斜杠 create slide, 告诉它你要自动帮你生成。 第三步,打开浏览器看效果,哪里不满意就点击那个元素,留一条评论。第四步,回到 agent 里跑 apply comments, 它就会自动把你的修改应用上去,然后重复这个循环,直到你满意为止。右边是一些配置信息。 openside 的 配置文件很简单,基本上就是设置一下端口、目录、路径这些,大部分情况你不需要改配置,默认就能用。下面是四个内置的 c 口命令。 create gunk slide 创建换灯片 slide outring 是 技术参考手册 apply gunk comments 应用检查器的修改 create theme 创建可附用的主题。 最下面是文件约定,每套换灯片就是一个 index 点 t s x 文件导出一个配置数组,每个元素就是一页,非常直观。 兼容性方面,基本上任何能编辑 react 代码的 agent 都可以用。 cloud code code, ex cursor, wind surf, gemini, c l i 这些都支持。 生成的焕灯片就是一个静态网站,你可以部署到 versal, cloud, flair, pages, netify 这些平台,也可以直接导出成 html 文件或者 pdf。 最后怎么开始呢?就三行命令,分别对应着创建项目 cd 进去,然后打开你的 agent, 开始用自然语言描述你想要的换灯片就行了。最后我来演示下如何使用。先在终端中一次运行三个启动命令, 确保前置面板可以打开。最后在生成的文件目录下打开终端,然后运行 clod code, 现在就可以在 clod code 中让大模型使用 open slide, 既能创建换灯片了。这里我选择它推荐的这种情况一般一路回车就好。 现在已经完成了幻灯片的制作,下面让它自己打开运行一下。本期视频到此结束,我们下期再见。

下午的时候在和一个朋友聊天,然后他现在他们这种技术的工作吗?都是在用 ai 的 编程卡里扣的,说一些 ai 的 这种编程在帮他们去写代码吗?就说你现在是不是比较闲呀?什么事? 而且我现在非常的忙,而且更忙了,因为现在他可以同时交付去做好几个这样的一个项目,那就是 同时要有几个项目在跑,那其实是 ai, 它提升了整个的效率革命。那我自己亲身来讲,我刚刚 如果历史上我的一些 ppt 就是 正常的,按照以前正常没有 ai 的 节奏的一个 ppt, 至少快哈,至少快,我就是全身心投入进去,出来,然后至少要两三天, 快的话我出来了框架,然后再把我的内容填充到这个 ppt 里面,然后再去找到我的设计师,然后帮我去调整和修改,至少要两三天。那接下来我带大家看一下我用 ai 的 一个, 就是我把我自己的一些想法和框架还有标题所有东西给到 ai 以后,他帮我出了一个,然后我用的是 card code, 然后他这个出出来是完全是能用的, 太可怕了,真的太可怕了。给大家看一下,然后大家看这个 ppt, 就是 我给了一些框架, 给到了我的 ai, 然后他帮我出的,就是我给了他我的内容是什么,然后我我的要讲的是什么?我核心自己的一些观点是什么?然后我是怎么看待这件事情的,然后把大概的东西给他,然后他就从整个的这个就是 猜到他的细节,猜到他的打法,猜到他的整个的安利,然后内容怎么做,所有的东西全部都给我出来了,看到没有?这是个 ai, 不 到十分钟左右给我完成的,看到没有?非常的好。

朋友们,离谱的事来了!一个 ppt scale 竟然在 geth 狂展一万个新标!当你还在被各种 lv 的 ppt 困扰时,它直接把 cloud 变成了高级审美 ppt 生成器。你直接把文案堆在 cloud 或者 codex 说帮我基于这篇文案生成一份儿瑞士范的 ppt, 需要几张配图,从内容到排版,一口气全干完了。它 直接给你推出一套完整的 html 网页 ppt, 各种前端三 s 动效配色,字体大小高级感直接拉满。更绝的是,它内置了两套视觉系统,一套是杂志感的电子水墨风,负责蓄势表达。另外一套是瑞士国际主义风格,专治各种方法论和产品分析。就现两个严格的设计总监, 直接给你锁死了三十二种版式,想乱来都不行!什么封面、数据、大字报、图片、网格、对比页,全都给你安排的明明白白。而且这个 skill 还能让 ai 帮你生成配图、信息图, 甚至还可以裁切自带的照片,一键插入 ppt 槽位。这哪是 ppt 工具,这简直就是把设计团队自动流水化放到了 skill 里,让工具为自己赋能。

好了,各位朋友呢,相信刚刚的视频已经非常清晰了,那这一期我向大家推荐的项目依然是在 github 上有着九点二 k 星标的一个开源项目,它的名字叫做归藏 ppt skill。 归藏 ppt skill 是 一个能够帮助我们制作网页 ppt 的 这么一个 skill 技能,它可以快速的导入到我们 ai 界面当中,不管是 open code 还是 cloud code, 或者是说我自己在使用的 codex, 它的字数文件,它的 redmi 文档当中已经是闪烁的非常清晰了,我希望大家能够在这个网站中把这个 redmi 文档从头到尾读一遍,那这就可以非常快的上手这个 skill 了。 那我简单跟大家讲一讲呢。首先就是安装,安装很简单,如果你跟我一样使用的是 codex, 那 我们直接在对话框中 输入帮我安装这个归藏 ppt skill, 它就会快速的定位帮你安装,就把这个复制进来就可以, 就是他的一个基本的情况。我向大家简单介绍一下,你可以自己来看这个字数文件。那首先有两条视觉系统,一套是电子杂志风,另一套是瑞士国际主义。整体来说,我觉得瑞士国际主义比较的约简单,适合这种会议上的汇报,嬉皮的展示,或是呆萌的一个汇报。 那这个电子杂志风我觉得更多的可能就是一些内部的会议会更多地使用到它,或者说一些小型的培训。如果说你有条件的话,我会推荐大家使用 codex 来进行 这个 scale 的 运行,为什么?因为它有 codex 的 配图功能,也就是说如果你在生成的过程当中,它会给你自动地去给你的 内容进行配图,在某种程度上会方便很多。比如说我给大家看一看我之前生成的,那就是这个,那我打开来看一下,我这个背景图实际上是在创作的过程当中,是由我的 box 给我生成的, 像这个图片,那像这个背和背景图都是他帮我生成的,然后这里的背景图,这个背景图都是他帮我生成的, 他直接给我生成的,又不是我自己去找的,这是一方面,所以说我会推荐大家使用 context。 还有一方面就是如果说你有自己的文件,像我生成的关于鸦片战争的,他是没有相关的文档和教案给到他的。如果是你是一名历史老师,那你肯定会有这节课的相关的教案或者说一些。嗯, 你自己收集到内容要加进去,如果这样的话是最好的,因为这样他的内容就会更丰富一些,信息信息就会更足,他生成的内容就会更加的严谨。如果说你的内容很少像我这样只是给的一段话能生成,那它总体的效果就没有那么的好。我后边加了一个, 这样这个已经有这个 markdown 文档,我给到他之后,他给我的一个新的,我们来一起看一看,对比一下。那像这个内容我觉得 就会更多一点,虽然说它的页数更少,但是它这个内容更加的严谨一些,前后关联性更强一些。对,虽然这是两个不同的领域,但是如果说你有更多的 microsoft 文件,你自己去比较一下,就会发现你生成出来的内容实际上是有差别的。 这是第二点,我们在制作 ppt 的 时候,如果你有事先准备好的 txt 文档或者 markdown 文档是最好的,你直接投喂给他,告诉他你想要什么样的风格,你应该给我配什么样的图片,都可以直接告诉他,只 要他安装这个技能之后,你都可以直接告诉他,这样其实能够帮助我们节省很多的 ppt 制作时间。你比如说像后面的我就 markdown 文件的,我给到他之后,他只用了四分钟就帮我把整个 ppt 做完了, 这个是不是帮我们省去很多的时间?如果说你有这种回报,或者说需要去培训的这样的一个场合,我觉得非常方便的,我希望大家都能够用起来。好,本期内容就是这些,谢谢大家。

设计师朋友们,你们还在为画人脸模型熬夜吗?今天带你们看个颠覆认知的操作,用智能体写代码画人脸简直是降维打击!先看第一组,就用 next pen 里最基础的圆锥圆柱 球体,几行代码一运行,一个萌萌的卡通人脸就出来了。眼睛是球体,鼻子是圆锥,耳朵用圆柱拼接,是不是比手动建模快多了?再看第二组增强版,这次加上了布尔合并,合并倒圆,代码里多了几句合并几何体和倒圆角的指令。运行后,你看 原本棱角分明的脸型变得圆润柔和,眼睛和脸部完美融合,细节一下子就上来了,这效果手动调要多久呢?最厉害的是第三组高精度细节版,代码里加入了更多参数控制, 从眉毛的弧度到嘴角的角度,甚至连眼球里面的瞳孔角膜都能精准定义。 u g 一 直行,连鼻涕胡子都模拟出来了,这精细度完全不输专业建模师。 现在的智能体已经能把复杂的三 d 建模变成简单的代码指令,设计师们与其花时间抠细节,不如学学用代码解放双手。你们觉得这种智能建模会取代传统设计吗?评论区聊聊你的看法。

最近罗克保底非常火,我试用一下他做 ppt, 发现一个很大的 bug, 如果你直接在这里点换图片,大概率会生成失败,也就是给你显示几张图片生成成功了呢,看起来效果也很差。 然后我就怀疑是不是这个工具自带的插件有问题,让 deepsea 直接帮我去生成这个 ppt, 你 看效果还不错。这么一顿操作消耗了一千多万 tokyo, 然后总共三块多钱,的确超值。