android 发布了他们的最强模型 cloud of 四点八,老规矩,我不想跟你念参数,那我其实只关心一件事情,就每次新发模型,我们把它丢进真实的项目里面,它的干活质量到底怎么样? 那这一次这一个 cloud of 四点八新发布的模型啊,我刚测完,我反而觉得 gpt 五点五加 codex 的 组合还能打,为什么呢?看到这个视频最后你就懂了,不过这一次有个东西是真的有意思,就是它这个动态工作流在 cloud code 的 里面,就是你只要一句话, 带上 workflow 这个关键词, client code 当场就给你写一段脚本,然后咔的一下拉起一个几十个上百个 agent 的 舰队,一起去帮你干一件大事。 我们来看一下它整个运行的一个流程图大概是怎么样子的。从这个图片可以看到哈,就是当我们 client code 里面你写了一个 workflow, 它这个时候通过脚本,然后去给你并发各种 agent, 那我们可以看一下它这个脚本长什么样子哈,其实也比较简单,就是它有每个阶段嘛,就是你是 workflow 的 一个流程,每个阶段,比如这个阶段它要排查啊,这个时候可以看到它这个用了一个 await, 是 吧? await 去并行运行了多个 agent, 完事之后走到这里得到了结果,这时候就回到你的主要的对话里面,它又开始去 定型,去开始第二个阶段,再去掉各个 a 镜头,大概就这样的一个工作流的一个过程。下面的话到我们的一个实测环节,这次的话我们用了我的一个开源项目,就是 c c 杠,哈哈,它目前的话有十一点九 k 的 star 是 一个,就是把 curl code 的 卸载原代码补齐,做了一个桌面端,还有 c o i 的 一个 开项目嘛,那这个开项目的话最开始也一直是 gpt 五点五加 codex 去迭代的,那这一次的话, cloud of 四点八出来之后,我要去做一个新功能,我们本期的一个实测哈,就是要让我们这一个桌面端,它在它的右侧能够对我们本地的一些 服务,比如说你用 react 或者是 vue 写了一些本地服务,这个时候我们要去点击,让它在右侧展现出来,或者是本地的一些 html 要拦截这个行为, 并且我们右侧要有要有一个小的一个浏览器预览,而且能够像 codex a p p 一 样,能够就在在上面去选中一些按钮啊,标题啊,或者一些块儿啊,能够去做定位,而且还能够直达答案,让它去修改。 在 codex 聊天中,当它改了哪些文件,比如说是 html 呀, markdown 啊,其实你都可以去点击,点击完它会在右侧去预览,而且下面也有这种打开的方式,也整体的交互,就相对来说挺棒的嘛。在整个桌面端,我认为现在 codex a p p 就是 目前交互最好的在桌面端来看, 那下面我们来看一下这个 html 它是怎么做到整哪打哪的?可以看到这个时候我们不是打开了这一个我们这一期视频的这个 ppt 吗?那它这边有一个模式的话,就是你可以去去,这样有一个选择器可以去选嘛?比如说我选中这一块啊,这个时候我就可以用自然元描述啊,我觉得这一块的 ui 交互啊,文案不行, 那就可以通过这样的方式让他去改,可以看到他就对我们这一个图片这一块加了一个备注嘛,对不对?然后还有我们这块的信息整体就是这个交互的功能,然后还有的话就是这个截图啊,他这个截图已经保存到剪切板,我们可以用大概这样的一个流程, 我们就希望我们这 c c 刚哈哈也支持这个功能,并且也有人在我们的 github 要求里面提出来了要这个功能,那我们就试一下。那今天的话 我用了 gbt 五点五以及我们刚刚看到了 kalco 的 off 四点八去做这个任务,那这边的话也是给了它五张 codex a p p 它整体的一个交互流程,并且我们也是用了这一个 superpowers 的 一个头脑风暴模式,相关的一些提示词都是一样的。然后我们去测试这个任务,我们可以看到 codex 这边呢,它最终启动了四十三个, 呃,三部 a 镜呢?帮我们把这个任务完成了,所以效果怎么样?待会儿我们再来看。那我们回到就是 clock code 这边也是用了陀螺风暴 t s 也是一样啊,也是同样的,就是每个阶段让告诉他我们最终这个设计文档要做成什么样子。有了设计文档之后,他也是去 各种实盘刹不住 a 进的去做。那在 codex a p p 这边的话,它整体的这个消耗可以看到今天我是烧了五亿的 token, 那 对于刚刚我们那个任务,大概我估算了一下,大概有三亿 token 这样子吧。 cloud 这边的话也是今天一天就烧了我这个一百刀的百分之二十的一个额度吧,一天就烧了,没有做其他的 任务,基本上没做其他的任务。好,我们下面来看一下两边的一个实现情况如何。好,下面我们来看一下 cloud 桌面端加 cloud off, 四点八,他去帮我们写了这一个 c c 杠,哈哈,桌面端就右侧这个浏览器预览的功能。 那这边的话我也给了一个提示词,就是让他帮我们产出一个 markdown 的 一个内容以及 html, 再让他去写了一个本地的一个突突项目嘛,就是用 react 去写。那最终他这边写完了之后呢? 啊,可以看到这里其实是已经他这边做了一个监测,当然这块的交互其实没有 code app 原声那么好,当然他也做到了,我们来试一下哈,就是我们在运用浏览器打开 啊,可以看到这个,是不是已经可以去看到这个这个网页这个预览效果了?那我们可以看一下截图功能,点一下可以看到这边其实也是可以用的嘛,是不是?那第二个的话比较关键,就是他这个检查元素嘛,可以看到他也是完成了,是不是?比如说我们就说这个按钮,我们就在这让他告诉他啊,我需要把这个按钮改成 就是这一个网页的主题色,你帮我改一下。另外的话,当前这个按钮的这一个 border 这些我也不是很喜欢,你去调整一下。 好,我们来去确定,你可以看到这边它就已经帮我们把这个东西做过去了,就是把截图嘛,就我们刚看到 codex app 那 边的一个交互,交互过去了,我们就可以去让它去做做这个事情。 那下面的话就是其他的一些功能哈,其他一些功能的话就是它可以在这边,比如说我们这是一个 markdown 的 内容嘛,所以说你可以在工作台去预览,基本上就是把那边实现了一遍。 其实整体实现还是挺复杂的,可以看到 codex 那 边他完成这个任务他都开了四十多个 java agent。 那 cloud 这边其实我没去统计,因为它这个过程没有像 codex app 那 边那么直接, 整体的效果其实完成度还可以,当然还有一些细节优化的点。好,我们来看一下扣贷 app 跟我们完成同样的功能,他是做的怎样子的?可以看到他在这一块, 在这一个行内,其实就帮我们把这一个要预览的这一个,呃,本地的地址啊,还有你的 markdown 啊, html 都做出来了,其实这块交互我觉得会稍微好一些。那么点过去看一下可不可以用,那可以看到都是同一个页面吗?是可以用的,刚刚我们说改按钮那个他其实已经改好了,是不是?那么看一下他这个截图可以用吗? 这个截图这个方式是这样子,它不是像呃 cloud code 实现那样子,是放一个图片在这里, cloud code 那 边会好一些。好,我们来试一下它这个定位也是可以的,可以看下,也是能选择某一个。我们选到这一块说一下,这个文字太大了,改小一点,字号改小一点, ok, 可以 看到它这个其实完成度也挺好的。那现在的话,其实我也没有想清楚,到底是把 gbt 五点五生成的这个核到我们的这个主干里面,还是说把 cloud 那 边去核一下?我可能会把 cloud 那 边的这一些 open 这边的加过来,然后用用 gbt 五点五的这种这种样式,最终把两个合起来,得到一个比较好的一个交互方式。那再看一下吧,从我四月份发布以来,就是从它泄露原代码,再加上我们做这个桌面端嘛, 一行代码的微信百分之八十的代码都是 gpt 五点五加这个 qd 写完的。可以看到我今天除了写这个项目以外,还做了其他一些功能。那下一个版本也在,应该是明天就会发布了,我需要去做一些就测试嘛,可以看到它真的是非常非常的好用,而且最关键啊,它不封号 是不是?那你如果是用呃 cloud 的 话,就是真的特别容易封号,我已经被封了四个了。好,下面我们来做一个总结。对于大多数人而言,我还是推荐你选择 qd 加 gpt 五点五。为什么? 你看我老婆这种律师哈,她现在都已经用上 codex 加 gpt 五点五来帮助她在平时的工作中进行赋能。打个比方,她平时有很多需要去操作 word 呀,然后 excel 啊,还有去填一些表单,这个是完全是可以用啊, gpt 五 点五加 codex 去做。再让我不最近也给她做了一个就是律师相关的一个工具嘛,因为她有她们有很多资料,其实都是需要在本地去操作,就是不能上云嘛, 比如说你像客户管理啊,还有一些合并 pdf 啊,这些都是可以照本地去做的。你说像这种工具,直接用 codex 去做,让它去描述你的需求,然后用那个就是一个 go 的 模式嘛,让它去做,完事之后再让它用 computer user 自己去测,它会自己去 啊,写完之后 build 出来这一个桌面的 app, 然后如果你看像我们这种不是需要去选择 pdf 嘛,对不对?如果你需要去选择 pdf, 它还会自己去打开这个,就像我们一样去打开,打开完了之后 去选择,然后去帮你去压缩,做这种合并,各种都可以做到。所以我为什么会推荐大家去使用这个呢?而且等待下一代模型发布的时候,它会更强。还有最重要一点嘛,就是 g p t 五点五, 你正常人用它一般不怎么封号,那 cloud off 四点八这边也挺强的,但是呢,它的门槛就会高一些,并且它的这个桌面段哈,它这个桌面段体验其实相对来说还是差, codex 会差一些,如果你这两个都用不了, 那你也可以用,就是我的这个开源项目就是 c c 杠,哈哈,这个开源项目也是开源免费的,也没有任何的一个门槛。你也可以用,就是各种国内的模型嘛,比如说你可以用 deepsea 呀,你看我这边其实都有,就 deepsea 呀,或者你可以用小米的呀,或者是智普,你都可以。那它基本上内核它也是 clio 的 本身嘛, ci 的 本身 功能我也在迭代,就看大家自己怎么样个选择。 ok, 不 管是 off 四点七四点八,它整体的这个发布啊,没有给我很惊艳的感觉,没有上一代从四点五到四点六的那个惊艳感, 那还是倾向于就是 g p d 五点六的一个发布,看它到底会带来怎样的改变?我现在基本上已经离不开 codex 这个 app 了,我最近真的狂用。我刚也给大家看了一下我的一个 token 消耗,最近一个月吧消耗了大概一百亿 token, 一 万多刀的一个消耗, 最近就是狂用,特别特别好用,而且运行起来也非常的方便。但是它也有一个问题,就是它容易内存泄露,我六十四 g 的 内存它有时候都能给我干嘛,就理解不了到底在干嘛。 ok, 那 这就是本期视频所有内容了,如果大家觉得这视频做的不错,可以给我一键三连,我是阿建,我们下期见。拜拜。
粉丝2.3万获赞8.3万

大家好,我是手软猫咪。今天这期视频,包括你现在看到的每一页画面,都不是用剪映、 pr 或者任何传统剪辑软件做的,它是 ai 写的一堆网页代码,然后直接渲染成了 mp 四,没有时间轴,没有关键帧,没有拖拽素材。 整个过程我只做了三件事,写文案、录音频,把东西丢给 ai。 可能你会问,这有什么意义? ppt 谁不会做?意义在于这套流程一旦跑通 以后,出同类视频的编辑成本几乎为零,换个文案,换个音频,同样的风格,同样的质量,几分钟就能再出一条。接下来我把整个流程完整拆给你看。先说整体思路,就四步。 第一步,写文案,就是你现在听到的这些话,先把要讲的内容写出来。第二步,生成音频,你可以自己录,也可以用 ai 配音,录完之后用剪映之类的工具把气口和停顿剪干净。现在这句话就是我用阿里的 cosy voice 训练的自己的声音, 听起来我觉得还是挺不错的。导出一个干净的音频文件。第三步,生成字幕,把音频丢进剪映或者其他语音识别工具,导出 s r t 字幕文件, s r t 里面会标记每句话的起止时间,精确到毫秒,这个时间信息是后面的关键。 第四步, ai 生成画面,把 s r t。 字幕文件丢给 ai 编程工具,比如 color code 的 或者 open code 的 这些模型用什么都行。 这期就是用 deepsea 生成的,效果一样好,告诉他按照这些时间戳每句话,生成对应的 html 页面。最后用 hyperframes 这个开源工具把 html 渲染成 mp 四的视频, 核心逻辑就是 s r t。 字幕充当了画面和声音之间的桥梁。如果你不需要这么精确的音画对应关系,比如你只想快速出一版概念视频或者内部演示,那 s r t。 的 不用直接把文案大纲丢给 ai 就 可以 让它自己安排节奏。这里单独说一下 hyperframes 这个工具,因为它是让整套方案成立的关键一环。 hyperemax 是 high end 开源的一个项目,完全免费商用,也没有任何限制。他做的事情是你给他一个 html 文件,他用无头浏览器逐帧截图,然后拼成视频。你可能会说,我自己用录屏工具录 html 页面不也一样吗? 不一样,录屏的问题是时间不好把控,你手动翻页,手动触发动画节奏很难精准。而 hyperremax 是 精准到毫秒的, 每一帧在什么时间显示什么内容,完全用代码决定,不需要人工介入。这意味着效率提升了一个量级。理论上,你一晚上可以批量产出一百期同等质量、同等美术水准的视频。 所以所有你能在网页上实现的效果, c s s 动画 g s a p 动效 three g s 三 d 场景都可以变成视频。而且因为是逐帧渲染,同样的代码永远产出一模一样的结果。 对于我们这个场景来说,最重要的一点就是它天然适配 ai, 因为代元模型最擅长写的就是 html, 你 让 ai 去操作视频剪辑软件的时间轴,它做不到,或者说很难实现。但让它写 html, 这是它训练数据里最多的东西之一。 至于 hyperframes 具体怎么安装,怎么调用,这些你完全不需要知道,你只需要知道它是干什么的,能做到什么程度就够了。把 hyperframes 的 项目仓库地址丢给 air 编程工具,告诉他用这个工具来渲染, 剩下的它自己搞定。我全程没有手动超过任何一条 hyperframes 的 命令,现在一步步看实际怎么操作。文案这一步没什么特别的,你可以自己写,也可以让 ai 帮你列大纲,然后自己调整,重点是确定好每个段落要呈现什么内容。文案就是你整个视频的骨架,音频部分 录音用任何你顺手的工具都行,录完后用剪映把气口和长停顿剪掉,让语音听起来连贯。不想自己录的话, ai 语音合成现在的质量也完全够用了。最终你需要的是一个干净的音频文件。 s r t 字幕。我自己是用剪映 把音频导入剪,应用语音识别功能自动生成字幕,然后导出为 s r t 格式。每一条字幕都有编号时间戳和对应的文字,这个文件就是你丢给 ai 的 核心输入。 最后是 ai 生成 stml, 打开你的 ai 编程工具,把 stml 文件丢进去,然后告诉他你想要什么样的视觉风格。 ai 会生成一整个 stml 文件, 里面的每句话都对应一段内容,时间轴全部绑定好了,预览一下效果,不满意就让 ai 继续调,满意之后让它渲染成 mp 四,再和你之前的音频合到一起,视频就完成了。 到这里你可能会想, ai 每次生成的风格都不一样怎么办?今天是赛博朋克,明天变成了水彩风,没法形成系列感,这确实是个问题,但解决方法很直接。先打磨一套模板,你先花时间跟 ai 反复调一版你满意的 html 模板 配色、字体、动画、节奏、布局方式都调到你满意为止。这个过程可能会来回好几轮,这是一次性的投入。 调好之后,你把这个模板文件保存下来,下次做新视频的时候,开一个新的 ai 对 话窗口,把两样东西丢给他,你的模板文件和新的 s r t 字幕或文案大纲,告诉他参照这个模板的风格和结构来生成新的内容。 这里要说一下为什么是给参照物,而不是写一份详细的设计规范文档,也就是所谓的 skill, 让 ai 去遵守。 原因很简单, skill 是 文字描述,每次生成都会受大模型随机性的影响,同样的规范文档,跑十次可能出十个稍有差异的结果,很难做到完全一致。但如果你给的是一个实际的 html 文件, ai 是 在看着具体的代码去仿照, 颜色值、间距、数值、动画参数全都是确定的,付现的精度高得多,所以这个用模板做参照物的步骤不可替代。最后聊一个观点, 在做这种 ai 生成的 ppt 或者视频画面的时候,瓶颈不再。模型能力在美术参考现在不管是 deepsea cloud 还是 gpt, 写 html 和 css 等能力都够用了。能不能做出好看的东西,差别在于你给他看了什么。 你跟 ai 说帮我做一个好看的 ppt, 他 只能给你一个泛泛的、不好不坏的结果。但你如果给他一张苹果发布会的截图,说按照这个风格来, 或者给他一个现成的设计稿,说参照这个配色和布局,结果就完全不一样。所以我的建议是,平时看到好看的画面就截图存下来,不管是网页、 app 界面、别人的视频截图、海报,甚至游戏 ui, 这些都是你的弹药库。 但要注意,截图只是参考,它的作用是帮你明确自己想要什么方向,真正落地的时候,还是至少用 ai 做出一个 demo, 调到满意为止。这个 demo 就是 我前面说的模板, 它既是你的美术标准,也是后续批量生产时的一致性锚点。总结一下今天的流程,文案、音频、 s r t 字幕、 ai 生成, html、 hyperframes 渲染成视频。整个方案的核心价值是可复制性。第一次跑通这个流程可能需要几个小时去摸索,但一旦有了满意的模板,后面每一条视频的制作成本就非常低了。 hyperture 是 完全开源免费 ai 编程工具,现在也有了很多免费或低成本的选项,感兴趣的话可以自己动手试一下。我是手仁猫咪,我们下期再见。

兄弟们,这是一个能让 ai agent 设计并生成原声可编辑 ppt 的 skill。 它的核心思路是先让 ai 生成 svg, 再用脚本转成 pptx。 之所以这么做,是因为大模型训练数据中 svg 远多于 drawing m l, ai 生成起来更得心应手, 而且两者都是基于坐标的矢量格式,转换比较容易。这样导出的 ppt x 每个元素都能直接点选和修改, 具体怎么用?把它安装到 cursor、 cloud code 等支持 skill 的 agent 工具中。丢一份 word pdf 或网址给 agent, 用自然语言下达指令。比如用这个 pdf 做一份 ppt, agent 会自动完成内容分析、视觉设计、 svg 生成并最终导出 pptx。 如果配了深图或搜图接口,它还能智能配图。此外,这个 skill 还内置了三个独立工作流,一个是模板复刻,把你喜欢的 ppt 样式转成模板,后续直接套用。 另一个是智能配音,将 ppt 每页备注转为语音并回嵌,实现口播旁白。三是动画定制, agent 根据你的描述,给 ppt 添加出场动画和页面切换效果。

今天来给大家分享一下如何快速制作好这种 ppt 啊,并且只需要五分钟左右,我们原来的内容就这样的文字排版的,当然我们只需要把这个内容发送给 cloud, 并且附上这段指令啊,让他根据上面的内容生成 ppt, 他 就能直接去进行生成啊,生成完成之后呢,我们点击这里下载 就可以直接打开了,这一共是十页,并且排版布局啊也是非常的 ok, 而且可以来去进行二次编辑调整,如大家也想使用的 cloud, 用来写作科研,做数据分析,做 ppt 等等,都可以点击我主页的置顶作品找到我。

今天的目标是手把手教大家安装 skills, 零基础小白友好,同样的 agent, 搭配同样的模型,为什么人家做出来的效果就是不一样?差距其实就在一个东西上, 人家装了 skills 做行业调研报告,没有安装 skill 的 时候, agent 无法搜索网络上的公开信息,只能依靠过时的训练数据来写报告。而安装了 skills, agent 不 仅能举出近期的真实案例,还能列举出来所有的真实信息来源。再比如,做 ppt, 没有安装 skill 的 时候, agent 的 配色一如既往的蓝紫色渐变,而安装了 之后, agent 的 设计的 ppt 瞬间变得更高级了,切换的动效也很丝滑。那 skill 到底是什么?为什么能让 agent 一下子变得这么强? 我用一个类比讲清楚,先想象我们的 agent 是 一个特别能干,什么都愿意帮我做的通才助理。通才的优点是什么都能做,缺点是每一件事都不够专业。而 skill 就是 我给这个助理喊来的一个领域专家,可能是一个 ppt 设计师,也可能是一个调研分析师。这个专家手里揣的那本书,是他在这个领域多年经验沉淀的 s o p, 踩过哪些坑,什么做法好,什么 细节不能漏,全都写在里面。我交代任务的时候, agent 会先翻这本书,再照着专家的方法去做。这就是为什么有的人做出来的东西就是不一样,表面看是同一个 agent, 背后其实站着一整排的领域专家。今天第一个要给大家推荐的 skill 就是 这个叫 agent reach, 它在开元社区上已经有超过两万的 star。 简单来说,这个 skill 就是 能够给 ai agent 们一键装上互联网的能力,有了这个 skill, agent 们就可以去解锁最新的网络上的一些公开信息。我们尝试用 npx 的 命令去安装这个 skill。 skill 已经安装成功了,我们需要重启让它生效。斜杠输入 agent, 用上下箭头去找到要用的 skill, 找到了之后不要急着按回车,因为回车会直接把消息发送出去,这个时候应该要直接按 tab 键, tab 键是把这个 skill 的 名称补充到输入框,复制作调研报告的 prompt 发送给 agent, 它已经在读取 agent reach 这个 skill 的 文件了。这里提示 agent reach 安装完成, excel 搜索已可用。现在开始正式的调研了。 pdf 文件已经保存成功了,我们可以打开看一下。但是这样的一个 pdf 文档还不是很利于阅读,那我下一步我想要把它转成一个 ppt 文档。今天要给大家推荐的第二个 是归藏老师的一个 ppt skill。 这个 skill 在 开源社区上已经有超过一万的 star 了,它主要是能够让 agent 们去做出来非常好看的 ppt。 这里有电子杂志风,瑞士国际主义风。我们同样是通过这个 n p 叉的命令去安装 skill, 复制 n p 叉命令可以新开一个终端 发送出去。这里中间有一个问题是你希望安装给哪一些 agent? 然后有一些通用的 agent 都在这边已经默认勾选上了,还可以去选择一些其他的 agent。 空格键是选择回车就是确认。这里是问我们 安装的范围是仅在当前这一个项目内可用还是全区可用,那我这里选择的是 global 全区可用上下切换,然后回车,推荐 simlink 的 方式回车是否确认安装? yes, 这里是问我们是否要安装这个,帮你查找 skill skill 强烈建议大家去安装上这个的,这样的话以后 agent 就 可以自动帮你去查找 skill 了。到这一步的时候,我们已经把这个 skill 给安装好了,这时候我们可以启动 agent, 斜杠 ppt 就 已经可以找到我们刚刚安装的规范 ppt, 然后 tab 键输入这个 skill, 再把我们之前准备好的这一段做 ppt 的 prompt 同样的复制过来。 因为有 skill 的 缘故,这里 agent 呢会先问我视觉的风格,他推荐我选择瑞士国际主义,那我们就 follow 他的推荐选哪套主题色克拉英兰。 agent 呢?开始读 skill 文档了, agent 呢,已经写好了一个 ppt 的 html 文件。哇,这个背景居然是会动的耶!这是没有 skill 的 时候,这是有 skill 的 时候。 不多说了,赶紧去安装这个 skill。 第三个要推荐的 skill 是 花书的这个 design skill, 很多人在 webcoding 的 时候会觉得 agent 做出来的网站前端设计太丑了,花书的设计 skill 就是 来解决这个问题。这是 webcoding 从零到实战系列的第三期,我们下期见。

我发现使用的克拉的用来做 ppt 啊,以及做图片也是非常的强,我们来看一下,我直接让他帮我分析一下这国外的四大 ai 都有哪些区别,以及我们在什么情况下应该 用哪一个 ai, 然后让它生成一个海报或者 ppt 的 形式发送给我。然后呢它就直接生成了一个 ppt 啊,我刚才点击下载,然后打开看了一下,它一共生成了十页啊,不知道看一下大家觉得效果怎么样,这是每页的内容啊, 总结啊等等之类的应用场景啊,非常好。然后呢我在想我是截图呢还是什么之类的, 要把这个图片全部保存下来,然后我直接跟他讲,把这个图片里面 ppt 里面的内容直接生成一个图片的形式啊,发送给我,并且让它生成一篇三百字左右的文案啊,来讲讲各大 ai 的 优缺点啊。然后呢他首先把这个 配套的文案生成下来,并且呢把这十张啊图片也能直接生成下来,我们直接点击这里下载就可以了,直接下载看到没有? 如果大家也想使用的 cloud 的, 用来写作科研,做数据分析,做海报,写代码等等,都可以点击我主页的置顶作品找到我。

哈喽,大家好,我是奇帅,今天给大家分享一下怎么用 ai 大 模型快速做 ppt 的 方法。首先整个方法的结论就是先内容后形式,我们做 ppt 不要说上来先打开 ppt, 打开以后一顿一顿操作,而是先自己内心想清楚,我们这一次分享通过 ppt 形式讲什么内容, 把内容给确定下来。内容确定下来以后,我们后期再让 ai 去帮我们排版,其实里面最核心的内容是来源于我们个人, 只不过后面现在来讲苦力活排版什么的,我们是交给 ai 来做的。首先整个方法一共分为五步,我们先从头到尾过一下。第一步,我建议大家在自己的笔记本上先用手写写一下大概的结构化的大纲。 先说我们这次分享什么内容,把这内容大概先在内心里面串一遍,通过这个笔记本的手写也先记录下来。第二步,我们打开自己的电脑或者打开手机 这个输入法,打开这个输入法与通过语音转文字的形式,我们把刚才自己在笔记本上写的内容大概的讲一遍。 接下来第三步,我们把刚才的文字脚本交给 cloud code 去分析,并且给 cloud code 发指令, 让它去生成 stm 二版本的演示文稿,这里面其实大家可以调用各种 skill。 接下来第五步,格式的转换,这五步我自己亲自通过手写到云转文字,再到 ai 分 页,再到生成 ppt, 觉得格式转换这五步是我自己的实操的过程。那么每一步到底怎么做?其实从我们手写那个大纲和笔记的到最终输出,其实每一个环节都有一个具体的操作方法。第一步是内容的准备, 我们这部首先要在自己的笔记本上用手写结构化的大纲,先不要考虑说你第几页放什么内容,把大纲的内容以结构化的形式写出来就行了。手写的优势在于我们不受排版的干扰,专注于内容的本身, 笔和这个纸能让我们沉浸下来,能让我们有深度思考的状态,把我们想表达的东西呢完整的先给梳理一遍,最终我们会输出一份手写的相对来讲比较结构化的一个内容大纲。第二步是云转文字, 我们可以打开某个输入法,然后通过云转文字的功能,看着自己笔记上记的那些内容,完整的给念一遍表达出来。 这个时候也不要说自己说的话太多,也不要说自己说的不够结构化,有点啰嗦等等都无所谓。我们这一步最主要的目标是要把自己想表达东西给重点给说出来。我们要一个完整的文字的脚本,这个文字脚本里面有口水词, 有其他的莫名其妙的词汇都无所谓,但是我们最主要的目标是有这个脚本,有这个脚本以后,接下来我们就可以通过 ai 去生成了。 我们拿到这个脚本交给 cologne, 就 给他说你读取一下上面的内容,然后做一个 ppt, 看看怎么把这些内容给分页以结构化形式展示出来,让我的观众能够轻易的明白我表达的内容。最后 cologne 会给我们生成一个分页的文字脚本, 然后也方便我们快速讲解,让别人听得明白。我们拿到这个方案以后再问给克拉克的,告诉他你接下来帮我生成一个 l t m 二版本的 ppt, 如果说这中间你可能内容还要更改,那么你可能要让克拉克的给你生成一个可修改版本的。如果说你确定不改了,后续你也不想自己改,全是通过 ai 大 模型让克拉克的去改的话,那你就直接让它输出不可编辑的版本就行了。 最后它会生成一个 stmr 版本的文件,保存为本地了。 tmr 版本的 ppt 可以 通过浏览器的形式去打开,就像我们现在看到的这个就是一个 stmr 版本的。一个 ppt 生成完以后,最后我们要做一个适配不同场合的输出, 如果说我们自己分享,这就无所谓了,我们直接通过浏览器打开这个 i t m l 版本的文件就行了。但是可能有些正式的场合需要 ppt, 那 这个时候我们要用 cloud code 或者 code text 去转成 ppt 的 格式。 如果说你要想确保自己这里面的字体间距等等保持美观,那么在不同电脑上打开都一样,那么我建议你导出一个 pdf 的 版本,这个事情同样也是要交给 code code 或者 code text 去做就行了。我们只需要告诉他, 你把这个帮我生成一个 pdf 的 版本,其实在中间的任何过程中,我们都只是需要下命令,转完以后就直接用就行了,我们要的是最后的结果。对比下来,我们想一下,我之前做 ppt 的 时候是打开 ppt 边做边想, 其实包括就算我的内容确定了,我后面还得再开始调字体,调间距,反反复的调整非常麻烦,如果说我要做一个分享类型的 ppt, 多多少少也得半天或者一天的时间,这也算是效率越高的。 但是现在我有了这个 ai 的 辅助,我就可以专注于内容排版这些苦力活,完全交给大模型,交给可乐扣的,省下了我大量的时间。你就像我做当下分享这个 ppt, 我 大概前前后后用了不到二十分钟, 从最初的想法到这个 ppt 最终的生成,一共不到二十分钟,还是效率挺高的。 那么整个流程操作下来,我觉得非常没毛病,非常完美,就给出的结果也非常好看。所以说我也建议大家自己亲自去实操一下,按照我这个教程的实操,这以上都是我通过 cloud code 去做完整 ppt 的 一个过程,也希望对大家有帮助。

今天看一个 cloud for ppt 插件,它的重点不是帮你生成一堆图片再塞回 powerpoint, 而是直接在 ppt 里面生成一份结构完整、后续可编辑的演示文稿。 进入方式也很简单,在 powerpoint 的 开始菜单里打开加载项,选择 cloud, 就 能在右侧面板里直接输入需求。这次我用一个学术汇报来测试,题目是面向本地部署的大语言模型推理优化与应用研究, 要求里一次写清楚研究背景现状问题、技术路线、实验设计结果、分析和总结展望,整体做成深色学术风格控制在十页左右。这种提示词的关键是把页面结构、内容范围和视觉风格都说清楚。 插件接下来不是只做一张封面,而是在当前 ppt 文件里规划整套汇报。点击生成后,它会先拆解主题,再按页搭建内容。你能看到它在逐步创建标题页、研究背景现状与关键问题、技术路线、实验设计、实验结果等。页面 生成出来的封面已经有完整标题、复标题和学术汇报风格。后面的页面也不是空模板,向大模型、本地化、趋势推理、资源瓶颈、工程化落地需求都被组织成了卡片和章节。 再往后看,方法设计、实验设计结果分析里出现了表格、流程结构和柱状图,这一点很重要。它生成的是 ppt 里的文本框形状表格和图标,不是截图,后续改标题、调颜色、换数据、挪版式都可以直接在 powerpoint 里编辑。 它还具备搜索能力,搜索到的是网上真实内容,用来补充材料和参考信息,比完全凭模型记忆生成更不容易跑偏, 所以这个插件更适合做可继续加工的 ppt 出稿。它把资料理解、结构规划、页面排版和可编辑对象放在一个流程里完成,也省掉图片转 ppt 的 变形问题。最后看一下这些页面,封面研究背景、技术路线、实验结果、总结与展望都已经成套生成, 你可以把它当成一个可编辑的学术汇报,股价后面只需要根据自己的真实数据继续精修。如果你还想看 club for ppt, 做商业计划书、产品发布会、课程课件或者论文答辩这类场景,可以在评论区留言, 我后面会继续拿真实案例做实测,重点看它生成的内容质量、搜索来源和 ppt 可编辑程度。觉得这类工具评测有用,也可以先关注我。

上条视频和大家分享了,装完 coco 之后,那怎么用它来帮我们解决实际的问题呢?那接下来我将会出一系列的教学视频,包含怎么用 ai 做 ppt, 怎么做视频,怎么做自己的个人作品集合网站,以及如何收集资料等等。 当然如果你有其他的需求,也欢迎评论区留言,我会陆续出相关的教程给大家,所以记得持续关注哦。好,接下来我们直接进入到正题,今天第一期教程,先和大家分享怎么用 ai 做好 ppt。 之前我们一直强调 skill 是 菜谱,要做出不同的菜,就得找到不同的菜谱,告诉 clarko, 他 才知道流程是什么,用什么配料。所以大家平时可以持续关注下那些在给哈仓库里面新标比较多的,就证明用的人很多。其中做 ppt 的 skill 在 中文圈里面非规章老师的这个规章 ppt skill 莫属了。 那最后我做出来的效果先给大家看一下,这个就是我把一个简单的个人信息的握文档丢给了 coco 要用的这个 ppt skill 做出来的这样的一个效果,大家可以看看觉得怎么样?我觉得整体的效果做的还是蛮不错的,他把我的这个信息做了一个提取,然后整理在网页上面, 接下来我就会演示在 vsco 里面怎么调用 clouco, 用这个 ppt skills 来去做出这样的一个成品。首先我们先打开 vsco, 就是 这样的一个界面,在 vsco 里面可以搜索这个 clouco, 就是 在这个扩展里面就是这个 clouco for vsco, 直接点击安装,我们安装好这个 clouco 的 扩展之后,后续每次打开 vsco, 我 们在这个右上角就会看到这个 clouco 的 按钮。我们每次去做一个项目的时候,我们都可以新建一个文件夹, 比如说这个是我之前新建的一个空的文件夹,然后假设没有使用的文件夹,我们就在这里面直接新建一个文件夹,然后选择打开,打开之后直接点击这个 clark co 的 按钮,我们就可以直接进行对话了。打开这个对话窗口之后,像刚刚说到的,我们要让这些 skill 帮我们去做事,但很多时候我会给大家一个建议,就是这个 skill 具体是能做什么的,我们可以先丢给 clark co 问问他, 所以你问他的时候,他会先去读取这个网页里面的内容,他就告诉我们这个 ppt skill 是 可以帮我们去做一个横向翻页的网页, ppt 是 一个 html 的 文件,具体下面有这些功能,如果我们想让它基于我们给的内容,让它去输出一些 ppt, 那我们就可以直接把我们的信息丢到这个文件夹里面,我们把这个简历放到这个文件夹里面,然后就会在这个文件夹里面去识别到我的这个内容,我就让他基于这些信息帮我做一个 ppt, 可以 看到他自己在一步一步的去规划要做的事情,他就先规划这个 ppt 的 结构还有内容大纲,然后生成这个瑞士风的 ppt 之后再去验证这个效果。当他做完之后,他就会提示你是否要在浏览器当中打开这个 ppt 的 预览效果, 我点击券之后,他就打开到浏览器让我去做一个预览,这个就是一整个瑞士风的一个 ppt 的 效果,我觉得整体还是非常的清晰和简洁明了。对比我那样一个 word 文档的一个信息, 我觉得通过这样的一个 ppt, 或者说这样的一个求职简历给到 hr 来看,其实还是挺加分的,不知道大家觉得怎么样?所以总结一下。今天跟大家分享的就是在 vsco 的 这个软件里面去安装完这个 clolo 的 扩展之后,每次我们打开 clolo, 然后去新建一个文件夹, 把你要给 clolo 识别的一些信息跟内容都放到这个文件夹里面,然后每次点开右上角的这个 clolo 的 图标,我们就可以跟 clolo 去进行对话了。 第二个比较重要的就是我们每次让 cloudco 帮我们干活的时候,最好就是调用别人已经封装好的 skill, 当你解决不同的问题的时候,就用这些 skill 帮我们去解决。 然后当你不知道这个 skill 能干什么的时候,就直接在这个对话框里面,让 cloudco 帮你去读取这个网页里面的内容,问问他这个 skill 是 干嘛的。所以对于那些想要做课间 或者去做一些演讲分享,对外的展示这些内容,我觉得用这个 ppt skill 是 一个不错的选择。所以今天的分享不知道对大家有没有帮助,或者大家在实操的过程当中遇到什么问题都可以留言,我会针对大家的问题给予解答, 以及大家还想知道用 call 能做什么,也欢迎评论区留言,我会出相对应的教程分享给大家。好,那我们今天的分享就到这里,我们下期再见。

如果你也被 cloud design 种草了,但又不想付费,不想把数据传云端,不想被绑在一个模型上,那么今天这个工具就是你要找的。你现在看到的这条视频就是它帮我制作。它 叫 open design, 功能上跟 cloud design 对 齐,区别是原码公开,不绑模型,数据留在本地没有门槛。有意思的是,不管你平时用的是 cloud code 还是 deepsea, kimi 还是 gemini, 一 共十三种,它自己就识别了,不需要你再装任何东西。你本地的 ai 就是 设计引擎, 全程在你电脑上跑代码,设计、搞项目,文件全在你手里,想分享的话也可以一键推到路由 excel 公开上线, api 秘钥自己配,从头到尾你说了算。它自带了三十一个设计技能,七十二套品牌设计系统, ppt、 网页、海报、移动端原型,一句话就出来,而且是带自检的,不会出那种一眼 ai 的 烂东西。不管你是设计师、 pm 前端,还是做自媒体,值得一试。

兄弟们,他来了 clodico 的 桌面端应用,不需要 clod 账号,只需要下载个软件,打开就自动检测环境,一键补齐,依赖配置个模型就能用。国内的各种模型也支持接入,本地就可以直接运行,专为新手而生。那他和官方的 clod 桌面端有什么区别呢? 第一个,官网的封号严重,不管是网络订阅方式,你不在官方 c r i 你 都有可能踩雷,已经有很多兄弟中招了。第二个,他很多功能都是受限的,你必须开订阅才能做到。第三个,贵,订阅费加 token 包,重度用户一个月开销不小。第四个,网络问题,国内访问要么慢的离谱,要么干脆连不上, 那用我们的工具箱区别在哪呢?首先,第一个对新手更加友好,打开就自动检测环境,检测完了一键安装,进入主页登录后直接可以使用。 第二个,模型自由,你想用什么模型就接入什么模型,工具箱也自带 cloud 和 gpt 的 模型。第三个,多窗口并行,可以添加多个新的窗口,甚至可以开 codex 同程序窗口,切换效率更快。 第四个,更稳定,不需要担心封号问题,也无需使用模法,国内直接可以用。第五个, skill 和 npm 包一键安装,直接搜索 skill 名称,直接点击安装就会自动全剧部署,简直不要太爽。 第六个, u i 设计,交互更友好,原生 cloud 的 cloud 是 程序员的终端工具,而这是给所有人用的。 cloud 的 桌面工作台,左侧多项目同时执行,右侧看 agent 的 进度和 get 状态, 每一步都看得见,把命令行的 ai 编码变成桌面级的可观测工作流,所以我做这个不是为了和官方较劲,是真的受够了写到一半被封号那种崩溃。想要这个工具的兄弟们关注我,我都给你准备好了,用得爽记得回来告诉我。

上一期关于如何从零到一安装 cloud code 获得了差不多十万人的观看啊,但是有很多人还在问像 cloud code 的 桌面端如何配置呢,哎,正好前段时间啊, cloud code 的 桌面端也能够接第三方模型呢,所以说今天我就给大家带来这个教程。 ok, 大家好,我是 fred, 专注从普通小白的视角分享怎么从零开始用 ai 和 web coding 提升自己的生活和工作效率。 我们第一步的话可能还是去打开整个 cloud code 的 这个官网啊,然后这里可以去下载 cloud 的 这个呃桌面端的应用,安装好了之后,我们就会进入到整个 cloud 的 这个界面, 然后到这里面的话就有一个很重要的点,就在于说不要直接登录啊,这里面直接去点这个 help, 然后点这个 troubleshooting, 然后这里面去点这个 enable developer mode, 也就是打开开发者模式, 点击这个 enable 之后呢,它就会重启啊,重启这个桌面端,重启桌面端之后,大家就可以看到这里面多了一个音呃 developer 这个按钮,也就是这个开发者的按钮,然后我们打开这个 configure third party influence 啊,点进去之后呢,我们就可以看到这里面,哎,其实我已经点好了,首先大家需要选择就是这个 gateway, 然后这里面需要关注的点就是一个是 url, 就是 它的整个的链接,一个是 api key, 这两个怎么去获取呢? 首先从 url 上面来讲,我们可以打开 deepsea 这个官网,我们这里可以看到像这个呃 deepsea 的 sorpy 的 url, 就是 这个这个网站,所以说我们只需要把这个网站呃复制进去就 ok 了, 然后 api key 怎么去获取呢?然后同理我们去点击这里 api key 进去之后,这里面可以去创建 api key, 呃,然后比如说 friend three 啊,然后点击创建之后,它就会自己默认复制出来这个 api key 呢,但有一个点非常非常非常关键的点啊,就是说大家一定要关注,就是你如果复制了这个 api key 之后, 那么后面的话就是,呃点击关闭之后,后面这里就没有办法再复制了,所以说我们就只只需要把这个复制进来,这个 api key 复制进来,然后往下的话有三个非常两个很关键的点,一个就是我先可以给大家擦掉, 就这里面去添加这个模型,这个模型怎么去获取呢?也同样道理,点开这里可以看到这个模型的名称,也就是 deepsea v 四 flash 和 v 四 pro。 ok, 我 们就把这个模型复制进来,有个很关键点就在你你需要去打开这个 e m 的 上下文 啊,也就是一百万 token 的 上下文啊,这个会让你整个使用体验会更好。第二个就是 deepsea v 四 pro, 对 吧?然后我们把它复制进来,然后同理也是,呃,打开这个 em 上下文,完事之后呢,就只需要点击这个 apply locally, 就是 本地应用,它就会重启了。 ok, 重启进来就大家就能够看到一个非常非常熟悉的界面,就是也就是用 clock code 的 界面啊,我们可以问一下,好吧,你是什么模型对吧? ok, 久违的这个闪光啊,虽然说它写的还是 cloud, 但实际上它就是 deepsea 的 flash 啊,包括 em 的 啊,这个上下文和 pro 的 模型。 所以说总结下来的话,我们今天这个事情啊,所以首先首先要退出这个登录啊,就刚刚没有演示,但如果你本身有登录,那你可以退出登录。第二个,点击这个开发模式第四,然后看到这个 devilper, 然后才算成功。下面去关注一下整个的一个配置啊, gateway, ur l, api, key 和你选择的 model 以及 em 的 上下文。 然后整体完成之后呢,整个 color code 就 能够配置好的。 ok, 我是 fred。 后面我会持续用真实的案例告诉大家怎么把 ai 用进自己的工作流,欢迎大家关注我们,下期再见。

大家好,屏幕上是 open slide 自动生成的自我介绍换灯片,那 open slide 到底是什么呢?简单说就是你用自然语言告诉 ai 你 要做什么。换灯片, ai 帮你写 react 代码, open slide 负责把它渲染成可以演示的换灯片,整个过程你不需要打开 powerpoint, 不 需要拖拽排版,甚至不需要自己写代码。它有三个核心概念,第一,每一页换灯片就是一个 react 组建,不是什么模板引擎, 不是 markdown 转换,就是真正的 react, 你 想怎么写就怎么写。第二,固定画布,所有页面都渲染在一个一千九百二十乘一千零八十的画布上,框架会自动帮你缩放,适配不同屏幕,你写的时候就当屏幕就是一千九百二十乘一千零八十,用像素值就行。 第三,它是专门为 ai agent 设计的项目,初使化的时候就自动带了一套 skills 文件, agent 读了就知道该怎么写。换灯片来看一下它的架构,其实非常简单,整个项目就三层,左边是脚手架,就是你跑 npxinet 的 时候用的。 它帮你生成项目模板和那些 skills 文件,中间是核心,运行时包括一个 vita 插件、换灯片查看器、检查器和演示模式。右边就是你的内容,也就是 slides 目录下的文件,你只需要关心这里就行了。 那 vt 插件具体干了什么呢?就四个勾子, ctrl 设置开发环境 resource id 声明虚拟模块 logo, 生成换灯片的加载逻辑, ctrl server 监听文件变化处发热重载。然后它生成三个虚拟模块,分别管理换灯片列表、配置和文件夹结构。 接下来看怎么用。左边是工作流,四步循环。第一步, innit 一 行命令生成项目。第二步,在 aint 里输入斜杠 create slide, 告诉它你要自动帮你生成。 第三步,打开浏览器看效果,哪里不满意就点击那个元素,留一条评论。第四步,回到 agent 里跑 apply comments, 它就会自动把你的修改应用上去,然后重复这个循环,直到你满意为止。右边是一些配置信息。 openside 的 配置文件很简单,基本上就是设置一下端口、目录、路径这些,大部分情况你不需要改配置,默认就能用。下面是四个内置的 c 口命令。 create gunk slide 创建换灯片 slide outring 是 技术参考手册 apply gunk comments 应用检查器的修改 create theme 创建可附用的主题。 最下面是文件约定,每套换灯片就是一个 index 点 t s x 文件导出一个配置数组,每个元素就是一页,非常直观。 兼容性方面,基本上任何能编辑 react 代码的 agent 都可以用。 cloud code code, ex cursor, wind surf, gemini, c l i 这些都支持。 生成的焕灯片就是一个静态网站,你可以部署到 versal, cloud, flair, pages, netify 这些平台,也可以直接导出成 html 文件或者 pdf。 最后怎么开始呢?就三行命令,分别对应着创建项目 cd 进去,然后打开你的 agent, 开始用自然语言描述你想要的换灯片就行了。最后我来演示下如何使用。先在终端中一次运行三个启动命令, 确保前置面板可以打开。最后在生成的文件目录下打开终端,然后运行 clod code, 现在就可以在 clod code 中让大模型使用 open slide, 既能创建换灯片了。这里我选择它推荐的这种情况一般一路回车就好。 现在已经完成了幻灯片的制作,下面让它自己打开运行一下。本期视频到此结束,我们下期再见。

想必通过 ai 去生成 ppt 已经是大家普遍的需求了,那近期我就把各类的 ai 生成 ppt 的 方案都做了实测,三周,花了我上亿的投坑,总计花费也超过一千块钱了。 本期视频我就把我过程中的一些经验和踩了一些坑分享给大家,把这三种方案在生成效果、生成成本、生成效率和适用场景上的表现做了一个记录,在视频最后整理了一个表格,有需要的朋友可以截图保存。 那目前从我看来,现在大家对 ppt 的 需求是比较多样化的,因为有的时候需要设计感比较强的 ppt, 有 时候又需要生成一些汇报类的 ppt, 那 有时候我对于 ppt 的 内容可能又会反复的调整, 所以也就导致我们现在的 ppt 生成的需求很难用一套工作流就把它全部满足。那我们从现在的 ppt 生成技术方案上来说,大概都是三类部件的组合,一类一是大模型,比如说 cloud、 四点七 gpt, 五点五 deepsea、 gm、 kimi, 这些都是可选项, 它们其实就是 ppt 生成的大脑去指挥这个 ppt 的 生成的过程。那第二个必不可少的就是 agent, 比如大家常听说的 cloud code codex、 open code, 这些其实都是智能体框架,它们是工作任务的流程指导,当然目前还有一些第三方工具做的 skill 也可以归属到智能体框架里。 那第三就是一些后处理的手段,因为模型在处理能力上的不足,你就会发现有一些能力我们需要去外挂一些部件, 有些是通过大屏的提示再去做一次操作,那有一些是外挂一些组建,比如说像图片转 svg, 像 html 转 ppt, 当然这一块不是必须,它主要是为了补齐模型能力的不足。 那我们把这些两两组合之后,就会得到非常多的生成方案。当然其中有一些因为竞争原因,一些框架和模型是没有官方兼容的,比如你想让 clock code 去接 emoji, 当然虽然也有一些邪修的办法,但是我实测以后会有很大的不稳定性,所以这类方案也就不在我本次的分视频范围内。 那最终到底哪种更好呢?我就在这些海量的组合里面做了一批测试,我这次测试是拿了我工作中的一个简单的一个产品介绍, 这个内容并不是太规整,我就直接把这段文字再加上一句,请帮我生成 ppt 作为输入,那其中并不做特别细化的 prompt 提示的处理,一方面为了尽量的公平,另外一方面也尽量能体现出模型以及 action 自身的理解和设计能力。 最终我就挑选了三个方案,我觉得应该能覆盖开头我们说的各类的 ppt 生成的场景了,那下面我们就来详细的看一下实际的内容。好,那第一种方案就是使用 codex 加上 gpt image 二生成, 那这张图就是我通过 codex 加 image 二去生成的。可以看到它其实还是一个 ppt 的 展示形式,但是它整体的文件格式是 png 的 格式, 所以你会看到整体的它会有 ppt 的 标题,也会有 ppt 的 内容,而且从整个内容上来说,它的设计感还是非常好的。那我个人感觉这张 ppt 直接拿到产品发布会上是完全可以使用的,但是有个问题就是其实网上有很多人在分享用 codex 去转 svg 的 方式去生成二次编辑的 ppt, 像一些常规布局的形式,它其实转 svg 还可以,但是你只要稍微有一些设计感的考虑,它再去转 svg 的 时候就会有问题。像刚才那个 ppt 转完之后就会有非常大的设计上的损耗, 这种有些设计感的图片在转换的时候基本上都不太能还原效果,虽然它把文字和矢量图都已经摘取出来, 但是整体的效果已经完全没有,刚才我们看到那种设计感就是那第二种就是通过 clockcode 加上 pptmaster 去生成的一个原声编辑 ppt 的 一个文件, 那大家可以那从这个文件里面可以看到整体的效果还是不错的,每一个元素在 ppt 中都是可以编辑的。而且最关键的是左后端是接的 deepsea 的 模型,并没有接像 deepsea 和 ops 四点七这样的更强的模型, 我接 deepseek 去生成这样的 ppt 的 时候,整体效果也没有差很多。那第三种就是通过 clockcode 加上 off 四点七去直接生成的一个 html 的 网页, 但是我要求它去生成一个类似 ppt 形式的 html 网页,所以它也会有前面的这个导航。整体效果大概就是这样,从生成效果上来说应该是比 ppt, 但是同样的它也会有一些转换上的损耗, 所以如果你对 ppt 的 格式没有严格要求,那 h 加二五去做演讲是非常棒的一种形式。那最后我们来做一个总结,如果你需要设计感比较强的 ppt, 那 首推还是 codex 加 gpd 二,效果很好, 缺点就是二次编辑转 svg, 很 可能会丢失一些设计效果。所以建议就是在前期就和大模型做好整体版面的确认,在最后进行生成。 那如果你的设计感要求不是很强,而且要汇报的形式一定是 ppt, 那 我就建议你使用 color code 加 ppt master 加 deepsea v 四 pro 这样的方案,那这种方案整体效果非常可控,设计感其实也不差。而且实测我生成二十张 ppt 也就最多是两百 k 的 token 消耗,按现在 deepsea 的 折扣价,一张 ppt 也就两毛钱,非常给力。最后,如果你的汇报不严格要求是 ppt 格式, 那我非常建议你直接使用 curlcode 去生成 html 去做演讲,这样子对大模型的生成更友好,且动态效果更优。

如果你也想用 skill 做高级感的 ppt, 这四个做 ppt 的 skill 一定要收藏!第一个, beautiful html, 一个通过 html 做 ppt 的 skill, 一 共有三十四个模板,从简洁、商务到内容展示全都有。而且它做出来的 ppt 更加有网页感,整体会比较简洁,也更像现在很多公司都喜欢的那种比较干净、高 高级的视觉风格。如果你是做过工作汇报、内容分享、课程型的 ppt, 优先看这个。第二个,微藏 ppt, 这个适合对审美要求更高的人,它最大的特点就是设计感非常强,而且自带一些动画和页面的转场。里面有很多风格,比如 电子杂志风,也有比较现代的瑞士国际主义的风格,而且还能顺便做各个平台的封面图。如果你经常把文章转成演讲的 p 个人分享、关键表达、产品分析的呢?那这个四 q 必看。第三个,卡米,这个比较适合经常做文字内容的人,他不是那种特别强烈的商务风,而是那种非常舒服的质感的排版。他更像是一套比较干净的纸面的系统,轻安静,而且不抢内容。如果你要做读书笔记这 知识分享,或者文字比较多的那种清亮的汇报,可以用卡米。第四个,卡瓦雷达,这个严格来说它不是专门用来做 ppt 的, 但是它非常适合做 ppt, 里面的封配图等等,里面需要更好的一些视觉素材都可以用它。它可以直接输出拼音记或者 pdf, 直接放进 ppt 里边。

小白也能会的。 tray 里安装 cloud code 教程来了,在 tray 左侧边栏点击插件图标,在搜索框中输入 cloud code, 在 搜索结果中找到官方插件安装, 安装完成后还无法使用,不使用魔法的话,需要链接国产模型的 a p i t 访问智普 ai 开放平台注册账户,完成实名认证。这里需要自己添加一个 app, 后面要用, 在右下角输 power shell 中运行以下命令, 测试链接,启动 cloud code 显示缺少文件,就让 ai 帮你完成, 结束后再次测试链接, 重启一下, 好像能打开 cc 的 页面了,但还是报错了, 是缺少 get 文件,点击链接去网站自己下一下安装, 再次打开就完成了。

hello, 大家好,从今天开始我准备全程记录一下,我去开发一款量化交易软件, 并且在模拟盘进行模拟交易的整个过程。 那么今天跟大家分享的是量化交易系统开发流程。 首先开发流程的概览我们先来看,一共分为七步,第一步的话就是获取数据。 第二步,数据清洗。第三步,策略编辑,第四步,策略回测,第五步,策略优化第六步,模拟交易第七步,实盘交易。 首先第一步我们要获取数据,获取数据的来源主要分为以下四个方面,我们可以获取它的行情数据,也就是每一只股票的动态的 k 线,以及特定的一些技术指标, 比如说五日均线、十日均线等。第二个就是宏观的基本面上的数据,比如说央行利率的政策以及行业板块景气周期等等这一类的基本面数据。第三就是企业的财报透视数据, 比如说他的季度报、年度报等等。最后就是余情相关的数据,新闻及社交媒体的情感指数等等,每家公司的余情变化数据。那么数据的接入渠道目前有 网络上的下载数据客户端,比如说万德的数据,但需要购买会员 a p i 接入,这种一般都是比较稳定,但是需要收费。最后的话就是我们爬虫获取抓取数据, 那么数据来了之后,我们要有一定的数据清洗的规则,比如说我们要清除垃圾数据,要对控制数据进行处理填补,以及我们一些特定格式数据的转化, 比如说时间数据,我们就不能是文本的格式,另外还有数据对齐,通过数据清洗手段可以提高我们模型预测的准确度。 接下来是比较重点,我们需要去进行策略编写。信号捕捉逻辑是依靠技术算法或量化指标, 在嘈杂的持续中寻找微弱的预期差信号,过滤无意义的噪音,实现高精准度的探测。当我们进行信号捕捉之后,我们要进行交易, 交易呢就分为建仓以及平仓仓位的动态调度就是当触发条件时,精细执行开平仓指令,为了降低滑点和市场冲击,需要合理规划订单类型,并施加单笔限制。 第三就是主动止损保命线,在底层算法中将止损逻辑提升至最高优先级,一旦策略发生方向性错误,无条件迅速切出,保障核心资金的安全。这一步的策略编写 在不同的板块中会有不同的编写策略的逻辑, 而策略编辑完成之后,我们要进行策略回测。第一个就是我们要进行回测参数的设置,要精准匹配测试的本金, 引入与真实交易市场一致的交易税费用金比例,并加入代表执行滑点和流动性溢价的动态乘法缓冲区。 第二点的话就是我们要进行策略的实力化,也就是将书写完毕的交易逻辑载入回测仿真引擎沙盒, 将核心逻辑与代调参数因子进行解偶,构建高度隔离的安全推理环境。 第三就是进行历史数据的载入,导入经过严格清洗的历史行情数据加载流程,具备单向持续性,彻底隔绝信息向历史前推的时间反向回流污染。 第四步我们要进行回测的执行计算、盈亏计算、统计指标生成回测报告等等。 策略回测中的持续径直跟踪、绩效核心审计、极限压力测试以及生成综合回测报告等等, 都有具体的指标计算逻辑以及预期输出结果等。 完成策略回测之后,我们要持续地进行策略优化。 第一个点是要重视交易费用。回测中完美的虚拟高收益往往在真实盘中被手续费与划点残蚀。 调优的前提是用最苛刻的佣金惩罚和滑点模型审视策略。如果一个策略在叠加交易摩擦后优势不在,就果断要舍弃。第二种是要重视风险,重视退出 调优呢?是为了在极端行情中存活,而不是追求暴力,必须在底层代码中焊死最大单笔硬止损和多维度全局资金回撤熔断保护拥有主动优雅退出能力的算法,才能在长跑中获胜。 第三,禁止采用网格调优去寻找特定历史片段下的极限最优解。 接下来我们要进行的是第六步,模拟盘交易。在这个过程中,我们要强制设置至少六个月的模拟向前测试期, 迫使策略直面单边牛市、单边熊市以及横盘风险轮动转换等等。 并且要深度理解过去并不等于未来的真相。在历史回测中跑出再惊艳的数据,只要逻辑存在过度逆和数据泄露或无法感知新市场机制变化, 策略在生产环境跑动时,其概率优势便会逐渐漂移退化。模拟交易正是用于严苛的样本外前项测试, 唯有在横跨两个季度的模拟盲测中,系统未发生崩溃,执行延迟控制在毫秒级,且实际收益特征和胜率满足回测设定的基本期望,方可获取实盘准入。 我们认为模拟盘稳定收益要在百分之一百以上,再考虑实盘交易。 最后,我们要进行实盘交易。首先,我们要做好三个准备,第一,实盘交易首年不以财富多寡为成败标准,也就是我们要做好第一年会输的准备。 第二,不要急于扩大投资,增加杠杆,克制幸存者偏差下的规模膨胀。 首期几笔交易的偶然胜利极易引发非理性的自信爆棚,坚决克制快速追加资本规模甚至铤而走险增加杠杆的冲动。第三,要稳住心态, 置身事外,充当冷酷的系统监护者。量化交易软件的本质就是用确定性的数字和代码逻辑,帮助我们彻底隔绝人类贪婪、恐惧与临摹犹豫。 只要系统仍在预设风控安全边界内跑动,禁止任何人工主观干涉,保持绝对平和的局外人姿态, 用严苛纪律征服市场企服用程序规则重塑交易心态,保持对数据的敬畏,在绝境中规划好离场红线,最终由期望、胜率和数学概率去裁决。 感谢观看!另外,接下来的几期视频中,我会逐步使用 ai 的 工具, 如 vs code、 cloud code, 并接入 deep seek 大 模型去打造一款量化交易软件。在这个过程中,我会根据它的实际表现情况 进行算法以及策略的优化,并且在模拟盘中观察 打造一个相对适配我们个人投资领域板块特征的量化软件。 感谢支持!