像这种可以随意编辑的机智图,还有流程图等,真的不用自己再去慢慢的手搓了,或这种素材我们找起来都不是很好找,而且画一个同款的手动肯定也得一天。今天教你们一分钟生成这种高清的可编辑的插图, 我们直接上干货。第一步, copy 你 想绘制展现的文本内容,把它扔到 j、 b、 t 当中,再输入我的同款指令,让 ai 先生成一个绘图指令。接下来把得到的指令 copy 到这个 paddog 中,然后在这里点击这个机智图就可以,只需要一小会图就能生成出来。像这里的字体字号都是可以改的, 且还能随意地拖动图标里的元素。这是一张可以更改编辑的 ai 图,跟 jimmy 生成那种静态图是不一样的,整体不满意也能重新生成。它会在新的位置上重新生成一张新的图,不会覆盖原来的图,整 个绘图的历史记录都是清晰可见的,可以任意的选择。而且图标支持多种格式导出, d、 n、 g ppt、 pdf 都是可以的,满足多种的格式要求,拿去汇报当 ppt 的 素材都是完全没有问题的。而且像这种流程图、拓扑图也都是一样的操作,还支持自己选择风格、配色等,原来一天的工作量,现在改一小时就能完成,属于是非常的顶级了。
粉丝9.2万获赞430.0万

免费、无限制、无敏感词,当这些优势融合在 a a 里,会有怎样的效果?众所周知,售后二是需要付费的,这是 a a 生成的,这也是 a a 生成的。不止这些,还有这样这样 以及这样的视频都是用投影工具创作的,不用再去找魔法或者画线,已经 n 呢 banana 和 solo r 了,离谱的是,不要魔法不要钱也就算了,这样的效果可以说技压群雄,关键是四 k 直出,本地补水,没有让他们限制。一键安装,普通电脑也能轻松使用。傻瓜式操作,你只需要写上提示词,点一下生成按钮,这样的爆款视频分分钟生成, 关键实现随心所欲,大胆创作!本期视频呢,干货满满,建议大家先收藏再观看。个人心痛的是,这工具的出现,直接把许多设计师门槛给干碎了。无论是学生、特效师,还是对 ai 有 兴趣的小白,都可以轻松学会像这样的 ai 漫剧整活视频或者专业的电影运镜,直接无脑操作也就好。 最后还有重磅福利,咱们视频的 s 一 点和包对应的模型插件,以及 s d 商业落地的实战流程都已经整理好了,话不多说,马上带你上手体验再来!整合包之后,我们先来解压一下安装包啊, 那直接右键解压在当前的文件夹,那这个文件夹不建议是中文啊,我们要全英文的路径。解压完整之后呢?看到不需要安装任何东西啊,我们找到第一个粉色图标,双击打开启动器就会进入到启动器的界面啊,我们找到第一个粉色图标,双击打开启动器就会进入到启动器的界面啊, 然后呢,左下角会有一个启动器标识的一个版本,我们再点击一下一键启动按钮,因为是第一次启动,我们需要等几分钟来进行部署,稍微耐心点一下就好了。然后我们就进入 s 一 的操作界面, 但如果说把它比作房子的话呢,只能当做毛坯房,因为我们只有一个摩天,什么也做不了。那么这个时候我已经帮大家整理好并放置了各类型最常用 并且好问的模型安装包,并且把模型的中文备注以及预览图一起的整理打包好。只需要在 s e 的 操作界面呢,就能够看清模型的样图和中文的名称,更不会和别人一样只显示一串英文代码,风格根本都分不清,看着就头大。

那最近有个很棒的软件呢,叫做 open design, 就 如果最近你很苦恼怎么去歪勾顶出一个好看的设计,怎么卡的在这么贵的话,那这期视频呢,我会向你具体介绍一下,你到底可以用它来干些什么? 比如说如何用它来生成一个好看的网站或者 html ppt, 如何在过程当中呢?一点一点改成你满意的样子,以及如何编写出一个设计文档,让 ai 输出的质量呢,能够更高一些。 首先白扣顶有很多的工具,但不是所有的工具都可以用来做设计,而 open design 这个工具呢,是我前段时间在 game 上面去挖宝挖到的,你看已经快物我可省了。你可以简单的理解为它就是一个集设计的体系模板, skills, mcp 为一体的一个 设计平台吧。应该可以这么说,比如说像设计体系的话呢,就包含了像 l b, n b 啦, apple, bmw, 特斯拉等不同品牌的一些配色字体,还有他们设计的一些文档。而模板的话呢,这里面就包含了很多社区的朋友们,他们自己做的一些网站啦, ppt, 图片、视频等等之类的。 而 skill 的 话呢,就比如说有一些网站的动效设计,一些数据看板的主键模板,还有一些设美海报等一些更偏具体场景的一些能力在这里面啦,所以你会发现它其实并不是一个能够提高你审美上的一个工具,但它绝对是一个能够提高你设计效率上的工具。 而且啊,我方便的是在执行配置,这里面呢,你可以选择很多不同的模型,就如果你尝试过 cloud design 的 话,其实你就会发现,虽然它输出的效果真的还挺不错的,但无奈就是真的太贵了,所以对比起来的 open design 的 这个性价比就挺高的啦, 而且我自己最常用的呢是酷睿 x 还有 kimi, 就 只要你安装过他们的 ceo 之后啊,我喷几下就可以自动去掉啦。所以这个工具它本身是不收费的,你只要支付那个大模型的那个费用就可以了。那接下来呢,我就来给你演示一下这款工具它具体应该是怎么操作的来。 那首先 opendi 呢,它是支持很多不同类型的创作的,比如说像产品原型,数据看板, ppt 图片视频等等之类的,比如说我选的原型啊,它下面就会提供很多不同的模板,你可以附用的。但如果你想让它的输出更稳定一些呢?最好还是像我一样,提前先准备好一个设计的文档给到它里 面就会有项目的介绍啦,以及把你想要的一些 ai 设计变成前端能够开发的一些指令。这个文档呢,我会放在最后给大家做分享。 然后当他在加载的时候呢,上面就会有一个设计的系统,你可以看一下这里面的配色是不是你比较喜欢的啊?我这里就暂时先不需要了,因为我的文档已经写了具体字号了。 然后过一会之后呢,他会先给你一个 brief, 因为文档已经比较详细了嘛,所以他这里就只要几个细节补充一下就可以了。 ok, 然后一般我会再给他一些网站里面的图片,然后这样它输出的效果会更好,发送大概五到十分钟之后吧,右边呢就是它生成一个 h t m l 一个链接啦, 我们打开它,然后这就是它生成的一个效果了,而且你还可以用平板的形式来预览,或者是手机的形式来预览,其实整体的感觉也都还可以的。然后假设你觉得,哎,这里的文字被这个卡片覆盖住的话,其实右上角这里会有一个编辑栏,我们点击这个会制, 比如想改这个标题的排版,那我就圈起来,然后在这里输入右侧卡片,压住了大标题,请你把标题的大小再缩小一些, 发送大概等一小会呢,你看哎,他就已经改出来了,然后再去点这个编辑,然后再去调整他的文字的颜色,字体等等之类的就可以了。 这个时候如果你觉得,哎好像还挺满意的话呢,右上角其实会有一个交互 cursor, 我 们打开之后呢,其实 v s code 啊, indiegogo 这些都可以,点击之后它就会调整到对应的一个软件里面去了。 那第二个功能呢,是它有一个很丰富的一个 skills 技能库,在设置技能这里,因为它有很多不同的类型,每个类型后面呢,都会有非常多 skills 的 种类,比如说你看呐, 这是将一些比如 excel 或者 csp 的 表格数据变成可量化报告的 skills, 或者是用 nano banana 生成网页 ppt 的, 还有一些关于视频图像和音频生成类型的一个 skills, 总共算起来呢,有一百三十几个,我给你演示一下。 比如 skill 里面呢,有一个叫做 animation motion 的 类别,打开它之后呢,你会看到这五个就是跟动画相关的技能了,就如果你觉得你的网站,你的 ppt 比较干巴的话,其实就可以用上了,那具体怎么用呢?比如这是我之前做过的一个案例啊,没有任何的动画,如果我在输入框这里 呢,它其实是一个让东西动起来变大变小,但入但出的这么一个效果,然后就要求它参考这个 skill, 请为网站中的文字和卡片增加动画效果。 ok, 再稍等五到十分钟之后呢,哎,你看就效果还可以,对吧,就整体的这个动画效果就感觉就出来了, 但你想啊,有时候你凭空去照一个网页或者 ppt 出来的话,其实还蛮考验你的题日词的嘛,对吧?所以我觉得第三个很棒的点呢,就在于它有一个社区里面又提供了大量别人做的一些开源的模板,比如说原型啦, ppt、 图片、视频等等之类的制作的一些模板在这里面, 比如说点开这个吧,左边的就是你可以看到一个效果,右边的就是它的这个效果的提示词啦。所以假如我用这个薄板,然后去生成一个 html 的 ppt 的 话,那同样我们过一会之后呢,噔噔,这就是它的一个效果啦, 虽然怎么讲呢,就是有一点点的瑕疵在这里面啦,但是毕竟 ai 不是 一出而就的事情嘛,对吧,再去一点一点的去调整就可以了, 所以你会发现呢, open 站它就是一个 ai 的 设计平台,你不要指望它能够给到你一个多好看的设计,因为它不能够去提高你的审美,但它绝对是一个能够提高你设计效率上的工具的,所以如何去提高你的审美?我觉得除了一个好用的工具之外呢,一个好的设计文档也同样重要。前 段时间我在研究怎么去写这个文档的时候呢,我就发现呢,与其给它一段提示词呢,让它去摸索,还不如把整段提示词呢, 变成前端可以完全执行的一套指令,也就是把你所描述的那些什么高级感、科技感,赛博朋克电影画面的这种感觉变成一行一行的代码,将来就不用自己去发挥了。 比如设计师呢,会在颜色上标好具体的色号,模块组建呢,都会有具体的坐标,包括材质啊,程序员也会用代码来去实现,所以你也得这么细才行,就是用代码能够理解的语言来去写这个文档。 当然,其实我们是写不出来这么专业的一份设计开发的文档的嘛。所以后来呢,我就让 ai 把我参考一些网站的提示词啊,提炼成一个通用的模板,比如说像 motion size, 它里面就会提供一些免费的网站模板,你可以把它的提示词呢 copy 下来, 我一般呢会把链接和模板都发给 codex, 然后要求它提炼出这个模板的结构,然后变成一个通用的模板。这样呢,以后我看到不错的网站,我就可以用这个模板来套进去了。 但这里要补充一点啊,就是虽然它是一份 ai 能够看懂怎么开发的文档,但是对于你来说,你是看不懂里面的,比如说材质啦,动效是怎么开发的嘛,对吧,是不是你想要的? 所以后来呢,我就让 ai 去参考某个网站去做,或者复原某种效果动效,这种方式反而是最有效率的。而且这个过程当中呢,其实我也发现了很多有趣的设计网站,我自己罗列了一张表,有数据面板的,有创意设计的,有一些几何之类的网站,你可以截图尝试一下。 所以现在比如说我想再去开发某个网站或者是 app 的 时候呢,我都会先去网上找一些参考,然后呢去复原某种效果来形成一份文档,然后再把这份文档呢给到比如说像 open 在 这样的一些工具来让它来帮我复原这个效果,以及 呈现这么一个整体的一个一个一个工具吧。所以我觉得这个方式其实对于我们这些小白来说最有效率的,所以我也希望你能够参考一下,也可以去尝试一下。 ok, 那 么希望今天这个视频能够帮助到你, respect, 拜拜。

现在我们打开我们的 word 八 day, 然后回到这个页面,我们今天来配置一下微信公众号连接相关的 内容,就是我们通过 word 八 day 帮我们去从选择题到写一篇文章,然后到排版到存到我们的微信公众号的草稿箱,这一种流程是如何操作的? 我们先打开这个页面之后,然后可以在技能广场里面去找到一些就是关于公众号排版,公众号写作 之类的,这种技能包,大家可以去用。然后在我们前面的课程里边,我们可乐这里是已经做了一些角色设定的,就是我们已经创建好一个写作团队,他应该拥有什么样的一个角色, 我们可以在这里去重新问他一下,我们就直接问我们的可乐,就我们的小龙虾, 然后他的团队角色有哪些,然后他会帮我们把我们之前已经在我们的 oppo 八 z 里边预设好的一些角色定义,然后给我们通过表格的形式列出来。按照之前的介绍,这个就是可乐,它相当于是一个主的智能体,然后 他会有一个我的这个标签,然后相关的配置文件在这里也给列出来了。就是 mac 的 话,就是在用户名下面,然后你的 o 八 d 目录,然后可乐,然后下面会有一个隐藏文件夹, 点开头的 o 八 d, 然后 rulers, 他 会有一个每个角色的配置。 windows 的 话应该也是这样的,就是在你的用户下面,一般都在 c 盘,然后找到你的用户名,然后 o 八 d 找到你的可乐,然后它会有一个配置的一个空间,都可以在这里去做一个查看。 然后除此之外呢就是再讲一下,就是小龙虾它会有一个记忆系统,就是为什么我们要说这个过程是一个养虾的过程呢?就是因为我们在跟它不同对话的时候,它会记住我们过往的一些操作和执行记录。 我们点开设置这里,然后这里会有一个记忆,然后这里就可以查看你的所有的对话记忆,就包含你里边做过什么事情,然后都有一些简单的介绍, 这里可以去修改和查看,也可以在这里去修改,然后这里还有一个从其他 ai 导入记忆的功能, 就比如说我们可能平常用豆包或者 deepsafe 这种工具更多,然后你就可以用一句话来去总结一下你在那个平台使用的一些行为习惯,让他给你输出一个文档出来,然后你可以直接导入。嗯,有了这个之后,现在打开我们的浏览器, 呃,然后我们直接搜索微信公众平台,然后就是打开他的官网,然后默认的话进入页面,是这样的,如果我们没有公众号的话,然后我们就可以在这里去点击查看详情, 在这里去注册一个新的公众号,然后我们一般情况下是参照这个流程就可以去直接去注册,然后这个注册完成之后,我们就扫码登录一下 注册流程,我就不再演示,然后我直接打开我的公众号,给大家来看一下它默认的首页是这样的,它可能会显示一些关注数,然后有一些阅读数据,我们打开这里,它有一个设置与开发, 然后这里会有一个微信公众号的 app id, 然后等下我们会用到这里,进行到这一步之后, 我们在我们的浏览器里边再输入开发者平台,然后它打开之后首页是长这样的,同样我们也需要登录一下, 然后我们打开这个页面之后,在这里左上角这里有一个我的业务与服务,然后点击公众号,这个时候就打开了我们的微信公众号的这个 基础信息的页面,在这里去找到我们的 app circle 的 就密钥,我们可以理解为一个是我们的身份证 id, 一个是连接器的密钥,然后我们要通过这两个东西才能把我们写好的文章存到我们的微信公众号后台, 然后这里还有一个 api ip 白名单,就是我们再去切换不同网络的时候, 都需要把我们自己的当前网络 ip 去配置到这个 ip 范围单里边,我们才能把写好的微信公众号文章,然后推送到微信公众号的草稿箱里, 这三者是缺一不可的。然后我们就先把这个页面放在一边,我们回到我们的 word body, 我 们现在就可以去通过我们的 当前设置好的这种多角色的团队,然后调用技能去帮我们去写一篇公众号文章出来,然后我就直接让小爪来去做一个,就相当于是我的总 agent 总智能体来去做一个统筹,然后让他去安排其他的角色去帮我把这个任务去完成, 我们就可以这样去写,然后我就让他 把我的需求告诉他,就是写一篇公众号推文,然后内容是怎么样的,就我让他去调用每个不同的角色,然后去帮我完成最终的推文效果,这里我们也可以去直接调用一些微信公众号的排版,然后公众号写手之类的一些技能,他可能会更好用一点。然后我们 在这里先调用一个公众号写手的一个技能,然后让他直接去帮我去完成这个任务。在这块我们稍微等一下, 我们可以看到生成的文章是这样的,他生成的这个文章效果排版比较简约, 然后我们如果想要美观一点的话,可以直接告诉他,让他帮我们把这篇文章排版一下,使用科技简约的风格, 然后他帮我们排版完成之后,使用了蓝紫渐变的科技风,我们来预览一下他最终产出的一个效果,这里是可以实时看到他排版的一些效果的, 然后这里他对我们的这种代码格式啊这类这种展现就是包括这种引用格式就看上去更加美观, 就是配图生成的一些地方就需要我们自己去插入一些图片,然后他也帮我们做好了一些站位,然后他现在这个排版任务已经完成了。然后我们去怎么发布微信公众号的,给我们了一个发布步骤,当然我们想要 直接推送到草稿箱,对吧?我们就需要通过这个呃技能包来去做一件发布的处理,我们可以让他先去帮我们发布一下,看有没有什么问题。 ok, 这里他就可以看到,就是我们去发布的时候,他告诉我们我们的 ip 目前不在白名单里边,然后需要我们自己手动去操作一下,然后他告诉了我们当前网络连接的 ip 是 这个, 呃,然后我们把这个 ip 去复制一下,回到我们刚才的这个微信开放开发者平台这里,然后这里会有一个 ip 白名单的设置,然后我们直接点编辑,嗯,如果是新用户的话,然后这里可能是 就没有这些 ip, 然后你就可以点启动,点启动的话直接就把就把 ip 给放到这里就好了, 然后绑定 ip 名单,需要你管理员的身份去做一个授权就算了,是不是?然后这里就可以看到我们的 ip 白名单,然后在这里已经绑定好了, 因为我这里之前已经用过这个 app storage, 就 app 密钥。然后我在我们的 oppo 八这里边已经连接过一次,然后这里我就先重置一下,然后给大家演示这个绑定流程, 然后这个就直接点复制就好了,然后复制完成之后,这个地方是不会展示的,然后你的 a p 三可以的,是需要你自己保留好,如果你忘记的话,然后你可能就需要重置,我们再回到我们的 o r 八的里边,然后我们直接告诉他我们的 ip 白名单已经配置好了 就行,然后让他继续去操作他刚才没有完成的任务。 因为我们之前在这里已经绑定过我们的公众号的 app id 和 app service, 就是 app 密钥, 所以他直接帮我们把这个草稿已经推送到我们的微信公众号里边,我们先预览一下,然后等一下告诉大家怎么去自己配置这个微信公众号的 app id 和 app 的 秘药,然后这里就是可以看到就是我们刚才生成的一篇文章,然后更新于下午的三点十二分,然后我们看一下最终的预览效果,然后它的效果是这样的, 然后这里面就是我们刚才写好的一篇推文的样子,当然这个封面设计方案这是这种内容,就是不需要展示在我们的页面里面,对吧?然后我们就可以在这里去直接点击修改,然后 下面这些内容我们也可以去做一些修改,然后包括后面最后面这个封面的设计方案,对吧?然后我们就可以直接在这里去做一个删除处理哦,我们整个一篇文章就 已经处理好了,我们这里也可以去预览一下,刚才没有说到怎么去把我们的这个刚才获取到的这个 app 和这个嗯 ipid 如何去配置? 就是第一步我们先获取微信公众号的凭证,然后拿到这个 app id 和 appserve, 微信开发者平台里边去获取这两个内容,然后把我们的 app id 和 appserve, 然后复制出来之后, 嗯,然后第二步它让我们去写一个配置文件,但是我们自己不会写,对不对?然后我们就完全不需要考虑它写的这个流程, 然后我们直接把我们的 a p p id 和 a p p service 直接告诉他,然后他就他会帮我们去搞定,他已经帮我们把这个 a p n id 和 a p p service 已经配置好之后,然后 就刚遇到了刚才我的问题,就是需要添加一个 ip 白名单,然后这个地方需要大家注意一下,就是如果我们在家里,还有在公司或者是在外面,比如说咖啡店之类这种地方,然后我们连的网络它的 ip 是 不一样的, 大家需要去获取当前的最新的一个网络 ip, 然后去把你的网络公网 ip 给配置到这个 ip 白名单里边,这样才能把你写好的微信公众号文章给存到我们的微信公众号后台, 然后这样的话就是一个完整的从内容产出到存到草稿箱文章生产的一个全流程。

今天看到一个可以无限次数免费生成 imageall 图片的一个工具,现在免费分享给大家,就是它,我来给大家演示一下,输入你要生成图片的提示词, 点击创建等待即可。现在它生成好了,我们来看一下图片的效果,这个效果真的是非常的不错,而且它还是免费的,最关键的是它可以无限次数免费的去生成,不管你是做电商还是做带货还是做美工等等,只要你有图片生成的需求, 你就用它,它能给你免费的生成,而且它无限次数。如果你觉得它生成的图片不够清晰,那么你可以看我上一期的教程, 怎么把图片变成四 k 的 高清大图,咱们有什么图片需求就丢给他,让他来帮我们生成。方法教给你了,用不用就看你了,记得点赞收藏,我们下期再见!

最近好多人问我, ai 生成的图文真的能直接发布吗?我前前后后试了二十多款相关工具,要么只能单点写文案不能作图,要么生成的图是死图,改不了。真能从选择题跑通全流程发布的少之又少。 话不多说,直接开测。今天用的是零一 agent, 它不是那种普通的聊天式写作工具,而是专门面向内容创作者和中小商家的 ai 内容生产系统。首先,测选择题环节, 我输入账号定位是家居好物类小红书博主近三十天粉丝评论的核心痛点是出租屋低成本改造。 你看他直接给我出了十二个带爆款属性的可执行选择题,连每个选择题的切入角度、内容结构都列的明明白白。以前我光扒竞品找评论区需求,选个题就得俩小时,这一步一分钟就搞定。 接着我随便选个十元,搞定出租屋墙面改造的选择题,让它生成小红书图文,你看,文案写完直接自动排好版了。手图、配图、分段格式、话题标签全给你配好, 几乎就是接近可发布的状态,还能一键适配公众号知乎的内容格式,不用自己在挨个调排版。哦对了,它生成的所有视觉内容都不是死图。 点进零一 agent 智能画布,你想改文字、拖拽图层、调字体颜色、局部重绘、换风格都可以,不用跳去 ps 或者设计网站来回改。如果是做电商的朋友,上传个产品图和参数,直接就能生成商品主图、详情页、活动 banner, 省了好多和美工来回沟通的成本。 最后,内容改完,直接绑定账号,就能定时发布到小红书公众号、知乎头条这些平台,整个流程从小题创作、排版、作图到发布,全在这一个网站里搞定,不用来回切五六个工具。 不管你是自媒体博主、小红书运营公众号小编,还是艺人公司老板、中小微企业的营销岗、电商运营,这个工具都能帮你省不少事。反正我测下来,他生成的内容简单调整个三五分钟就能发,比你自己从零做,效率高太多。想体验的,我把链接放简介了,自己去试试就知道有多像。

ai 创作的入场券刚刚被撕了,我不是在瞎扯,哪怕你在上厕所,也先花两分钟听我说完。你有没有想过, ai 云端大厂还在让你付费排队等服务器生成的时候,横空出世?一个 ai 工具,它全开源,永久免费,本地离线运行, 你的每一个想法创作不需要经过任何云端审核,创意成本直接清零,甚至可以直接去接单赚馒头。这款 ai 工具就是 stable diffusion, 它直接把技术评权甩到了每一位普通人脸上,消费级显卡就能驱动,分分钟生成。 虽然它免费生成,但是千万不要被免费就等同于垃圾的想法给骗了。它生成的细腻度和风格丰富度,正是那些付费产品砸钱推广不敢让你知道的存在。你去扒一扒技术底裤, 大半都来自 sd 的 开源社区,而且他对新手极其友好,不需要编程基础,不需要天价显卡,跟着一键安装包走,避开所有坑,那些你羡慕的酷炫作品, 很快就能从你自己手上诞生,从一张白纸到千变万化的画面,这不是魔法,是技术赋予每个普通人的权利。那么本节课所用到的 ai 工具和各种 ai 实战案例都打包好放在网盘了, 六六六直接暴走!首先第一步,先确认我们的安装包是不是已经完整下载好了,不要缺斤少两的,不然安装的时候会失败,这一点一定要注意。下载好之后,右键点击安装包,选择安装,等进度条走完点完成就可以了。 装完主程序,找到你下载好的模型压缩包进行解压,那解压完以后会出来一个模型文件夹,还有一个说明文件,我们双击打开说明文件,这里面写了各种模型应该放在哪一个位置, 找到你解压出来的视频,生成模型全选,按住 ctrl 加 c 复制,然后回到主程序的安装目录,进入说明文件里面的路径。 model 文件夹里面的 ctrl n t 文件夹找到以后,我们按下 ctrl v 复制粘贴进去,如果之前已经有粘贴过的,那这一步就可以直接跳过了。这里有一个重要提醒,所有的文件存放路径必须是全英文,不能有空格,特殊符号还有中文, 不然很容易出现莫名其妙的报错,省得后面给自己找麻烦。全部弄好之后,我们回到原目录,往下面翻,找到这个图标,双击启动, 那这个启动器对新手是非常友好的,不需要我们额外下载别的软件,也不用手动配置那些复杂的环境依赖,点一下就自动部署好了,省了很多的事情。 启动器还自带了几个实用的功能,能够自动检测你的硬件,根据你的显卡性能调制它的参数,还有模型管理,方便你更新删除。 那这些模型都是在这里弄的,非常方便,启动的时候看控制台的进度,等它启动成功,并且弹出浏览器的窗口,就说明我们已经启动好了。那这里要说明一下,我们第一次打开呢,就默认只有一个基础的模型,就是这个, 那我点击打开,可以看到我这里有好几个模型,那都是我提前已经安装好的了,每一个模型都配有了预览的图片,就选对应的模型就可以了。 好了,朋友们,那到这里安装和基本使用就全部讲完了,整个过程没有复杂的步骤,新手也能很快的学会,赶紧去试试吧。

别再给这些昂贵的 ai 视频工具送钱了,想做高质量的图片和视频,这三个免费的 ai 工具赶紧用起来,一千万图片视频都能免费生成! so, there is a dinosaur in this case! 虽然有的时候出图是有一点慢,但画面质感那是相当能打,电影感、光影感、氛围感通通都有。二、会员它是开源的,玩法更自由,可以用 one l t x 的 模型,直接通过提示词,就能一键生成一整套完整的视觉运镜。 三、它不是用来生成内容的,而是帮你选模型的同一个提示词,多个模型同场 pk, 水效果好,水更稳定,一眼就能看出来。所以,别再盲目付费试错了。先用一套免费的工具,搭一套完整的工作流深层内容对比模型测试效果,跑通之后,再决定哪些模型更值得花钱。

本地 agent 是 ai 发展现在最重要的领域了,也是普通人跟上这个 ai 时代我觉得最直接的方式。如果你现在仍然每天只是跟那个聊天机器人在问一些问题,还没有正式去接触过本地 agent, 觉得概念太多啊,没有头绪啊,不知道从哪里开始,这个视频呢,就特别适合你,它不是一个简单的这个工具教程,而是会告诉你普通人使用 agent 的 这个方法论,不管你是用哪个 agent, 都 都可以用上这套逻辑。如果让我来给 agent 排名的话,我觉得世界上 t 零级别的应该有四个, cloud code code、 open code 和 pi agent。 如果你有自己用的顺手的 agent 啊,其实大致的逻辑都是一样的, 但我今天呢,想带大家吃点好的。刚才提到的前三个的 agent 啊,主要的作用基本上就是帮你写代码,因为你看到它名字里面都带有一个 code 这样一个单词,你可以在网上收到大量大量的教程,但其中啊,这个 pi agent 是 里面最冷门的一个。 国内啊,我看到网上几乎没有人特别去聊这个主题,但是呢,它也是最特别的一个,因为它不是去专门帮你写代码的,它是帮你去完成日常任务的。大家看啊,在这个 open root 的 排行榜上呢, pad 的 这个每天的 token 消耗量是排在第六名的, 除了前面两个乱消耗的大哥,它仅仅地排在了大名鼎鼎的 cloud code 后面。 open i codex 负责人今天还说啊,它们大概有百分之五的生产流量已经跑在了 pad 哈尼斯出来的这个 agent 上面。别看这百分之五啊,你放在 codex 这个量级的工具里面我觉得已经很夸张了,之后大家会了解到说做同样的事情,其实派的消耗量会小很多,所以他排在第六名呢,我觉得已经很厉害了。最近三个月啊,派呢是我用的最多的 ai 工具, 所以我今天就想用派 agent 来给大家做一个 agent 和 skill 的 入门教学。我会手把手来教大家做三件事情。第一个呢,就是我们一边装 skill, 一 边去演示案例,搜索的,读 pdf 的, 读 office 的, 与 语音生图,做视频,每一步我们现场都去跑一遍。第三部分呢,最后我会让拍 agent 去做一个完整的大的案例调研,并且去自动生成一个很酷的视频。然后呢,再顺便提一句,观看这个视频,我觉得最好的学习方法是你打开你的电脑,一边看我的视频,一边自己去动手,视频呢可能有点长,大家可以先点赞收藏,然后慢慢看。我们现在正式开始, 我们先来说一个很重要的区分啊,就是像 cloud code codex, open code 呢,这些都是代码智能体。这个 agent 的 主要的目的啊,就是去写代码,产出就是代码,你让他去写一个功能,他交付给你的就是整个项目里面的这个一个个文件。比如说我拿 cloud code 的 举例子, 它里面呢就预装了代码的缩影,测试、运行、 get 操作、编码规范,整套呢都是围绕着更好的去交付代码项目去设计的,开箱即用写代码呢,确实是非常方便。 大家平时任务其实都不一样啊,不是每个人都天天坐在那边写代码的,你可能想要去搜资料,读 pdf, 整理表格,写汇报,做 ppt。 如果你预装一套通用的编程的工具,其实没有办法去照顾到所有人的日常办公的需求,派是怎么解决这个问题的呢? 派的设计思路啊,其实跟其他的 agent 都不太一样。其他的 agent 啊,大家知道功能越来越多,派呢,是反过来的,他是一个极简主义者,他把底座做得非常的极简,只保留四个最基础的工具,读文件、写文件、改文件和跑命令。除此之外呢,其他什么都不装了。他为什么这样设计呢?是因为他想让你去搭一个自己的 agent。 如果你是搞研究的,你可以装 pdf, 装搜索的 skill, 如果你是办公的,你可以装表格的这个 skill, 如果你想让他开口说话,你就去装 edge tts skill, 如果你去想做视频,就去装 hyperframes。 你 装一个 skill, agent 就 多一项能力,每个人手中的 pie 啊,最后长的都不太一样。大家看他这官网上的口号也是这个意思, 世界上有很多很多其他不同类型的 agent, 但是这个派 agent 就是 你自己的 agent, 这句话呢,就是最精确的表达了他这个派 agent 设计的这个基本的理念。上面我提到了好几次的这个 skill, 那 skill 具体是什么东西呢?就是一份给 agent 的 说明书,一份给 agent 的 操作手册。 agent 读完之后呢,他就知道怎么来具体的干活了。我们看啊,他 底座保持极简能力呢,就是你可以按需去安装,这就是 pad 的 设计思路。到这里呢,可能有些朋友也会好奇啊,就说你这差别到底能有多大呢?听起来好像也差不多嘛,我给你举一个具体的例子,如果你平时去用 cloud code 发一条,你好发一条 hello, 这个系统提示词呢,就会占到你两万的 token, 像 codex 跟 open code 可能稍微少一点,但也要一万五千字的 token 左右。 pad 是 多少呢? pad 系统提示词啊,不到一千五百字,差出十几倍。这会带来直接的三个好处, 一呢就是快,上下文短模型就会算的快,给出的答案也会快。第二点呢就是省省 token。 我 自己的体感就是做同样规模的任务, token 消耗呢,大概只有 cloud code 的 三分之一左右,甚至更少。第三点呢,就是聪明,模型的注意力是有限的,大家知道,如果你的提示词越长, 模型呢,可能他的注意力就越分散在派里面呢,没有一万字的预设的这种为了编程的提示词在旁边去抢注意力。在同一个日常的任务当中,派就是比 cloud code 的 更 更聪明,更听话,这个体感就会很明显。再回到开头说的这个 openroot 的 排名啊, pad 对 话每次消耗的头壳呢,只有其他 agent 的 几分之一,但总消耗量却能排在第六,我觉得这个含金量就很高了,说明在海外,在这个极客圈里面,也就有一大批人把 pad 当成日常工具在用了。 然后呢,派默认呢,他是跑在这样的这个命令行里面的,你看到有点繁琐,所以呢,我给他包装了一层网页,把它做成一个简单的这个容易使用的应用。这个项目呢,我自己大概已经使用了三个月左右,我跟我的朋友们基本上每天都在用。确实呢,把我很多日常的工作里啊都串了起来, 我觉得非常顺手,所以我现在公开出来了,开源出来了,如果大家有需要的话,也可以直接拿去用。下面的演示呢,其实就是用我自己开发的这个 pad 应用。好,我们先来安装这个 pad。 怎么安装呢?当然首先呢先要来安装 node js, 这个呢几乎是你去装所有的 agent 都要去依赖的这个一个基础的东西,如果你之前安装过,那你就跳过这一步,如果你没有安装过,你就在这边选择自己合适的电脑的环境,然后下载安装包,双击之后呢,一直下一步,它就帮你自动安装好了。 然后呢打开你的终端,在启动之前有一个可选的步骤,就是设置国内的镜像加速,你可以去搜一下 npm 国内的镜像加速,这里我用的是腾讯的镜像加速,就是输入这样一行命令,然后直接回车就可以了。 设置好镜像站之后呢,我们就可以启动派了,如果你是 windows, 你 可以点击菜单,打开你的 power share 应用,如果你是 mac 呢,直接打开终端就可以了,所有的都是这样,同一条命令,然后回车,他会问你是否继续 输入。 y 代表是的,刚刚输入的这条命令的意思是什么呢?就是运行我开发的派 web 的 最新版本,它首次运行呢,需要下载一些项目文件,所以会慢一点,之后更新的时候呢,都是会从缓存里面去加载,会快很多。安装好之后呢,它就会自动弹出这个派的网页应用了,就是大概长这样子的,看到左边呢就是 文件浏览器,你可以选择一个自己的目录,或者用我这里设置的默认的目录,然后下面呢大家可以看到可以设置模型,可以设置添加自己的 skill, 然后中间呢就是我们非常熟悉的这样一个对话框了, pi agent web, 然后你可以在这里输入文字,也可以上传图片, 然后可以选择一些参数啊,模型等等。然后呢,第一步我们就是要先来添加我们的模型,因为你没有模型的话,你这个 agent 做的再好其实也没有用。点击这里的模型,点击添加模型服务商,我们看到派支持很多这个官方的供应商, 然后也支持走这个 gpt 的 订阅,如果列表里面没有呢,你就选这个 custom 自定义接口,这一步呢就跟你配置其他的 agent 的 接口一样,填好 base url, 点好你的 a p i t, 然后点保存就可以了。添加好服务商之后呢,我们在这里选择添加模型,我们填上模型的名字,我们今天用的是 g p t 五点五,而最近用五点五实在太爽了,量又大,然后能力又强。 这里呢勾选上它的推理模式,然后可以允许图片输入,然后把最强的 x high 的 这个思考模式选上。窗口,我们选择二十万,然后这里填个六万四的这个最高的投屏输出保存,然后我们来测试一下,发个你好,我们看到模型已经通了,然后呢我发送我问他一下,说看一下我的桌面上有什么, 你看他已经能读取我电脑上桌面上的这个文件了。其实呢就是我们下载完派之后什么功能都没加的派呢,已经能做不少的事情了, 说整理文件夹,然后批量改文件的名字,执行命令,跑脚本,只要是本地电脑上能通过文件和命令完成的事情,派,他基本上都可以帮你去完成。好了,到这一步为止呢,我们看到我们的 agent 已经调通了,接下来呢,我们开始学习 skills。 多人觉得啊,这个现在 ai 时代概念太多,发展太快,不知道从哪里开始,那就牢牢地记住一个公式, agent 加上 skill, 这样就可以了,这是对于普通人来说现在最基本的框架,最本质的逻辑。下面我演示的啊,不单纯是去装一个 skill, 因为我这里也加了一个很方便的装 skill 的 这样一个按钮,我 会装一个 skill, 然后马上跑一个小任务。你会看到说我的派呢,怎么样?从一个只能读写文件的这样一个本地的 agent, 一 步步地变成一个能搜索、能读资料、能说话、能深图,甚至能做视频的一个工作流的 agent。 点击 skills, 然后我们这里添加 skill, 你 可以去搜索 skill 的 名字,然后选择里面想装的 skill, 点击安装就可以了。这里呢,有两个选项,一个叫做 global, 一个叫做 project。 global 呢,意思就是说你在 global 情况下安装的 skills, 是 所有你的项目都可以去使用的 skills。 如果你在 project 里面去安装的 skill 呢,就是只有这个项目你可以用这个 skill, 其他项目呢,不能去使用这个 skill。 所以呢,我一般就默认就选 global。 今天呢,我会来装几个我平时最常用的 skills, 覆盖基本上百分之九十的日常的场景。 第一个呢就是要安装搜索的 skills, 让我的 pi agent 能够去联网搜索,为智能体提供搜索服务的商家呢有很多,我这里呢推荐两个。 第一个呢就是这个 tivoli search, 它注册很简单,免费账号,每个月有一千次的,这个搜索额度很适合这个新手去使用。第二个呢就是 brave search, 它的搜索结果会更好一点, 但是比较麻烦的就是需要绑定信用卡,免费额度呢也是一千次是一样的。我这里呢先给大家演示 tivoli 怎么来安装,我在这里直接搜索 tivoli search, 点击安装, 安装好了。然后呢,我们去这个 tab 里搜索的官网注册一个免费的账号,然后可以把这个 key 复制过来。我们回到 pad 之后,直接跟他说帮我去设置 tab 里搜索用的 key, 然后 key 是 什么?什么?就是你刚才复制过来的这个 key 直接发送,然后 pad 呢会自己去写入这个配置, 它配置好之后呢,我们马上来试一个小任务,看看能不能搜索。搜一下这周最重要的五条 ai 新闻, 按重要程度排序,每条说明发生了什么,为什么重要?适不适合做短视频?保存到一个 news 点 m d 文件发送。我看到啊,这个派呢,开始调用搜索的 skill, 然后去整理结果, 它不是只给我随便很多的一大堆的链接,你看它这里有个评价搜索结果,它可能会把新闻去去重排序,然后再按照我的这个需求判断哪些更适合去做短视频。 好了,任务帮我们全部做完了,你看最后帮我们生成了一个这个 news 点 m d 文件存在了我们当前这个目录,下面我们来看一下,在右边呢,我还写了个预览的界面,给到这个 拍一进去用,你看五条 ai 新闻非常清楚啊,我觉得很厉害。那除了这个 tiffany search 之外呢,如果你想要得到更好的搜索结果,你可以去安装这个 brief search, 然后也是一样, 就是点击这个添加 skills 按钮,这里有很多搜索结果。我推荐的是这个 bad logic, 他 写的 brave search 的 skill, 因为 bad logic 啊,其实是派的作者,我觉得他写的 skill 会比较好一点,之后的步骤也跟刚刚一样, 这里点击安装。安装好之后呢,我们去 brave search 的 官网去注册一个账号,申请个 api key, 然后把 api key 复制给我们的 pi agent, 让他帮我们去配置就可以了。好,搜索 skill。 我 们安装完之后呢,第二类就是去 去读文件的 skill。 pdf 相关呢,我推荐的是这个 open ai 发布的这个 skill 文字版的 pdf, 它会提取文字来读扫描版 pdf, 你 需要在 pad 模型里面设置里面打开刚刚的那个图像识别能力,让模型能够看到 pdf 里面的图。 安装好了 pdf skill, 我 们安装好之后呢,我用 deepsea v 四的技术报告来测试一下。我把 pdf 啊拖进我的这个工作目录里面,放进去之后呢,刷新一下文件浏览器这边呢,就可以看到这个报告了。我们可以艾特这份报告,然后直接跟他说读取这个 pdf, 总结里面的核心信息。然后我们看到啊,这个派呢,会自己去调用我们刚刚安装的这个 pdf skill, 把十几页的报告都去读完,最后整理成结构化的总结。这里的重点是啊,我不用去复制 pdf 的 内容,也不用自己去提取文字,直接把文件丢给他,剩下的呢,叫他自己去处理,举反桑啊。其实 ppt, 然后 word, excel 其实都能安装 skill。 word 呢是用来读文档的, ppt 呢是用来拆这个演示文稿的, excel 呢,是用来处理表格。 ppt 里面门道是最多的。这个视频里面呢,我就先不展开了,后面有机会再做一个单独的视频跟大家讲解一下。这个视频呢,只跟大家展示这个最基本的这个文件的读取能力,到这一步为止啊,其实你的 pi agent 又能联网去搜索,也能读本地的各种类型的文件资料了。 然后接下来第三步呢,我们想让我们的这个 pi agent 能够开口说话,所以还是用同样的办法去安装这个 i g t s skill。 这个 skill 呢,不需要任何账号的,其实直接安装,然后就能用了。我看刚才这个派呢,已经帮我们生成了这个一份新闻的简报。然后呢,我现在想把这份简报变成语音跟网页的,我们开一个这个 新的绘画窗口,艾特这份文件,把这份文件改成一分钟的口播稿,转成语音做一个 html 界面,里面包含文稿和音频,排版简单直观。然后呢,帮我打开这个网页发送。 大概三分钟左右,这个派就突然帮我们跳出来了一个这个我们刚才要求的这个 html 页面,他刚刚先帮我们写了文稿,然后再调用了 html 生成音频,然后呢,写了 一个这个 html, 把文稿跟音频放进去,最后直接帮我弹出了。打开了这个网页,我们来播放一下一分钟口播稿,本周五条 ai 新闻。大家好,这里是一分钟 ai 快 讯第 一, open ai 的 推理模型,在八十年数学难题上找到新构造, ai 正走进真正的前沿科研。现在呢,这一步大家有没有感觉其实已经有点这个工作流的感觉了。之前呢,搜索 skill 负责找信息,派负责整理 t t s 呢,负责把它变成语音 h t m i。 网页呢,负责把这个结果落地成一个可以打开可以分享的这样一个文件。我们看到它这个步骤的总结啊,先生成了一个口播稿,然后转成了一个 mp 三的音频格式。最后呢,生成一个 h t m i。 的 网页。以前聊天机器人啊,只能把结果输出在你的对话框里面,太呢,却可以把答案变成你电脑上的文件啊,网 页啊,音频。很多人担心 ag 的 跑任务啊,会不会很贵很消耗 token 这么长一段的这个任务是吧,但我的体感是,这种小任务成本完全没有想象中的高。像 当我跑任务啊,这么长一段的,这工具调用跟执行大概花费呢,是零点三美元的额度,但实际支出要低得多,因为订阅一个两百美元的套餐,你就能用一个月五千到一万美元的这样 a p r 的 额度。更关键的是啊,派,其实它的上下文提示词很短头肯消耗呢,比其他代码智能体要低很多很多。 第四个功能,我们给派来增加这个声称图片的功能。接下来呢,我们就来安装这个现在的最强的深度模型 gpt image two 好安装好了,这个 skill 的 原理啊,其实是调用 codex 里面的 gpt image two 来生图,如果你订阅了 gpt plus 或者 pro, 就 可以把生图能力也交给派去使用了。我们来试一下这个 skill, 平摊一个对话窗口,我们还是给刚刚我们生成的这个新闻啊来配图。 根据这个文件的第一条 ai 新闻,用 gpt image two 生成一张适合短视频封面的图片,风格是简洁的三 d 科技感的图片。 好,任务完成了,我们先来看一下第一条新闻是什么,就是 open ai 的 推理模型,在数学难题上找到新的构造,看一下这个图片非常不错啊,就是完全符合了我们的要求,有这个科技感。然后主题也是刚刚那个 ai 新闻的那个主题。 这个 skill 呢,有个小问题给大家说一下,在 mac 上是直接可以用的,在 windows 上呢,如果遇到这个脚本报错啊,其实完全不用慌,就是万事接问 ai, 让你的这个 skill 里面的脚本有哪里有 bug, 然后修复再运行它自己完全能够修好到这一步呢。我们其实看到我们的 pad 已经能搜索了,能读资料,写文稿,生成语音,生成图片了,那最后一步呢,我们就是让它来增加这个做视频的功能,我们直接搜索 ipad frames 安装。这个呢,是我最近特别喜欢用的一个 skill, 它非常适合做这个讲解类的视频产品,介绍科普动画,然后过程演示。它的思路也很巧妙,不是去直接让 ai 生成视频, 还是先让 agent 写一个带动画的 html 网页。 html 因为是用代码组成的,所以它生成的时候非常稳定,又可编辑,可预览,然后呢,再逐帧去渲染成一个完整的视频。而且对你来说啊,你完全不需要去懂 html 里面的代码是什么意思,你只要告诉他你想要什么结果好。 安装好之后呢,我们来先跑一个比较小的 demo, 先开一个对话框,用 hyperframes 做一个二十秒的动画,解释什么是 agent, 只生成 html, 不 需要去渲染视频, 我们来看结果,你看它生成好了,它能做标题,然后转场图形,动画字幕的节奏。这个东西呢,你继续加上一些语音,加上一些图片, 其实就能变成一条完整的视频。我们给 pi agent 配上了这五个功能之后啊,我们最后来验证一下我们现在这个 pi agent 它拥有的能力。比如说,我问他,你现在安装了哪些 skills, 它们的位置在哪里?你看啊, pi 呢,会把它现在所有的技能都给列出来到这里呢, skill 一个一个都解锁了, 搜索的,读资料的,语音的,声图的,视频的,单独看呢,你其实看每一个都不复杂,但如果我们把它串起来啊,就能做很复杂很复杂的任务。最后呢,我们就来把这个整合起来,一起来做一个大的项目。最后这个案例里面,我们想做一份行业的调研汇报,假设呢,我现在想要研究一个问题, 是一台英伟达的 g b 两百 mv link 七十二的 ai 机柜要卖三百万美元左右,那这些钱到底用在了哪里,花在了哪里呢?我直接跟我的 photographer 说,作为一个调研项目,一台英伟达 g b 两百 mv link 七十二的 ai 机柜,钱到底花在了哪里?要求做成中文的 hyperframes 演讲,用 tts 配音, 用 gpt image 生成图片素材。关键数字数据必须有来源不确定地方呢?写清楚,是估算的长度呢,大约是两分钟左右,需要有字幕显示,不需要渲染,视频发送。就这几句话,其实我只要说我需要什么,结果 pad 呢?就开始帮我自动拆解任务了。 第一步呢,他会先调用这个搜索 skill, 去查英伟达官方的资料, g b 两百 n v link 七十二的这个产品信息公开的报导,或者成本的估算。第二步呢,他会帮我去整理这个资料,把关键的数字跟来源都单独记录下来。第三步啊,他开始拆解成本了,比如说包含算力、核心网 络的互联页轮之类的这些成本。第四步呢,他会开始写中文的关键词,翻译成人是 two, 生成图片素材。第六步,他调用 h t t s 生成中文的语音解说。第七步啊,他才会用 hyperframes 把标题页、成本拆解,图片、动画、语音全部组合成一个演讲的界面。我拿到的是这样一个完整的项目,文件夹里 里面有资料的笔记,有成本的拆解,有中文的演讲稿,有语语音的文件,有所有这个图片素材。最重要的是还有一个可以直接打开预览的这个 hyperframes 的 这个页面。大家来看一下这个效果,非常完整的一个介绍英伟达 ai 机柜的这样一份视频的资料。 今天看一笔账,一台英伟达 g b 二百 n v l 七二 ai 机柜三百万美元花在哪?先看规格,英伟达官方说明, n v l 七二在液冷机柜里连接三十六个 grey c p u 和七十二个不恰当 g p u, 组成一个七十二 g p u 的 en v link 浴 整柜 m v link 通信宽带一百三十 tbs hbm 三亿约十三点四 tb 价格没有公开标价。 tom's hardware 二零二六引用业内来源给出二百八十到三百四十万美元。二零二四年 h sbc 估计约三百万。下面按三百万美元中位数算, 第一项,三十六颗 g b 二百 super 值, h sbc 估每颗六到二百五十二万美元,占整柜约七成到八成。 单科 superg 里主要价值来自两科, blackwell、 gpu grey cpu hbm 和先进封装。 epicai 估算单科 b 二百,制造成本约六千四百美元, hbm 接近一半,先进封装约一千一百美元,逻辑规片低于百分之十五。 第二项,互联和网络,机柜里有九个 envlink switch tray, 还有铜栏 connect 网卡 blueview dp 管理网络和本地存储公开资料,没有逐项价格,按三百万总价扣掉 superg 后,这部分和其他系统件合计大约几十万美元。第三项,工程成本, envio 七二公,耗约一百二十千瓦,重量约一点三六吨。你需要夜冷供电机会结构测试和集成 tom's hardware in modern stanley 数据 gb 三百 nbr 七二的冷却部件泵约四点九八六万美元,这个数字只代表冷却部件量级,不含机房侧 cdu 配电合约。结论很简单,最大的钱在 gpu hbm 先进封装和 nvlink 生态。 第二层是液冷和电力工程,在往外是供给稀缺、软件占质保和整柜集成溢价。最不确定的两项是实际成交价和非芯片泵拆分, 他们随客户采购量和合同变化,这就是派 agent 的 价值,相信大家都学到很多了,就我们最后再来回顾一下。 agent 呢,现在大概上可以分为两种, coding agent, 它的产出是代码,帮你写项目 派这种日常的任务的 agent 呢,产出的是结果代码,只是中间的一些手段而已。 coding agent 是 预制菜,内置了一套完整的写代码的流程工具。提示词,派是个性化的,是自己搭的它的底座。极简 能力呢,靠 skill 一个一个往里面加,每个人最后用到的派呢,其实都长得不一样。所以这期视频的重点啊,是看我们怎么一步一步的去解锁这个派的能力。装搜索,它就会联网, 装 pdf 跟 office, 它就会去读资料。装 h t t s 呢,它就会开口说话。装 g p t image two 呢,它就会生成图片素材。装 hyperframes 啊,它就会做带动画的演讲跟视频。 最后啊,当你把这些单一的 skill 串起来的时候,你就突然发现它强大的能力了,它能完成一个真正像工作一样的任务,从一句话开始,交付一份完整的行业调研演讲报告。 coding agent 呢,解决的是开发的效率,它也解决的是工作流的效率。好了,今天视频就到这里了,我是蒂斯种黑金李超,我们下次见。

ai video 是 一款开源免费的 ai 长视频生成工具,它能够根据文案进行智能排版和剪辑,自动生成字幕、自动配音,实现全流程自动化的 ai 视频创作。 我是这款软件的作者阿生,软件已在 github 开源,你可以下载源码自行部署使用。今天我通过一个实际案例,演示如何用 ai video 生成 ai 视频。 首先进入官网,首页有软件的基本介绍,点击视频创作菜单, 这里提供两种视频生成模式,第一种, ai 主题创意视频,只需输入一个主题, ai 便会自动生成完整文案,并匹配视频画面,适合灵感创作。 第二种,文案生成视频,如果你已经有写好的文章,直接复制粘贴即可将文章转为视频。我们选择 ai 主题创意视频, 在文本框中输入你想生成的内容,比如制作一个关于 python 基础语法入门教程的视频,要求编程入门教学、视频代码演示清晰,概念解释通俗易懂,适合零基础学习者。 不要写视频控制指令,也不要复制其他平台生成的指令。我们的智能体工作流会分析文案内容,自动生成分镜视频并自动剪辑。接下来你可以设置视频比例,支持横屏、竖屏等多种格式。 视频风格方面,系统默认内置了多达一百零七种风格可选,我们这次选择摄影写实风格。然后是字幕与配音设置,选择一位男生配音,还可以添加背景音乐等。 一切准备就绪后,点击一键生成视频按钮。由于涉及 ai 文案创作、画面生成、语音合成及智能剪辑,请稍等几分钟。 一般建议四零九零二十四 g 显卡推荐四十八 g 版本,显存越大升成越快。如果你自己没有显卡,可以租用各双立云平台的显卡进行部署,现在价格都很便宜,不到两元每小时。 我这里已经在仙宫云 c、 s、 d、 n 两个平台部署好了镜像,你可以直接开机使用。在进度条下方可以看到当前视频生成的详细状态, 生成完成后,点击播放即可预览效果。你是否曾经觉得编程世界像一堆天书,根本看不懂? 别担心,每位程序员都是从零开始的。今天我们要聊的是 python 入门,它真的是为小白量身打造的。 python 最大的魅力就在于它的语法结构非常像我们在日常阅读的语言。如果你想对深层的视频进行修改, ai video 提供了二次剪辑功能。 进入后台可以对视频文案、字幕、配音、分镜、图片和视频进行二次修改,直到深层满意的画面,最后再合成新视频。 好了,今天先演示到这里,更多功能留给大家亲自去探索体验吧!

这个 ai 工具可以把小说文本一键生成这样的爆款漫画,操作特别简单。这里复制小说内容,自由设定故事类型、画风页数,系统还配好了专业提示词,点击生成, ai 会智能梳理剧情,打造人物与场景,整套分镜一次性完成。 这里还可以上传自定义人物参考,然后点击批量生成,一分钟直接出片。生成后支持单张编辑调整,最后直接导出就能发布。这些都是我生成好的漫画风格,质感拉满,全程傻瓜式操作,省去所有繁琐步骤,新手也能轻松做出爆款漫画。

哈喽,大家好,我是阿宇,大家觉得视频开头的两个角色模型质量如何呢?这两款模型都是我用楼等 ai 给我生成的基础模型,然后再精细微调优化出来的成品。 如今楼等 ai 的 性能提升十分显著,不仅能够做到四秒快速生成的一个模型,还是全球首款支持千万级面数生成的三 d ai 工具 生成的贴图还能够实现全方位无死角的贴合覆盖。亲身实测体验下来,他的进步幅度很大,出膜的质量也格外的稳定,现在已经成为我工作中十分好用的得力助手。 接下来我们聊聊他本次更新的几大核心亮点。最让我惊喜的就是他的模型成品质量大幅提升,生成的形象和上传的参考图 还原度极高,这一点体验感特别好,这对新手和零基础玩家也十分的友好,触摸品质在线,简单微调后就能直接用于三 d 打印或者是其他各类场景。 其次是超快的模型生成速度,还提供了多档速度随心选择,支持四秒、九秒、二十秒、八十秒等不同的模式选择。 这边还有个小按钮,一次性可以生成多个结果,供大家自行选择,然后像抽卡一样抽到自己满意的。想快速出样预览效果就选择高速模式,想要精致丰富的细节,放慢升速度即可,细节质感也会随之拉满,灵活设备不同的使用需求。 这是我之前做的硬汉猫,然后渲染的一个梗图,现在我丢给 roden 给我生成。这里能明显的看出来,生成的模型和参考图形象高度的契合, 贴图不仅还原,更是做到了三百六十度无死角的覆盖,一托于原生的专属算法,它的贴图生成质量十分的出色。然后在模型上这些细微的纹路也并非发现贴图的效果,而是一托于千万级面塑打造出来的实体真实细节, 成品直接可以当做高模使用,如果丢去三 d, 打印出来的效果肯定也是和网站上面看到的细节是一致的,所见即所得, 如果想要更精细化的模型,我们也可以手动调整。就拿这两个模型来说,我拿到生成的出口后,只是简单的修正了不合理的结构,衔接声音的部位微调了整体万龙过剪影 可以看到我保留了很多部分,我其实并没有去动,我最满意的部分就是他的这个后边的头发,他给我生成的出来的效果我很是满意,全程累积花费六个小时左右就完成了优化。整体成品和原生生成的效果差距并不是很大, 并没有进行大幅度的改动,只是做了一些精细化的微调。传统手工建模的功底依旧需要自身的积累打磨,但 ai 确实极大的简化了创作流程,大幅的提升了我的工作效率。 这次留等 ai 特意给粉丝争取到了福利券,一美元就能开通,原价三十美元的月度会员,折合 rmb 就是 六七块钱,一共五十份。在首页右上角就可以点击兑换, 兑换成功后,若无长期使用的需求,也可以在首页取消订阅券否放在评论区,想体验新功能的朋友抓紧领取试用吧!

注意看打印涂鸦笔记,就能把草图变成现实,可以把任何人放到任意场景中, 海报点一下,改文字换人物,一键无痕修改,再推一下鼠标,就能三百六十度更改图片视角。这些都是我用最强设计 a 政策喇叭头完成的。今天分享四大场景使用玩法,让 ai 做设计变得像呼吸一样简单。 上传一张普通图片,然后点击铅笔工具,随便画几笔,把图片和涂鸦合并图层,然后选择 nano banana pro 模型,大概描述一下想要的效果,就能一键帮你把草图变成现实的成品。整个过程不需要复杂的提示词,你的灵感就是最大的生产力。 普通生图工具基本上没办法做到精准控图,但在老外这里,只要点一下海报上的文字、人物背景,都能做到无痕修改。对比一下,完全没有破坏原图的排版和质感,哪怕自被遮挡,它也能够自动理解前后层级,实现无痕替换。 最绝的是它最新上线的多角度功能,像这种三 d 的 ip 图,只要拖一下按钮,就能在保持人物一致性的前提下,实现三百六十度的视角切换。而且我使用下来,感觉不是在重新做一张图,而是在改一份已经生成好的设计稿,体验非常的丝滑。 以前做内容运营和电商,最痛苦的是定好一张主图后,需要去重复抠图,对齐延展不同尺寸的物料。现在可以直接上传一张随手拍的产品图,定好福星视觉,它就能自动延展成一整套完整的物料包, 甚至能直接把设计图贴到真实的样机模型上,光影匹配也极其逼真,只要几分钟,一个人就能搞定一整套上新素材。 其实 yy 的 最大的不同在于,它扭转了我们对 ai 只能帮我画张图的认知。它不仅仅是一个生图工具,而是一个真正的设计 agent。 比如在做 ppt 时,可以直接丢给他几分背景资料,再给一个简单的提示词,它就会像一个真正的商业逻辑的设计总监一样,自动去搭建整套文稿的内容框架。 而且它输出的不是死图,里面的所有文字图标都可以进行二次编辑,而且支持多种不同风格的 ppt, 全部都是一键支出。 如果你是设计师,你会发现它是一个非常高效的写作工具。如果你是那种创作者、电商卖家,或者像我一样不是专业设计出身,它也能帮你把脑子里的想法快速落地成成品。这可能也是我最近最强烈的感受, ai 做设计终于不只是能生成,而是真的开始变得像呼吸一样简单。

你也想做出那种一张图点赞几十万,评论区炸裂到全在球教程的 ar 绘画视频吗?那你一定要知道, comfy 它不是普通的 ar 绘画工具,它真正厉害的地方, 是把一张图背后的所有步骤,拆成一套可以附用的工作流。普通工具是,你输入一句提示词,它给你一张图不满意重新抽卡。但 comfyui 不 一样,它是节点式工作流模型、提示词、采样器、 controlnet、 laura, 全部变成一个个节点。 你想控制人物姿势就接 ctrl alt。 你 想换画风就挂 laura, 你 想修脸,放大出视频就继续往后接。截点,每一步都能看见,每一步都能调整。所以它不是让你堵结果,而是让你控制结果。这就是为什么很多高手会用它。 因为 ar 绘画真正拉开差距的,已经不是一句提示词,而是一整套稳定的工作流。更狠的是, com 会是开源,免费的,可以在自己电脑上跑, 也有官方桌面版和原版本。它支持的不止是图片、视频,三 d 音频都能放进同一套流程里。 flex、 sd、 三点五、混源 y 二点二,很多新模型都能接进去。 社区里还有大量现成工作流,别人调好的流程导出一个 g s o n 文件,你拖进去就能研究修改附用,一键换风格,一键高清放大,一键把图片接成视频。当然,它不是打开就会用的小白工具, 满屏节点和连线,第一眼很劝退,电脑配置也会影响速度。第三方节点也别乱装,因为那些节点本质上就是代码。 但如果你想把 ai 绘画从碰运气变成可控、可附用、可批量, comui 真的 值得学,别的工具给你的是一张结果图, comui 给你的是整套出图方法。你现在用什么 ai 画图工具?评论区聊聊。