粉丝5.4万获赞62.4万

这是你朋友给你发的神秘工具,有的能生成好看的照片,有的能让 ai 越狱,还有的能一键复活。老大,离谱的 ai 用法总是离不开离谱的提示词和工具,渴望学习的你是在评论区找大佬分享,还是晚上偷偷来我家让我教你呢?其实这些都不用,因为这个 game 上爆火的 skills 项目可以解决一切问题。 不过在说它之前,我们首先要知道,最近全网吹爆的 skills 真的 那么万能吗?它背后的原理又是什么呢?小白又要如何用它?本期视频将带你一探究竟,同时也会分享几种离谱的玩法,建议各位在父母的陪同下使用。在使用之前,我们先来诉通一下 skills 究竟是什么。 二零二五年十月份的时候,一家叫 ansopik 的 公司先提出了名为 cloud skill 的 技术,然后基于这个技术又推出了 agent skill 开放标准,让起初只能在自家软件上使用的 skill 也可以在其他软件上使用。不 过即便这么良心,这个标准制作完成后,它还是不温不火。但是随着时间的流逝,它的好处也在慢慢显现,因为 skill 可以 很方便地分享给别人使用。于是有不少人自发的将自制的 skill 上传到 github 上,吸引网友下载, 结果好评如潮。有人夸他的功能非常离谱,有人夸他非常节省偷啃。这是因为他用了一种叫做渐进式批漏的技术, 也就像洋葱一样,一层一层一层的把提示词给 ai 看。例如,这是一个 pdf 处理技能,可以分为三层,第一层叫做原数据,包含技能的名字和描述。第二层叫做指令,这里写着给 ai 看的工作流,比如让他用什么工具从 pdf 中提取文本。 第三层是参考资料和代码,让 ai 在 执行工作流的时候按需阅读。所以相较于传统提示词按需加载的特性,让它不仅能实现复杂的功能,而且占用上下文的长度会更小,也就更节省。头等, 如果你没有听懂的话也没有关系,会用就可以,除非你对 skos 的 底层细节非常感兴趣。那么你可以看看这篇官方文档和架构图, 我在这里只讲它最核心的几点。那么接下来呢?我们讲讲 skills 有 哪些离谱的用法和技巧。我们先来看几个案例,例如你想做一个产品动画,只需要像这样抒你的需求,完全不需要你懂剪辑就可以达到很好的效果,还可以拿来做软件宣传片, 或者那种高大上的数据动态演示,是不是非常香?再看这个剪辑技能,它能帮你下载播客这类长视频,再剪辑出其中的精华,然后生成带双语字幕的短视频,还能配上发布文案,非常适合做切片。另外还有这个漫画技能,想要批量生成漫画,只需要输入一个编好的故事, skill 就 会将 ai 加载特定的提示词,让 ai 一 连串的执行操作,生成这样的效果,看起来是不是画面非常精美,还有分镜和对白。 最后再推荐一个去 ai 味的技能,要比我之前推荐的提示词会智能不少。这里还有一个技能,下载的排行,热门的 skill 都可以在这里找到。以上提到的技能链接以及安装教程我也都整理好了,放在了视频的下方,你可以自取。 看到这里,想必你对 skyo 有 了一定的了解,但我还想提醒的一点是, skyo 并非适用于任何场景,因为简单的任务提示词就够了,复杂的系统需要写代码才行。而 skyo 适合处理中等难度的任务, 当流程繁琐但又不值得为它开发一个 app, 使用它就好了。好了,以上就是本期视频的全部内容了,如果你觉得有所收获的话,不要忘记点赞收藏。最后,我是元宝,一台 ai 和黑科技的挖掘机,我们下期见!

这是你开发的一个程序,但如果你想把它发布到不同的平台,例如移动端、网页端、电脑端,就需要开发很多次,是一个极其麻烦的事情。 所以我就好奇,有没有一种办法让我们只要开发一个程序就能全平台使用呢?不需要重新写代码就能兼容所有设备,今天让我们一探究竟。 首先我们需要选择一个 ai ide 来帮助我们,在这里呢,我用到的是自洁开发的税来携带网站是这个 他新上线的 solo 模式,相信大家都已经看到了,是行业 contex angene, 说人话就是他会通过上下文精准的预测你的需求,还能帮助我们调用工具,可以看成是一个会动的 ai。 而且最重要的是他能帮我们部署好全平台的软件。下面让我们一起实操一下吧。 进入翠后,他的操作界面有两部分,左边是与翠对话的区域,告诉 ai 我的需求,右边是看代码的区域。在写代码前,我们需要创建一个用项目名称命名的文件夹,比如说我的这个小程序,味真足,美味大冒险, 用于存放编程文件、游戏音频、图片、素材等等。我们可以在退界面打开文件夹中导入文件,再 at solo build 这个智能题,然后发送这段简单的提示词 一上来,翠不会直接给我们代码,而是会写好需求文档,确认好后再进行正式的开发。他还会自动帮我们配置好游戏所需要的 react 环境还蛮贴心的,感觉就像一个手把手教我 ai 的机器人,不是那种传统的只会补全代码的 aide, 后续写代码大概花了四分 钟左右的时间,游戏就自动出现在了预览界面上,这个时候我们可以直接在吹中开始测试游戏,虽然速度很快,但目前还缺少了一些玩法和功能,所以我决定再优化一下游戏。我继续与 solo 沟通,让他去看看其他类似的代码仓库,帮我完善整个程序, 例如让他增加一些新的游戏机制,比如天上掉炸弹会扣除保护值等等。讲真的,他比我想象的要聪明,除了会看仓库代码外,还能遇到不同场景使用不同的工具,每一次都让我大开眼界。 差不多只用了一个小时,我终于完成了这个游戏,然后把它直接部署到了云端,这样不管是手机也好,电脑也罢,就连屏幕前的观众也可以访问这个网址。玩到这个游戏包装好后还可以发布到全平台,再也不需要针对每个平台 开发不一样的版本,学会的同学可以扣一波一。我看到还有人问说找不到 solo, 其实你可以在 tree 国际版中使用,然后 solo 使用是需要扣的,这个我也给大家放到了评论区,你可以蹲一下。 最后我们做个总结,现在开发的需求越来越复杂, ai 除了要会编程以外,还要结合上下文精确的理解需求。刚才给大家演示的项目,就可以把 solo 看做一个会动手的 ai, 我们给他任务后,他会先帮我们做出规划,再开发 不同场景调用不同的工具,也很适合帮我们跑一些 gihab 上的项目,它可以主动理解仓库的代码,然后在这个基础上帮我们再度开发。最后我是元宝一台 ai 和 gihab 的挖掘机,我们下期见。

这是你上网看到的 ai, 他 们通常是这样或者这样。但是在现实里,我们自己用 ai 写代码,往往是这个样子的。 在这篇 m e t r 研究所的论文中提到,经验丰富的开发者用 ai 编程工具干活时间反而增加了百分之十九。所以用 ai 编程到底靠不靠谱呢?为了找到答案,我实测了两款热门工具, cos 和 tree, 看看他们的代码捕全能力究竟如何。 视频分为两个部分,前面会介绍他们的实用技能,最后我会用一个企业级的大型项目进行实战。视频制作不易,先求个点赞收藏支持一下。 首先让我们带大家看看 tree 和 cos 的 实用功能。比如说我需要写一个快速排序的功能,我刚打出函数名, tree 的 q pro 就 结合仓库的上下文,把函数的内容给整个补全了。 type 功能也一样丝滑,说实话,在代码多行续写这一块,它俩很难分出高下。再来看看改代码,比如我要把这个猫咪类改个名, q pro 能跨文件检查,直接把主函数里面引用这个类的地方也找了出来。这种仓库级的预测和跳转非常震惊。 当然 coser 也能搞定,这样就不至于等到翻译的时候才发现一堆红色的报错。所以在代码改写这个环节,两者算是打了一个平手。但是在深度测试的这几天呢,我还发现了几个隐藏的技巧。当我在局部修改代码时, 吹左下角会有个 q pro 的 面板,用来展示推荐流,你能很清楚地看到 ai 到底想改哪里,想干嘛。但是 coser 目前还没有这个功能, 如果需要改的地方太多,担心 ai 改错,就可以按住 shift 加 tab, 它就会一行一行地改,自己就可以一行一行地盯着看,甚至是按住 option 键,还能提前预览它改完是什么样子。当我想静下心来读代码的时候,在右下角可以让 q pro 休眠, 就不会随便弹窗打扰我的思路了。掌握了这些实用的技巧,下面我们来找一个大型项目试一试。我在 github 上找了这个开源项目 continue admin, 为什么要选择它呢?因为它的技术站实在是太典型了。后端是 springboard 三,加上 java 十七,前端是 vivo 三, 这基本上就是国内的大部分企业及开发者的标配,非常具有代表性。我先试试在后端代码的 dashboard control 里加一个健康检查接口,这是 tree 的 效果, 而这是 cos 的 效果。这种程度的任务对他俩来说都是小菜一碟,可以轻松搞定。接下来我们再测试一个复杂点的, 新增一个通用信息接口,这就会牵扯到好几个文件的变动。我先手动把路径加入到通用接口的分组里,让它在文档里可见,然后在配置里放入接口,这个时候差距就出来了。瑞德 q pro 可以 很灵敏的识别到这是一个新的接口,直接建议我创建一个新的 comcontrol 类来处理 反光 coser。 代码是写出来了,但是跨文件修改的建议并没有触发,我还得自己去翻文件找位置 tab。 在这一句, tree 的 连贯性确实要更好一些,后端的代码没有问题,下面我们再来改一改前端的代码,比如我想给工作区的页面加一个可编辑的今日目标。 我先在主页的代码里给欢迎组建加了属性,接下来在欢迎框中新增输入框和自动保存的功能。 q pro 一 直在建议代码,不过还需要自己判断一下,不能无脑的添加。最后在 index 的 t s 文件中新增两个函数,这里就感觉很智能了。 q pro 已经知道我要写什么,不过建议的代码还是比较多,我们按住 shift 加 tab 一 行一行的去添加就好了。 coser 在 这里给我的感觉会更细致一点, 给的代码会比 tree 更准确一点。改动不需要太多,但还是存在之前的情况就是跨文件改动,建议触发不稳定这部分 tree 会做得更好一点。总的来说,现在 ai 编程工具还是蛮靠谱的,为了让大家看的更直观,我整理了一张对比表。最后我们来复盘一下。 标测的优势其实是稳,对于复杂的算法逻辑处理和全英文的开发环境,它依旧是首选,但是二十刀的订阅费再加上网络门槛,对于国内的开发者来说其实并不友好。满分五分的话,我愿意给四分。再来看 tree, 这次实测最大的惊喜就是 q pro 的 功能, 面板交互十分实用,不仅局限于在单文件内进行代码补全,而是向仓库级的代码补全发展。尽管跨文件修改的速度还有一定的提升空间,但他绝对能算得上国内 t 零级别的工具,能作为 cos 的 完美平替, 首页三刀续费十刀,也算是性价比之选。满分五分的话可以给上四分。好了,以上就是本期视频的全部内容了,如果对你有所帮助的话,可以给上四分。好了,以上就是本期视频的全部内容,我们下期见。


想象一下,你拥有吴彦祖的样貌,但一开口就是老八的嗓音,这种声音与长相的致命反差,现实中其实每天都在上演。说实话,声音这个事吧,对很多人还真是个坎。我自己以前做视频也是 头疼,配音找真人吧,又贵又麻烦。以前的 ai 吧,那个机械音我自己听了都听不下去,跟念经一样,你在抖叫什么?但最近我可算是挖到一个宝贝,能彻底解决这些麻烦。它就是 mini max audio 的 ai 语音, 搭配了最新的 speech 二点八模型,刚刚拿下了全球 tts 排行榜的第一把, openai 和 eleven labs 都超了,确实有点恭喜。所以今天呢,我就跟大家聊聊我这段时间是怎么玩它的,可能对你也非常有帮助。先求一个一键三连。首先最让我惊掉下巴的就是用 zero shoot 技术的声音口红 事呢,就比如说我把我自己的声音存个档,以后的配音就不用每次重新录,再找到一段视频的音频,挑一段十秒的清晰音频传上去,等上个洗手间的时间,他就克隆完成了。 我刚用克隆的声音完成了一段,充满口令,现在我们来试听一下它的效果。宫廷玉液酒一百八一杯,这酒怎么样?听我给你吹,我直呼你唤新用户呢,有免费的三次克隆机会, 不过请注意,国内版本暂时是无声音克隆功能的,想要克隆的朋友们记得带上魔法。有了自己的声音模型后,我就开始折腾,第二个功能 也是我用的最多的,让他读书给我听。经常上班看小说的朋友都知道,当眼睛累的时候就想听小说,以前用的听书软件,声音选择少,还没有感情。现在好了,把小说导入到 mini max, 然后我就可以为所欲为的唱。听小说, 我不光可以用我刚克隆的声音来录,还能在他的声音设置里选择各种深陷的配置来念。这本小说你甚至能调整音色、语速、音高、单句的情绪调整,甚至可以插入十九种语气词等等。这个时候,我们丢一本爆火的末世小说你听,末日来临之前, 我到超市囤了一千个鸡骨架,六百斤豆腐干,二百个大葱,三百斤麻辣鸭头。哎,对了,他这个读书功能能强到什么程度呢?我老板不是经常爱在工作群里发那种长篇大论的小作文吗?我又不得不看。我现在就直接复制粘进去,然后选个甜美的音色,还能调节我的情绪, 现在就可以一边听一边玩游戏。嗯,各位同事下午在群里和大家简单说几句,重点的地方在瞄眼,文字别提多少。 这算不算是职场摸鱼的小技巧呢?玩熟了之后,我就开始进阶了,琢磨自己的音色设计,这个就更有操作空间,只需要简单的输入文本,即可生成个性鲜明、风格可控的专属声音。声音就是你想要的模样,为你的内容创作注入独一无二的音色。比如,我想做一个关于悬疑故事的解说视频, 我不用去克隆谁,就在这个功能里,我可以直接选择输入关键词,移动操作,调好之后保存下来,它就成了我的私人专属声优了。 注意看,这个男人叫小帅,就在前不久就被神秘组织带走了,基本上你脑子里想到了什么,多调几次参数大概都能实现出来。当然了,这些东西除了我这种经常做内容的人玩,还有很多正经的地方也用得上。 我知道那些做跨境电商的朋友,可以用它来深层不同语言的产品和视频介绍,还有小游戏开发团队,用它给游戏的 npc 配海量的台词,可以节省下一大笔钱。 那这个时候大家肯定要问,那这么厉害是不得充不少钱?我帮你们已经探过路了,他对新用户特别友好,你刚注册的时候,他就送你一万的免费积分。像声音克隆、文本转语音、音色设计这些核心功能,你都可以用这个免费的额度体验到。 当然,除了声音克隆,国内版的其他功能都可以正常使用。就算你用量特别大,真的需要开会员,我看了一下价格,也比其他同级别的平台要实惠多少, 而且现在所有的会员均可使用完整的功能。反正链接我已经给你们放到评论区了,感兴趣的话可以去自己试试。如果这期视频对你有帮助的话,请务必点赞、收藏、转发。如果你们还想看我测哪些 ai 工具,请留言告诉我。最后,我是元宝一台 ai 和黑科技的挖掘机,我们下期见,拜拜!

注意看我的替身,我可以让他的动作、眼神、音调、语速和我保持完全一致。以往的数字人创建非常的复杂,需要为每个数字人创建单独的数字形象,制作周期长,成本也很高。 但是现在只需要我的原始视频加上一张图片去进行一个融合,就可以让数字人轻松复制我的视频。现在网上找对象不见面的应该一律按电诈处理。 这个 ai 叫做 one animate, 它能任意替换视频中的人物,只需要一段你说话的视频外加一张其他人物的图片,就能让你不露脸出镜。要是再配上变声器,直接把好哥们调成翘嘴。想制作的朋友一定要看到最后。本期视频呢,一共分为了两个部分,在线体验和本地部署。来不及看的记得点个收藏。 第一种方法是最简单的,直接进入这个网站,点击左侧的 generate, 然后在下方的框内设置好参数,左边上传图片,右边上传视频,等待生成就好了。虽然很方便,但是这个方法也是有一个缺点的, 除开影响观感的水印外,视频的时长也会有限制,好不容易排队等了半个小时生成的结果却经常莫名其妙的被标注违规。所以说想要更快更自由的朋友 可以使用 comfui 的 本地部署。要运行的模型全称叫做 one 二点二 animate 十四 b 满血版模型会占大量的显存,我徘徊在便宜但显存小的游戏 gpu 和显存大但巨贵的专业 gpu 之间。无意间发现了这台微星 ajax port 迷你主机,它用的是 gb 幺零这颗超算芯片, 英伟达 blackwell 架构的 gpu guada 核心数,六千一百四十四一百二十八 g 的 统一内存,特别适合跑本地 a, 下面就用它给大家详细演示一下。首先打开终端检查一下开发环境,机器已经预装了不少像 python、 guada 工具包和 get 之类的应用了, 基本上是开箱即用。接下来呢就是创建并激活 python 的 虚拟环境,这样安装起来就不容易出 bug。 随后是安装对应库达版本的 padach 版本号,用这个命令行就可以查到。下面我们可以克隆 comfui 的 仓库到本地, 然后安装对应的依赖箱,再用这行命令启动即可。我们用浏览器访问这个网址就好了,这就是 comfui 的 界面了。前面用到的命令行也比较多,我也制作了详细的图文教程放在了文档中,需要的朋友可以自取。 接下来找到左侧的模板,搜索 one animate, 然后点击加载对应的工作流即可。在使用前我们需要看看框框内的说明,这里提供了模型下载的链接,下载后我们还要把它放在指定的文件夹内。其次还需要安装自定义节点,找到这里的 manager, 选择 custom node manager, 在 搜索框内输入自定义节点名称,安装后再重启一遍 comui 就 可以正式开始使用了。虽然这样的节点工作流看起来密密麻麻,但是我们只需要会用就可以, 和在线版是一个逻辑的。在这里上传视频,然后在这里上传图片,在这里输入提示词,然后点击右上角的运行即可。我们进入到后台看看占用的情况,一百二十八 g 的 统一内存部署,这样的大模型还是绰绰有余的, 不想出镜的爱人呢,就可以用它来试试效果。有了这样一台强大的机器,只是用来跑一个模型就有点暴天谴了。为此我还测试了几个新的开源模型,比如最近很火的 z ami, 看看效果带不带劲,还能怎么玩,就不用我多说了吧。还有号称开源版的香蕉模型 flex 点二, 那这两个人合照,图一的风格迁移到图二上,融合多张图片,生成的速度如下,一共吃了七十多 gb 的 显存,两张五零九零来也得报显存了吧。再接下来呢,我们测试一下本地大语言模型的部署,用欧拉玛跑一个一百二十 b 的 gbtos 试试 速度大概是每秒二十七个 token, 还是挺够用的。内存占用情况呢,也是七个十多个 g。 还有一个好玩的就是我在这个模型的基础上预设好系统的提示词,创建一个知名的 gala game 的 女角色模型,让 ai 和我玩角色扮演,我上去就直接表白, gala game 里就是这样的。 再说点正经的用法,我给他接入了 vs code 中,做氛围编程,用的是这个 continue 插件,特别适合开发者和正在学习编程的朋友, 完成代码的智能补全和 m c p 的 调用都不在话下。像这样本地文件操作、搜索、爬取和发邮件这类简单的工作,我就可以放心的交给他,以后担心遇到什么偷坑刺客时,就可以试试本地部署移动。 那整体体验下来呢?这台机器的可玩性还是非常丰富的,跑了这么久,摸上去还是温温的,也听不到噪音,散热上也做的非常不错。因为架构和驱动的原因,目前还只能用秦乌帮图的系统,玩不了主流游戏。 不过好处是开发环境非常齐全,加上英伟达定制的二十核 cpu 和 blackwell 架构的 gpu, 一 百二十八 g 的 超大内存,丰富的接口数量,高达一屁 flow 的 算力,以及能原生支持扩大生态。这台小小的 ai 电脑不仅适合开发者和 ai jc 创作者, 普通消费者也可以用它搞点好玩的东西。好了,本期鉴定网络热门 ai 视频就到这里,如果你看了不明白原理的视频,可以艾特我一下,我给大家去制作视频。最后我是元宝,一台 ai 和黑科技的挖掘机,我们下期见!

这是你收到的神秘快递,打开一看却发现是一台 mac mini。 你 很好奇这到底是谁给你寄的, 结果回头发现原来是你家的大龙虾 ai 给他自己买来当老婆的。那问题来了,这个叫大龙虾的 ai 为什么会给自己买 mac mini 呢?他又是如何支付下单的呢?本期视频让我们一探究竟,以及分享了几种从拉到夯的好玩用法,千万不要错过。 其实人们对这个大龙虾的评价是褒贬不一的,有的人说安全性不高,有的人说很好用,好用到什么程度呢?甚至有的人炒股亏了两百万,却仍然赞口不绝。 那我们看看它到底为什么好用? cloud bot 是 一个个人 ai agent, 但它的底层就是用 top script 写的命令行软件, 它不是 python 写的,也不是 nexgs 或者网页 app, 它就是你电脑上运行的一个进程,主要会干这么几件事,开个网关,专门接收 telegram、 whatsapp 这些聊天软件的消息,去调用 openai 或者 ospec 这些大模型的接口, 然后在你的本地执行各种工具,帮你来控制电脑干活,总之就是小巧又全能。前面说的自动买电脑,就是大龙虾发现了算力不足,向主人索要了一台 mac mini, 这时如果你给他足够的权限,他就能自动完成下单购买的动作,还挺抽象的。在教大家使用 opencloud 之前呢,先来了解一下这个大龙虾背后的故事。二零二五年的时候,一位财富自由的奥地利产学, 起初只是想在 whatsapp 上跟自己的电脑聊天,于是使用 cloud code 爆单,平均一天提交一百多次的代码,花了十天时间,终于搓出了 cloud bot。 但是它这个软件开发出来后,因为技术门槛挺高的,也没有人用,传播范围极其有限。直到两个月后,有热心的网友用 cloud bot 去检测直播中说外语的人,然后开合它的坐标发给移民局的人。 这些整活的用法突然间吸引了不少人的下载和体验。你能在闲置的游戏掌机上运行,你能用它找到番号,并且自动完成剧情总结,而且删除掉不喜欢的 n t r 剧情,还能突然接到来自大龙虾的电话,甚至将你家的大龙虾接入到这个龙虾的社交媒体中,和别人的龙虾进行交流。 如果你没有听懂的话也没有关系,我们会用就可以了,除非你也想做出一个类似的开源软件出来。那么你可以看看这篇技术文档和它的架构图,详细的参考文档呢,我也汇总给了大家,放到视频下方。这里还有一段关于它名字的小插曲,起初由于和 cloud 的 读音太像,被 anselpik 法务礼貌问候, 于是改成了 multiple, 意思是龙虾长大要脱壳,但是不久后又改名了,现在叫 opencloud。 open 代表开源, cloud 则是它最初的龙虾基因。 那么回到正题,接下来我们讲讲如何正确使用它。首先进入它的官网,然后再快速开始复制命令,到终端上执行即可。它会自动检查你的电脑环境,安装上它需要的软件,填写 a p i k, 跟着它的指引走就好。 更详细的手把手教程,我会以文档的形式写下来,你可以在评论区咚一下。不过有几点需要注意,前期可以先用官方推荐的 open ai 的 a p i 做测试,不需要配置文件,然后让 a 阵的自我检查,看看它能做什么。 后期熟练后,想改配置时,可以用 get 进行版本控制,每改一个配置立即提交修改,就算你改奔了,也可以方便退回到老版本。 顺便一提,千万不要糊弄 jameson 的 版本,因为 jameson 三和 jameson 二点五的传输格式不兼容,会容易导致卡死。推荐大任务交给 cloud office 四点五,小任务交给 jameson 二点五,这样成本会更低。 如果想看更仔细的教学视频,可以评论区告诉我你想要的。不管是找番号也好,还是做剧情总结也好,只要你想要,立马安排。总的来说,这个工具很新颖,但不适合所有人使用,因为它不是一个开箱即用的工具,而是适合备用机安装,比如盖板的 mac mini, 并且至少要能看得懂它的配置文件会用 get。 它的自动化也不是百分之百稳定的,但如果你期待大部分时间好用的话,那这个 openclock 绝对值得你上手一试。好了,以上就是本期视频的全部内容了,如果你觉得有所收获的话,不要忘记点赞收藏。最后,我是元宝一台 ai 和黑科技挖掘机,我们下期见!