哈喽,大家好啊,之前呢,我开源了自己的一套呃,前后端一体的这个 ai 项目,一个开发的一个框架叫维格啊,也是基于 fast api 加 voe 的 一个一体化工程的模板,包括前端和后端。今天呢,我基于我的这个维格的模板啊,做了一个项目,然后把它给开源出来。 呃,这个项目呢,主要是用来呃写脚本的,就是写视频的这个脚本。这个项目的核心呢,就是使用语音跟 ai 去对话,然后把你的这个脑子里这个想法,把你的这个创意然后给提取出来,然后输出成 呃可用的一个脚本。呃,因为之前写脚本嘛,我就是想到啥写啥,想到啥说啥,呃,上下文一点逻辑都没有,然后开头也不好,没有任何的这个 钩子,所以说,呃视频做的也不是特别好。这个项目的核心呢,就是使用 fast whisper 啊这个模型去把你的语音转成文字,然后 ai 呢再去校正,然后通过多轮的这个跟 ai 的 对话,然后把你的这个内容最后整理输出成一个可用的这个脚本。 其实我觉得脚本的效果像我置顶的这两个视频呢,都是使用我这个工具去写出来的,一个是跑了五点一万啊, 呃,我觉得效果还是不错的,就是能达到可用的一个级别,但是后续呢,还需要不断的去优化和调整。接下来几期视频呢,我会不断的去迭代这个项目,然后,呃我希望有一天就是用这个项目可以做出百万级的这种播放爆款的这个视频的脚本, 这也是我最终的理想和目标。这期视频呢,就是我主要是想把我这个项目完全开源给大家,然后呃大家也可以拿去学习或者是使用, 呃,也希望呢能对大家有所帮助啊。接下来呢我给大家整体的介绍一下我这个项目的一个功能,整个项目都是我使用 ai 工具啊,使用 cursor 去写的, 包括首页的设计,包括功能的实现,都是使用 ai 去完成的。接下来呢就是我带大家简单的介绍一下我这个整个项目的一个功能,首先你需要让 ai 去了解你,所以说我在这里啊加了一个自我介绍啊,你可以去编辑你的这个介绍的这个信息, 你这个编辑完之后呢,你点保存之后呢,它会自动的去分析你的这个自我介绍,然后进行画像的总结和这个标签的标签的一个生成。 呃,这一步非常重要,因为,呃我在提示词里内嵌了这个我的个人信息的这个画像以及标签,这样你在对话的时候, ai 就 更懂你,知道你要去做什么,知道你的这个视频的赛道啊,知道你的方向, 然后才能更好的为你提供这个脚本的思路,才能更好的帮你去写出一个好的脚本出来啊,这是非常重要的一点,所以说第一点呢,就是我们先 把画像和这个标签生成一下,然后接下来呢我们就跟 ai 去对话,对话呢有两种形式,一种是文字,一种是语音,通常呢我都使用语音的方式去对话,这也是整个项目的一个核心, 因为语音呢就是你想到什么说什么就行,即使卡壳了也没关系啊,就是你把你脑子里的那个火花,把你脑子里那个创意,慢慢地通过跟 ai 对 话的形式,然后去提取出来,然后最后生成你想要的一个视频脚本, 然后你再去拍视频,就非常非常简单了。呃,我还加了这个呃脚本研究的一个功能啊,脚本研究的一个功能,但是可能现在不太好用啊,大家可以去帮我去完善一下,或者说提一些意见。 这些呢,就是我历史生成的一些脚本,包括这个跑的比较好的真名的三点零啊,写代码的时代, 大家可以看一下最后生成脚本的一个格式哈,都是非常规整的,就是在你呃拍视频的时候,你就非常清楚自己要说说什么,但是你也可以进行微调。接下来呢,我给大家实操一下,我平时都是怎么用这个工具去写脚本的啊? 这期视频呢,我想做一个 deepsea 微三点二版本最新发布的一个脚本啊。嗯,我觉得还是从呃功能的升级,以及这个呃新版本的一个有什么新的特点,咱们把它重要的给挑出来,然后说一说。 呃,像其他的,还有就是对比其他的模型,比如说现在主流的 g t p 五点一,或者是 g m i 三点零 pro 啊,对比下这个模型,然后有什么样的特色和功能?呃,因为它也是开源,或者是因为 deepsea 是 开源的嘛,所以说跟那些闭源的系统。因为因为 deepsea 也是开源的嘛,所以说,呃对比一下,就是跟闭源的系统现在还有多少的差距? 呃,另外呢,还有就是,呃,我,我想到哪说哪啊?就是,嗯,在这个服务器的部署上啊,具体需要什么样的配置,都能部署哪些模型?呃,整体呢?是这些。 ok, 他 现在开始进行了语音识别和转写,我们看一下后台任务啊,现在语音上传成功,然后他这个视频时长是八十三秒, 现在开始语音,现在开始语音的一个转写,这个还是挺快的,大概一分钟,几分钟的视频,很快十多秒就完事了啊, ok, 这个后台再跑一个任务, ok, 完事了,看他这个,他就把我的语音给识别出来了。接下来呢是进行使用 ai 模型进行修正,因为有的文字或者是前后句或者识别它不准确,所以说我们要使用 ai 修正, ai 修正之后呢,然后自动发送,然后看一下 ai 的 回复啊。 呃,准确的来说呢是 g p t 五点一和 g m i 三点零 pro, 它其实已经发布了啊,在十二月初,呃, g p t 五点一呢,可能在十月末发布的啊,这个是以我说的为准。呃,如果你不知道呢,你可以看一下 d c v 三点二最新发布的稿子,或者说最新的文档,你可以上网搜索一下。 然后呢,根据整体的内容,你可以给我出一篇那个初稿,咱们看一下,然后现在开始给我写一个初稿,初稿写完了呢,然后就是不断的去让他去修改啊,如果不符合你的这个,你感觉,你不符合你的这个感觉,或者是跟你的调性不符合,你就让他一直改就行了,因为这个语音发送吧,你就说到哪就想到哪,说到哪,然后也比较随便。 最终呢我们给他直接生成一个视频的脚本, 他会把你的对话里的所有的这个内容进行总结和分析,然后把这个 ai 这个生成的脚本直接提取出来,然后帮你整理成一个脚本,你在口播的时候可以直接去用看这个主标题,副标题啊,副标题你也可以自己输入一下。 ok, 我 们假设我们使用这个脚本啊, ok, 点击保存这里呢,我们就可以去脚本的列表页面,脚本的列表页面他就在这里, 然后你看他这个脚本还是很完善的。视频标题写好了,开场怎么说,呃,你看十二月初中国 ai 丢一颗核弹,三点二正式开源,不仅推能力直逼,而且还拿个电,更是把全部开放。 ok, 我 平时在使用这个脚本生成系统的时候呢,就是经过多轮啊,多轮的对话,然后把我想要表达的这个内容,然后告诉他。呃,给他提炼核心,然后通过这个语音不断的交互呢,让他最终生成我想要的一个脚本,然后不断的修改开头结尾啊,包括中间的一些过渡啊,然后让他去帮我生成最终的一个脚本,这个脚本差不多就长这样啊。嗯,就是你要表达的内容,然后还有一个结尾,然后你想他写成什么样,他就写成什么样, 这个还是比较简单的,然后,呃,大概的流程就是这样啊。以上呢,就是我整个项目的一个核心功能介绍啊,这个是我这个项目的地址,已经开源在 github 上了,也是基于维格的这个项目的框架去开发的一个项目后续呢,也有很多工作要做啊。这个项目比如说我们给它加上 r a g, 比如说让他学习播放量比较高的这种视频的脚本的这种范式啊,让他不断的去生成爆款的这种视频脚本,这也是我最终的一个目标哈,就是持续的生成爆款的视频。好,那这期视频就到这了啊,咱们下期见。
粉丝1778获赞5932

来了来了,全网都在找的豆包手机同款 ai 工具,智谱开源 autobot 膜给你们找到了,操作简单而且免费,小白也会试用,同时支持安卓、苹果、鸿蒙。 下面我速分享给大家。首先点视频右下角分享键分享复制链接,然后打开这个工具包, 没有的去下载一个就会弹出资源包,没有弹出的去首页输入鱼饼大全,然后打开这个文件包,右下角去保存就可以了。

准备好,你即将在几分钟内拥有一个你随时可以访问的私有免费大模型。第一步,下载欧拉玛。欧拉玛呢是最火的专门为本地运行和部署的开源大模型设计的工具,下载完它呢,只需要输入一句, 欧拉玛瑙某某某开源大模型就任你用。第一步呢,我们打开欧拉玛的官网,然后点击他主页的下载,跳转进去之后呢, 选择适合你的系统,比如说我这里的系统是 windows, 下载好之后继续跟着它的步骤去安装。第二步,按住键盘上的 win 加 r, 在 这里输入 cmd 回车。在终端输入我们唯一的一条命令,欧拉玛 run 拉玛三点一,让欧拉玛帮你运行拉玛三点一的模型,现在他就开始下载模型了。下载完成之后呢,你就看到这个提示, 你已经可以成功的在本地运行这个大模型了,然后你就可以直接开始对话了。第三步,首先 ctrl 加 d 或者直接输入 by 就 可以退出对话啦。 我们打开欧拉玛的官网,看到右上角的这个 models 点进去,这里几乎有所有的前沿大模型,我们想要哪个模型点进去拷贝他的口令?比如我们再来一个最近登顶世界之最的千万大模型,欧拉玛万千万拷贝过去,回车 搞定。现在呢,你就可以像普通 ai 客户端那样去对话了。如果我们要读取网页链接的话,在这个网页链接之前加一个井号就可以了。如果要上传文件的话,就点击对话框左边的这个加号就可以上传了。再设定一个提示词,让他永远回复中文。 好啦,拥有一个运行在自己电脑上随时可以访问的大模型,就是这么简单!关注皮皮,每天解锁一个逆袭小技巧!

免费了,不要三四九九,也不要九块九,不包手机的平替智普的开源项目 open auto gm, 配合它的开源模型 auto g o m 九 d, 咱们也能实现手机 agent 的 自由。我用手上这台安卓手机和 mac 电脑搭好的环境,让他来帮我购物, 这是执行效果,提示词是在淘宝上找到帮宝适黑金刚 l 码最低价的商品,加入购物车,然后发微信告诉我商品选好了。我来看看。这套开源方案和豆包手机最大的区别有三点,第一, 一,运行级别不同。开源方案只能在前台运行,豆包手机可以在后台自己默默的运行。第二,手机的便携性不同。开源方案手机和电脑必须用数据线连接,或者是在同一个 wifi 下,豆包手机可以只拿着手机到处走。三、智能程度不同。 开源方案接的是九 b 参数的小模型,能完成大部分的基础场景,但是极限智能比不上豆包手机。推荐两种适合的使用场景。 场景一,操作电脑忙不开的时候,比如快下班时提前叫车,当同事还在等车的时候,你已经上车回家了。场景二,需要在手机上多个 app 之间切换,收集数据,分析并且最终操作手机的场景。比如说在双十二购物选择最低价格商品时,我的微信收到消息了,任务完成。 牛逼!那么这么牛逼的手机, a 镜的方案会不会很难配置呢?完全没问题,我摸索了一套极简方案,只需要一行命令和一句话就能配置好。 首先看我这期视频,一行命令把 cloud code 安装好,然后打开 cloud code, 告诉他这句话,一路点同意就能安装完成整个配置过程,需要用数据线把安卓手机 在电脑上这么简单都能就能搞定,快去配置一套试试吧!你还有什么场景想用手机 app 来解决的?详细的安装过程和常见问题我会总结成文档,方便大家查看。关注我,玩转 ai 编程。

今天出一期智谱开源恋爱手机的教程,点击进入这里,我已经登录账号了,直接搜索智谱的这个项目, 下面有文档可以查看。 点击 code 选择下载方式, 可以使用 get 下载,打开终端,输入这段命令即可,没有 get 可以 直接下载压缩包使用。 看一下项目介绍以及如何使用, 有条件的可以自己部署模型,没条件的按照我下面的步骤操作。 第一步,查看 python 环境版本,三点一零以上 win 加二输入 cmd, 打开终端, sim 版本是三点一二,满足条件需求。没环境的去下载安装 top 杠杠 w 点 python, 点 alt 杠 download 杠。下一步, 按 d b 安装,直接点击第三方教程,按照步骤一步一步来, 我这里的环境变量都已经配置好。 第三步,要在手机上进行操作,按照步骤一步一步来 打开终端,输入 app devices, 跟我一样现实设备信息就说明成功了, 不择这两行命令去安装依赖 打开终端直接粘贴命令即可。 这个项目是之前下载的,解压缩打开即可。下一步,使用官方的模型,点击链接打开申请蜜柚, 我的账号已经是登录过的了,先去申请注册,然后创建蜜柚。后续要用 打开之前下载的项目修改 ipi, 并设置模型, 设置密钥 忘记一步,安装 app padboard, 直接点击,然后下载在手机上安装 手机输入法中启用,最后点击运行即可。


分享一个可以快速学会开源系统的方法,这个方法我也一直在用,所以我个人的学习效率也提高了很多。第一步呢,先从 get 汉堡上把源码下载下来,然后用科斯这样的 ai 编码工具打开这个项目。 第三步,我们就开始问问题,问问题的时候先问一些结构性的、框架性的问题,然后再去逐步的深入到某个功能上。 因为 ai 呢,是基于原码做的回答,所以它回答的质量和准确度都是非常高的,基本上没有幻觉。

今天给大家分享一个豆包手机同款的开源项目,也就是最近特别火的智普,他们开源的 open oto g l m 是 专门用于控制这种托管手机的智能体。这个是一个框架,也是一个项目,但是这个总体来讲它的亮点大于实践, 主要有两个比较大的创新。第二个就是他们这个框架是可以进行这种手机的 连接,其实它跟按键精灵是差不多的,甚至它比按键精灵要小或者简单很多,实现了电脑和手机的远程操作,可以直接连 usb 或者直接在一个 wifi 里面就可以进行对接和联通。 我也详细梳理了一下这个项目,它开源的话其实并没有开源特别多的东西,像一些 memory 记忆体啊,这些记忆模块都没有开源,而且它只有一个智能体模块,它更像一个 simon, 而不是实际的一个项目。因为他在去年的时候其实是呃发了一个 app 的, 也是 otoglm, 但是在后面就没有特别多的推广了,而且效果也一般。 但是由于这一次豆包手机大火了之后,他借着这个风也做了开源,让大家也看到了这个项目。 我们详细来梳理一下这个项目。首先它的主要的架构就是你可以支持用它自己的本地模型,当然它都是使用的这种 best url 的 方式,你可以用本地的,也可以直接用现成的,但是那个模型必须要支持能元素定位, 现在币源的模型几乎都可以多模态的,最近的微软也开源了一个三 b 的 模型,应该性能也是蛮不错的,做元素定位,而且思考的模型 应该性能也是蛮不错的,但是他没有跟这个模型做一下对比,不知道他们九 b 的 这模型跟这个微软开源的三 b 的 模型比起来怎么样,应该大差不差,因为微软这个模型稍微小一点点,但是测试起来效果还是蛮不错的,而且小了之后才能在我们这种本地的这种显卡上面跑。九 b 还是挺大的,不算小了, 但是他有量化的,不过肯定是需要二十四 g 才能跑的,三 b 的 话做一些量化操作的话,也是可以让他实现在十二 g 内存上面跑的。 我重点比较疑惑的就是它到底有哪些工具和它这个智能体,它是什么样的一个智能体?它智能体只有一个智能体,然后我也没有 memory, 也没有记忆的规则,然后主要就是典型的 react 智能体, 整个流程就是典型的感知、思考、行动的这样的一个循环。然后每一次它做任务的时候或者下发任务的时候,它就会把整个 手机的系统去构建一个上下文,他的系统有什么应用这些,还有他的截图,就构建这样整体的一个上下文,加上你的一个任务规划, 然后他通过思考思考了之后去规划出来一个计划,然后去做执行,每一次执行了之后,他再进行一次思考,然后再进行执行,直到完成任务为止。当然他还有一些敏感操作,比如说验证码,比如说 要进行付款呀,这个是要人工介入的,它会主动的提示你们,我重点是想要知道它有哪些工具,或者可以执行哪些操作,是怎么样执行的?然后我就让它梳理了下,我是用的这个 deepweek 来做的,梳理它的工具也 跟按键精灵是差不多的,甚至比按键精灵要简单很多。首先就是启停指定的应用,然后手机上面关键的那几个按钮,还有就是滑动输入文本,返回上一页,还有点击,这些都都是可以的, 主要用的就是滑动文本和点击这几个,然后启启停应用,切换应用,这都是标准的按键精灵里面的东西。然后就是操作他的其实是一个相当于方寸扣领,点击某一个按钮去调用这某一个工具,然后有一些比较标准的规则, 应该执行前要检查应用,然后最多呢连续的等待三次,验证这个操作是否可以 进行操作。然后就是完成之后检查一下它的准确度,其实整体看起来它是一个 demo 的 形式,它并不是一个特别完整的项目,只是一个 非常简单的 demo, 稍微复杂一点的可能就是它搭起来了这样的一个框架,你自己可以去加一些 memory, 或者说加一些什么东西,然后我去可以放在你的手机里面,可以进行继续的二次开发。 总体来讲这个项目还是不能直接拿来做实际的运行的,可以做二开,这个是可以的。然后我都还专门让它梳理了一下它的记忆模块有没有,它是没有记忆模块的,它只有它模型上下文 token 的 这样一个上下文,然后这些提示词它都是用的中文呢?然后必须遵循的一些规则, 这些提示词其实还可以拿来做一些借鉴这些智能体的提示词借鉴还是蛮不错的。还有像这些执行动作某一个 app, 然后这就是它们方选透的一些东西了,当然做成 mcp 其实也是可以的。

你敢相信你正在被国外 ai 收割?像这样这样,还有这样的美女视频,都是用搜乐等付费软件生成的。但有一种软件,这工具完全免费,无需魔法,普通电脑就能流畅运行,操作简单,堪称到傻瓜模式。 你只需要输入叠词,点击生成,短短几秒钟,同款爆款视频就能轻松到手。直接调用 flex 二强盗模型,结合简洁的操作界面,直接把专业级图片视频制作的门槛降到了最低,无论你是学生设计爱好者,还是 ai 新手,都能快速上手,自由发挥创意。最关键的是,它目前完全免费, 让你零成本玩转 ai 视觉行程。我还将本视频的 sd 整合包以及对应的模型、插件提示都以文档的形式整理好了。感兴趣的六六六,不玩虚的,马上带你上手体验。下载完整合包之后,我们先来解压一下安装包啊, 那直接右键解压在当前的文件夹,那这个文件夹不建议是中文啊,我们要全英文的路径。解压完整之后呢,现在不需要安装任何东西啊,我们找到第一个本色图标,双击打开启动器,就可以进入到启动器的界面啊。 然后呢,左下角会有一个启动器标识的一个版本,我们再点击一下一键启动按钮,因为是第一次启动,我们需要等几分钟来进行部署, 稍微耐心等一下就好了。然后我们就进入了 s 一 的操作界面,那如果说把它比作房子的话呢,只能算做毛坯房,因为我们只有一个模型,什么也做不了。那么这个时候我已经帮大家整理好并放置了各类型最常用并且好用的模型安装包, 并且把模型的中文备注以及预览图一起的整理打包好。只需要在 s 一 的操作界面呢,就能够看清模型的量图和中文的名称,就不会和别人一样只显示一串英文代码,风格根本就分不清,看着就头大了。如果对于这个金袖子荷包感兴趣的朋友六六六那我会给大家去逐一的回复。

兄弟们,我这整套系统全程 ai 写的代码,每手动敲几行,你们说牛不牛?下面看看功能,图书管理、 借阅管理、图书预约罚款管理、数据分析、 读者管理。不多说,下面我手把手教你怎么让钱精准输出能直接用的系统代码,新手也能快速上手。第一步,整理原始需求。 第二步,生成需求文档, 确认 需求。 第三步,创建数据库。前后端代码 表结构设计中 后端程序开发中, 导入数据库脚本, 导入后端程序, 设置 main java 依赖,有问题 交给 ai 给修改好, 启动后端程序成功了,导入前端代码, 安装前端依赖 环境,有个小问题丢给菜处理,完美解决。 启动前端程序, 兄弟们开始登录了哦,碰到一个后端小问题, 交给我们的 ai 小 助理解决。 兄弟们看到效果了, 把前端美化一下,要求简洁大气, 开发一下。其他功能 成果展示, 喜欢的宝子记得关注加收藏,下次找起来不迷路!需要原码的评论区回复原码!