我最近挖到一个新挂件,真的有点上头,也是轮到我说,我们那时候哪有你这条件啦。现在的 ai 玩具一个比一个有趣,各种有趣或者高颜值玩具我都喜欢收藏。当我收到阿里口迷你机器人的造型,我直接心动 冻了,圆乎乎的一个给我男朋友也拿下了一个,一对粉男 cp 连上就能变身成有趣又可爱的小伙伴,平时出门当爆挂陪着,不仅好看,还会有各种可爱小表情。嗨,艾莉克,爱你。 如果年上网后就是我的陪伴。宝宝晚上吃什么呀?好纠结啊,要不咱点个芒果糯米饭?真的好久没吃了耶。怪不得今天碰到个好离谱的事情。我跟你讲, 离谱的是像打结的耳机线,越理越烂,但没关系, 我陪你慢慢解开他有大字陪我聊天,心里舒服多了。为什么我会有两个?因为两个艾利扣放在一起居然是可以谈恋爱的!有种现实中是情侣,就连玩偶都是情侣的那种好笑,而且居然配对还是一次性的, 只要两个仔配对成功,那就分不开了。就这么离谱的设定,但是又觉得有点个性,就挺像给那个特别的人准备的信物,独一无二的然后永远在一起的仪式感。我男朋友那只无所谓,反正我给我的仔买了一个盲盒,身体一共有四款,看看我能猜出哪个。 我居然拆出宝宝的那个,给他换一件新衣服放桌面,又可以陪我开心上班啦!每次我的自言自语和碎碎念,都会有一个小宝宝来接我的对话,真的很有仪式感,反正我已经入坑了,准备把这个系列的衣服都集齐。
粉丝8767获赞6.5万

国内用户如何使用 codex? 这个视频我将教大家不需要解决网络问题的情况下完美使用 codex 软件, 避免使用 codex 时提示输入手机验证。我们需要准备两个软件和一个网站,那两个软件呢?分别是 codex 和 cc switch, 一个网站就是我们要选择接入哪个模型,或者是我们使用的 api 中转站。首先我们可以到 codex 官网来下载,我们可以直接打开这个网址,国内用户是不需要上网环境就可以打开的, 打开后我们可以直接下载,如果你是 windows 电脑,这里会出现 windows 的 版本, 我们直接点击下载就可以。第二步,我们打开这个 cc switch 的 github 仓库,我们可以直接输入这个网址来打开,在这里我们选择下载它的对应版本,点击后我们向下滑动, 在这里我们可以找到不同的客户端,我的电脑是 mac, 所以 我选择 mac 版本,点击后直接会下载 这里你如果没有配置好上网环境的话,下载这个客户端会比较慢,那我在这里已经帮大家下载好了,并且已经上传到了云盘,如果需要的话,你可以在评论区留言,下载好后我们正常安装就可以。 现在我们打开 codex, 现在我们可以看到它,让我们选择登录,这时如果你没有上网环境的话是无法使用的, 那现在我们就用到了第二个软件 cc switch, 我 们正常安装 cc switch 后,我们选择打开它。 打开这个 cc switch 后,我们看最上方的这一栏,我们选择 codex, 在 首次配置时默认是只有最上方的这一个官方 api 的, 下面这三个都是我自己配置的,那如何配置自己的模型或者 api 呢?我们点击这个加号, 在这里我们可以选择不同的供应商,也可以自己填写供应商的名称。那我这里以这个 ai go code 的 这个 api 网站为例,点击后我们看到这里的参数,它已经帮我们设置好了, 我们现在只需要填写一个 api k, 那 我们可以打开它的官网,在这里我们点击登录或者注册,如果首次使用的话, 它是需要充值额度的,充值好后我们可以点这个 api k, 然后在这里我们可以看到这个 codex 有 不同的两个分组,我们可以选择这个速度更快一些的,或者性价比更高一些的。 我们点击这个创建,可以给这个密钥起一个名称,然后点击创建,这时它会生成一个密钥,我们选择复制,然后把这个密钥粘贴到 cc switch 中, 我们选择添加,添加好后我们在这里点击起用,这时我们再将 codex 重启一下, 这时我们就可以看到他现在可以正常使用了。这里我全程都是使用正常的上网环境,我们来测试一下,帮我生成一张,欢迎大家点赞收藏。评论的图片要求十六比九的比例, 它现在已经按我的要求可以正常对话,并且可以生成图片了,而且调用的还是最新的 emoji 二模型, 并且全程不需要登录,不需要其他的上网环境。我们接入第三方 api 的 话,也是用多少花多少。这个方法主要是针对那些没有上网环境的同学, 如果你在安装过程中出现了任何问题,都可以在评论区留言,我会给大家逐一回复, 下个视频我将教大家如何具体使用这个 codex, 它和 cloud code 有 什么区别?我们下个视频见,欢迎大家点赞收藏评论。

哈喽,早上好,现在是早上的七点,其实我五点钟就起来了,因为今天欧迷你上线,我就想看一下我的账号能不能有幸的去使用上它。在拍这个视频之前我已经嗯简单的探索了一下了, 所以现在的话呢,可以给大家拍一个视频。首先我准备了一段大概十五秒的一个脚本,脚本里面是包含了创意,然后就设计元素,因为早上试的时候呢啊,放了一个真人参考图上去是不过审的,那么我就把这个形象人物形象的 这些描啊特征我都用文字去让 ai 给我描述出来了。我试过有大概两个渠道是可以用上欧迷你的,详细的话我就视频里面不能讲了,你们自己看就好了。然后,呃,然后的话选择十秒,竖屏参数都是一样,然后把这个内容放上去,我们点开始 一次就呃生成两个哈,这一边是 c 档是二点零的,同样的 c 档是二点零,我们选十五秒,这边可以选十五秒哈,哦, ok, 呃,然后欧米尼这边的效果已经出来了,我们看一下哈,唤醒你的不该是喧嚣,而是对深度的渴望,掌管你的种熟时区 deep moment 咖啡。 然后这一次,呃,点进去之后呢,是要有一个像进度条的一样的东西,就是我可以随意拖动,随意拖动到每一帧的一个地方,然后刚刚我尝试一下这个,这个挺有趣的,就是我拖动到男主角的这个地方,然后跟他说把男主角的衣服改成黄色,其他 五遍,然后直接发送给他。这个就有点像我们在啊制作制图的时候啊,对话框的一个形式,告诉他我在哪里修改修改什么地方,然后就跟我昨天发的一个前三是很相似的,哎,你看他就把这个男主角的衣服改成黄色了。这时候我们回去看一看, c 档是二点零的,还在排队。好,现在 c 档是二点零的效果也出来了,我们看一下哈。 唤醒你的不该是喧嚣,而是对深度的渴望,掌管你的专属时区, deep moment 咖啡, 专注每一滴。然后两个模型对比下来的话, c 档子二点零的运镜还是比较优秀的。然后欧米尼的话呢,它就是中规中矩的一个感觉,在实际应用上面的话呢,它的效果也已经不错了。 呃,今天演示的这个还相对比较简单的,动作幅度小,场景简单。呃,那么在后面的话,还会在实际应用上面去看一下动作幅度大,场景切换的比较丰富的情况下,它的一个表现是怎么样。 讲的再好,实际应用上面的体验感是非常重要的。那么在后面的一个广告片的时候,我也会融入到,如果使用 omini 的 话,它的效果会是怎么样?那么我们下期见啦,拜拜。

deepsea 接入 codex 保姆级教学安装 miimo 二 codex 输入转发指令, 新开一个终端, 显示配置信息, 打开 c c switch 复制 api, 复制 u r a o 复制配置参数。

今天给大家分享一下 cloud 和 codex 最近都在推出的这种构模式,我会用一个实际的例子给大家展示一下,在一个真实的业务场景下面,我们不用构模式和我们用 cloud 的 构模式以及跟 codex 的 构模式产出的一个结果的质量的差异, 以及我也会说一下这个购模式比较适合什么样的场景去使用,它的效果是比较好的,希望对大家有帮助。我这里举的一个实际的业务 case 是 我有一个电商的朋友,他最近找我想让我帮他做一个电商里面的选品工具,然后他给了我一个获盘表,就是这个腾讯的一个 文档表格啊,给大家看一下它长什么样子。其实就是一个啊,供应商常用的一种货盘模板吧,就是图片、款号、颜色、码数、价格、性能等等啊,有几百个产品把它放在了一个货盘表里面,但是这个表格它是一个只读文档,所以其实我没有办法导出这个 文档,然后直接交给 agent 帮我去做一些事情。那么我其实要做的第一件事情就是把这个货盘变成我本地的一个一份格式化的文件。最开始我还是习惯性的用这个 cloud 帮我去做, 但是做的过程中我就发现他绕了很大的圈子,首先一开始他用这个 open c l i 去做,我就觉得不是很合适,所以中途我就打断了,跟他说这个东西应该不需要 open c l i, 是 不是可以直接采集过来, 然后他就去调研了一堆 api 的 东西,后面绕着绕着他又绕回去用 open c o r。 那 我觉得我这个场景其实是比较适合构这个模式的,因为我觉得它的输出是比较确定的,它的解决方案我觉得也是 ai 自己就能够完成的,应该不太需要我我的介入。 因为理论上你只要拿到腾讯文档的这个表格结构,然后按照格式化的把图片啊,款号啊、价格那些信息采集下来,录一份这个 c s v 的 文件,然后把图片下载下来,放到我本地,其实这个事情就完成了。它的实现过程我觉得应该也是比较简单的啊,直接通过脚本其实就能完成了, 所以我就尝试了一下。一开始我是用的这个 cloud 的 购物模式,然后这里的话,其实我就会发现它的质量其实会高比较多啊。它没有用这个 openclr, 也没有再去用什么 api, 而是去逆向逆向了这个腾讯文档,然后拿到了这个结果,但是他只拿到了一百一十六个产品,但实际上这个表格里面是有两百三十款左右的产品的。最终他用了二十分钟跟我说这个任务完成了,但其实他拿到的结果是不太对的。 同一时间我也用这个 codex 啊设定了一个目标,帮我去完成这个目标,经过二十二分钟的一个时间,它就顺利完成了,并且产出的质量非常的高,不管是款式的数量,还是图片的数量,以及整个交付的这个结果,完全就是一个我想要的结果。 那其实二二十二分钟可能看起来很长,但是其实在这个过程中完全不需要我的干预啊,在这个过程中我还一直在一个 再跟这边的 cloud 去聊到底是应该怎么去做,然后啊回过头看,发现 codex 已经把这个事情直接完成了 啊。所以说像这个 go 这个模式,我觉得啊,总体体验上,我觉得 codex 的 能力, 它交付的质量是要比 cloud 的 质量要好很多的。其次的话就是构模式比较适合的是这种编码型任务,代码型任务它就输出一些脚本,输出一些代码文件,然后帮你去完成一个事情,那么就要求你给出的这个任务,它一定要是比较有确定性结果的, 就相当于在这个过程中就不太需要人工的去做干预,那么这种任务就会比较适合用构模式去实现。在这个过程中无论他花多少时间,但是他其实不需要我们人去做干预,那其实他不用占用我们的时间精力,我们只需要隔一段时间来检查一下他是否完成了就可以了。 这里其实还有一个非常实用和方便的小技巧,就是当这个 go 完成目标之后啊,我们检查这个产出的结果是符合我们的预期的,那我们其实就可以直接在这里调用 skill creator 啊,把它刚刚完成的这一套流程封装成一个 skill, 那么后续我们需要再用这个流程的时候,就可以直接调用这个 skill 来完成,那下一次它就不用再用二十二分钟,可可能两三分钟它就可以把这个结果产出给我们了。如果大家还没有用过这个构模式的话,我真的非常推荐大家去 啊,用 codex 的 这个 go 模式去处理一些你在日常工作中比较确定性的编码型的脚本型的任务,那么怎么去使用?其实也非常简单,就是在今天 codex 的 版本里面,如果大家更新了的话,就会看到这个加号里面会有一个追求目标的 这个按钮,如果我们在对话里面开启的话,在这里直接输入你的目标,然后发送消息的话,那么这个对话就进入了一个 go 模式,它就不需要你去参与,最终会直接把你需要的这个结果产出给你,非常推荐大家去试一下。

dance 二点零这次终于有对手了!谷歌刚刚发布的视频模型 omni 到底行不行,我们一试便知。先来看 omni 强在哪里?首先是视频编辑能力, omni 能够在改变画面元素的同时,保持角色和场景的一致性,比如把现实中的雕塑变成泡泡,一触即破, 把自拍里的镜子变成液态,让人碰到就变成终结者。或者是把小提琴手从音乐厅挪到草地上,再变换一个拍摄角度,不过他好像忘记把琴带出门了,真是尴尬。其次是物理引擎更加精准,那说人话就是重力、速度和碰撞之类的效果更加真实。 另外,奥尼也拥有了全能参考的能力,除了能够参考图像、视频和音频合成最终效果之外呢,还能给视频加上指定的特效包装。正为我的动销同事捏一把汗, 那接下来我们看看同框对比 omni 和 c dance 二点零谁的效果更好呢?实测下来, omni 的 物理效果确实更加优秀啊,画面风格也更加丰富多变,但中文能力就远远不如国产模型 c dance 了,这些有机材料就能自醒发光,而且 c dance 的 人物位置更加稳定,画面更有影视风格。 目前这面的 omni flash 模型已经正式上线,不过每天只能生成三条视频,你觉得 omni 能够和 c dance 一 战吗?来评论区咱们接着聊。

想知道如何让你的 openclaw 真正操纵你的浏览器吗?你看我让他在网页打开豆包,他就帮我打开豆包,帮我完成我的指令。 再来看我需要 b 站视频数据,他同样能自动解锁并整理数据发给我。龙虾已经完全像我自己的双手帮我去操作所有浏览器的操作了。 这里需要注意,以前的 openclaw 操作浏览器是通过截图加上自带的大模型去分析截图。这个方案有三个致命的问题,一、受分辨率影响太大。二、动态内容经常误判。三,速度慢, token 消耗巨大。这次用的方法是通过 chrome 官方调试协议 c d p 直连浏览器,不再截图拆, 而是直接读取倒木数和羽翼结构百分百精准,速度快十倍,抽根绳百分之九十。一句话解释,从看图猜操作升级到直接读懂页面,这不是小优化,而是直接换赛道。以前 ai 隔着窗口帮你想, 现在 open call 直接进你的浏览器帮你干。你最想看哪个自动化场景的深度演示?欢迎评论区一起交流谈论。

嗨,大家好,我是小陈,前面已经教大家使用 colode code 接入了 deepsafe, 这一期的话教大家 codex 接入 deepsafe, 其实 codex 和 code 差 colode code 的 接入方法差不太多,只不过要比它多一个 c c x。 第一步的话,呃,首先还是下载这个 note g s 主播是以 macbook m r pro 为例出的一期教学视频,然后第二个的话,两个都是差不太多的, 就是 windows 和 macbook 都是差不多的,然后第二个的话就安装那个 codex 的 一个本质就是他的桌面版,然后第三步我们直接从第三步来,我是苹果的,我就下载这个。好,下载完成以后给他弄到桌面上, 然后双击解压它,然后解压完成以后把这个东西丢掉,然后再回来,我看我们的教程。好,解压完成以后点击 mac, 然后这里可以看得到,看得到我们的一个。嗯, 首先是这个 e n v 的 这个 e n v 的 这个东西,这里 这个的密钥的话是等一下我们启动服务以后的一个访问密码,然后我们这里我们按照教程来,先是运用这个指令直接去点双击,它是打不开那个文件的,我们要用终端切换到桌面的这个文件夹,然后给他权限, 给他权限以后,然后再给他加上这个这个东西这个指令,然后再给他启动服务, 等一下我们可以先不着急启动服务,我们可以看一下这个,呃,这个文件夹啊,是,是不是有一个 e n v? 好 的,我们看有个 e n v 对 不对?然后这里是密奥,现在是一二三四五六,对不对?我们可以把它改成六个六, 然后把它保存一下,然后在这边的话我们再启动服务。 好,可以看到我们的服务已经启动了,然后把这个管理地址复制一下,随便用哪个浏览器都可以打开。好的,这里要输入密钥,刚刚是一五个六。呃,六个六吗?一二三四五六。好的,看一下,没问题,访问。 ok, 没问题。 然后这里弄好以后,大家可以把这个切换为简体中文,然后现在的话我们要添加渠道,我们是 dbc 的 话,我们首先找到我们的呃, dbc 的 一个开放平台,然后 我们先创建一个 apikey, 随便打,随便打,创建一个,然后复制过来,复制过来以后,然后添加一个渠道,然后第一行添加这个东西,然后第二行我们找到这个接口文档,然后把这个东西复制过去, 然后复制过去以后,然后这里有个详细配置啊,我们点击详细配置,然后复制类型,选择 open ai 的 卡槽,然后滑滑滑,滑到最后面,把这个呃规范化给它打开,然后创建渠道。 ok, 这边创建好了,对不对?然后 配置配置已经好了,然后我们找到那个 cc switch, 我 们把 cc switch 打开。 好的,然后这个是我前面配置的,现在我把它把它删掉,教大家重新配置一下, 点击添加。在哪里呢?找到中间这个就是 open ai, 第一个是圆了我们的可可扣的,第二个的话就是我们的 open ai, 就是 这个 codex, 然后点击加号自定义的,然后 名字可以随便写,你又可以写 delete, 然后呃链接不要,然后 这里的密钥的话,就是刚刚那个六个六,一二三四五六六个六。好,然后 api 的 请求地址, api 请求地址在这里啊, api 请求地址, ok, 大家不要把这个窗户关了,关掉了,关掉以后那这边就就连连不上了,就是 codex 就 不能正常访问了。 我那个教程里面有让他就是一直在线的,就是后面这里不想每次都挂着终端,让 c c x 后台静默,这里有方法的大家可以尝试一下。 好的,我们来获取一下,先获取模型,可以看到已经获取到两个了,这刚好是 v 四 pro 和那个,然后我们点击添加。 好的,然后我们把这个 dbc 可进行使用。使用以后怎么验证呢?打开我们的 codex, 这个是前面的,我们现在看一下能不能连通了,我发个你好过去。 好了,这里是有问题的,我们把它先退出去,重新启动一下, 我们重新打开我们的 codex, 等一下, 等待它打开, 把它打开了,然后这边我们来测试一下有没有连接上。发个你好过去把这个先删掉 哦,可以看到是有问题的,那我们来看一下是哪里配置有问题,这边是可以的,运行中没有问题 哦。大家知道是为什么吗?是我们点的时候,我们点到后,点到,点到其他地方去了,点的可能是第一个可的扣子的,然后我们又把它这里给他删除一下, 我们找的是这个 codex, 配置也是一样的,把这边的复制过来,我们去第一个格子扣的,大家到时候配置的时候一定要看清楚, 复制一下, 然后找到这个 codex, 然后粘贴过来,然后这边的 这边也复制一下,把它粘贴过来。好的,然后在配置这里,然后我们找到 open ai, 然后往下滑,找到这个规范画非常键。 ok, 创建一下。创建完以后,然后我们再来看一下, 再来发个。你好,看一下, 可以看下终端。 可以了,这边应该是没有问题的。好的,已经来了,我们这可以干嘛呢?打开浏览器,搜索 codex 的 相关内容, 尝试一下,看它能不能打开。 然后我们点击 yes, 他打开的是谷歌的呀。那我们可以跟他说一下,你可以说让他打开 e d g 的 浏览器进行搜 索回车。 ok, 那 这边他就是打开的 e d g 的。

前面的几期视频,我们聊了奥拉玛的相关技术,并在奥拉玛中安装了大模型。今天的话,我们来看一下如何在 openclaw 里面来连接奥拉玛里面的大模型。首先的话我们打开命令提示符。 好,首先的话我们先看一下 openclaw。 好, 这里安装的是二零二六五点幺二。接下来的话,我们看一下奥拉玛 奥利码的版本是零点二四点零,我们看一下奥利码里面安装了哪些大模型, 这里我安装的是天文三八 b。 接下来的话,我们来看一下我们安装的大模型是否支持在其他工具里面来进行调用奥利码 show, 然后我们把这个大模型的名称给它拷贝过来。 好,我们粘贴一下。好,敲回车。好,这里的话我们要看一下那个 capabilities 里面有没有这个 tools, 如果有的话,我们在那个 openclaw 里面就可以直接调用了。 如果没有这个 tools 的 话,大模型是不支持在 openclaw 里面来进行调用的,那么我们使用之前的话,我们先通过奥拉玛秀,然后加上那个大模型的名称,我们看一下有没有 tools, 有 的话我们就可以在 openclaw 里面进行调用了。好,接下来的话我们给它配置 openclaw。 openclaw 好, 敲回车, 这里的话我们选择 local 这一项,这里的话我们选择 mod 这一项。好,这里的话我们选择木,然后我们来找到那个奥利码。 好,在这里。好,我们敲回车。好,这里的话我们就用本地的奥利码就可以了,我们选择最后这一项 local on 这一项。好,那么奥利码的那个本地的这一个地址的话,就是默认的这一个,我们敲回车。 好,经过一段时间的等待的话,我们已经找到那个我们安装的这一个大模型,那么我们选择那个奥乐玛下面的千万三八 b, 这里好,往下面移动,然后我们在那个呃千万三上面我们敲一下空格,选中,然后我们敲回车, 好,这里的话我们选择那个 down, 就是 我们已经设置完成了,我们退出来。好,接下来的话我们把网关给它启动起来, open close get away run, 好, 我们的网关已经启动完成了,我们通过命令行来打开 open close dashboard。 好,那 openclock 已经打开了,我们把这里关闭掉,然后我们选择一下我们的模型,这个是我们通过奥拉玛在本地安装的大模型,请问三八 b, 然后我们选择一下,然后我们来跟它对话。 好,到这里的话,我们用 openclock 连接本地的大模型就已经成功了,那么我们在使用之前的话,首先要安装那个奥拉玛,奥拉玛安装完了的话,我们要下载那个对应的大模型, 那么我们使用之前的话,首先要把那个奥利码给它启动起来,有没有启动的话,我们看一下就是那个右下角这里有没有这一个图标,那么这个是奥利码的图标, 那么启动完了的话,我们要看一下我们下载的大模型有没有那个 toos 的 功能,如果有的话,我们就可以在那个 openclaw 里面来使用,如果没有的话,我们就要换一个版本再来进行使用,那么这个就是在那个 openclaw 里面连接本地大模型的一个简单的步骤。

哈喽,大家好,今天给大家分享一个我纯用本地大模型做的一个 ai 自动生成播客的 app, 是 纯用本地大模型哦,没有借助任何云端的 api token。 我 先给大家简单介绍一下我这个 app, 然后现在大家看到的就是我这个 app 的 界面, 呃,这个 app 的 前端是用苹果自带的 xcode 的 去写的,真的非常的漂亮,也非常契合苹果生态系统的设计,它就是属于这种玻璃质感,然后呢也有一定的透明度。这个 xcode 的 呢,有个问题就是说我只能 在苹果的生态里面去使用,但如果离开苹果这个生态系统,它就不行了。这个 app 呢,我一共用了两个本地大模型,一个就是大家这边看到的千问 三点六三十五 b, 然后激活了三 b 的 这么一个 m o e 模型。我的 t t s 转语音的模型呢,其实也是用的千问系列的, 这边大家能看见它的名字叫 cosy voice, 我 非常非常推荐大家去尝试这个 t t s 本地的语音模型, 因为他的性价比非常高。首先他的内存我没记错的话应该是只有两个 g, 大 部分电脑其实都可以带的动。然后另外呢,他的整个参数设计是非常丰富的,然后大家能看见在这个地方我们可以有 呃预训练音色的选择,然后有跨语种的复制,然后呢,这边我们也可以去选择音色的种类啊,男女不同语言系的,那比如说我之前有试过用 英文女婿做测试,然后说出来确实就是一股外国人的味道。这边也可以选择随机推理的种子,让他啊尽量去发散,或者说去限制他的发散。整个工作的流程是非常简单的,在输入合成文本这里,你只需要把你的 文字文案输进去,然后点生成语音,他就会造成你设置的参数去生成一段一段一段的音频,然后最终给你一个完整的音频呈现出来。 好,想必大家也发现了,他其实是没有一个标准化的 u i 设计的,这个地方其实是暴露了本地的五千端口,严格意义上讲他并不是一个 u i 设计,然后在这个端口呢,你可以去调配你的参数,问题就来了,我想做成这种样子,那么我怎么样把两个本地的大模型调用起来 呢?因为在这个地方他默认的他只能去输入文本,但是呢,我在这个地方生成了文本之后, 我就必须通过一个自动化的方式把它粘贴过去。 cosy voice 它本来是只能默认用 gradu web ui 去进行嫁接,但是呢,在本地上这个是没有办法去操作的,所以我就选择了用 python 去写一些脚本, 然后用 fast api 去调用他们的功能。那么整体下来呢,这几个工作环节全都是通过 fast api 去调用的,然后我们在这里只需要点击一键生成,然后所有的工作他们就会自动化的去完成。 在点击生成之前,我们看到这个语音合成有很多参数,这个参数是完全一比一的,把这个五千端口的原始的参数设置界面把它复制过来了, 我们同样的可以去选择我们推理的模式,然后也可以选择我们音色的类型,包括速度、随机种子和这个五千的端口是一模一样的,所以整个 ui 这块呢,我用 xcode 完美复制了五千端口。 cosvoice 的 所有参数设置 好,然后在这个地方呢,我们就能看见最终生成的音频文件。呃,如果说中间有报错或者其他的问题,我们 点击这个工作流日制,就能看见我们每一步每一个时间工作流他进行的步骤,如果有报错的话,也会体现在上面。最后呢,这个地方我还是加入了可选项,然后在服务模式这个地方。呃,大源模型和 tts 的 来源,我们都可以选择本地和云端 啊,如果选择云端的话,大家去填自己的 api key 就 行了。好,当我们把这所有内容都 设置好了之后,就回到生成流水线这个地方去,把我们想听的 youtube 上的新闻或者说其他的视频放到这里,点击开始生成就 ok, 大 概可能会等个十分钟左右,我们来试一下之前我已经预先训练好的一个结果,大家可以感受感受 中东那边的情况。伊朗的局势依然很紧张,军事冲突现在已经进入第七十六天了,英国海军那边传来消息,一艘在阿联酋附近航行的商船被不明身份的人控制了,现在正朝着伊朗的水域开过去。就在这么个节骨眼上,或者慕斯海峡的船只明显多了起来, 伊朗最近也更新了船只过境的检查规定。受打仗的影响,国际油漆价格一直在涨,现在美国的全美平均油价已经涨到了美加仑一点五亿美元, 有过过会,为此吵得不可开交。民主党那边的杰夫里斯直接开火,指责政府打这场仗浪费当事人的钱,还推高了物价,让老百姓日子更不好过。中医院议长约翰逊则反驳说,只要海峡能恢复通畅,油价和经济压力自然会降下来。他还提到特朗普之前说过, 处理伊朗问题不考虑民众经济困难,这话其实被夸大了,大家别太当真。首先转到英国政坛最, 大家可能还是很难区分它是真人还是 ai, 只说因为现在 ai 整体的这个音色呢,它是比较趋同的,所以我们可以根据音色去区分是真人还是 ai 好。 说到最后呢,其实我也想给本地大元模型去证个明,因为之前在帖子里面,很多家人们也会疑惑说, 本地大元模型到底能干什么?我买硬件花的钱都已经可以买几年甚至十几年的 api token 和订阅会员的费用了,为什么还要在本地大元模型上面去花钱?这一直是两种观点的博弈和冲撞吧。 呃,不过我觉得没有谁对谁错,有一个词叫 overqualified, 就是 你没必要在一些简单的事情上面去用那么厉害的模型,杀鸡焉用牛刀,就是这个意思。 那比如说像我现在用的这个工作流,其实大家能看见啊,嗯,不管是说字幕抓取还是翻译,还是生成口播稿,还是语音合成,其实每一个环节都是非常简单的,这是一点。然后另外一点,我是在两三年前 deepsea 刚开源那会我就下了它的十四 b, 它的幻觉太严重了,而且知识面非常非常的窄。但是这么多年过去了,一个设 ai 的 速度大家也能看见,迭代的真的非常的快, 现在的十四笔的参数和以前十四笔的参数,那一定不是一个量级的,它能解决的问题,它的知识广度肯定也不一样。本地大语言模型它也在迭代,它也在发展 很多工作的环节,如果说我们能把它拆分开去分配给 router, 让 router 去选择用什么样的语言模型去解决某一个细节问题就够了。如果你的需求是非常专业的,或者说你想得到更加准确,更有深度的知识, 你是处于在学习过程当中的一个使用角色,那么我建议你还是走云端的 api, 走币源的模型,这个一定是最好的。如果说你是在线下去做一些项目, 你需要去拆分开这个项目每一个工作流的节点,那么本地的开源大模型它一定会给你更大的帮助,而且你的成本也会相对来说固定一些。好了,今天就是这样,谢谢大家。

有好多人在喷美国豆包啊,也就是珍妮奶昨天发布的那个欧米尼的模型又拉垮了。实际上我觉得你可能是,呃,没研究好啊,它还是很强的,给大家看一下它的用途,我觉得是大家用错了啊,这原视频,然后我上传了我的产品图啊,我的产品图, 我上传了我的产品图,然后呃,换了一个模特,你看一下,直接一一句话跟他说,换一个产品,换一个模特,他就可以直接生生出来了,看见没?一件复刻爆款视频呀,这不就是 能理解吗?这还不强吗?这这已经不是那个即墨的那种动作变更的,能理解吗?那个动作变更他可能是用那个 ctrl u i 去做那个那个什么做出来的效果啊,这个就是他这个世界模型,我直接把原视频里的产品和人物一键就替换了呀,那我以后去复刻爆款视频的时候, 就不需要像传统的大家去用那个什么呃,先上传爆款视频,然后给真皮奶或者豆包去用多肽的模型去分析他的脚本啊,然后你去从零开始生成,现在我直接把人家的爆款视频上传给他, 加一个自己的产品或者模特啊,他不就直接出来成品了吗?这才是就是史诗级的这个更新啊。

啊,出一个 codex 如何进入 deepsea v 四 pro 的 最简单的教程啊?首先首先是在这个网上下载啊,下载自己电脑对应的版本就可以了,把这个下载下来之后,有一个这个,这个装上就可以了,然后需要第二个工具, 第二个就是需要下载一个这个 cc switch, 这个下载之后呢,还需要先把它下载下来啊,还需要另外一个东西,还有另外一个东西,主播写了一个中转的一个一个工具,因为这里面是不能 codex, 是 不能直接用, 不能直接接入 deepstack 的, 然后需要写一个中转的服务,然后在这写了个中转的服务,大家能看到这个地址吧? 这地址要说呢,这是 get 它的一个地址啊,然后就可以把这个把它克隆下来,克隆下来直接 n p m initial, 然后再 n p m 是 大,然后就运行起来了,运行起来之后,然后再回到这个 c c c 位区里边, c c c 位区里边,第一个是客户的,这个先不用管,然后进入这个,第二个,这个这个拆的 g p t 这个, 然后进去这个里边呢?然后点一定要先选中这个,然后再点这个加号,再点这个加号,你主播已经添加了,然后和这是一样的,然后这个里边这个自定义的名字啊,这个这个贴什么都可以,这都不贴,不贴这个屁,随便贴一个这个,这个没有什么用啊,然后然后就这这个地址,这这个地址 就是刚才刚才 github 上边这个项目,这个项目的里面运行起来的地址啊,就贴这个,因为它运行起来就是这个,就是个端口啊,就贴这个,然后这模型名字我们就写的这个 vise pro。 好, 下面把这个勾上, 然后然后这里边有一个内幕啊,往下滑,这有个内幕,内幕这个地方,这个地方的名字是可以自定义的啊,它显示的是在这显示出来的,你希望他让他显示 dsp 和 vga pro, 那 你就把它改一下,如果你这显示成 d s, 那 这个地方就会显示 d s, 那这就好了,把这个弄过去之后,然后点这儿让它启动,让它启动,这样就好了,这个这个它就把它可以关掉,它就常驻在后台就可以了。然后这个时候我们可以看一下啊,这手机这个,然后这儿我问他,你是什么模型, 对吧?他说他是 tiffany 版本,是 vsco 版本,是 vsco, 对 吧? 然后是什么什么什么他可以干什么,对吧?这个就是完全大好,大家可以点点关注啊,到主页加咱们的技术交流的粉丝群在里边,可以有什么问题啊?可以提出来,然后咱们可以一起交流讨论。

我是咱们小黄老师,一月份新来的学员,同事也买了他的智能体,然后用他的智能体去做文案,然后第三条我就报了一条一百多万的 这个视频,现在跑了一百多万,然后一点八的点赞,说起的也非常巧,他是我春节的时候闲着没事,哎,我坐火车,我说用智能体征上点文案吧,然后我就把我的想法告诉了他, 他就给我生成了文案,然后二月十三号呢,我就开始去拍了,然后到二月二十五号,然后一共跑了一百多万,我觉得这智能体是非常方便的,他大大的缩短了我思考时间,我只要把思路告诉他,然后要生成,生成之后保存下来,我觉得不可以的话我再给他生成一份,然后最后把几条呢就是拼接在一起,我觉得非常方便, 大大缩短我的一个工作时间。之前我可能说两天到三天的工作,可能我今天一天就能结束,而且非常轻松的。

我退订了用了一年的 chrispityplus, 最后一百零五点九九美元订阅了 gemma lite pro 的 年费套餐。说实话,对 chrispity 还是有点不舍的,但是 gemma lite 真的 很香,而且大多数人用不好 gemma lite 是 因为不知道它的隐 藏功能,我在后面会介绍这个功能。那在用 chrispityplus 的 这一年里呢,它确实陪伴我解决了很多的问题,比如 webco 帮我查下代码,口播帮我优化文案, youtube 帮我生成标题、简介 和标签。而且有一个很关键的点,所有的内容都是我自己的风格,因为呢,我未给了他很多的资料,在某种程度上呢,他比我更懂 我。但最后为什么我还是转头了 gmail pro 呢?原因很简单呢,因为谷歌的多模态能力真的太强了, gmail 的 背后是谷歌整个 ai 的 生态系统。拿个最常见的音频转文字,我丢给 gmail, 他 很快就按照我的要求,根据我上传的音频跟我核对词汇表,并且呢,返回了完整的音频 字幕。反观 chart gpt, 当我用同样的提示词以及音频丢给他以后,他回答我,当前环境下,我无法直接播放并 自动转写 a p 三音频,这让人挺无奈的。所以 jamie 呢,在多模态的便捷上确实更胜一筹。音频、视频甚至生成一个应用都能直接在一个对话页里面完成。而且它还有一个我认为是学习场景里的大 杀器,就是 nobel lm。 你 把一本书丢进去,它能给你做思维导图,生成讲解的音频和视频,甚至呢,直接帮你做一份 ppt。 更重要的是,它可以基于这本书的内容,你可以一直的追问,直到你完全了解书中的内容。这已经不是普通的知识库了,而是一个会读书,会复盘,还能陪你思考的好助理。 而且这个 nobel lm 是 可以直接连接到 jamalai 的 圈里面的,也就是我开头提及的,要用好 jamalai, 就 要利用这个大部分人都不知道的隐藏 常功能。这一步真的非常的关键,因为它解决了一个重要的问题,就是我怎么样 ai 真正长期并且正确的理解。我以前每开一个对话都要用 front 反复的解释,那现在呢,我直接把指令定义好,它就能够更好地知道我想要什么。这个逻辑呢,其实在 g p d 里面呢,也是 坚果的,就是它的项目。我拿自己的赛事品牌觉得之王的 youtube 举个例子,我每次上传视频都需要英文标题简介和标签,那在 gdp 里面呢,我会新建一个项目,在右上角呢,写好这个项目的指令,只要我把资料微给他,他就能够稳定的输出。而在最外的这边呢,同样的是用 jam 来做会更加 的顺畅。你来看一下,这些都是我创建的 jam 助理,有生成封面的,有内容制作的,有插图生成等等,我来带大家看看怎 怎么用这个卷。我可以新建一个卷,写清楚名字用途以及风格要求,甚至呢,指定他默认用什么工具。比如呢,做图片我就选 nano banana pro, 做视频呢,我就选择 v o e 三点一。那在下面呢,我还能够给他接知识点,比如说本地的文件与 盘,或者直接连接到 nobel l l, 也就是说,他不是猜你要什么,而是呢,知道你在什么体系里?右边呢,还能够实时的预览效果。我给你看一个例子,我做了一个插画师专用的卷,我把左边的规则都设好以后呢,在右边测试了一句话,钢铁侠蓝色背景, 你看一下它出来的效果是不是挺好的?这就是我指令你定义好的平面插画风格。我再来测试一个更难的,试一下知识图片,我只需要输入一个知识点,比如光和作用,它就能够生成示意图跟解释。 我们来看看生成的结果啊,图解是不是挺准确的,而且文字的生成也没有问题。 nasa banana pro 的 中文生成能力真的太稳了, 就算你想模仿一个封面也没问题。我用我的封面助理上传一个自己的照片,以及油管大神店的封面,我再把标题和发布平台发给他,我们来看看有什么神奇的 事情发生。他很快呢,就会把油管大神的这个封面的风格模仿出来,是不是还挺好的?以后呢,就再也不怕没有好看的封面了。所以你看,一边是 jpg, 同一件事还要拆成好几部, 所以这才是我卷透 jimmy 阵营的主要原因。我不是说谁不行,而是我更想少折腾。 jimmy 给我的不是只是一个回答,而是从学习、消化到输出,再到创作的一 整条闭环。 chart gdp 真的 不是不好,而是站在二零二六年这个时间点,我更需要一个能看能听能读能记, 还能长期融入我的工作体系里的 ai。 我 们比的不是谁家的模型更强,而是好用的工作流才值得我们掏钱付年费。你呢?你会选择 gigabyte plus 还是 german apple? 我 们评论区里聊一下。 ok, 以上就是今天的所有内容,我们下期再见。

你是不是也以为 v e n。 就是 点一下就能像外网的工具?但真相可能跟你想的不太一样,很多连气息用错了,它真正的用途先受结论。 v e n 的 本质不是魔法通道,而是一个网络加密工具。 它主要做三件系,第一系把你的网络嗅机进行加密处理,第二系通过终端服务器进行查修。第三再解密访问目标网站。说白了,它更像一个加密快递箱,而不是可以打开任意文件的通道。那它到底有什么用?它最强劲的合法用途包括保护公共 wifi 下的嗅机安全、企业远程办公访问、内网 防及网络嗅机被监听,以及开发者进行快递器服务器测试。它的核心气息是隐私和安全工具,而不是所谓的内容解锁工具。 很多人对 vpn 最大的误解是以为装了机后就可以随便访问任何网站,但实际向并不是这样。能不能访问某个网站取决于很多网络条件和地区规则。 vpn 急需改变你的网络路径,并不等于拥有无线访问权限。另外还有一个容易被忽略的问题,不同国家和地区对这类攻击的使用油不同,规定一线免费庇援,还可能存在记录用户受制陷禁隐私泄露的风险。所以 vpn 不 系装了就安全,它本机向系攻击用队来系隐私保护手段, 用错了可能变成风险来源。总结一下, e e n 不 系三桥嫌弃他本机是一可王某加密于隐私保护工具,你怎么理解?他决定了你是在正确使用工具,还是被工具误导。

我用 ai 来通过浏览器操作店铺的视频不是火了吗?有一些网友一直在质疑 token 消耗的问题,说我这样子操作浏览器非常消耗 token, 非常不划算之类的。包括其实我在之前的视频中也经常有一些网友来询问,这样操作到底要花多少 token? 那 我现在就以程序员的角度来把 token 消耗这个问题 详细的解释清楚。首先你们要知道在什么情况下 ai 会很费 token? 简单来说就是上下文太大的时候,上下文大确实会消耗 token, 但是我要记住一点,如果上下文都是有用的消息,那这个 token 消耗就是有必要的,这种情况叫做消耗大但不浪费。而真正浪费的是什么? 是上下文中包含了太多的信息,重复的信息。那我在这里先解释一下什么是上下文中包含了太多的信息,重复的信息。那我在这里先解释一下 ai 的 那一句话, 它包括了你 ai 前面的回答的内容,你发给他的文件, ai 调用工具返回的结果,包括 ai 去网页上面去采集信息。那知道什么叫上下文之后,我们再来带入实际的场景。我们让 ai 来干活的时候,其实可以分为两种情况,第一种叫做一次性的活, 就是干完这一次就结束了,如果是这种情况,那我觉得消耗多少托肯,其实消耗了就消耗了,不需要太纠结他到底用了多少托肯,因为他只是临时的帮你解决一个问题,就好像你雇了一个临时工,那临时工平均的单次成本是不是要比你长期雇佣一个员工更高。第二种情况,重复性的活 就是今天干了明天还得干,现在干了等一下还要干。那,那我们真正要讨论的就是这个重复性的活, ai ai 诊该怎么干? 首先在第一次干重复性的活的时候,它其实跟干一次性的活是差不多的,第一次效果都会非常高,因为你主要是在调试它的整个流程,你和 ai 其实都在探索这个步骤,哪里可以自动化,哪里会出现问题, 所以第一次消耗高一点是正常的。但是一旦流程调通了,我们后面就不应该让 ai 去从头来一遍。这时候我们应该做两件事情,第一件事就是让 ai 来梳理成一个 skill, 这个 skill 呢,相当于是这个流程的一个标准作业手册,就是 s o p, 它会明确每一步该怎么执行,遇到什么问题, 遇到什么情况,该怎么解决这个 skill。 为什么要透解决托管呢? skill 本身它其实也是占用托管的 skill, 被读取或者调用的时候,它也是会占用上下文的嘛。 但是它节约的地方在于第二次之后,让 ai 执行这个流程的时候,不需要像第一次那样把所有的操作说明再重新发给他。因为你发的这些内容它其实也是上下文的一部分。 就比如说你之前说先做什么再做什么,哪些地方都能做,用什么方式去做,去遇到什么问题该怎么解决,之间所有的内容如果你每次都重复去发给 ai 的 话,那它就会每次都占用这个上下文去下 auto。 那 现在有了 skill, 你 就可以说调用这个 skill 就 完了, ai 它就会根据这个 skill 去按照固定的流程去执行。第二点就是 ai 不 需要每次重新去熟悉跟探索操作步骤,它就不用每次去重新理解这个流程,就直接按照这个 skill 里面的 sop 值执行就完了,这就是减少了重复理解、重复规划、重复返工的一些问题。然后说到 skill 呢,有一些网友也会提提到嘛, skill 能节约 token, 这些网友其实他们略懂, skill 节约的 token 是 非常少量的,而真正节约的大头 其实是把固定的流程写成脚本,这也就是我下面要说的第二点,让 ai 把固定的流程写成固定的脚本。当你们看不懂 ai 的 操作的过过程,思考的过程,其实他在非常多的步骤中,他都在写代码, 写了非常多的各种脚本,比如说渲染脚本、 python 脚本,包括浏览器的这些脚本。还有 ai 也能够调用外部的一些服务,比如说外部的 api、 c i 工具,当然这些东西可能需要我们主动告诉他去调用什么东西,那这些服务,这些方式为什么能节约多?可能因为这些脚本和这些服务 其实他们是在干活, ai 只是调用他们 ai 写这个脚本,真的干活是这个脚本,但对于很多飞机人员可能听不懂这些脚本是什么意思,到底是干嘛的。但你只要理解那么一点,脚本是负责执行固定动作的, ai 是 负责调度和判断的。当 ai 把脚本写完之后,如果这个流程是非常固定的,你真的可以不需要 ai 的 参与,你直接执行脚本,让电脑自己来操作,自最后产出结果就行了。但如果流程比较复杂,中间需要一些判断, 脚本跑完之后再把执行结果返回给 ai, ai 看完之后再决定下一步该怎么做。所以高频稳定客观的流程其实就是应该代码化、脚本化的去做的。那低频复杂需要理解判断主观的一些事情才应该交给 ai 去做。 代码脚本负责执行, ai 一 整负责决策。在我们电商场景下,我们绝大多数的工作其实都是非常重复的。举个例子,上架商品 有几种情况,第一种情况是你已经把你的产品的所有信息准备好了,然后你让 ai 去做自动上传的动作,其实 ai 是 会先写一个自动化的上架脚本, 那你直接就启动那个脚本,就能够通过那个脚本上架了,你就不需要再通过 ai 来启动这个脚本了,明白吗?但是我们实际运营中肯定还有更复杂的情况,比如说商品信息不全,或者说我想让 ai 来帮我去创建这个商品的标题,那在这种情况下, ai 参与的其实就是生成标题的那个步骤而已。 而真正要模拟浏览器去把你的商品上架上去,那后面的所有的工作其实是固定脚本去做的。好。再说回我视频中的那个案例,我让 ai 去五个店铺里面去采集每个店铺的订单数据,很多可能会以为它是在五个店铺里面一步一步的操作浏览器,所以一非肯定非常消脱狠, 这只是你们的意向。我在这个步骤里面, ai 真正想做很多地方在哪里,它其实就是发动了启动某个店铺的指令,启动完之后它直接就调用那个脚本去完成了采集操作。那浏览器里面每一步怎么打开,怎么点击,怎么采集,怎么保存,其实都是脚本在执行, ai 也不会每一步都去盯着浏览器看,只是每个店铺在采集脚本完成之后,它会看一下执行的结果, 截个图看一下采集是否成功。所以他真正参与主观判断的就两个步,一步是启动哪个店铺,第二个是 检查结果是否成功,中间大量的、重复的、固定的、客观的动作都是脚本完成的。所以你觉得这样的操作会很消耗脱粉吗?我希望我讲清楚,不知道你们听懂了没有?关注我会持续分享更多从技术人员出发,去用 ai 来做跨境电商的真实案例。