啊,那么我们看一下今天的这个课间内容, ok, 你 看这个是我让我的龙虾啊,我让我的 ai 去优化了一下,重新调一下它的这个位置,嗯,那么我们今天主要讲助力提效啊,从大模型对话到任务闭环啊这一块儿,然后 我今天主要讲什么,其实就是讲几块儿,第一块儿是 open class 什么 啊?第二块呢?讲经营炼录啊第三块讲讲落地工具,第四块总结和问答也会给大家看看一看我的龙虾,看看我的龙虾能做到什么程度。来,我先问一下大家,调研一下大家啊,有用过龙虾的安装了龙虾的 来扣个六六六,还没有安装的扣个八八八好吗?我祝所有互动的伙伴今年呢都能发大财啊,无论你扣哪个都发大财好吗?啊,已经用过的扣六六六,还没有用过的扣八八八啊已经用过的扣六六六,还没有用过的扣八八八。 ok, 我 看到 forever young 啊是八八八,我看到雪莲是八八八四,言是八八哈,看来啊,小柔也是八八八,震动也是八八八幺幺也是八八八,看来大家没用过的人居多。嗯,那么其实我今天就更多的给大家讲一些他的效果 啊,因为用过的伙伴的话,像超哥远程超哥装好了那个东西, 就是啊,这个财神爷说搞到了一半,一旦大家真实的用过之后啊,你就会发现它太神奇了啊,那我我今天主要是唤醒大家的这个 期待,让你想用它哎,给大家演示演示这个玩意牛在哪,你们看完你们一定是会忍不住想去用它的啊, ok, 呃,那么先回答第一个问题啊,就是 openclaw 是 什么?有很多的伙伴,很多的伙伴都都都问我一个问题,说,小习校长啊,你那个玩意儿,我,我有了豆包了,我手机上装了 deepsea, 哎,我,甚至是网页版,我,我在用拆 gpt, 我 还要不要用龙虾?然后问我这个问题的时候,我就说,这个完全不一样啊,这个和 gpt 啊,和什么 你们所用到的那些豆包完全不一样,他说有啥不一样?是不是就是又换了一个名字的 ai? 是 不是?还是就是类似于什么千问也出一个, kimi 也出一个,也都是一个对话 ai? 然而事实上我跟大家讲, 它不是一个对话 ai, 它是一个有手有脚能替你干活的一个东西。哎,就是你问豆包,你去问 gpt, 你 问完它给你一个对答案,比如说,比如说你看 我,我也有 gpt 啊,我也有 gpt, 我 去之前问它了一些问题啊,呃, 啊,好,问这个吧,我去问他一个电影啊什么的,他问完了就回答完就结束了。但如果我想让他去做点事,比如说我说你给我写一个瞬息全宇宙这部电影的一个呃,简评,或者说你去调研一下,下载一些他的这个图片 剧照,他肯定不行, gpt 是 没办法的,但 opencloud 他 是一个有手有脚的能替你干活的。我说你给我下载一个什么,他是分分钟给你下载下来了,甚至那部电影,就刚才我问的那部电影,就是我让我的龙虾下载了一个高清版的二十个 g 的 啊,因为我一直想看那个电影,我没时间看,然后我又,我又那个在国内的视频网站上找不到资源,因为他可能有一些呃,就是国内不让播的东西, 然后我就去龙虾上面,我说让他自己找资源给我下载,他就下下来。所以龙虾他是啥?他是能调用你电脑,他能让你的电脑干活的。
粉丝15获赞50

部署本地的 openclaw 已经可以剪视频了,大家都知道了吧, 这个让硅谷大佬每日一封的 openclaw 阿月,我呢也是拉到本地试了几天,现在就带大家把本地部署和接入飞书每一步都走明白。为了防止偶然性啊,我呢也是连续测试了四台电脑,确保每一步都可行,接下来你们只要跟着做就可以。点好关注收藏, 我这里依旧用的是 windows 系统来操作,因为 macos 系统呢,环境相对比较简单,不像 windows 这么复杂。首先呢,我们要确认好 windows 的 安装环境,安装的时候呢,全部都点 next, 一 直到完成即可,建议呢,不要去变更中间的安装路径。 呃,安装完成后呢,我们可以检查一下环境,我们在命令提示符的窗口输入这两个指令,如果输入指令后跳出版本号,那就说明安装已经成功了。这里提到的两个环境文件呢,我在文档里面也全部都准备好了。 好,接下来呢,我们就开始全区安装 oppo 卡使用管理员 c m d 指令输入,这个指令安装完毕后呢,再输入这一条指令, 好开始了。 ok, 这一步跳出来的呢是风险提示,我们直接选择 yes。 然后呢我们选择 quickstart, 这一步呢是选择大模型,我这里呢用的是千万,因为他是国内的,如果大家有惯用的呢,也可以自己进行勾选好,然后我们这里模型选择默认的即可。 之后呢会跳转到大模型的首页进行授权验证,大家验证通过就可以了。那通过后呢,这里也同样有一个选项,我们直接选第一个默认的模型。 ok, 下一步呢,这里可以看到很多的应用选项,这其实呢就是指令输入的终端,因为这些都是国外的,所以我们先不管,选最后一个,跳过,后面呢我会给大家介绍如何接入国内的飞书。 ok, 继续,这里会问你需要配置什么 skills? 呃,我们也跳过,没问题,因为这个不着急,后面都可以手动去配置的。 好,这个也不用管我们用不上,直接跳过。好,然后我们稍等一会,会自动弹出一个网页,然后你会发现这个网页是打不开的,没关系,我们这个时候呢,再运行一个 c m d 的 指令, 好,这就是欧奔 cloud 的 兑换框了,我们来尝试和他打个招呼, ok, 他 回复我了,那到这里呢,其实基本上就成功了,还是比较简单的啊。然后呢,我们再来尝试为大家接入一下飞书,很多小伙伴呢,在这一步呢,其实就被劝退了,因为怎么样都接入不了这里,大家看好我怎么操作。 首先呢,我们进入飞书的开放平台,我这里呢用的是个人版,我们来创建一个企业自建应用, 进到这个凭证与基础信息界面,把你的 app id 和密钥保存下来,这个很重要啊,后面会用到的。然后 我们添加一个机器人,再到权限管理这一步,为他添加一些权限。这里的权限列表呢,其实官方呢是有指导文件的,但是呢就藏的比较深,我呢也是给你们找出来,直接放到文档里面了,你们直接一键复制过来就 ok。 好,然后我们需要配置一下这个事件回调功能,在这里的订阅方式选择长链接这一步呢是必须的,而且是绕不开的,也是大家碰到卡点最多的一步,很多小伙伴呢在这里呢就是一直报错,好,不用担心,我呢,已经整理了一份非常长的傻瓜教程,大家直接照做就 ok 了。 然后选择以后呢,我们添加事件,然后添加搜索接收消息, ok, 然后我们就去点击创建应用,然后再发布就 ok 了。 好了,配置工作完成之后呢,我们就要开始给欧邦克劳接入飞速杀键了。由于 windows 的 系统环境问题呢,所以大家的电脑情况都不太一样,所以会出现不一样的报错问题。网上的很多视频呢,也没有把这个问题针对性的讲清楚,我自己呢也试了三到四台电脑来做尝试,都非常有挑战。 如果你手边也报错的话呢,不用担心,我这里想到了一个邪修的办法。好,那既然 oppo klo 可以 控制我的电脑,那为什么他不能自己安装飞出插件呢?我们来试试看吧,直接和他对话。呃,你自己安装一下飞出插件,然后呢,他就会开始疯狂的工作,并自行去验证安装环境和插件配置 啊。五分钟左右后呢,他就会告诉我,他工作完成了,需要我提供给到他飞出机器人的 app id 和密钥。这个呢,其实我们在上一步已经有了,我们直接复制给他,让他呢继续去工作。这里的工作过程当中呢,我们的机器人可能会下线几次,原因呢是他需要去重启网关, 如果呢,你感觉他下线太久的话呢,我们可以用 open cloud get away 这个指令重新把它呼出来。最后呢,他会要求你在飞车上和他对话进行测试,并为你排除最终的一些故障。 ok, 全部搞定,已经可以在飞车上正确回复我了,并且呢,刚才在外部的对话记录他也全部都记得, 呃,我们这里呢,再用手机给他发一条消息试试看。好,他也同样接受成功了。好了,这里欧本卡接入飞书的配置呢,就完全对接成功,基本上都是他自己完成的,我呢只是配合他提供了一些必要的信息, 妥妥的全能小助理。接下来我们来看看他能为我们做一些什么吧。比如呢,我现在想要订一张机票,我就让他帮我查询一下最便宜的航班,他立刻就给我列了具体的信息,包括航班号,价格以及其他的一些航班信息。不过这一步呢,是需要接入 api 的, 大家可以自行去网上找免费的接入就可以。 好,那现在过年了嘛,马上大家呢也会送礼嘛,那我就让他去浏览电商的页面。呃,不过这里呢,需要先安装一个 oppo club 官方的浏览器插件,我们直接从官方渠道进行安装就可以了。具体的步骤呢,已经放在文档里了,大家直接照做就可以。我让他给我打开。 ok, 成功,呃,然后我继续让他为我搜索燕窝。好,也成功了。 好,那我们现在在拿最近小伙伴在学习的 ai 的 线上作业丢给欧本克,看他能不能帮忙完成。 首先我们要让他找到作业的本地目录,并让他完成里面的题目。他立刻就找到了,并且迅速告诉我,完成了。啊,这速度还是真的蛮快的啊,但是呢,人呢,还是比较懒的。如果呢,你抄作业都不想抄啊?没事,直接让他把填完的东西返回给我。好,他已经做完了,我们来看看啊。 呃,代码呢?全部都完成了,不过呢,我也是看不懂啊。看懂的高手可以来说说他完成的这个准确率怎么样。 好了,那这次安装说明就先讲到这里了,关于 open cloud 的 更多能力,有时间呢我们可以再去测一下。好,那既然已经部署成功了,有兴趣的同学呢,也可以再去深度探索一下 啊。对了,现在呢,各大厂呢,也出了针对 open cloud 的 云端部署,我这个呢,也可以跟大家快速的分享一起。好,这里是阿月,希望我的视频能够帮助到你,让你更了解呀,我们下期再见。

呃,大家好,给大家说一下我这两天做的工作,第一个就是有关这个最近的 open claw, 这个什么龙虾特别的火,然后呢,我试着原先想着是本地多可儿本地部署,然后呢?刚张姐那个鬼龙死了, 原先我想着多可儿本地部署,但是好像不太行,然后呢,我又又看看网上说这个龙虾的话, 他有,他要那个有一些安全的隐患,他可能是有对你的电脑本地的文件进行一些删改,有一些权限。然后呢,我就想的是在呃, vm 虚拟机上面进行的呃,本地的部署,然后呢,部署给大家看一下效果吧。 呃,一般就是在 vm 虚拟机里面运行的这个 open cloud, 然后呢就是这种效果,它只不过是这个连接不了,可能是前后端的问题吧。然后途径这个点不了, 别的的话还可以点开看一下,就是这个效果,在这个终端这里运行的新建的一个终端窗口输入了这一行命令。

我给大家一个 opencloud 的 部署方法,所有人都会,而且特别简单,在 ai 时代,你要习惯一个思想,就是所有的活让 ai 帮你干,不要自己干好。我们来说这个方法。第一步,第一步,下载本地部署的 mini max agent, 就是 在他们的官网点击下载,选择你的电脑版本的 mini max agent, 下载到本地, 然后就会获得一个 minimax agent 的 图标,这是第一步。第二步,在这个 minimax agent 的 对话框里输入,我需要本地部署 open cloud, 这是第二步,这个时候 minimax agent 会帮你部署 open cloud, 本地部署的 好,部署好了之后,这个 open cloud 你 就可以使用。但是大家知道 open cloud 是 user in the loop, 就是 它需要你自己不断的调,不断的循环,你会遇到很多问题, 很多伙伴放弃本地部署是因为这个问题无法解决好。这个时候再向本地部署的 minimax agent 提出你遇到的问题,比如说飞书配置不上,怎么唤醒不了,哪里有问题?这个时候 minimax agent 会帮你解决你本地部署 phone call 的 全部的问题, 然后就可以了。然后这个事情全部下来,不需要你会任何的技能,也不需要你了解任何的呃代码,只需要按照我的步骤来做,让 ai 来帮你做这个工作,让 ai 来盯住你的 ai, 然后希望我的伙伴们都学会这招来部署它,而且 费用成本不是很高,现在我已经用上了,就是挺好用的哈,分享给你们。好吧,真的很好用,你们一定要去用。然后如果通过这方法通过成功的,快来给我点个赞,这是我探索这么多天最简单的那个方法。

很多人在问 oppo klo 的 这个龙虾呀,本地部署有什么优势?今天一条视频给大家讲清楚。我,我用一个例子给大家讲,比如说你目前当下你的营销数据,你的粉丝数据啊,或者核心用户的信息等等,这些东西你要不要上传到云端?我们也要考量的第一个点是什么呢? 他会不会像几年前这个所谓的网盘一样,有一些网盘可能就关闭了,这个资料你还能不能拿的出来?第二个问题呢?这个数据上传到服务器上之后,你会不会担心这个服务器的公司掌握你这些数据? 那如果做到本地部署呢?第一个问题呢,就这些数据都在自己的电脑里面,咱们不用担心被别人看到,特别是这种敏感的数据,比如说咱们粉丝的数据啊,客户的信息,这种敏感的数据我们可以在本地电脑上, 不会说上传到服务器里面,随便谁都可以调取,那这个点就是比较好的一个点,同时还有一个优势是什么呢?目前我们用本地的时候, 相应来讲他不用来回再跑一次晕转,所以效率会比较高。所以本地部署最大的优势其实就两个,第一安全性比较高,第二效率性会比较高,反应比较高。 所以如果你这边要是做龙虾部署的话,你想了解一下目前本地部署和云端部署对比有哪些优势的话,那我今天这个视频我希望可以帮得到你,如果你还有哪些问题呢?我们可以评论区里,欢迎交流。

哈喽,朋友们,是不是前面一段时间很多朋友都在关心怎么去部署小龙虾的问题,那我今天就给大家简单分享几个快速部署的一个工具。那首先我之前用的是这个 ez curl 里面这个快速部署,它现在有两个版本,一个是个人版本, 那你只需要把这个下载到你的本地的一个电脑上面啊, windows 版本、苹果版本,还有原端版本三个版本部署到本地也是去接入它元旦的一个 a p i 或者是 这个原端版,然后原端版其实就用的它一个原端的服务器,把这个小龙虾部署在它的服务器上,然后在服务器里面分一块啊,给到你去使用。相当于这个本地上载的快速部署版本,是用你本身电脑的一个性能 啊,这个原端部署版本就用了一个辅源服务器。那大家都知道,我原来分享的那个是我在用的一个服务器的一个企业版本的,因为当时想要快速接触这个小龙虾,到底使用的一个效果是怎么样的?然后它里面也有一些很多的这种 技能市场,看到没有?就是防忽悠啊,多 a 键的一个配置啊,这就是他写的一些技能的一个市场,以及他那个三万的同款技能包。只是他这种消费模式,他不是接的你自己的一个模型, 而是在他这里面再去接其他的一个模型啊,包括充值直接冲到他们那边去,然后他再给你去分配算力,所以他们就做一个中转站的一个存在。像这个是我第一个用的,包括像后来微信出的这个 qq, 直接可以部署在你的微信本地,就这个我觉得后面可能用的人会更多,那其实大家都知道,我们原来其实用的是飞书来给他进行了一个沟通交流,那现在 qq 最方便的地方就是他直接原声的啊,接触的微信,所以这个大家可以持续的去关注看一下, 然后像这样的快速配置工具,其实现在又多了很多很多,可以大家看到飞出的妙达 win klo, 所以 我给大家搜一下啊,带 klo 尾标的工具到底有多少,给大家看一下,特别有意思, 你看出了多少?带 klo 龙虾汉堡包,是不是啊?那我各种 klo, 各种给龙虾开发的一个框架呢?刚才看到这个 q klo 啊, win klo, 各种各种各种啊,那他都是其余开源的这个龙虾,然后给大家做了一个快速部署,如果大家感兴趣的可以挑一些去使用,那我后面也会持续给大家分享哪款好用,哪款不好用。 另外我这边还单独准备了一个老的一个 macbook, 给大家去演示在本地部署是如何部署的一个教程,因为其实很多人都去买了个 mac mini, 那 你如果有有闲置的电脑,有装 linux 系统,或者是闲置的这个苹果系统,哪怕是像我这样英特尔的一个老配置的一个系统,其实也足够去运行它了, 因为它用 mac mini 的 好处在哪呢?一个就是低功耗,长期开着不费电。第二个就是它的原声的一个苹果系统更适配它的这个部署环境,里面很多工具都直接可以直接调用或者是 linux, 那么就是分两步,第一步就是我会持续给大家分享这个云端的部署是如何部署的,以及出现了哪些好用的一个快速部署的框架。那第二个就是我会在我这台电脑上面去本地部署一个龙虾,也许是用这些快速部署的框架,也许是用龙虾原来开源的去进行一个部署, 所以我后面会持续给大家分享一个养虾日记的系列,好,一个是云端,一个是本地,看看大家最终喜欢用哪种方式。

前两天啊,我那个视频讲了,就是什么样的公司所需要 ai, 那 么你的公司到底需不需要 ai? 那 么今天呢,我们就要讲一下具体的一个行业,那么就是电商,因为有很多电商的老板来我这里配置大模型,然后有的配了两套,有配了三套,还有甚至配了四套的,那么他们到底是来干什么的? 这个我相信也是很多电商的朋友们去好奇的一个问题啊,因为有很多人会问我说,为什么我看别人配了大模型,但是我却不知道该怎么用,我到底应该用在哪里?那首先啊,就是你的 erp 系统和 c m 系统这两个东西呢,对于电商行业的朋友来说是最最最最重要的,因为 erp 就是 一个电商的命脉嘛,对吧?你到底卖出了多少?你的成本是多少?那么你的利率是多少?哪个 sku 的 产品是卖的最多的?哪个给你创造更多的价值?然后包括 比如今年双十一或者双十二啊,哪个可能会成为爆品,哪个的趋势会更好?那么这些 ai 全部都会给你答案。而且最重要的一点啊,就是你像很多人力方面就可以节省了,比如说我需要去查我上个季度或者说我上半年所有的销售数据,哪个 sku 的 东西卖的是最好的啊?我哪个产品 我利润率是最高的?然后哪个是有卖报趋势啊这种等等等等,你人是需要花大量时间去操作的,但是 ai 你 只要把你的 erp 给他,那么他可以在十几秒就给你一个答案,这个是非常非常快的。那么所以我每次就说,呃,要让人去做一些决策的工作,而并不是做这种很重复的工作,比如说我去查数据, 我去找各种资料,这种是一个很重复的工作,并且很枯燥,那么这类 ai 做比人要快非常多,那不仅可以节省人力的同时可以 提升非常多的效率。就说 ai 它其实并不是直接能帮你赚钱的一个东西,但是它可以在方方面面为你节省非常多,不论是你的金钱还是时间。那么其实除了 e r p 和 c m 系统啊,还有很重要的就是合同啊,电商呢,有很多合同呢,是比较大的啊,尤其是你的进货合同, 然后包括你比如说有一些且订单啊,或者怎么样的这种很大的合同,那么你可以全部去让 ai 帮你去审一下这合同到底有什么一些漏洞,或者说对我们这边自己是不太友好的一些款款项,这些 ai 全部都可以帮你去看出来。 然后包括你可以让合同去呃,让他去帮你把合同做一个完全的整理,比如说你今年一年有一两千份合同,那么他可以去把你全部整理出来,比如说哪些合同是在履行中的,哪些合同呢?是正在 啊,有点问题的啊,有那些合同履行完成的,那么各个金额以及总个金额都是多少?这些都是它可以在很快的速度下帮你去找出来的,而并不需要人去一个一个翻,这个时代的效率太低了。那么所以言而总之,总而言之,我们还回到最重要的一点,就是为什么要用 ai, 是 因为 ai 可以 帮我们有更多的效率, 有更高的效率,然后帮去帮我们解决更多啊,人很难在短时间之内办到的事情,这个就是一个效率的提升。就说 ai 它其实不能帮你赚钱,但是它可以帮你节省很多。

n 卡的本地大模型部署好了,对比我之前给大家讲到的这个 max studio, n 卡和 studio 在 价格上差不太多,但是如何去选择呢?如果你是家庭使用它又可以当电脑,性能是非常强的。然后它拥有六十四 gb 的 显存部署,像 opencloud 这样的机器人,它的回复速度肯定是没有 n 卡快的。但是好在它的显存比较大,六十四 gb 你 能 能够跑更多的模型是大于英伟达的这个模型的。但是如果你和我一样对性能要求极高,那你可以考虑一下英伟达的这套解决方案。至于这个 n 卡的解决方案和 max studio 在 速度上到底差距多少呢?拿这个五零九零来说,如果你问他一个复杂的数据,比如说帮你看十到一百张表,那这么多的数据, mac 基本上要一 分钟才能给你回答,但是 n 卡的话,二十秒直接给你数据,那毫不犹豫肯定 是 n 卡。我刚刚用这个 n 卡输出了一篇关于短视频运营的报告,可以看一下,输出是非常细化的,而且像这样的内容在实时生成中,大概也就是十到二十秒就可以出一个这么详细的日报。然后我也给他安排了多个 agent, 比如说我用我的 max studio 作为 主对话,他做我的 ceo, 那 像英伟达性能比较强,他要采集大量的数据,运营比较复杂的这个预算,那我就会把他很多关于一些公司的重要财务数据, 可以帮我查 erp 吗?嗯,可以看到它已经在调用我本地的这个模型了,然后一堆的数据表格正在输出,也就是说我们正常在使用它,无论是一台机器还是两台机器或者是混合使用,你的体 验都可以是非常好的。通过这样的多 a 检测的智能体,你还可以创建多个角色,然后每个角色也有自己的 skill, 你 让它做短视频运营的数据分析以 及做你的财务报表都是可以搞定的。而且像这套算力全部都在自己家里或者是在自己的公司里面,你的重要的合同数据都不会留到网上。所以说各位企业的大老板,如果你对本地算力和数据安全也有要求的话,像这样一套混合解决方案,你的企业也可以安排上。

现在很火的养龙虾,很多人听着觉得不错,但是真正用了才会发现它其实特别的吃 talkin 简单的任务也需要一个很大的成本,今天我就教你们一个更简单的方法,在自己的电脑上部署一个大模型,来操控自己的免费龙虾。零 talkin 零成本。 首先对我们普通用户来说,最适合的还是这种傻瓜式的安装,就用一些简单的工具,比如像鲁大师免费龙虾 ios cloud 这种来一键部署,打开之后呢,它会自动根据我们的电脑配置来选择合适的一个模型和部署方案,只要跟着提示点点点就行,它就会把整个流程帮我们走完。部署好后,它不是只能像 gbt 那 样聊天解答问题, 它还能帮我们操作电脑,比如发邮件、整理文件,还有做一些日常的管理操作,很多原来需要自己动手才能完成的事情,现在只需要直接跟他对话,他就能处理,这才是龙虾真正的作用。重要的是我们平时分析一些科研的机密,本地部署的模型会更安心,数据处理都会在自己的电脑上完成,不用担心数据或者是论文泄露,还能选择用手机连接,把远程操作的门槛都降低了。

大伙好啊,今个呢,我们聊一下如何在本地哈部署这个拉玛 c p p, 那 么它的作用是什么呢?各位,先说一下啊,它能让我们在本地哈运行啊这个语言类推理的大模型。 那么为什么要在本地部署呢?有几个情况哈?第一个呢,就是最近哈,呃,这个网上都说这个豆瓣要收费了啊,对吧?呃,收费之后呢,有一些功能,可能我们正常用的挺好,再用可能就要付费了,对吧?然后再有一个是什么呢? 就是我们如果在做项目的时候啊,比如说有一些东西涉密了,不方便在网上传,对吧?这个时候我们就需要在本地,是吧?构建自己的这个资源库,对吧?各位,那么这个时候我们就需要在本地有一个可以类似于像豆包啊,这个 deepsea 啊这种的服务类大模型,对吧?所以呢,今天我们聊一下如何在本地哈部署这个拉玛 c p p, 它呢实际的作用就是可以让我们在本地哈运行啊这个语言推理类的这个大模型,大家看啊,现在我已经部署好了,非常简单哈。那么再有一个情况是什么呢?各位,我们有一个自己的这么一个批量管理软件,是吧?目前有一个环节就是题词词的来源 目前很严重的依赖于我们外部的这个呃, ai 工具,对吧?现在呢,我们如果在本地已经构建了一个可以用来进行语言推理,生成对应任务的这么一个大模型之后呢,各位大家看啊,我们就可以把这个东西直接集成到这个平台当中,是吧?提 着此这一块,我们就最后一个环节就已经集成到这个行当中了,这个就是后续啊,就是大概是四点一之后是吧?呃,继续优化的一个功能,大家先知道这么个事就行了 啊,再有一个是什么呢?目前千万三点六是吧?这个三十五币出来了,然后呢,号称是一个能干活的大模型,对吧?各位,那么我们把它在本地运行来之后呢?第一可以构建自己的私有资源库是吧?更安全,第二呢效率更高,对吧?各位, 那么话说回来啊,怎么去部署这个拉玛 c p 啊,它其实就是一个能让我们运行这个语言推理类模型的这么一个工具啊。不大,我们首先来到这个 github 哈,这个网址,好吧,这个网址哈,然后来到这里之后,各位,简单的一种方式哈,我们找到右侧这个 release, 好 吧,找到这个 release, 然后往下翻哈,这里边有对应的版本,那我是 windows 系统,我们往下翻啊,这里边有一个 windows, 好 吧,在这里哈,各位,呃,我是酷达十二的,所以呢,我就找这个酷达十二哈, 找这个酷大十二,大家根据自己的情况啊,显卡情况去选择好吗?有很多这个类型,大家根据自己的情况选择就行了,那么我选择酷大十二,然后把它下载到本地之后,大家看好,我把它下载到本地之后进行解压,解压完了之后大家看进入到这个文件夹当中,这个就是项目下载之后的效果, 好吧,不大哈,大概是看一下啊,五百多兆,好吧,不大哈,然后呢,别着急启动,各位,我们启动的时候呢,可能要需要设置一下参数,怎么去办呢?大家看,进入到这个 lama 啊,解压之后的这个文件夹,然后注意新建一个文件,比如说我叫 start 啊,我已经有这个 start 了,那我就 start new, 新建一个文件,然后大家注意把这个后缀名啊,各位,把后缀名啊改成点 byte, 好吧,有些同学这个小那个小伙伴的电脑可能这个看不到后缀名,是吧?这个很简单,我们打开这个文件夹之后,这上面有一个查看,大家点击查看,点击显示后边有一个文件扩展名,就是文件后缀名,你把它点上之后就能看见了啊,也能修改了。那我们新建这么一个 bug 启动文件之后呢?大家看啊,我把我之前这个打开, 大家看在里边输入这么一句话啊,比如说这个是拉马,搜索这个拉马的这个文件啊, 调用谁呢?大家看啊,这里边有一个这个,好吧,拉玛告诉搜索点 e s e, 实际上就是调用它哈,然后后边杠杠 host 四个零好吗?它指的是开放远程调用,因为我们后期啊,各位,后期要把它集成到这个批量管理软件当中,我们需要通过这个软件远程去调用啊,这个拉玛 c p p 好 吗?各位,所以这个位置我们给它开放远程调用,后边 pos 端口八零八零,大家看啊,就这个端口,根据自己情况设置就行, 好吧,自己设置一个端口啊,然后后边杠杠 models 杠 d i r, 它指的是我们的大模型存放的文件夹地址好吗?比如说我存在 cf ui 的 这个 l l m 目录当中了,那我就找到哈这个 cf ui 找一下啊,找到 comui, 然后找到它的这个 models, 找到 l l m, 把这个上面地址复制一下,粘到这里边就行,好吗?这样呢,我们这个启动文件就配置完成了,很简单,对吧?各位?然后呢,大家看啊, 翻回头来,来到这个启动项,好吧,来到这个 lama 的 这个解压文件夹目录,找到我们刚才设置的这个 star 的 启动文件,好吧,里边的内容刚才展示过了啊,开放远程端口,设置模型存放的目录,然后前面是调用的这个 lama server, 然后双击一下 打开,双击完之后啊,这个老板就启动了,他默认的啊,启动端口啊,是刚才我们配置的那个八零八零,对吧?然后呢,我也,我之前已经启动过了,翻回头来,我们在网址上输入,幺二七点零 点零啊,多了一个点啊,幺七点零点零点一,然后冒号,英文的冒号八零八零,大家看,这样呢,我们就把这个网页打开了,大家看,其实他就是个小豆包哈,他的这个能力跟你选的大模型有关,那么我选的是千问三点六啊,目前号称能干活的大模型,好吧,一会说这个事啊,然后呢,我们点 第一次,我们可以点击加载一下这个模型,然后输入你好,是吧,他就进行推理了,然后给我们这个答案,这个模型确实能干活啊,各位,大家看啊,这个是我之前用这个千分三点六,然后拉拉本地部署的这个 呃软件哈,然后呢,生成了一个贪吃蛇的这么一个小游戏,里边大概七百多行代码,我就告诉给我生成一个网页版贪吃蛇啊,大家看,双击完之后,这个游戏还挺好玩的啊,效果还不错的啊,好吗? 好了,不解释啊,就是挺好玩的哈,然后千万三点六的模型在哪里下呢?大家看,我这里有一个网址,这是国内的网址哈,大家看, 根据大家的显存实际情况去下载对应版本就行了。那我是二十四 g 显存,所以呢,我下的是这个 q 四 k m 的 二十二 g, 好 吧,大家尽量啊,下载这个模型小于大家的这个显卡的显存,因为什么呢 啊,就算大点也没事啊,比如说你十六 g 显卡,然后你下个十八 g 的 模型,实际上也没事,它会把一半啊,它会把一部分资源放在内存当中啊,但是各位 用这种模型啊,大家看啊,这有一个 token 的 输出速度好吗?就是它运行,你可以把它理解为运行的效率啊,有一半资源在显存啊,在内存当中,这样会拖慢你的运行效率,但是它也能运行,就算你没有这个显存,纯靠 cpu, 它也能运行,就是奇慢啊。各位, 这种模型大家注意啊,还是注意下效率的,所以我们把这个模型都加载到显存当中,这样的运行效率是最高的啊,大家做这么个事就行了啊,尽可能的选择这个模型小于你的真实显存占用, 是吧,这个千分三点六,三十五 b a, 三 b 指的是三十五 b 的 参数,但是真啊,一次使用的时候只激活三 b, 对 吧,但是你也需要把这三十五 b 参数加载到显存当中啊,然后一次用里边的三 b, 对 吧,这样的效果是最快的。 好吧,各位大家说这么个事就行了啊,然后呢,其实呢,大家不止可以下载这个千问三点六号,也可以下载其他的推理大模型,放到对应的目录当中,是吧?在这里大家看啊,在这个位置我们是可以选模型的,我之前还有千问三点五号。 好吧,各位大家知道这句话啊,知道这么个事就行了,那么部署完,启动完之后,就可以跟它进行对话,然后完成任务了哈,然后呢,这个不是重点啊,因为我们刚才开放了 api 的 远程调用,对吧?大家看啊,就是以后怎么把它集成到这个软件当中呢?大家可以看一下啊, 现在我模型是加载的,我给大家演示一下啊,这里边我写了两个 api 啊,第一个是卸载模型,是吧? 就是我可以通过远程调用去控制这个软件加载或者卸载模型,大家看好好 success, 然后我们看一下显纯一下就下来了,这样呢,我们就完成了模型的卸载,对吧?然后下边这个是加载模型,大家看 是吧?加载成功之后,显示一下就上来了,对吧?证明这个远程调用是可以的,那么我们就可以通过远程调用的形式啊,把内容发送给这个软件,然后得到结果之后,是吧?然后我们把结果配合的使用到对应的软件当中去,是吧?就完成了调用。 好吧,这个只是一个初探啊,各位,这个只是个初探,大家学会安装,学会下载模型,然后把它启动起来就行。好吧,后续我们会有深入的这个使用教程啊。然后呢,视频当中说的一些使用细节,包括网址啊,包括这个启动文件怎么配置啊?大家可以来到主页哈,找到对应的视频,在视频下方大家可以查看一下。

嗯,最近一段时间啊,在本地部署运行这个语言大模型是非常火的,然后我个人认为的话,可能在未来的两三年、三五年的这样的时间里,所有的这个创业者,包括上班的啊,上班族 都会需要去具备这样一个能力,就是去理解大模型的使用,然后去熟练的运用大模型。 所以说今天我就跟大家分享一下在本地部署语言大模型的话的一些经验,然后我不会去讲具体的一些安装的过程,就是怎么安装的啊?这个模型怎么安装的,这个平台怎么安装的 这样一些东西。在抖音上面很多,今天跟大家分享的话,主要就是说什么样的模型,它能够在你的电脑上跑起来,能够流畅的跑起来,它能够帮你去解决什么问题?这个是今天跟大家分享的,然后 简单说一下,就是在本地部署大模型的意思,就是把这些语言大模型安装到你的电脑上,这样子不管是你有网络还是没有网络,你都可以跟他去进行一个问答,然后让他帮你去干活,或者是让他去解答你的问题。呃, 和传统的像我们像豆包或者是 deep deepsea 啊这种语言大模型的话,那它的区别就在于说,呃,豆包这样的语言大模型,它是运行在云端的,没有在你的本地,然后 嗯,如果没有网络的话,你是没办法使用。第二个就是你跟他的聊天的记录,包括你上传给他的文件啊,嗯,他是会上传到云端服务器的,没有私密性。然后对于很多的一些企业来说,包括个人来说,我想保证我自己的一些客户资料或者是自己的私密信息 不上传到这个云端服务区的话,那么这个时候就不建议我们去用这个云端的这些啊模型, 嗯,这个时候我们就会用到在本地部署这个语言大模型,然后目前本地能够部署语言大模型也是非常的多啊,也是非常多。然后我经常根据我的电脑情况的话,我现在目前话主要是用这三个啊, 一个是千万三点六、二十七 b 的 这样一个模型,还有千万三点六、三十五 b 的 专家型的一个模型,还有一个佳马仕啊,佳马仕是谷歌的, 这三个模型是在我的电脑上,我觉得速度和质量都还是比较好的。然后目前整个这三个模型啊,他的实际的一个评测也是在本地模型里面靠前的。 当然这里有一个概念,大家一定要知道啊,就是说对一个大模型来讲,他前面代表是他的名称啊,千万三点六,这个是千万公司的,然后三点六是阿里出的这个模型啊,杰尔玛是谷歌出出的,这个是他前面的这个名字,然后这中间这个就很关键了啊, 呃,三点六和四十他的版本哈,这个不用去管他。然后最中间的就是这个带 b 的 啊,二十七 b、 三十五 b、 三十一 b, 这个表示这个模型他的一个大小,也就是说这个模型的呃,他那个规模什么意思呢? 举个例子就说他如果是人的话,这个就表示了,就表示了你的一个脑容量越大的话,你可能就会更聪明,如果你的脑容量越小的话,那可能你就 不那么聪明一点,然后能够回答的问题就有限。所以说一个越大的模型,那么它的智能程度是非常高的啊。 像我们家用的话,部署的话有啊,四 b 的, 有八 b 的, 有十 b 的, 有十六 b 的, 然后有二十多 b 的, 也有三十多 b 的, 还有七十 b 的, 这样一些模型都是可以在家用电脑上进行一个配置的。 如果你要追求啊,像很多的一些大公司,像阿里啊、腾讯啊、百度啊这些公司,他们在服务器部署的这个模型,那我们在本地电脑上是肯定跑不了的,他们都是千亿级的这样一个参数,在本地是跑不了的啊。 嗯,所以说我们能够跑的基本是在七十 b 以下的,如果说你是非常顶尖的一些专业的工作站,那你可能会跑到七十 b 的, 然后普通家用电脑的话,基本上能跑到三十五 b, 二十七 b, 就 就基本上是一个天花板了,所以说大家可以一定要去注意看。然后 第二个需要注意,就是说啊,模型还有一些后缀啊,后一个后缀的话,主要是它的一个量化的参数,比如说像杰尔玛这个模型,它这个 i q 四,这个表示它是以四比特去量化的,这个参数会非常重要。我们看这个模型文件,它也会有 像三问千问三点六二七比特的话,它是写的 q 六 k, 也就说它是按六比特进行量化的,量化的程度越高,量化它表示一个模型的压缩率, 如果说压缩的越狠,那他的数字就会越低,比如说四比特,那就是压缩的非常厉害的六比特,压缩中等的巴比特就基本上轻微压缩,十六比特就是完全没有压缩, 完全没有压缩的模型,它质量是最高的,然后稍微压缩一点啊,也是可以使用的,精度没有太多的影响。但是如果是四比特以下的这个压缩率的话, q 二 q 一 啊这种, 嗯,我建议大家就不要用了,这种压缩率太低的话,他会失真啊,就会产生模型的一个幻觉,说这也就是这个意思啊。 q 二 q 六 q 四, 但是不是说越大就越好,这个要看你的电脑能不能装,嗯,至于这个模型能不能在你电脑上去部署,能不能流畅的跑起来,有个很重要参数,非常的简单,我教给大家就是什么呀?就是你去看这个模型文件的一个大小 啊,这个模型的话它是二十二个 g 的, 然后我还装了一个千万三点三点六三十五 b 的 这样一个 q 四的模型,它的大小也是二十二 g 的, 然后这个 g 码三十一 b 的 模型的话,是大概是十六个 g 啊,十六个 g, 对, 然后 这个什么意思呢?如果你的显存是三十二级的显存,或者是你的显存是十六级的显存,你一定要记到一点,就是这个模型文件它的大小绝对不能够超过你的显存,如果说它超过你的显存,也就意味着这个模型不能够完全的加载到你的这个 这个显卡的呃显存里面去,如果不能够加载进去的话的话,然后他就会通过这个内存和 cpu 去进行计算。我们都知道啊, cpu 它是一个多任务的啊,多现成的这样一个处理器,它是干很多活的,但是 gpu 它是 专门去干一件事情的,所以说它的计算速度会非常高,而且这个显存的宽带比内存的宽带是要快很多的, 所以说当你的模型全部加载到你的显存里面的时候,它的进行计算就是通过显卡去计算,那么速度就会非常快。如果说你把它放到内存里面去,通过 cpu 去进行计算的话,那么这个速度就会非常非常的慢啊,所以说大家一定要记住这一点,就是你的这个模型的尺寸, 它的容量大小绝对不能够超过你的显存啊,这里我是配置了两张显卡,呃, rtx 的 五零八零和 rtx 的 五零六零钛都是十六 gb 显存的,加起来就是三十二 g 显存,那么这个显存叠加的话,是在这种语言类大模型是可以去进行一个呃, 叠加的,使用的就是平台会进行拆分,但是你去跑一些像 comfyui 这样的一些生图生视频的软件,它就没办法啊。好,这个我就不讲太多了,大家一定要记住,就是说这个模型能不能在你的本地部署,首先第一点去看它的大小,大小不能够超过你的显存。 第二个很多朋友可能会问,那我是十六 g 的 显存,我去下载一个十五 g 的 一个模型没问题吧?当然没问题,你可以装进去,但是你一旦和他对话说成两句话, 你就会变得非常慢,为什么呢?就是在本地部署模型,还有一个很重要的概念,叫做上下文的一个大小,什么意思?就是你每跟他对对一次话,你,你告诉他的问题,他就会占用一定的容量, 随着你在一个窗口里面跟它对话的次数越多,这个容量就会越大。如果这个容量加上它本身的模型的这个容量,最后超过你的显存,它就会加载到你的内存里面去,加载到你的内存里面去的话,然后这个时候速度就会变得非常慢了。 所以说我们要确保就是说一个模型在自己的显存里面去,不能够到内存里面去,不能够让 cpu 去运行它,不然速度就会非常慢。 所以说大家现在知道了啊,就是你去装一个本地模型,第一要素是它的大小不能够超过你的显存,第二要留足够的空间去给它运行上下文,这个空间大概是多少呢?嗯, 大概一万啊,字节的这个上下文的话,需要的显存,嗯,应该是在一 g b 左右,所以说我们普通的对话的话,基本上你设个嗯三万吧左右的上下文,如果你 用这个电脑的 ai 的 a 检测去帮你干活的话,三万的上下文一般足够用啊,那么三万的上下文的话,然后 呃就需要大概三 g b 左右显存。如果你是去除处理这种长的上下文,比如说几十万这个小说啊,怎么怎么样,那你就需要设置非常长的上下长长的上下文,比如说六十四 k 的 或者一百二十八 k 的, 那么就会需要占到七八个 g b, 甚至包括十多个 gb 的 一个显存容量,那么这个时候你在显存里面一定要留够这个容量,如果没有的话,要么你就去压缩你的上下温,把它这个容量变小一点,要么就是下载更小一点的模型啊, 所以说我的三十二 gb 的 一个显存的容量,呃,那么我去跑一个二十二 g 的 这样一个模型, 我的空间容量还有十 g 左右,十 g 左右当然也还需要减掉两个两到三个 g, 这个是系统需要用的啊,就是你加载这块显卡,系统会用到 的,所以说,嗯,可能我能够用到的容量就是八个 g, 八个 g 的 话我就八个 g 的 话,我就大概能够设置三万到啊,六万这样一个一个上下文的一个长度吧。 好,这个知识大家清楚之后,然后我讲第二点非常关键的什么呢?就是说你下载一个模型,嗯, 它能够装到你的显卡里面去,就是我刚刚讲的就是它的容量绝对它的大小不能超过你的显存。第二,你要留够足够的上下文的空间,然后第二这个模型在你的电脑上跑得快不快,这取决于什么呢? 嗯,首先第一当然是你的硬件啊, cpu 这个型号越高,它的这个扩大啊,不要去选择 amd 或者是英特尔的这个这个 gpu 啊,英英特尔和 呃,这个 amd 的 显卡,它们目前在进行这个大模型的计算的时候,没有没办法去开这个扩大加速啊,它的速度会非常的慢, 所以说现在恩威达的这个显卡,它的市场占有率已经达到百分之九十多,就是因为它不光是它的库达啊,还有大力水手啊, d l s s 这个在游戏方面表现很好,它的库达在这个大模型计算方面也是非常的有用, 所以说,嗯,建议大家如果真的是想去学 ai, 然后去跑大模型的话,一定要选择这个 omega 的 显卡,然后,嗯,型号越高的啊,就是像四零九零或者五零九零,然后五零八零、四零七零啊,四零八零这种型号的话都是可以的,就是型号高一点。 嗯,但是最重要是什么?就是我刚才想跟大家分享,就是说,嗯,显卡要用 n 卡。第二就是你去跑个大模型的时候,嗯,他的一个平台会非常重要,我现在跑的大模型的话,这个平台是用的这个立马点 c p p。 呃,什么意思?就是说立马点 c p p, 就是 他去跑这个大模型的一个原生的一个环境啊,就是一个环境去跑它, 嗯,但是这个立马点 c p p 的 话,它会复杂一点,你需要在这个命令行 c i i 里面去进行一个部署。如果说很多啊,新进入这个这个领域的小伙伴 啊,想简单一点也有办法,就是去下载一些像 l m studio 啊之类的这样一个呃平台,这样平台它是直接可以在文档上面进行一个安装的,就不需要去输命令,然后安装好打开这个界面就可以加载这个模型,就非常方便。 那么但是有一个问题,什么为什么我现在不用这他们这些平台,就是因为这个 lm studio 啊,我测试过之后,它的速度比原声的立马的话是,呃,每秒钟升升升成那个托肯的,这个速度是会慢慢很多的。 呃,所以说我基本上就是用原声的立马啊。怎么样去装这个东西我也就不讲了,大家可以去了解一下,我今天给大家实际跑一下吧,跑一下这个 好,需要打开一个命令行,然后去输入到我们的一些启动的命令啊,输入到我们的启动一些命令,这些命令的话也不是很复杂,嗯,基本上在在这个在网上都有。 然后这个命令加载的命令的话,主要是就是加载你模型的这个位置,然后一些启动的参数我就不展开讲,现在我去启动一个这个二七 b 的 千文的一个 q 六的这样一个模型啊,把这个命令输进去,然后回车就可以了,然后它现在就是一个加载模型的一个时间, 然后我的两张显卡的话,因为有一张的这个贷款比较低,是 pcie 的 一点零啊,我现在还没有去改它,所以在加载的时候会速度会比较慢,但是跑起来的时候完全不影响啊,就生成这个托肯的这个速度还是非常快, 然后加载的时候可以稍微慢一点,但是已经完成了啊。在加载完磨成模型之后,就会生成这样一个地址,在本地的一个访问的一个端口啊, 幺二七点零点零点一八零八零在一个端口,然后我们在浏览器里面去打开它就可以了。然后这个因为我本身我是已经啊把它收藏起来,现在我就直接打开它,这是立马点 c p p 的 一个基本的界面,我们就可以跟它对话了,你是什么大魔 模型,这样对话的话,他就已经用这个千万三点六二十七 b 的 q 六 k 来进行一个回答,然后速度大概是在三十 to 肯斯每秒左右啊,有时候会快一点,比如说来到四十 这个时候呢,注意看一下,就是我的两张显卡的显存啊,基本上十六个 g 用了十三点六,然后另外一张的话是十六 g, 用了十五个 g 啊,这里面我做了一个权重调配, 然后我的 cpu 啊,它的运算率是非常低的,就基本上它是靠显卡和显存在进行计算,这个就是非常好的,所以它能够保证它的一个速度啊。现在这个大模型的,呃, 评分比较比较高的有哪些 好?然后提些问题,他就可以去跟你进行一个一个解答,然后 我们就可以在本地去使用它,然后本地使用这个大模型的话,好处就在于说,第一如果你没有网络, 你没办法去使用豆包或者 deepsea 的 情况下,你是可以在自己的电脑上去跑这个本地模型的,一样的话是非常智能,像千万这个二点,嗯嗯,千万这个,嗯,三点六,二十七 b 这个模型啊,我实际测过,他比豆包的这个快速的这个模型 是要聪明很多的,和豆包的这个思考模型的话差不多,当然专家模型就没有办法更详细的去进行一个测试了啊, 他也他也的自然程度也是非常高的,所以说你如果没有网络的话,你就需要去部署一个自己本地的模型。第二点就是对于很多的企业或者个人来说, 嗯,因为云端的模型向豆包我提一些问题啊,把我的企业的财务数据我需要去发给他看,然后把我企业的员工的一些信息,或者是我的一些核心商业机密中标的一些东西,我需要发给他去看, 那么这个他会把这个文件上传到一个云端服务器,这样确实私密性不太强啊。但是在本地的话,比如说我上传啊,他现在已经生成完了,我上传给他一张图片啊,上传随便啊,上传给他一张图片我让他看,呃,你看一下我的电脑 配置啊,这样图片给他的话,他在本地进行处理,那么这个,这个你的这个资料,你的呃所有的资料不需要去上传到云端啊,私密性非常强。所以说很多企业 和个人,然后包括一些商家,他的不需要自己的这个客服资料的流失的话,建议都是去做这个本地的部署,然后他在跑的时候大家可以看到啊。 嗯,显存啊,两个显存还没有用完,十六 gb 的 十五点一,然后十六 gb 的 十三点六,也就是说我现在还有大概呃三个 g 左右的一个空间去跑这个上下文,然后不会报显存,不会报显存的话,一个代表就是一个,一个一个表现就是你的 cpu, 你 看 我这个 cpu 的 话,它的一个运行的一个,嗯,占用率的话是比较低的,这样呢不会去影响模型的速度,主要是靠显卡啊,靠你的显卡进行一个计算 好,然后这个就是在本地跑模型的话,嗯,在平台选择的问题,建议大家如果确实不太熟悉这个命令行的话,就可以去选择这个像啊, 然后 a m m studio 之类的这样一些啊,非常简单的桌面平台,然后下载即安装,安装就可以使用。如果说你懂一些电脑的这个呃操作,然后又想去体验这个大模型的一个速度的快速的话,那么就建议大家像我一样去下载一些啊,这个纯底层的, 呃,跑模型的平台,像立马点 c p p, 还有 v l l e m 之类的啊。然后这个就是影响模型速度运这个计算速度的一个很关键的地方。那么第二个点就是什么呀?就是在大模型上,嗯, 下载大模型的话,像你用这个,嗯,像我用这个,立马 c p p, 它比我用这个 l m studio 最好的一点就在于什么?就在于它可以去支持这个这三个字。大家看到没有,这个叫 m t p 啊, 去支持这种 m t p 的 一个模型,但是像 l m studio 它现在还支持不了,这什么意思呢? m t p 的 话是一种加速的方式, 一种加速的方式,有 m t p 的 模型的话,它的速度会非常的快,没有 m t p 的 模型的话,速度会慢一点啊。这个具体的原理和机制我就不跟大家讲太多,大家可以在网上去了解一下。所以说你想去跑这种 m t p 的 模型的话,建议最好就是用呃,里马,包括这个 v l m 之类的 这个原生的平台去跑,像一些,有一些啊,像这个 l m 丢丢之类的,它现在还用不了这个 m t p 的 模型, 呃,这个也是对模型速度影响非常关键的。然后最后跟大家分享一点,就是说,嗯,我目前啊经常在用的话,主要是有三个,这个人工智能这个智能体啊, 第一个豆包我会也会经常用,有些简单的问题我会问他,因为第一他是纯中文的一个环境,第二在用他用到国内的这个搜索网络的话,去搜索一些东西,速度也是非常快的, 那么我要去学习大模型,要去掌握大模型,要去用本地的一些搭建知识库的人之类的事情的话,让本地模型去不消耗托克的情况下啊,啊不,不是不消耗托克,就是免费,有托克用的情况下 只消耗算力,你的电力的情况下去去用大模型的话就可以用本地的啊,这样一个部署的。呃,还有呢,就会用到这个,像这个 谷歌的这个啊,机密里啊机密里,然后这个是我觉得我用到的这个,呃,怎么说?这个智能体验 非常聪明的一个,非常聪明的一个,然后建议大家如果有这种条件就是科学上网的环境的话,大家可以去试一下啊,这个机密里我觉得是非常聪明的,然后,嗯, 所以说就是本地部署模型的话就是这样一些知识点,当然还有很多很多的一些知识点,然后我希望大家都慢慢去学习,比如说在本地模型的话会加很多参数,这些参数里面最重要的我觉得就什么呢?就是有一个这个参数叫做 f a, 嗯,这么个参数啊, f a 什么意思?就是你在本地去跑大模型的时候,在那个语言环境里面,你一定要去装两个东西,一个叫做 flash attention, 一个叫做 sega attention 这样的东西,然后 flash attention 的 话它主要是去加速这个本地的语言大模型的,你打开它之后啊,你的量化模型会跑得更快 啊。嗯,我在这我在这边再给大家演示一下,我跑这个千问三十五 b 的 a, 三 b 的 这个模型大家可以看一下啊, 哦,我这个模型都是去开启了这个 flash attention 的, 然后,所以说,呃,再加上我用的是 m t p 的 模型啊, m t p 的 模型,然后开启了 flash attention, 所以 说我这个,呃模型生成的速度,这个这个吐字的速度 还是非常的快, 大家可以看一下这个纤维三点五啊,纤维三点六,三十五 b 啊,这个模型是个 mo 模型, mo 是 个专家型的模型,它每次加载到你显存里面的计算量 会小很多,所以说速度会更快,非常的快啊。然后,但是我实测过它和二十七 b 的 模型比起来确实有一点, 怎么说不严谨,或者说有一点傻啊,同样一件事干出来,嗯,它的智能程度,比如说我写了一个围棋的游戏,我用二十七 b 写出来的话啊,我觉得是 ok 的 啊。 除了有一些这个嗯嗯对战的 ai 还需要调整之外,我觉得这个围棋游戏是 ok 的。 但三十五 b 写出来之后,它那个棋盘首先就是非常小的啊,它就不是那种标准的围棋棋盘,是一个可能九乘九的一个棋盘,然后 ai 的 话也是没有反应,需要你自己再去调试, 但是它作为市场的问答是没问题的,我们现在已经打开它了,这个千万啊,我们先去再去试一下,再去试一下,然后 看一下这个三十五 b 的 一个啊,大家可以看到它是千万三零六三十五 b a 三 b, 然后呃一个 q 四 k, 然后杠叉 l 的 这样一个模型也是有量化加速的。我们先问他一个问题,呃,中国从小学到高中的数学教学教育体系 好,我们来设这个问题啊,我们现在看到的,嗯,他的预思考时间会稍微长一点点,这个是因为我显卡插槽的问题啊,是我显卡插槽的问题,我有个显卡的话,他插在那个 pci 一 点零上面,所以说这个加就是预思考的这个速率会稍微慢一点, 如果调整过过后之后,他是是非常快的啊。然后现在他已经在进行一个思考和深层了,然后大家可以看到这个数据大概是在六十四左右。我,嗯,我觉得现在有点不对啊,我平时跑这个数据应该是在 一百左右吧,啊?一百左右吧,所以说九十多一百,所以说这个这个三点六三十五,比这个是很快的啊,是很快的。 然后一些常见的问答,日常问答的话,这个模型是非常推荐大家用的啊。嗯,我说的傻傻的是在做一些非常专业的这个数学,或者是一些啊这个领域的一些计算的话,他可能会比二十七币啊,因为二十七币那么多。专家吗?他毕竟 这个三十五币,毕竟只选了几个专家来回答你的问题,可能说没有那么全面,没有那么深入,但这个模型日常用是非常好用的,非常好用的。嗯, 所以说就是我们现在可以看到我刚才加载这个模型的时候,它会有一些基础的信息,里面有一个很关键的就是在于这个 flesh attention, 我 给大家找一下这个,这个,这个在哪里啊? flesh attention 没,没看到,这个在命令行里面,有时候你会看到它,然后加载的话是在这个, 我现我现在有点找不到啊,有点找不到。呃,我是没有开启吗?应该是开启了,开启了也可以让看一下这个命令行,也可以让。 对,嗯,我是开启了,但是在这个里面好像没有看到啊,没有看到,现在我也,我也不再去找它了。然后我想告诉大家,就是说 这两个东西啊,一个是 flash attention, 一个 sega attention, 它都是这个本地的一个平台,你必须要去跑本地模型,必须要去装到两个插件啊,这两个插件会让你模型的速度升的速度会非常的快。然后 flash attention 的 话,主要是在跑本地语言大模型的时候加进行一个加速, 还有一个叫做 sega extension 的, 那么主要就是在跑这个,呃, comfy y, 也就是说我们说的这个, 嗯,生成图片或者生成视频的这样一个平台啊。嗯,这样这样的一个模型,一些图上视频,纹身视频,然后嗯嗯,这样一些模型呢,他就会去用到这个 sega extension, 说这两个东西你是必须要去装的,然后还有一些环境, 嗯,像拍缝啊,然后库达这些东西,基本上,嗯比较适合一些老手啊。我们去部署它,在用这个 c u a 这个命令行去部署它的话, 都必须要这样去装,如果确实新人入门的时候你觉得太难了,没关系,你就用这个 l o m studio, 这个也是可以的,它除了就是稍微慢一点点,然后不能去加载 m t p 的 量化模型之外的话,它还是非常好用的。 然后当我们部署这些语言大模型之后,我们还可以去跑一些 ai 的 agent, 然后这这些 agent 的 话,他就可以去帮你干活。像我现在用的这个 anything l l m 这个 agent 的 话,然后 他能够帮我生做什么呢啊?嗯?能帮我做什么?我现在已经连到这个三点五啊,纤维三三点五,这个纤维三点六三十五 b 这个模型上面了,然后就可以直接问他啊,我是配置好的,然后 他就告诉我他能够做做哪些事情。但实际上啊,这个 a 剪子的话,他的这个功能还是比较多的,我们可以看到他的一些这个代理的技能啊,比如说去 进行一个呃资料库的搭建啊,就是我们说解锁生成,然后长期记忆,这个是 ok 的。 然后文档的总结没问题,去网站上抓取一些数据没问题,然后访问你电脑的文件系统,然后能够在你的电脑上去创建一些文文档 图标,包括 ppt, 然后能够去进行联网的搜索,然后还可以连接你本地的这个 呃 s q l 的 这个数据库啊,然后去调取一些,比如说你做商家的,对吧?你的你的数据库里面有很多你的商品的价格,你每次在改动的时候,它可以自动的去进行一个连接帮你调整,然后它还具备了一些什么邮件啊、日历啊,然后呃 outlook 这样一些连接的一些功能去,就就能够去帮你做一些 用 ai 的 这个本地模型去帮你干一些事啊。如果你不是用本地模型,比如说你用到这个他们养龙虾或者是跑这个爱马仕的话,呃去用到这个呃 deepsea, 或者是这个 呃谷歌的这个经理的话,他就会按 talk 给你收费啊,这个费用就比较高,所以说如果你只只是做一些简单的日常工作的话,你就可以在 自己的电脑上去部署这样一个本地的模型,然后用自己的 a 技能去跑,就没有一分钱的花费,他只会消耗你的电费啊,以及你刚开始前期的一个硬件投入成本啊。嗯,这边给大家再看一下啊,就是说,嗯,举个例吧, 嗯嗯,比如说我用,哎用 用浏览器去亚马逊网站帮我 查一下二零二六年,嗯,二零二零二六年四月的热销, 热销电子产品啊,这样一件事情,我生成给他之后,然后这个 agent 他 就会调用你本地的模型进行计算, 然后你可以看到他他的一个计算过程,然后他同时会用到他的 agent 的 功能,就去用他的一个内置的或者是你自己电脑上安装的一些浏览器去搜索这个网站,然后去 找寻这个结果,然后反馈给你,反馈给你之后,你还可以让他去生成一个什么 excel, 威尔,威尔的这样之类的一个表格,储存到你的电脑上,就相当于帮你干一些简单的活,这个是没问题的, 所以今天跟大家分享一下,就是说本地这些模型啊,我不讲安装,我就给大家分享一些经验,就是他怎么样跑你电脑上,大家一定要记住这个模型的大小不能够超过你的显存,而且你要留一一一定容量的这个上下纹, 然后同时的话去选择模型的话,呃,最好选择量化模型啊,量化模型,然后带 m t p 加速的那样些量吗?量化模型,然后平台的话,如果你呃 比较精通电脑,就去用这个 c u i 的 命令行去部署一些这个底层的一些跑模型的平台。嗯,如果你不太精通的话,如果是一个电脑小白的话,就直接去网上去当了这个 l m studio 之类的,这些啊,一个桌面版的模型平台就会非常简单。 然后,嗯,今天就跟大家分享这么多吧。然后如果后面会有一些教程的话,也是把我以后在跑模型方面的一些经验给大家分享一下, ok, 拜拜。

各位朋友大家好,这期我们来讲解一下音色克隆本地部署的方案,这个就是音色克隆本地部署的方案,使用方法比较简单,我们只需要在这里上传我们需要克隆的音色, 然后在这里输入我们要克隆的文案,点击生成语音,等待数分钟之后,就可以生成我们需要的这个音色。 来,我们听一下这个原声。人生一定要赌,一定要拼,如果你不赌的话,可能你没有丝毫赢的机会。 好,这里呢是我们需要克隆的文案,然后这里是我们生成的结果。来我们听一下这个生成的效果。窗外又下雨了,这种天气最适合窝在沙发里煮一杯热茶发发呆,周围潮湿的环境,心里却觉得特别安稳。 好,这个生成的效果还可以,我来说一下本地部署语言的模型这个方案的优点和缺点。先说优点,优点的话就是本地部署数据不会外传,有效的保护隐私。 第二个就是说本地部署调用的是本地电脑的显卡去生成音色,不需要占用网络资源,所以完全是免费的优点。说完了,我们再说一下这个缺点, 本地部署最大的缺点就是对电脑的配置要求比较高,而且生成的速度比较慢。以我这台三零六的显卡为例,这段文字大概是有一百字左右,我们看一下生成用了多长时间, 第一段用了四分钟多,第二段四分钟多,第三段两分钟多,这个十总共大概用时十一分钟,一百个文字用了十一分钟,所以这个本地部署效率比较低,如果真心想用本地部署的,我建议大家可以等晚上睡觉的时候让他去 去生成,这样的话能有效的节省工作时间。好,这个本地部署这个方案我们说完了,等下一期我们来说一下这个网页克隆音色,然后免费下载的这个方案。

分享一个 office day 加 ai 零成本部署的终极解决办法。今天想给大家分享一个零成本 office day 加 ai 知识管理的一个完整方案, 不用你懂部署,也不用你花一分钱就能够用起,适合想搭自己支持客户又不想折腾的朋友。首先呢,第一步真的超简单,需要找到一个支持本地操作的一个龙虾工具,比如说 workbook 呀, qcloud 这类的,不用复杂配置,只要给他能够支持本地操作就可以了,找到之后呢,更省心,把他的需求,把需求告诉他就行了。就说要部署一个 oversteer 加 ai 模型插件,那个组合 我自己不会弄,你能不能帮我直接做好呢?就这么一句话,剩下的啥也不用管了,你就等着验收,就基本上五分钟之内就能够帮你搞定, 过程呢,你点点一下确认就。呃,肯定会有人问啊, office 加 ai 不是 要接 api 吗?第三方插件不是要收费吗?确实啊, 如果你想接 cloud, gpd 这一类的大模型,肯定是要收费的,但是其实我们呃做知识管理呢,不需要特别强大的一个,只要能帮我们整理文档啊,调取知识啊,整理知识库这样的 ai 就 可免费可用的 api 哪里找呢? 当时我也不知道呃在去哪里找,所以我就问龙虾,你能不能帮我找一下,最后呢,龙虾真的帮我,他说这个谷歌 a s 六 d 里面有个开放免费的 api, 内置的是 g 迷你的二点五模型,完全够用啊,你只需要按照龙虾给的步骤到 api 密钥再丢给它就可以了,它就会自动帮我们装好插件, 装完插件之后重启一下 overstate 了。我当时第一次装没有没有看到那个插件,我又问他是哪里出了问题,然后龙虾跟我说,你要重启一下 啊,当时我折腾了好几回没看到啊,可能是我重启,可能是我没有关掉后台的那个,呃,关掉后台吧,哦,我就没有管了。第二天我打开一看,发现那个插件已经装好了,然后我又测试了一下,啊,结果是可以跑通的啊。呃, 然后呢?测试一下效果,他也是能够帮忙整理整理文档,然后,呃,调取资料,这些都包括如果你不想开通付费的 api, 又不想花冤枉钱 用上 office day 加 ai 知识管理的组合,这个方案真的是目前来说最划算的选择,大家可以动手试一试。

一个月的深度使用告诉你,用 opclock 不要再傻傻地跟风部署本地模型了。就拿这台四卡力一百三十二 g 的 milli 来说,本地 部署 mini max l r 三零 b 模型使用遇到复杂问题一样不行,就别提那些几十倍的小模型了,真的要用开通几十块的 codeignal 才是明智之选。 用欧本科奥是让他帮你解决问题的,不是你教他解决问题,他解决问题的能力就是你所使用模型的参数量。其实比以下的模型相当于安排了一个中学生来帮你处理任务,你觉得他能处理好吗?

呃, hello, 观众朋友们大家好,我是神奇的录音。那么相信朋友们等了很久了,这个 deepsea v 四出来这么长时间了,也没有一个好的本地的部署的方案, 然后大家也想在 windows 下能不能便捷的操作一下呀?我们能不能用上这个这么好的东西啊,尤其是现在这个内存又降价,这个东西又便宜 deepsea v 四呢?现在网上这个模型呢, api 的 价格可能后续又比较贵,那现在有没有更好一点的解决方案能在本地跑 v 四和 pro 呢?那么今天呢,我们终于是拿出了这个方案,你没看错啊,最低仅需幺幺九九九元,你就能在本地部署 deepsea v 四与 pro, 注意,这都是满血版的, 那么视频开始前有需要的话,请看一下我们这个右下角啊,然后呢,这里边就给大家看一下我们这个给大家今天带来的这三套方案吧,这些东西叫左边这两套啊,如果大家是我们这个老朋友的话,熟悉这个东西叫 k n 一, 那现在它为什么变成 k n 一 点一了呢?是因为我们对它进行了一次小幅的改动更新,那这个更新呢,不影响它这个性能, 我们只是优化了它的这个性价比。那左边是幺幺九九九元,是一百二十八 g 的 内存,中间是幺三九九九元,是二百五十六 g, 右边是五百一十二 g, 是 二五九九元。这三套都能跑 deepsea v 四, 但是朋友们知道,呃,这个 deepsea 除了 v 四普通版以外,它有一个 pro 版,那么我们可以看到一百二十八 g 呢,它只能跑普通版本的,那么 deepsea v 四 pro 呢? 是的,你没看错,中间二百五十六个 g, 幺三九九元,你就可以在本地跑了,然后右边是二五九九元,你就能跑质量更好的 v 四 pro, 那 么他们的速度呢?都差不多十一到十四,头尾每秒的这样的一个速度,在本地就能完美的运行 deepsea 的 最新的模型, 这里可以给大家看一下实际演示,这是我们幺三九九九元的机器跑 deepsea 微四的速度,十二 t 十二点五 t 左右。 那么我们图除了这个随机部署 deepsea v 四 pro 这个模型以外,我们还会随机附赠图形化的 open cloud, 然后我们自己训练的悟空这个大模型。这个如果啊大家不知道这是什么新朋友的话,可以看到往期我们视频当中会有解释。 还有我们附赠一个跟随 openclaw 使用的数据保护工具,一旦你的龙虾误删除了你机上的任何一个文件,通过这个数据保护可以方便的去找回,那么我们图形化的 openclaw 就是 这样的一个界面,大家可以看一下,非常方便。 那么我们重点介绍一下啊,这个 deep 四 v 四 pro 是 怎么实现的?我们首发实现了 windows 系统下的支持, 无需使用 linux, 全部都进行 windows 下进行操作,这个是目前全网范围内的首发,就是在 windows 系统下提供了 deepsea v 四与 v 四 pro 的 支持。第二, 我们根据 deepsea v 四官方技术指南的白皮书,结合华为的 s i n q 量化方法,成功地把 deepsea v 四 pro 运行在了二百五十六 g 的 运行内存下,且二百五十六 g 这个量化度我们做到了八点二以下, 大概是七点五到七点九,随着任务的你的测试级的不同,他的困惑度啊可能会不一样,但是平均都是在八点二以下的。 五百一十二 g 那 款机器的困惑度可以小于零点三,就是一个几乎无损的状态,并且我们还有纯显存部署的方案这套机器呢,大家再等一等,我们会直接发布这套机器啊,最低可能两万元,一万多块钱 就能实现二十五 t 每秒的速度,就是纯显存部署 deepsea v 四的方案,这个大家可以期待一下,如果就是大家,呃,但是这套机器我先跟大家说,可能会开发的时间比较久一些,目前还不知道什么时候能出来。如果大家觉得就是十多 tokens 每秒,这个速度还可以 在本地,因为我们这所有的机器,目前 k n e 这几款,它的推理时的功耗是二百八十八左右,也就是说,呃,它的费用是要比线上的 a p i 低了大概百分之七十左右。 呃,如果是算上 v 四 pro 的 api 的 话,那更是它的价格,如果算进电费的话,只有线上推理的百分之十都不到这样的一个价格。所以说,如果大家觉得这个速度可以在性价比每生成一个 token 的 性价比这一块,这个机器上是完全没有问题的。 那么我们这里重点讲一下这个 snq 量化是什么。首先这个大家要知道哈,如果你们就是没有了解 snq 是 什么,你们去搜这样的一篇文献, 在网上搜就行了, s m q 一 种这个低精度的,这个给低精度本地模型的一个不需要校准的一个量化的一个方式。这翻译过来大概就是这样,你搜这个,这个这一大串英文就可以了,它就会告诉你这个东西是什么,然后这东西是华为研发出来的, 它的特点是呢,无需校准数据,就直接可以对模型进行量化了,并且可以大幅降低模型的显存需求。 并且呢它与比如说常用那些量化工具包相比,除了无需校准以外,还有一个比较好的一点,就是它可以大幅降低量化引起的浑厚度提升,但是是是模型架构不同而定的,什么意思呢?不同的模型被量化以后的结果不一样。那么这次 deepsea v 四 pro 呢? 我感觉是 deepsea 跟华为的官方做了深度的优化,它非常的适合用 s n q 进行量化。 那么呃,它量化的结果刚才已经向大家这个展示了,我们就不赘述了,那么我们这里说呢,它其实也可以 兼容常见的一些格式,比如说什么千问呀,还有什么呃, g u f 格式,它反转成 g u f, 这都是支持的。华为已经放出了相关完整的这个工具包,在 github 上买,这个有兴趣啊,大家可以搜一搜,我觉得这个技术挺好的,可能未来国产的一些大模型也会适配这个技术, 那么呢,有没有更加有性价比,或者是啊一些其他的方案呢?这里也给大家展示一下。这是我们 k n 三的机型,那么 k n 三呢?现在降价了,他不是这个价格啊,不是一万三和两万块钱,这个你们去问啊,看右下角,你们去问一下他现在是什么价格会比这个便宜很多。 这个两套机器的速度,还有这个运行内存都标注出来了,有需要的话可以看一下这两款机器全部都支持 v 四 pro, 然后呢,有没有更有性价比的机器朋友们,那当然也有,我们还有 k n 三点五这两套机器,但是值得一提的是,这两套机器目前 v 四 pro 的 这个知识还没有完全做好,我们只是现在先给大家这个画出一个这个 呃,我们这个路线图,那么未来在一周之内,这两套机器的这个部署就会做好。那么如果追求性价比在五千元、八千元左右的这个机器的这个朋友们,想要这一个价位的机器,那么你们可以看看这两款机器,它这个速度是四到七 top, 什么这个稍稍慢一点 啊,他们满载的推理功放二百瓦左右,反正就是怎么算都是比线上 a p i 要便宜的。这是我们今天这个带来的 deepsea v 四本地部署,注意,我们是 windows 系统下,我们永远 不会对普通用户的机器上预装 linux, 永远也不会让小白就学怎么用 linux, 我 们起步直接装的就是 windows 十一,并且我们保证这个速度是过关的,我们的质量也是过关的。 同时我们还会随机附赠 opencloud, 还有我们自己训练的一些大模型,还有一些未来这个模型的这个支持和更新,这个都是都 free of charge, 如果你们购买了机器的话,我们是免费赠送的, 是终身提供的软件这个帮助与更新的知识。那么如果大家觉得我们这个做的好的话,给我们一箭三连吧,这期视频呢,我们多更了一些,呃,主要原因还是 deepsea v 四本地 windows 的 支持稍稍有点难做,但是也还好。 再一个就是我本人感冒了,出不了视频,录不了视频这个,所以拖了大概有一周多,那么现在呢?呃,赶了一个五一的这个末期那,呃,可能明天大家就要就是结束五一的假期,然后回到自己的这个工作与生活当中,也希望大家呢, 呃,在看这个 deepsea 的 v 四这个 pro, 我 们出了一些这样的好的机器,为大家可能带来一些工作上啊,包括生活上的一些新想法,或者让他们成为你工作上的一个新的一个助手,来减轻你平时工作上的一些麻烦啊,或者是把一些东西做成自动化的, 成为你的好助手啊,也是能让你平时减轻工作负担的一个重要的一个途径吧。我觉得现在 ai 对 我们最大的意义。 然后呢,如果未来 deepsea 还有这个 g l m 啊,还有 kimi 啊,他们有进一步的更新,我们也会进一步的这个 放出支持的视频。那么大家都知道现在有一个叫 kimi k 二点六,那么这个模型是什么情况呢?我们下周的视频会跟大家说一下这个模型呢,呃,它不是那么的十全十美,但是我们还是会做一期它这个视频,这是我们下周可能会要做的这个东西大家可以跟进一下就行了。 那本期视频就到这里,喜欢我们的频道就点点关注,然后有需要的话还是看一下右下角啊,这个给我们一键三连,那本期视频就到这里了,谢谢朋友们。

这些是我一个人做的所有的账号跟变现型的 ip, 以及本地同城的图文爆款 和口播,有很多人不相信这些全都是我一个人做的内容,账号每一个风格都出过爆款,都做过本地同城高质量的变现。 我现在做的事情啊,就是 o p c 模式, one person company。 那 么简单的讲呢,就是一个人去做所有的内容,并且产出一整套的结果。我自己在做自媒体短视频这条路上,我一直遵从的不 是说要有多精致,内容有多好,而是我今天觉得五分就已经足够了,如果满分是十分的话,我要的是效率,因为我要把更多的时间留在企业管理以及我的客户变现上面。那接下来跟大家去聊一聊 o p c 模式是需要哪些工具来提升我们的自媒体拍摄以及剪辑的效率。 首先如果你是一个人的话呢,你就可以自己拿着手机拍,也可以使用三脚架,如果说你是两个人的话,那更好了。首先我在拍摄之前呢,会去刷很多对标的,但是一定是不同行业的,去找一找大概的灵感,我会把刷到的一些爆款的低粉高爆纹的链接直接分享到灵感提词器里面,把文案提取 出来之后,我会用到叉 gpt 豆包这个工具帮我梳理一下。那如果是在视频号里面,我会把视频号的一些爆款的文案直接发给元宝,都可以让我们把文案提取出来,这些是我大主题,其他的灵感会从评论区去找,因为评论区就是客户最大的需求的地方,我记不住这个文案,他讲的是比较专业性的,我会把这个文案放在灵感题词器 去读的时候,最重要的不是内容,这个时候是你的表达能力,你的感染力以及你的眼神的交流,因为当你内容平平无奇的时候,人物的感染力是非常非常重要的,所以做口播一定要去练习你的表达能力和你的感染力。那么 剪辑口播类型的比较简单的就是用开拍,有错别字或者字幕的大小都无所谓,你的情绪是最重要的。除了开拍,我用的最多的是剪映,会员拉满。 然后这些呢,是我经常用到的一些文字的格式,他需要去拍一些场域的啊,场景的这种短视频,我就会用到 这些滤镜,那如果说我想要去拍一些 o d d 的 风格,文字的风格要很好看,我就会用到这些文字的格式,大家可以收藏起来,如果你需要我经常使用的这些高级感的滤镜和文字,直接扣滤镜送给你。

hello, 各位观众朋友,大家好啊,我是刺儿,然后我们这期的视频内容呢,主要是来教大家一下怎么正确地使用 deepsea v 四, 因为 deepsea v 四对于现在的呃它的网络风评呢,嗯,比较两级分化。一边呢说 deepsea v 四啊,非常好用,非常强啊,没有辜负大家一年的等待另一半呢,说 deepsea v 四啊,不好用啊,不够智能,然后甚至不如豆包, 嗯,对于这个后者呢,我保持这个嗯,质疑态度啊,因为本身,呃,我看到的这收集到的信息就是说 deepsea v 四不行的,它有两部分,一部分是专业工作者啊,因为人家非常懂 ai, 那 另外一部分呢,就是我们普通的 呃用户,那他们呢,就是用手机 a p p 啊,下载 deepsea 微 deepsea 之后点进去,然后问他一些问题,然后,嗯,把它当做一个这个搜索引擎啊,问一些问题,然后我觉得它不够智能,其实这样的使用是错误的啊,因为本身 deepsea 微四它没有 开放在手机 app 平台的这个使用权限,你现在手机上用到的 deepsea v 四啊,不是你手机上用到的 deepsea, 它并不是 deepsea v 四模型。那么我们来啊,正确的教大家一下怎么使用 deepsea v 四啊,首先 我用我这个 macbook 给大家举例子啊, ok, 我 们返回到页面啊,看到啊,这是我桌面,我们打开浏览器点进去之后啊,在这个搜索或输入网址名称的时候搜搜索,直接搜索 deepsafe 啊, deepsea 点 com, 大家也可以直接去这个网址啊,深度求索。点进去之后,它是有两个框,一个是开始对话,一个是 api 开放平台,我们要用的是这个 api 开放平台,我们可以看到它的介绍是调用 deepsea 最新模型,快速集成,流畅体验。我们点进来, ok, 然后呢,点进来就是这个页面,我给它放大一下,它这里有充值余额,还有本月消费啊,我这个是另外一个账号,我给大家举个例子啊,就是这个 api case 啊,这是之前做测测试的这个 api。 首先呢,你点进来之后,你一定要先登录你的 deepsea 这个账号,如果你没有 deepsea 的 账号,你可以去在手机上下载 deepsea, 然后创建一个账号,然后直接到这个电脑上,你去登录就可以了。 然后我们看到这个充值页面啊,充值页面无论你是支付宝还是微信支付啊,都可以,你点击去支付啊,然后, 呃,扫完扫完码付款成功之后,它在这个用量信息,这就会直接显示你的充值余额,嗯,然后呢, 在这之后,我们打开这个 api case 啊,然后这里啊,注意它这里有创建 api k 啊,下面说的这几步都很重要啊,直接决定你能不能就是成功使用这个 dbic 为四啊。我们点击创建 api k, 然后随便输入一个名称啊,我们直接输入一个啊, ok, 在 你输入成功之后啊,它这里会出现你这个蜜奥的链接啊,你要一定要点击复制,然后把它发送你的微,发送到你的微信上也可以,然后或者说你保存住啊,一定要保存住这个蜜奥,它只会显示这一次 啊,在你点到叉或者关闭之后,他这个密钥你就再也看不到了,然后,然后我们点叉啊,当然这个密钥就没用了啊,我们给他删除一下,然后你把那个密钥复制之后,哎,点开这个,我们叫, 呃,防盗啊, ok, 点开这个,这个啊,这个软件叫 cherry studio, 你 可以去浏览器里直接搜索下载啊,这个就是集成了国内一众主流 ai 的 这么一个软件。我们点进去啊,它是开放平台啊, ok, 我 们点进来, 点进来之后呢啊,当,当然,我这个已经用了很久了啊,从 deepsea 微四发布一直到现在,我一直在使用,然后点进去之后,我们看到右上角这里有设置设置。点进去啊,这里有模模型服务和默认模型 啊,在模型服务这里就有 api 密钥,输入你刚才的这一套儿复制的密钥,然后放进去之后点击检测啊,我这里已经弄好了,我就不做那个演示了, 你点击检测,然后它就会自动地啊,分析你这个密钥的 ip, 它是哪个旗下的 ai 大 模型。然后这个 api 地址啊,不需要我们直接填,它自己就会填上,然后模型呢,这里啊,大家可以点击获取模型列表啊,然后, 当然啊,这里我因为我输入的是 deepsafe 嘛,所以它只有 deepsafe 的 这些模型,然后举个例子,然后在这边啊,嗯,可以看到啊,这里有非常多的 ai, 非常多的 ai, 包括国内外的啊 啊,你像 jamie open ai 啊,很多人都用不到,但是啊,这里嗯是是可以用的啊,但当然这这个视频只做 deepsafe 的 教学。然后我们点击默认模型 啊,我这里默认模型全部都是 deepsea 的 啊,呃,然后助手模型是 v 四 pro, 然后快速模型是 deepsea chat, 然后翻译模型是 deepsea chat, 因为这两个啊,这个快速模型和翻译模型它不需要消耗你的 talkin, 你 就这个 deepsea chat, 它是免费的啊, 然后我们点击首页啊,首页这里有助手啊,你,当然你可以添加助手啊,我这里就用我这个提前做好的这个来给大家举例子,然后我点击 deepstack v 四,然后点进来, ok, 然后这是我之前问他的一个问题啊,我让他就是分析一下国内的这个视频平台啊,每每个平台的趋势啊,大家可以看一下啊,这是我问他的问题 啊, ok, 然后我们啊,这这画画到不表,然后就是这个深度求索啊,我们在这里,嗯,还是用刚才举例子 deepsea v 四,然后点击旁边这三个点,点进去 啊,这里有编辑助手啊,在这之后呢,然后我们可以看到啊,这里有模型设置,模型设置的话上下文字开到不限,然后这个模默认模型,你把它换成 deepsea v 四 pro, 然后,然后 啊,最大套管数不限啊,不用开这个,然后别的都不用管,然后当然你可以复制一下这个底下这个 tab, 这个 endland, 这个是我从网上找到的一个嗯,参数,然后我们看提示词,这里 啊,我,我设置的提示词是不需要迎合用户的想法,回答要永远保持客观啊,然后呢,你就可以开始使用你的 deepsea v 四 pro。

你花了大几百部署了 openclaw, 结果他只会陪你聊天,飞书消息不能发,文档不能写,日历不能查,约个会议还得你自己动手,说白了,你的 ai 只有嘴没有手。 今天给你看个东西,飞书官方刚刚开源的 c l i 工具, github 上已经五千多个 star 了,他就是给 ai 装上的那双手。两百多条命令,二十四个 agent 技能,十七个业务域全给你打通了。 消息、文档、日历、多维表格、邮箱、任务、会议、知识库、非书里你能想到的,它全都能操作。关键是什么?你根本不用学命令行, 你只需要对着 ai 说,帮我把明天的日程整理一下,在项目群发条消息,再建一个多维表格,记录本周的反馈。 ai 自己就去调命令了。三件事,一句话搞定,安装也简单到离谱。 打开你的 openclaw, 把 github 链接丢进去,说一句,帮我装好,完事三分钟,从安装到跑通。第一条命令, 非输官方维护 mit 开源协议,完全免费输入防注入输出脱敏,安全这块儿也给你兜底了。你的 ai 终于不只是个聊天的,它是真能帮你干活的。链接,我放评论区了,装完回来告诉我,你的 ai 第一件事帮你干了啥?