粉丝39获赞839

部署本地的 openclaw 已经可以剪视频了,大家都知道了吧, 这个让硅谷大佬每日一封的 openclaw 阿月,我呢也是拉到本地试了几天,现在就带大家把本地部署和接入飞书每一步都走明白。为了防止偶然性啊,我呢也是连续测试了四台电脑,确保每一步都可行,接下来你们只要跟着做就可以。点好关注收藏, 我这里依旧用的是 windows 系统来操作,因为 macos 系统呢,环境相对比较简单,不像 windows 这么复杂。首先呢,我们要确认好 windows 的 安装环境,安装的时候呢,全部都点 next, 一 直到完成即可,建议呢,不要去变更中间的安装路径。 呃,安装完成后呢,我们可以检查一下环境,我们在命令提示符的窗口输入这两个指令,如果输入指令后跳出版本号,那就说明安装已经成功了。这里提到的两个环境文件呢,我在文档里面也全部都准备好了。 好,接下来呢,我们就开始全区安装 oppo 卡使用管理员 c m d 指令输入,这个指令安装完毕后呢,再输入这一条指令, 好开始了。 ok, 这一步跳出来的呢是风险提示,我们直接选择 yes。 然后呢我们选择 quickstart, 这一步呢是选择大模型,我这里呢用的是千万,因为他是国内的,如果大家有惯用的呢,也可以自己进行勾选好,然后我们这里模型选择默认的即可。 之后呢会跳转到大模型的首页进行授权验证,大家验证通过就可以了。那通过后呢,这里也同样有一个选项,我们直接选第一个默认的模型。 ok, 下一步呢,这里可以看到很多的应用选项,这其实呢就是指令输入的终端,因为这些都是国外的,所以我们先不管,选最后一个,跳过,后面呢我会给大家介绍如何接入国内的飞书。 ok, 继续,这里会问你需要配置什么 skills? 呃,我们也跳过,没问题,因为这个不着急,后面都可以手动去配置的。 好,这个也不用管我们用不上,直接跳过。好,然后我们稍等一会,会自动弹出一个网页,然后你会发现这个网页是打不开的,没关系,我们这个时候呢,再运行一个 c m d 的 指令, 好,这就是欧奔 cloud 的 兑换框了,我们来尝试和他打个招呼, ok, 他 回复我了,那到这里呢,其实基本上就成功了,还是比较简单的啊。然后呢,我们再来尝试为大家接入一下飞书,很多小伙伴呢,在这一步呢,其实就被劝退了,因为怎么样都接入不了这里,大家看好我怎么操作。 首先呢,我们进入飞书的开放平台,我这里呢用的是个人版,我们来创建一个企业自建应用, 进到这个凭证与基础信息界面,把你的 app id 和密钥保存下来,这个很重要啊,后面会用到的。然后 我们添加一个机器人,再到权限管理这一步,为他添加一些权限。这里的权限列表呢,其实官方呢是有指导文件的,但是呢就藏的比较深,我呢也是给你们找出来,直接放到文档里面了,你们直接一键复制过来就 ok。 好,然后我们需要配置一下这个事件回调功能,在这里的订阅方式选择长链接这一步呢是必须的,而且是绕不开的,也是大家碰到卡点最多的一步,很多小伙伴呢在这里呢就是一直报错,好,不用担心,我呢,已经整理了一份非常长的傻瓜教程,大家直接照做就 ok 了。 然后选择以后呢,我们添加事件,然后添加搜索接收消息, ok, 然后我们就去点击创建应用,然后再发布就 ok 了。 好了,配置工作完成之后呢,我们就要开始给欧邦克劳接入飞速杀键了。由于 windows 的 系统环境问题呢,所以大家的电脑情况都不太一样,所以会出现不一样的报错问题。网上的很多视频呢,也没有把这个问题针对性的讲清楚,我自己呢也试了三到四台电脑来做尝试,都非常有挑战。 如果你手边也报错的话呢,不用担心,我这里想到了一个邪修的办法。好,那既然 oppo klo 可以 控制我的电脑,那为什么他不能自己安装飞出插件呢?我们来试试看吧,直接和他对话。呃,你自己安装一下飞出插件,然后呢,他就会开始疯狂的工作,并自行去验证安装环境和插件配置 啊。五分钟左右后呢,他就会告诉我,他工作完成了,需要我提供给到他飞出机器人的 app id 和密钥。这个呢,其实我们在上一步已经有了,我们直接复制给他,让他呢继续去工作。这里的工作过程当中呢,我们的机器人可能会下线几次,原因呢是他需要去重启网关, 如果呢,你感觉他下线太久的话呢,我们可以用 open cloud get away 这个指令重新把它呼出来。最后呢,他会要求你在飞车上和他对话进行测试,并为你排除最终的一些故障。 ok, 全部搞定,已经可以在飞车上正确回复我了,并且呢,刚才在外部的对话记录他也全部都记得, 呃,我们这里呢,再用手机给他发一条消息试试看。好,他也同样接受成功了。好了,这里欧本卡接入飞书的配置呢,就完全对接成功,基本上都是他自己完成的,我呢只是配合他提供了一些必要的信息, 妥妥的全能小助理。接下来我们来看看他能为我们做一些什么吧。比如呢,我现在想要订一张机票,我就让他帮我查询一下最便宜的航班,他立刻就给我列了具体的信息,包括航班号,价格以及其他的一些航班信息。不过这一步呢,是需要接入 api 的, 大家可以自行去网上找免费的接入就可以。 好,那现在过年了嘛,马上大家呢也会送礼嘛,那我就让他去浏览电商的页面。呃,不过这里呢,需要先安装一个 oppo club 官方的浏览器插件,我们直接从官方渠道进行安装就可以了。具体的步骤呢,已经放在文档里了,大家直接照做就可以。我让他给我打开。 ok, 成功,呃,然后我继续让他为我搜索燕窝。好,也成功了。 好,那我们现在在拿最近小伙伴在学习的 ai 的 线上作业丢给欧本克,看他能不能帮忙完成。 首先我们要让他找到作业的本地目录,并让他完成里面的题目。他立刻就找到了,并且迅速告诉我,完成了。啊,这速度还是真的蛮快的啊,但是呢,人呢,还是比较懒的。如果呢,你抄作业都不想抄啊?没事,直接让他把填完的东西返回给我。好,他已经做完了,我们来看看啊。 呃,代码呢?全部都完成了,不过呢,我也是看不懂啊。看懂的高手可以来说说他完成的这个准确率怎么样。 好了,那这次安装说明就先讲到这里了,关于 open cloud 的 更多能力,有时间呢我们可以再去测一下。好,那既然已经部署成功了,有兴趣的同学呢,也可以再去深度探索一下 啊。对了,现在呢,各大厂呢,也出了针对 open cloud 的 云端部署,我这个呢,也可以跟大家快速的分享一起。好,这里是阿月,希望我的视频能够帮助到你,让你更了解呀,我们下期再见。

今天来给大家算笔账,就是本地模型,他就是一个大坑,上次发了一个本地部署大模型的一个视频,引起大家讨论,发现大家对本地部署大模型这件事情还非常感兴趣的,但是我想说的是,你可以感兴趣,但你不要特别感兴趣。好吧,我给你算笔账你就知道了。 假如说你是一个 ai 的 爱好者,你一不小心花了三万六千元买一部最新的 m max, 一 百二十八 g 两 tb 的 十四寸的 macbook, 然后准备去跑大模型了,然后你部署了一个最新的 deepsea v 四 flash 的 量化版本, ok, 你 的产出到底是多少呢? 首先这个量化版本一下子会干掉你,一百多 g 的 内存可以与 m max 芯片超强的带宽,那你基本上可以达到一个八十多个每秒的速度,这已经相当的快了这本地部署的环境啊。 然后我们再来算一下,一天二十四小时八万六千四百秒不间断连续运行,能够产出多少头肯呢?答案是六百九十一万头肯。 那这七百万的头肯市值是多少呢?我们按 deepsea v 四 fly 是 按百分之九十的缓存命中的这个量来算,大概一百万是两块钱的,你七百万就剩十四块钱, 所以你花三万六千块钱去买这台电脑,然后本地部署,让他在本地跑这个大模型,他一天的产出就是十四块钱,你要回本的话,就需要需要多少钱? 需要七年零一个月,怎么样?回本还是蛮快的吧。 所以最后的结论是,你的数据如果有绝对的隐私需求,或者是私有化的需求的话,就当我没说过,如果没有这种需求,不要去跑本地模型啦,解 a p i 吧。

今天来做一个二零二六年至今的 ar 大 模型本地部署全科普,跟大家讲明白到底什么人要做本地部署,什么行业适配本地部署,什么硬件匹配,什么样的本地部署需求,这些在这一期都有答案。 在这一期,社长会按照模型分类、硬件门槛、设备适配、部署目的,理性选型这个顺序,一步一步化解大家的本地部署焦虑,也平息一下评论区无穷无尽的争论。每次看到这个评论区,我脑子里面就是这段画面,七个中队,七个中队 好像手里有七个中队就可以暴打天下了。为什么会造成这种情况呢?社长大概是知道原因的,因为多数人会把大模型和 deepsea、 千问划等号。其实现在的主流大模型按功能已经分化出了五个大类。第一类也是本地部署中最常见的类型,叫上下文推理模型, 它的核心作用是处理文本相关的任务,从日常对话、文档总结到代码编辑、法律、医疗检测、销售、文本解析都靠它。特点是侧重逻辑推理,对视觉音频处理能力弱,也是硬件门槛跨度最大的一类。 正因为他的硬件门槛跨度大,所以他也成为了评论区炒翻天的元凶。关于硬件门槛的问题,社长等一下会展开来说。这里先介绍模型分类,上下文推理模型,国内的有这些,我罗列在了左边,国外的有这些,我罗列在了右边,需要详细了解的可以暂停观看。 第二类是纹身图,纹身视频模型,这类模型侧重视觉内容生成,纹身图门槛相对较低,纹身视频门槛较高,对算力显存要求更苛刻。目前国内主流的模型如下,第三类是声音合成配音模型, have you forgotten who promoted you to this position and who did everything? 这类模型侧重音频生成,分为通用配音和专业配音两种,门槛跨度比较大,轻量版可以个人部署,专业版需要企业级硬件。 第四类是多胞态融合模型,这类模型是全能型悬设,可以处理多种任务类型,但硬件门槛普遍比较高,大多适合企业部署, 后续如果推出轻量版的话,也可以个人尝试一下。第五类是行业垂直模型,这类模型是二零二六年本地部署的热点, 针对性极强,仅适配于特定行业,大多需要付费授权,部分开源模型可以自定义微调。当然,这类模型针对的也不是普通人或普通企业,就不展开说了。接下来就讲讲大家比较关心的硬件门槛问题。 为什么有的模型能用洋垃圾搞定,比如好几年前的特斯拉 v, 一 百显卡,旧的 cpu 什么的,有的却必须上顶级配置。 市长从技术底层拆解一下,结合二零二六年模型的特性,讲一讲核心逻辑,再补充一些特殊硬件门槛模型。先明确一个核心前提,大模型本地部署的硬件门槛取决于模型参数、规模、计算精度和任务类型三个方面。这个很好理解,参数越多,显存或内存的需求就越大, 量化精度越低,硬件要求就越低。任务类型的现在一般分为生成类和推理类,生成类比推理类更耗算力。如果你只是上下文推理,而且对于上下文的长度要求不高,这就给了洋垃圾生存的空间。 以特斯拉 v 一 百十六 g 显卡为例,它的 f p 十六算力只有一百二十五 taylor flops, 放在二零二六年性能远不如 rtx 四零九零五零九零 a 一 百这些显卡。但首先,常文本推理的核心是上下文窗口的 talking 处理,侧重显存占用控制,而不是瞬时算力爆发, 计算过程是逐个 talking 推理,所以单次计算量不大。其次,二零二六年的长文本推理模型,无论是采用 m o e 架构优化,还是基于琳尼尔架构做优化,都大幅降低了对显卡算力和显存的需求。因此,基于这两点的 v 一 百显卡才能顺利上港。 那纹身视频模型为什么不能用特斯拉 v 一 百这类显卡?纹身视频是目前本地部署门槛相对高的模型类型,哪怕是轻量版生成十秒视频, 也几乎无法用 v 一 百流畅运行。这主要是两个方面的原因,一是纹身视频需要逐帧生成,加帧间连贯性优化, 单次计算量是纹身图的几十倍甚至上百倍,这种瞬时的算力爆发,不是 v 一 百这类显卡能够撑得住的。二是二零二六年主流纹身视频模型都要依赖 tensor core 核心,用于光线追踪、帧间融合, 而 v 一 百类显卡的 tensor core 核心性能薄弱,无法适配模型的核心优化,即使强行部署,生成的视频也会出现帧断裂、模糊、色彩失帧这些情况,失去实用价值。 除了上面提到的显卡硬件门槛,还有一些特殊硬件门槛模型,比如专业声音合成配音模型,这种模型的核心门槛除了看显卡之外,对 cpu 和内存的要求也比较高。再比如多模态融合模型,需要大显存的多卡系统加大容量内存。 其他还有些特殊门槛的行业垂直模型,和我们普通人相隔较远,就不一一列举了。那哪些模型能用个人电脑或者洋垃圾搞定呢? 哪些必须上好的配置呢?接下来社长就按使用场景加硬件成本谈一下设备适配的问题,再来给大家明确一下个人、中小企业、大型企业分别适合哪些模型,避免大家盲目跟风配硬件。 首先是个人电脑或者洋垃圾可以搞定的模型类型,依次是上下文推理模型、纹身图模型、声音合成配音模型,这几类模型用个人电脑就能轻松搞定, cpu 最低 i 七八七零零 k e 三二六六六 v 三,显卡最低特斯拉为一百十六 g r t x 三零六零十二 g, 内存三十二 g ddr 四硬盘最低五百一十二 g, 固态总投入甚至低于五千块钱,可谓是花小钱办大事的典范了。 然后是必须上好配置的模型,依次是纹身视频模型、多模态融合模型、行业垂直模型、专业声音合成配音模型,适合企业、专业工作室重度需求者的需求。企业是追求时间、效率和稳定性的, 谁也不愿意看到工作交给 ai 后, ai 也干不完,还老出问题,那就太耽误事了。比如社长最近对接的一个项目, 要求一天要转一千小时的语音,转文字最好控制在八小时以内完成,这样这台机器白天可以用来跑十人并发的大模型,晚上用来语音转文字, 这就相当于基本上让他二十四小时不停歇的干活了。这种配置那必须要上好的,如果他撂挑子不干了,工作就落下了,损失的可就不只是工作量那么简单了。企业级配置基本上都是三万起, 而且最近因为内存硬盘、显卡涨价,随便配一下都要四万加了。所以无论是企业或者个人,如果不是有明确的部署目的, 不要轻易来找社长配机器,因为这里面不只是硬件的投入,还有后续软件开发部署的成本、操作机器的学习成本,这些都是必不可少的支出。至于机器硬件配置,社长就不展开了,前面的视频也都有讲解,有兴趣的可以翻一下前面的作品。 下面就来说一说评论区说的最多的争论其实没有绝对的好坏,核心是模型适配,不同设备有自己的适配场景,也有明确的局限性。 a m x 三九五、苹果 mac mini 与英伟达 d g x 基本上可以归类为个人轻量企业级 ai 整机方案,它们都支持上下文推理与轻量纹身图,但纹身视频能力差异显著。 ai max 三九五和 mac mini 仅能跑低分辨率,轻量纹身视频对于重度高覆盖场景效率不足, d g x 则可以流畅运行全类型纹身视频适配。专业创作与企业高覆盖需求。三者核心差异在于 tensor core 的 支持算力规模与内存扩展能力, 需按需选型,毕竟对于一个靠 ai 短视频获得收益的创作者来说,一天发一条视频和一周发一条视频还是有很大区别的。 标准塔式主机确实看起来很笨重,它的核心优势是可升级,支持多卡兼容,性能强劲, 搭配不同的硬件就可以适配市面上所有模型的显存和算力,需求,能力比较全面。随着模型需求的增加,还可以通过升级 cpu、 内存、显存、硬盘来进行适配。当然,它也有它的缺点,体积大、功耗高、成本高。对于个人来说,性能过剩了, 所以没有最优的设备,只有最适配的设备,争论谁更好没有意义。核心看你要部署什么模型,满足什么需求。 最后,社长要说的是理性选型的问题。对于个人,如果你对于大模型没有明确的使用需求,可以先从个人电脑洋垃圾开始进行低成本尝试,慢慢发现硬件配置跟不上了,再向更好的硬件迈进。 对于企业,同样也要有明确的需求,比如采用云端的方案,要支付高额的 talkin 费用,那你就可以选择本地部署,通过一次性的硬件投入来降低成本。 比如你是敏感行业,很看重数据安全,本地部署就是你的合适选择。比如你的企业在生产环节或是业务环节需要大模型来代替人力工作,同样可以选择本地部署。如果你只是要写写文档、计划书啥的, 也不涉及到啥秘密,在线的就挺好的,完全不需要折腾本地部署大模型了。如果你还没有明确需求,单纯好奇,那更没有必要本地部署,即使配了机器,大概率也是在配完之后用过几次就闲置了。 希望大家理性选型,按需部署,不盲目跟风,不刻意贬低别人,根据自己的需求预算选择最适合自己的方案才是大模型本地部署的核心意义。毕竟技术的价值从来不是追求高端,而是解决问题。 另外有很多人真的是单纯好奇,私信我,我还要花很长时间科普,有时候一下子半天就过去了。还有很多人自己都没想好需求是什么,就跑过来说要做大模型本地部署,这也基本上问着问着就没啥下文了。社长毕竟也有工作要做,所以想要咨询的朋友们先明确自己的需求,避免浪费彼此的时间哦。

我建议所有使用 cloud bot 的 朋友们不要在本地部署大模型。很多人都说 cloud bot 呢,让 ai 可以 去操作你的电脑,这个听起来是很好的,尤其是呢,那些很注重安全的公司,他们会想方设法的在自己电脑上去 部署一个本地的大模型,那么这个样子呢,就把所有的文件呀,他的权限呀,停留在你自己的手机和这个电脑之间了。这个事情看起来是很美好的,但是背后呢,有几个隐患,我一个一个带着你说。首先呢,就是成本层面,到今天为止, 我认为部署一个你自己看得上的一个模型,还是一个比较大的一个成本的。首先你一定要清楚在本地部署一个大模型,你到底需要什么样的电脑配置。我给你个简单的算数,你就可以去理解了。你看到任何的一个大远模型,他们的都说自己的参数是多少,他们通常会以 b 去结尾,比如呢,他会说我是一个三 b 的 模型,十七 b 的 模型,比如像 deepsea, 大家所熟知的是六百五十个 b, 六百五十 b 的 意思就是六千五百亿个参数,但是呢,你怎么去算?你需要什么样的电脑?你只需要把 b 前面这个数字乘以一个二, 那么呢,就基本上代表着你能够在你的电脑上跑一个完整满血版的大圆模型所需要的 显存。这句话有点绕啊,有两个点,第一个呢是显存,而不是内存,第二个呢是满血版。首先什么叫做满血版?你会在网上看到很多人在教你用欧拉玛呀, lm studio 这些的软件去使用本地模型没有任何的问题,但是他们在 带你去下载的时候,你一定要注意它到底是不是量化版或者叫阉割版的。因为随着它自己的所需要的内存越来越少,那么它的精度也越来越低, 精度越来越低,那么大约模型所生成文字的正确率也会越来越低。所以呢,你会看到有四比特量化版,八比特量化版,听起来你可以用一个很小的一个显存就可以用,但实际上你用的是阉割版而不是满血版,就是用你 b 前面这个数字,再乘以一个二,就是你的显存。 第二个我们所提到的重点就是它要的不是内存,而是显存。六百五十个 b 代表着大概一千三百 gb 的 显存。一千三百 g 的 显存是什么概念?我给你举一盘数字,一个 h 一 百大概是八十个 g 的 显存,那么一个八卡的 h 一 百的 cluster 也就六百四十个 亿的现存,那你需要两个八卡 h 一 百的 cluster 才能够给一个人在一个时间使用一个满血版的 deepsea, 这个就是对现存的要求,价钱是多少大家自己网上去查,我只能告诉你一定超过百万。所以呢,你是否需要 使用一个 deepsea 的 满血版,然后在你的本地去跑呢?相比下,你知道如果你用 deepsea 的 api, 那么你大概需要一个什么样的成本呢?我印象当中 deepsea 的 a p i 是 每一百万个 token 只需要大概十六人民币。什么概念?一百万人民币你就粗略咱们保守估计,大概三十万个文字,你出三十万个文字 只收你十六块钱,你自己去对比一下,你要用到百万级别,你要让它出多少个字,这个就是成本上一个非常大的差异,很多人忽略了这一点,用一个阉割版的小模型,你会发现能力差的不得了,更何况我们是希望 logbook 在 我的电脑上去操作的,操作是不能出错的,你让他出一行指令,本来是应该添加,本来是应该修改,他给你变成了删除,这个事可就大了去了。所以呢,我是不太建议在没有绝对相信你自己的电脑硬件实力的时候,就随便的在你本地部署一个大模型,这是第一点,在成本层面, 第二个层面,我觉得是很多大家忽略的就是风险系数,你总是觉得似乎我在我的电脑上用一个开源大模型是最保险的。 但是你要知道,如果你想真正的发挥 cloud bot 的 一个优势,你需要使用它的 skills, 也就是它自己所推出这个 cloud bot, 全世界各地的极客都会贡献他们已经写好的 skills, 摆在网上,你下载下来,原本你的这个 cloud bot 什么都不会,但是你用了别人写好的这个 skill, 你 看今天又能干这个,明天再加个能力,后天再加个能力,对不对?那每一个 skill 是 什么呢?每一个 skill 呢?其实就是一个 markdown 的 文档,下载下来,它会按照里面一步一步去执行,但是呢,在执行过程当中,你会不会仔 就去读这个 skills md? 如果你自己没有读 skills md 的 这个能力的话,那么我建议你谨慎使用。为什么?因为你不知道它在里面会植入什么?到现在为止,虽然我们还没有看到一些不好的例子, 但我相信有些 bad actors 一定会找到 skills 的 类动,在里面植入一些不想植入的东西。你下载下来直接让大元魔去使用的时候,它会做一些不好的事情。但是这个时候,如果你今天用的是一个 开元的本地模型,你自己是没有这个评判能力的。但是如果你今天用的是一个接入别人 a p i 的 能力,在他输出一些不好的东西的时候,很多的这些 大厂的模型会在前面已经给你啪加了一道网关了,告诉你我不能够输出这样的东西,说白了,他们已经在帮你输出之前加入一层安全的护栏了。所以我们切一定要记住 opencloud 这个东西,它虽然 skill 是 一个很伟大的一个发明,让你可以用到全世界所有的优秀的人写的 skill, 同时它也扩大了潜在的风险。 所以这两点是我觉得普通的用户们暂时先不要考虑在你的本地去部署大模型这件事情,尝试把它下载下来,接入到呢手机里,然后接一个便宜的 a p i, 无论是很好很好的模型,价格也非常的便宜,都是大厂, 很多人呢,都会高估了自己的文件的安全重要度,而低估了大厂对于安全的服务度。你要知道,今天如果你用阿里云,用腾讯,用华为云,你的文件都是存储在他们上面的, 那其他的大公司都没问题,怎么就你的电脑里这个文件就会单卷安全的问题呢?对不对?所以呢,千万不要低估了大厂的安全能力,而高估了自己的文件的安全重要程度。所以呢,赶紧先去接入用起来,找一个你喜欢的大厂的 a p i 用起来 感受一下未来的时代,这个才是重中之重。慢慢地,你在不断地添加 skills, 慢慢地在考虑你是否需要转移到本地大模型,这个才是一步一步迈入未来的正确方法。

我不想写作家了,我不想去做书童和莫言的学生写诗歌写不过那些私人们还是写小说吧,扬长避短。哈哈哈。 你看我连本地步数我都学会了你知道吗?你也会本地步数啊?我现在才不会后悔呢,我觉得我今天一天过得好就行了。对好对。

一般人我是真的不建议部署本地 ai 算力了,特别是不懂技术的朋友,本地部署真的很麻烦,但是本地 ai 确实香得很,不管你是公司还是个人,他都能做你二十四小时不休息的专职助理,性价比非常高。首先在数据安全性上就完胜线上,像今天给义乌服装电商的老板准备发走的这套设备。举例这位粉丝给我说,每天都有很多店铺爆款数据,客户资料、定价策略、供应链底价。如 如果用人来看,不仅耗时,还容易出错,跑线上呢,精密数据又不敢上营,毕竟他可不想辛苦琢磨出来的成果被收入给同行当案例参考,那本地 ai 所有数据全程不出内网,不担心泄露。其次,他想每天二十四小时盯同行的爆款产品文案标题, 让 ai 来帮他分析未来女装的爆款趋势。那我们现场给他演示了一下,自动开网页,自动盯竞品,自动整合分析,以及提出优化建议。再就是老板还有做主图,生产品视频需求,那么训练完成之后, 你可以看到输出非常稳定,一天一百条都绰绰有余,还不用排队,不会限速。最主要的不接入外网, a p i 不 消耗 token, 一 次部署永久免费,而且最核心的商业数据都跑不出这台机器。本地 ai 部署真的是非常好的想法,而我们做的就是提前配置好这套模型的框架,也不需要你懂技术,我们提供整年的陪跑服务,教你怎么去用它。

最近很多电商老板都来找我部署本地 ai 模型,大家的想法都很统一,线上 ai 看着方便,实际用起来远不如本地部署。首先就是数据安全,公司的核心机密向店铺运营数据、客户信息、产品底价、爆款打法和定价策略决不允许上云,毕竟谁都不想自己的辛苦摸索出来的运营技巧、爆款逻辑被抓取,训练给同行当案例参考。而本地 ai 数据全程不出内网,安全性拉满。 第二,长期成本差距巨大。线上 ai 按 token 调用次数,素材生成数量收费,日常批量写文案,用量极大,根本控不住成本,尤其忘记多店铺运营费用直接翻倍,常年累积是一笔不小的开销,本地 ai 一 次投入终身无限调用,没有任何后续收费,省钱又省心。第三, 素材生产效率。线上 ai 生成的主图视频同质化严重,毫无特色,还经常被平台风控限制,高峰期卡顿,排队限速更是常态。本 地 ai 可以 专属训练独处的店铺风格,输出稳定,不间断工作,效率拉满。除此之外,本 d i a 可搭建私有知识库,对接 e i p 财务和客户管理系统,手机就能随时查询数据,自动分析销量与成本差异,优化客服话术,提醒到期合同和代跟进客户,还能针对性给出六幺八等大促优化方案,全程支持离线内网运行,断网也能稳定。使用。好了,这套 ai 模型和智能体已调试好了,准备发走,后续还有工程师一对一全程陪跑。

今天跟大家聊一下关于本地跑大模型这件事情啊,其实我觉得在现在目前这个阶段,本地跑大模型它的实际的用途并不是很高,非必要的情况下,我觉得还是接外部的 api 就 比较好 啊。我是通过了真金白银来得出的这个结论,因为我前段时间我的苹果 m 四十六 g 五幺二那个 都已经给我用满了,然后呢?我就想一次性换个好一点的吧,我就换一个内存大一点的。现在跑大模型不是要大内存吗?我直接买了那个一百二十八 g m 三 max 芯片的这个 mac pro, 然后结果发现用它来跑杰玛这些呃大模型的时候,其实它对话的速度还是很快,但是如果你把它接入到可拉扣的或者这种呃 a 阵盘里面, 他那个速度是你难以想象的那种慢啊。他手头跟加载要超超,不过差不多四分钟。我问他一个你好,他回答我要花四分钟,这什么概念? 那后面会稍微快一点,然后整个机子呢?就非常的烫啊,非常的烫,你要知道可以,这可是 m 三 max 的 芯片,一百二十八 g 的 大内存,然后有四百 g 的 这种内存贷款, 他还是很卡,然后这台机器本身的价格要两万多块钱,那你想如果我买一个普通一点的,对吧?我把这个多出来的,比如说我买一台一万多块钱的 macbook, 然后我去把这个钱你去充 gpt, 你 去充呃, deepsea, 你 充 cloud, 你 能够充几年?你能够充好几年哦。

ai 里的私有部署、本地部署到底是什么意思?说白了就是数据不交给别人。一句话总结,东西得攥在自己手里,不连外网,数据压根不出公司大门。 安全系数是上去了,但是成本也跟着蹭蹭涨呀,特别适合那种不差钱,数据金贵又怕泄露的企业。 记住一句话,想要安全钱包就得扛!硬琢磨明白这个道理,你就知道这钱花的值不值了。关注培西,带你一起 ai 升级。

大家是不是刷到 ai 的 私有部署和本地部署,然后就蒙圈呢?别慌,一句大白话讲明白,就是把 ai 装在自己的家里,数据全程自己管,不用往外发,也不用连外网, 再也不怕数据的泄密,但听着没有免费的安全感,这种方式成本会比云端的要高,毕竟硬件维护都得自己扛。所以啊,这招更适合手里面有重要数据的,然后又怕泄密的。 一句话来总结,要安全,就得舍得花钱,搞懂这个你就知道这个钱花的到底值不值了。关注我,用 ai 把效率提上去!

这两天大家刷短视频,估计经常看到有人在搞大模型本地部署,甚至还有人说自己在养龙虾。听起来玄乎,其实道理很简单,到底什么是本地部署?说白了, 就是把大模型从网页端搬到你的电脑或手机里,它不再只是一个只会聊天的窗口,而是拿到了你的授权的钥匙,能直接调动你本地的文件和工具。它能帮你汇总凌乱的表格,盯着机票的价格,甚至像个私人秘书一样,每天定时给你推送 精确的行业新闻。那养龙虾又是怎么回事?其实这就是在养你的智能体,你可以把它想象成初级版的贾维斯,刚部署完的时候,他可能还有点笨,但随着他学习了你本地的数据,加上你给他配置的各种 skills, 他 会越来越懂你的习惯。 为什么说他能翻倍提高效率?因为你给他下了一个简单的指令,这个智能体在后台可能会为了完成任务,自动拆解步骤,调用成百上千次模型运算。 你只需要动动嘴,剩下的脏活累活,他自己就就在后台跑完了。这就是我最近在折腾的事。如果你也想让电脑里住进一个贾维斯,本地部署就是第一步。

今天腾讯的 marvis 出来了,其实就是用来接管你的电脑,接管你的文件文件夹,这样的一个能力。这就是腾讯的 marvis, 其实也没什么好奇怪的,它跟 cloud co work 还有 codex 的 computer use 一 模一样,包括实际上还有 呃,我昨天安装的 picabu 这些,实际上它们都只干了一件事情,它们就是说本地和端测才是 ai 的 主战场。 之前大家用各种各样的云端大屏,那个主要是为了帮助大家完成这个科普和扫盲。但现在你发现了没有,地球上所有的大厂全都在干本地专测,接管电脑,接管手机,你知道为什么吗?是因为只有这样, ai 的 能力才会发挥的淋漓尽致,这就是真相。所以 怎么说呢,我觉得所有的大厂努力的方向都一样,最终都是在本地观测发力。这些话题好像有点学院派了。那,那我用接地气的语言说下。接地气的语言就是说让你的电脑,让你的手机成为真正的生产力工具,而不是让这个 ai 在 云端,可能 只能这样点到为止了。今天晚上我看到腾讯 marvis 的 发力,我也很兴奋,我觉得大厂就是大厂,你看他有 workbody 这些,但是他为什么还要做一个不同的 marvis, 就是 因为他知道真相,真相点到为止,只有本地和端测才是 ai 能够发力的重点。 ai 能够发力跟所有平台博弈,都是因为本地的能力啊。如果对 ai 不 了解的普通的用户可能听起来有点费解,但是我们 懂的都懂吧,能听懂的人现在都听懂了。所以我建议大家重视本地部署的 ai, 比如说爱马仕智能洗,这就是纯纯的本地部署的 ai, 它的能力超乎你的所有想象。如果还不了解的朋友我,我给大家一个路径啊,第一,在我的短视频和直播间找到我的小助理。 第二,你就可以获得本地安装部署爱马仕智能体的能力,不受任何大厂的影响。第三,你可以穿越学习的周期,解锁很多高级的能力啊,那我们只能说到这了,包括那些浏览器的自动化呀,还有一些自动化的工作流啊,这些只有本地才拥有的能力,到此为止。好吧。
