如果你已经把龙虾下载到了电脑上,那么你的第一个要完成的一定不是说你给他一个什么具体的任务,而是你首先需要对他进行初步化的一个配置,那这个配置的话,我简单的把它分成三个方面来讲,这每一个方面都非常重要。 首先第一个你需要给他一个标准的文件规范,这个文件规范有可能是比如说 word 文档,或者是 excel 表格,或者是 ppt, 或者是你在做的什么其他的工作,总而言之它输出的规范一定要标准, 那这个的意义在于什么呢?就是在于你可能会用它,你跟它要伴随很多年,那你的文件越来越多之后,你最后 自己去加工处理这些资料的时候,你会面对非常大的一个困扰,然后他有可能还会给你产生每一个文文件,给你产生很多个版本,那可能会更加的混乱。所以的话,我的建议是你先花一点时间先形成一个 呃,文件规范,你这个文件规范,你比如说你可以规定他的题目应该怎么取,前面的日期怎么排列,然后你的内容应该遵循什么样的一个输出规范,甚至你字体你都可以给他进行一个具体的要求。 那么你越具体之后,龙虾给你生成的这些东西,它就会越规范,你后面的加工调用的时候就会越简单和流畅。那第二个是这个性格描述, 因为你不管是采用什么样的龙虾,你需要的是一个靠谱的一个实事求是的工作伙伴,你不是要的一个电子舔狗, 所以说你给他的执行纪律就很重要了,那你很多龙虾或者是 agent, 他 都要求他都会有一个底层化的一个设置,是倾向于让用户感觉流畅,然后或者说顺着你的方向去说, 那这个的话你有可能你的考虑点已经距离事实很远,但是他依然是顺着你去,或者是产生各种各样的一个幻觉,那这个对你的工作结果肯定是难以实现保质保量的一个交付的。所以在这个方面的话,你可以也是要花一点时间形成一个 ai 的 执行执行纪律,比如说第一条实事求是,然后第二个你可以要求他 要输出的答案,要求质量,而不是以这个流畅等等这些。当然如果说有的兄弟可能不想在这上面就是搞的太复杂,那你也可以关注我,后面我会把这些标准的文本,我可以搞一个通用的版本发在评论区,大家可以直接复制去用就行了。 然后第三个方面也是非常重要的,龙虾为什么需要养?因为你一定要从这个角度来理解这个 ag 呢?他就好像是你公司新招了一个天才的实习生过来,他可能是一个通用型的专家,他可以通过调用大模型或者是其他的一些 skill 来去 充实他的知识库以前所未见的效率去学习。但是他终究不能理解你这个行业内在的那些可能不会上网的一些知识这些东西,而这些才是决定他能不能够变成你所从事的本领域类的这个专家的这个 高度,或者说它的深度。而这些东西就来自于你喂养龙虾的这么一个过程,所以我们叫做养龙虾,比如说你开会的会议就要那么你们每今年每月积累下的经营数字 啊,当然你在保证安全的前提下啊,然后再比如说你的这些营销策划案,再比如说你的其他的一些呃形成权益的文件等等,这些对于龙虾帮助了解你都是至关重要的。也就是说在这个 agent 这个时代, 你个人非但没有因为这个龙虾导致个人事业,相反他是会让那部分善用 agent 的 人的个人的能力得到无限的一个放大。 也就是说你复制一个归机版的你,那你需要把你的这些过去沉淀的这些知识,然后灌输到他,让龙虾了解你,让他成为一个 敬重的你,然后让他去替你干成那些。以前你可能需要去驱动、激励、管理别人来完成这些工作,而现在你只需要一串简单的提示词和约束词,你就可以让他帮助你高效的完成了,这个才是龙虾最重要的一个意义。
粉丝37获赞198

这一集我们来让这个扣子接入飞书和微信,这样不论你在飞书还是在微信,你都可以召唤你的 ai 助手,就是说在飞书里边和在微信里边都可以使用扣子, 在这个网页版扣子的右边有一个调节符号,这就是它的配置按钮,点击就可以打开扣子 a 帧的配置页,可以看到扣子 a 帧的名字叫做童童,这是刚才我们给他起的名字,可以对他名字和头像都可以进行调整。 现在我们来看看这个渠道的配置,可以从页面的中部或右上角增加配置渠道选项,有飞书,有微信,我们先看如何接入飞书,点击配置渠道页的飞书链接,然后出现飞书授权页, 点击去飞书授权,将会自动取得飞书的授权。在飞书这边我们可以注意到这边这个授权已经自动的产生。 现在我们再增加一个渠道,就是加微信, 点击渠道中的微信会出现微信二维码,用你的手机微信扫这个码,然后转到看看微信里的显示和操作, 我们可以看到在微信的窗口里显示,可以看到微信的 clobe, 也就是扣子的渠道分身已经接上了。再看一眼扣子 a 阵的配置页,微信和飞书都已经连接正常好, 微信这边我们可以问问他,你是谁,看看扣子和微信间的渠道是否通畅,跨渠道链接时间会长一点,至此扣子的几个渠道之间是已经打通了。在手机端点右上角设置点头像更换,找到你要换的头像, 点击确定,可以看到手机列表里和电脑列表里都同时完成了头像的更换, 哪个渠道?如果不想用了,在设置里把相应渠道关闭即可, 后续如果又想链接再重新授权即可。这一节就讲到这里,更多内容请查扣子二点五极简入门。

这个就是白龙马。如果你想连接微信,你就说我要连接微信。如果没有配置语音对话,你就说配置语音对话。如果你想要给他解除杀香限制,你就说解除杀香限制。 如果你想要让他读文件,你就说你看一下我桌面上的那个文件。如果你想查天气,你就说今天天气怎么样?如果他说搞不定没有能力,你就说笨蛋,你行的,你要相信自己。

给大家介绍一下新手如何快速搭建及使用自己的 a g 的 智能体来提高你的办公效率。该教程主要针对未使用过智能体的新手啊, 这个智能体的就是字节跳动推出的翠 solo, 这个翠 solo 先简单说一下啥叫智能体啊,就是你丢给他一个目标,你给他一个,他会自己去拆解任务,做规划,开始干,在干的过程中, 该查资料的查资料,该写代码写代码,该调用工具调用工具遇到需要授权或拿不准的时候,会停下来向你确认,你这边确认补充说明后,他会去接着去推进,直到把你给他的任务完成。 这个智能体呢,它目前支持 pc 端,还有移动端以及云端,云端是网页上可以直接去操作。还有两种模式啊,点击左上角,你能切换 control 模式是针对开发人员的,大多是用户场景还是基于这个 mtc 的 这个场景。 首先你装完之后呢,要给它最好是配一下自己的一个模型,我这边用的是 gm l 五,因为到晚上的话可能也会出现排队 被收入他自己自带的模型,到工作高峰期也会排队,排的时间有时候会比较长啊,会影响你的工作效率,所以建议大家去配一下这个模型。模型的配置呢,其实就是点击左下角这个头像,然后再弹出到这个框里,点模型模型,这里点添加 添加,你根据你自己的需要吧,可以使用 kimi, dp 还有海螺啊,以及这个字谱的啊,这里以 deepsea 为例吧,你就选择把两个模型都选上啊,两个,一个是 一个是推理模型,一个是快速的模型 api 的 话,到 deepsea 的 官网去去注册登录,完成实名认证,在 api key 这啊新建一个 key, 把这个 key 复制过来, 复制过来之后点击点击这个提交,先点击这里的提交,再点击下面的提交。模型添加完之后,在这里就选择自己配置的模型去用就行了啊,模型配置大概就就这么多。另外一个就是啊,这个技能是智能体的一个 比较核心的一个功能啊,去 solo 它官方自带的有一些智能体,这些智能,这些 q 啊这些技能, 这技能你可以根据需要去去安装就行了。点击这个加号就安装啊,它上面有介绍,根据你的工作场景啊,需要哪些去装哪些,你自己也可以去啊,多尝试多去试,自己摸索一下啊,我这边也安装了一些技能啊,有这个, 这也是我在日常使用过程中去装的一些技能。这个还可以自己去安装,有两种,一种是官方直接安装的,另外一种就是可以去上传自己的技能啊,这里我可以上传一个演示一下把,这个我之前上传的,我可以给它卸载,装完之后不想要可以卸载, 点击这个上传技能,这个是技能的一个压缩包,它必须是 vip 的, 或者是直接一个六点 m d 也行啊,这里面按照它的格式去上传就行了啊,这个技能的话你可以从多渠道去获取吧,这个根据自己的需要去上传就行了。 技能上传完之后,他在这会出现,在这出现这个技能是应该是一个文章的,检查文章是否有 v i 感的一个技能啊,创建完这个技能一种是直接安装,一种是自己上传啊,这是两种方式啊,下面给大家说一下这个 如何去使用啊,在如何去使用智能体啊?智能体的话,那你其实针对这个智能体主要的还是针对你技能的一个使用啊,如果仅限于跟他聊天的话,那你用豆包用 deepsea 网页版的那个也可以用啊,效果也没差多少,那个还还免费。 所以说既然用这个,那肯定你要么用他的这个技能,要么用他的自动化啊。技能的话,因为是针对他,可以针对你的办公场景啊,针对你的实际的工作情况,去打造一些 qq 的 工作流程啊,这个才是重头戏啊。 目前这是两种模式嘛,一种云端,云端的话你可以在本地操作云端,也可以在网页上直接用啊,其实这个看个人需求啊,最我这边主要用的最多的还是基于本地模式。 本地模式呢,给大家演示一下这个技能如何用,有两种方式,一种是自动触发,一种你啊手动。比方说你可以指定一下这个是通过浏览器,他能去打开浏览器去登录账户了,去操作各种网页啊,这边可以去尝试一下啊,比方说我们让他搜索一下, 打开百度搜索今日热点吧,热点汇总汇总成文档,这个你说完以后他就开干了。他这边因为他工作的是智能米,智能体不同于网页啊,他这边如果去调用技能的话, 他右边会展示调用了哪些技能。这边他还有一个 ppt 啊,这边我也试过,他做的 ppt 也还行, 它这个智能体你看不到,它是内置的,你给比方说咱把这个新闻的文章它做成文档之后,搜集完之后,你可以接着让它去做啊,帮我做成 ppt 啊,它会已经寄予一个文档,它会帮你做成一个 ppt 啊,这个可以自行去尝试。 你看这个,这边他调用智能体之后,他右边会有一个代办任务,他他需要规划几步去做啊?这边他规划了三步,下面他这个技能就是 skill, 他 调用了哪些技能,他会列出来啊?这是产物,这最后的结果会放在这, 调用他内置的技能,咱让他去,让他去干。咱们这边还有再再建一个任务,可以有多个任务再给大家演示一下。基于本地工作的话,其实如果咱真是要用这种智能体的话,肯定要解决咱们自己 一个办公场景的一个重复性,重复性的工作可以教给他打造成 skill 啊,让他去帮你去做啊, 其实这个才刚才说了,这个就是自定义技能啊,这的话基于本地工作,这个才是 真正能帮助企业 ai 落地的一个核心的一个功能啊,因为你可以基于 skill skill 的是啥?它就是一个工作的一个指导啊,你这个建完之后,你指定你只要说你当前要干啥,它会判断出你当前要使用哪个技能去做哪件事啊, 针对你企业的,因为每个企业的场景都不一样啊,可能每个企业使用的这个落地的 skill 可能也都不一样,这里没有一个什么共性的一个东西啊, 这个当然你打造这个,打造这个 skill 的 话,可能需要你对 ai 有 一定的认知啊,你可能说我,我知道 skill 怎么建啊?我知道,但是你要是对这个 ai 认知达不到的情况下,那你可能 就是做出来的技能,包括日常使用中,它可能也不会那么理想啊,你可能说啊, ai 也就这样, 其实你要想把它用好,可能需要你提升,去持续地去对 ai 的 一个学习吧。嗯,我这边反正是已经有两年的一个 ai 的 企,就是落地经验了,在我们企业也是一直在做这个 ai 落地的应用啊,如果 如果有这方面需要沟通的话,可以就是找我单独去沟通啊,我这边可以给你简单指导一下,让你少走弯路吧,少花,少花一些冤枉钱啊,能快速的帮你企业去落地啊。 然后这个这个工作目录啊,就是就是这个可以就是这样的一个目录啊, 它它其实你要是真正去落地的话,你肯定需要去打造一些 skill, 其实你可以把它理解成是一个工作流程啊,就是一个目录可以可以把它作为一个员工啊,这个员工他能干哪些事儿? 那你就这是对它的一个整,它首先这个是 agent 的 这个 md 呢?它是一个整体的一个工作指导啊,就是我这个员工能干哪些事儿啊?大概给 ai 说一下, ai 每次, 每次比方说他基于这个目录去工作的时候,他首先会先读这个这个文件的规则啊,这个这个文件的规则说明之后,那然后他才会去去下面才会去 去根据你的工作需求啊,根据你的任务去调用不同的技能去进行一个工作啊。我这里有一个比较长的一个流程,就是一个写作流程吧, 他是每一步干啥,每一步干啥,就是这样的一个工作,其实你每个人,其实每个人的工作啊,都可以去给他增流成这个技能啊,他让 ai 来 来辅助你去工作,其实 ai 并不会替代每个人的工作,他只能说让你去做更重要的事。一些重复性的工作啊,完全可以让 ai 去做啊,你把你释放出来,可以去做一些更重要的事。当然 ai 呢,它也不是完全自动的啊,它还需要你去确认, 你还要去对你这个 skill 的 工作结果去负责啊,最终的结果肯定不是 ai 来承担这个结果,谁用啊?谁来承担?对这个结果进行确认来你承担这个最后的一个工作的一个检查,去审核啊,它是否合适,不合适的话你就接着让他去做啊, 这个应该已经完成了啊,调用 d o c 啊,它是它把它它做成,做成一个 word 了,做成一个 word 文档了,这边任务它应该已经拿到内容了,它需要下一步去 去创建一个 word 文档。下面我再建一个任务,给大家演示一下,我这个基于我这个工作目录,我我打造的这个 个人的一个,相当于我办公,我日常办公的一个 skill, 他 是如何工作的啊?首先我这边里面有个 skill 呢,就是有个技能,他就是能帮我收集一些素材,帮我打造持续更新和完善我的知识库, 那就是比方说我,我给他两个链接啊,帮我把这些链接内容加入知识库, 这里它可以多个任务并行处理啊,可以同时处理多个任务,然后移动端的话也可以去看到我手机可以录一下屏。操作移动端的前提是你要在设置里头把这个给打开,把这个 solo 移动端,然后点允许操控你的电脑啊,保持电脑唤醒状态, 可以去查看这个当前任务的一个完成情况,也可以远程,远程的话去操作自己的一个 办公电脑,办公就是你的办公电脑,他可以帮你去操作。这边看打开这个翠 app 啊,这边能看到,打开之后他能看到我这两个任务,哎,一个是把内容加到知识库,一个是百度热点的一个汇总啊,这边可以看到他的工作当前完成情况。 这边比方说你中午去吃饭了,你这个 ai 还在工作,你可以看他工作的,检查他工作的完成情况啊,可以给他下达新的指令,让他继续去工作啊。比方说你去 见客户干啥了,这边 ai 该让他去工作,去工作。这边就是在打开手机也能看到你的这个 ai 工作完成的一个情况啊,这边可以输入下达新的指令,这里大家可以去尝试,我这里不过多演示了。 看这边它也是有规划的,它有几步规划?这是调用了两个 skill 啊,这个是知识库的一个打造的一个 skill, 这个是获取素材的一个 skill, 它调用了两,它自己去,它自己会去调用啊,就是它很智能,就是它该调用哪个 skill, 它自己去去调用。 其实他这个 skill 他的怎么去调用呢?其实这个的话是像这个知识库,这里面有脚本啊,有这个参考的知识,然后主要还是靠他啊,这个 skill 的 话 名称是必须要有的啊,这个简介他是根据这个简介来判断的,就是你这个 skill 能干啥,你只要这个概描述描述清楚啊,他就会自动的能判断到。如果, 如果你的任务模糊不清,或者是这个 sql 描述的不清,那这个 sql 可能调用不到啊。如果调用不到的话,你也可以在这手动去去斜杠啊,可以用斜杠命令 或者是点这个点这啊,然后去去去触发某个 sql 啊,因为你自己做的 sql 你 肯定清楚,然后这边手动触发,这边也不用 ai 去判断了,它效率可能会更高一些。这边它已经收集到了啊, 这个是一个 word 啊,他已经把这个资讯去收集到了,收集到他会放在这啊,做的还不错。这里你可以接着让他做,比方说接着让他去帮你做 ppt 啊, 这里都不再演示了,做 ppt 的 话比较慢,可能需要一二十分钟。然后另外这有一个自动化啊,自动化的话也是比方说你每天都要去做的某些事,比方说我这边会每天定,每天会去, 就是定期的去收集一些 ai 的 一些资讯,因为我要学习 ai 嘛,所以,所以它是一个持续的学习,我每天都要去看,所以说我会让他每天帮我去, 去定时的去收集一些我想要的资讯啊,这个资讯也不是啥都啥都收集的,我就是有学习有分享价值的,然后他帮我保存到文件,然后 他每天都会去执行。这个其实创建的话有两种创建方式,一种手动创建,你直接输入任务名称,然后你这里希望他去干啥?跟爱沟通一样,就是自然语言描述就行了 啊,这个云端的话一般用云端,云端的话因为因为你电脑关机他也能去执行,除非那你用本地的话,那你每天保持你的到这个点,你的电脑在开机,你这个软件在打开他才能执行, 或者他执行不了。绘画中创建也是一样的啊,通过绘画创建都是一样,其实跟恩爱沟通都是通过自然语言描述啊,他会帮你去创建核心功能,基本就这两个,另外一个就是这个, 还有一个 m c p m c p。 现在如果有需要的话可以用,比方说你公司有系统啊,你公司有一个系统,它提供一些接口啊,你可以把这加上去啊,把公司的系统可以出一些报表数据啥的啊,你可以加到这,如果你公司有这个 m c p 接口的话,你把它加上, 加上的话,那你就在这能直接用了。你做方案了。做啥了啊?能直接能直接调用那个数据啊,更方便一些。其实 skill 都是一些标准化的,不是那个 mcp 都是调用一些标准化的接口啊,现在大多数场景的话,那可能用的更多的是这个技能啊,就是这个 skill 这个任务让他去执行吧,大概整整体呢,这个 aint 的 功能大概就这么多啊,大家可以去尝试啊,下载下来先去摸索, 如果有什么问题的话可以给我留言,或者给我私信或者评论区留言都可以啊。这个是这个已经完成了,收集好了,已经交付了啊,行,那就这事就说这么多。

嘿,欢迎回来,上期带着大家部署了本地 open claw, 感觉怎么样呀?是不是觉得还差那么点意思?今天呢,我会带着大家给自己的小龙虾加一些超能力, 比方说通过即时工具,比如飞书或者微信给龙虾下命令,这次我也会分别采用手工配置和让龙虾自主配置这两种方式,让大家感受到不一样的配置体验。 全程实录,不含废话,准备好了吗? let's go! 第一步,创建飞书应用 首先我们来到飞书创建一个 bot, 用于跟小龙虾对话,这里点创建企业自建应用,随后给应用命名,添加应用描述,选择一个心仪的应用图标,点击创建按钮即可 找到左侧菜单栏的事件与回调订阅方式,选择推荐的长连接,然后点击添加事件搜索栏,输入 message, 选择最下方的接受消息,再点击添加按钮,确认开通权限,选择开启。 这时候出现了创建版本的提示,点击创建版本,版本发布的内容按实际的填,最后点击确认发布,等待应用发布。 第二步,配置终端接着我们来到终端配置,输入命令 opencloud channel set, 接着会出现提醒,是否现在配置选择 yes, 接着让我们选择通讯渠道,选择 firelock 飞书,此刻它就会自动安装插件,这里跳出了一个二维码,我们用手机端飞书扫码, 选择第一步,创建的飞书 bot, 然后等待电脑这端确认连接可以了, 下来是群组聊天设置推荐新手都选择 open responding on。 接下来的配置我们都无脑,选择默认值就好了。 到这里配置就完成了,我们重启一个窗口, 输入命令, open clock gateway restart, 重启网关,接着查看通讯配置的结果, open clock channel's list 看到返回了绿色的文字,没问题了。 第三步,手机端测试。现在我们来到手机端发起聊天,看到整个过程还是顺畅无阻的,飞书的配置就顺利完成了。 帕特配置企业微信首先我们需要登录企业微信管理后台,找到安全与管理,选择管理工具,点击智能机器人,再创建机器人, 添加一下可见范围右下角点击 a p i 模式,创建连接方式,选择长连接,下面点保存,跳出机器人信息弹窗,补充一下名称和简介点,确定后保存 在企业微信管理后台的管理工具下,能看到刚才创建 bug id 和 sacrist。 下面我们采用更为轻松的方式, 直接让 openkey 来帮我们配置起微,告诉他 bot id 和 safecourt 的 内容,接着就等待他的汇报吧。这里再问一下进展。 哇,又恢复了,现在立刻去手机起微看看,找到 ai 智能客服,问问他是谁,得到的结果非常靠谱。 好了,分享快到尾声了,我们来回忆一下。今天分别配置了国内主流的两种通讯工具,并且采取了纯手动和智能体自主配置的方式,你更喜欢哪种呢?最后我也准备了配置资料, 有需要的朋友可以在评论区留言获取,另外你们还有啥想听的也可以告诉我,如果觉得有帮助请记得一键三连,我们下期见啦!

如何在 hermes 当中配置多 agent, 实现不同能力的 agent 讨论同一件事情或执行同一件事情,类似于这个样子,比方我建立一个产品方案讨论时,我在里面创建了四类角色,当我去发布一个事情的时候,我可以艾特指定角色进行回复, 也可以让其中有一个角色调动其他人,这样就很具想象力的。那怎么设置?总共分为三步,第一步,在这个页面里面我们去创建用户,相当于就创建一个 agent, 点击这个地方, 你只要去定义他的名称就好了。第二步,很关键的事情,你需要去定义他能做什么,比方说我定义第一个产品经理,他的身份是什么样子,他能做什么已经不能做什么。 第三步,我们就只要在这个群聊里面去建立这样一个场景,把不同角色的人去拉进来,类似于这个样子,你把刚才创建好的这个身份去把它添加进来,这样一个群就创建好了,很简单,对了。

前脚攻击步刚提示 opencloud 的 安全隐患,后脚腾讯又掏出了它的内侧底牌, qcloud 企鹅版龙虾正规军下场了。我看了眼官方公布的功能,只能说大厂的降维打击太狠了。最变态的功能是哪一个? 不是支持 windows mac, 也不是内置国产大模型,是微信直接对话远程操控电脑。以前玩开源 a 镜的你得懂配置,升版本还把龙虾整跪了,搞了半天还得重来, 现在零配置,在地上发个微信,家里的电脑就能开始帮你干活了。微信直接变成了操作系统的遥控器,再加上它直接打通了五千家 style 市场,这说明什么? qq 可乐已经不是极客的玩具了,它要变成普通人的数字牛马,读文件,发邮件,搞浏览器, 在本地跑的明明白白。如果后续再叠戴个社交可乐,那效果简直炸裂。为什么大厂能赢?因为开源只解决了能不能跑,大厂解决了安不安全和好不好用,别再折腾那些危险的野路子了。 qq 那 次你拿到名额了吗?评论区见。

今天跟大家介绍一款真正来自于未来的 pc 级 ai agent, 跟目前大家熟知的各种这个 call 那 个 call 不 同的是,它不是在你电脑上安装的又一个平平无奇的 ai agent 程序,而是直接给你的整个电脑配置了一个强大的 ai 大 脑,它可以访问你电脑上的资料,而当时在经过你授权的前提下, 来帮你完成各种各样的事情,这个在能够帮你做的事情上是完全不同的范围。这真的就像你招了一个能力非常强的人,然后呢把你自己的电脑给他,让他能够利用你的所有资料来帮你做事情。他就是来自于腾讯的 mars。 今天这期视频我们就来详细的看一下这个 mars 到底怎么样,他能干啥, 以及为什么我觉得他值得你的密切关注和使用。当然首先我们还是得先安装上啊,先看看他长得什么样子好。安装很简单,跟安装其他的电脑软件没什么区别,我们直接到官方的下载页面,挑选一个对应你系统的版本,然后 下载下来,然后就跟你平时安装别的软件一样啊,双击安装然后就好了,目前 mac 支持 windows, mac 和安卓啊都支持。装完了以后登录打开那大概是这样的一个界面,整个安装过程是不需要敲命令的,更不需要写代码,这个对于普通小白来说还是非常友好的好。进到界面以后呢,左边这一栏基本上就是它的几个核心的入口, 对话呀,自动任务啊,技能啊,本地知识库啊等等,我们可以依次看一下。那首先是对话,这个界面他应该很熟悉了啊,你可以简单的理解为他就是你跟你的电脑直接对话的这样一个窗口,在这里你可以把它当成吉他的 a r 一 键等来跟他问答。当然更多的我们使用 mark 是 让他来帮我们干活,对吧? 比如说让他来帮我们找到某个文件,或者是整理一下下载目录,甚至让他直接改一下你的系统设置啊,都是可以的。当然更加复杂的活他也能干啊, 这个待会我会跟他演示。然后这里的自动任务其实就是定时任务啊,你可以在这边把你想要让他做的事情写好,然后 mars 到点就可以自动帮你去执行,甚至还可以循环每天每周这样去执行。 然后这个定时任务呢,你也可以直接在这个电话框里面通过对话的方式让他来帮你创建。然后是这里的技能广场啊,它自带了各种各样的 skills, 如果你看中哪个的话,点一下就安装好了,然后就可以用了。在下面的本地知识库分成应用文档图 和我的电脑这一块,那本质上就是你这台电脑上所有的文件资料和安装的应用,他帮你归类在这边。那说到这里,很多朋友会想,他能访问我电脑上的所有的资料和应用,那 会不会导致泄露风险呢?那关于这一点, mars 也考虑到了,所以在这里的这个设置里面,你可以选择笑脸模式和隐私模式两种。在这个隐私模式下呢,你电脑上的所有的文件都不会有任何的上传的动作, 这样的话就杜绝了任何的信息泄露的可能性,不过这个隐私模式对电脑的配置会有点要求啊,所以你可以看一下自己的电脑配置,然后看看能不能用。当然,如果你不是特别在乎隐私性,或者说你相信,比如说腾讯对于隐私的保护,那你也可以选择这里的效率模式,那我一般就是选择这个模式,哈哈, 还是比较相信腾讯对于这个隐私的保护的,不然的话,你想想微信对吧?你有多少隐私都在微信里面,早就炸了。那这个笑脸模式呢,是结合了本地模型的极速响应,再加上云端模型的强大算力,所以它整体的 ai 能力会更强,然后能做的事情也更多。 然后这里这个手机图标点进来的跨端操作,这个也可以说是非常的与时俱进了,哈哈,你可以在手机上安装一个移动版的 mavs app, 连接以后就可以直接来操作你的电脑了。除此之外呢,你也可以用微信的这个 cloudbox 来连接,然后你通过微信来跟他对话,他也一样能够帮你在电脑上干活。 ok, 接下来我再给大家介绍几个我真实在用的使用场景,看完你就知道 mars 有 多么强大和实用了。 第一个场景是我目前用的非常多的,那就是找文件,跟很多人一样,我电脑里面的文件实在是太多了,然后很多时候忘了一个文件放在哪里,你就很难找出来了。 这是我之前做一些 ai 工具集合的视频的时候,我就突然想起来很久之前存过的一份关于 ai 神器的 pdf 文件,但是具体叫什么文件名我忘了,像这种情况我之前就得痛苦的倒腾半天,还不一定找得出来,那现在有了 marvis, 我 就可以直接跟他说 帮我找一下,有一个关于 ai 键的 pdf, 然后他很快就开始搜索,然后就给我找出来了。注意在这里他不是根据文件名,而是直接去理解文件内容的方式来找出来的,图片也一样能够通过这种方式去查找。比如说我之前下载了一堆的图片素材, 其中有一些有书架的图片,我需要做视频用。那同样我也可以跟他说帮我找一下书架的图片,顺便整理到桌面的一个文件夹, 然后他很快就给我找出来了,并且还按照要求帮我整理到了桌面上面的一个文件夹。像这样的体验让我第一次真正的感觉到 ai 是 在应用我的整个电脑来帮我干活。 上周我去办公室干活,结果发现我要用的素材落在家里的那台电脑了,我人都已经出门了,我实在不想因为这个再跑一趟。然后我就直接用手机打开了移动端的网页 app, 然后跟他说把我电脑桌面上那个叫做午夜素材的文件发给我, 然后妈咪就帮我找到了这个文件,并且发送到了我手机上。这感觉就有点像是你的电脑变成了你的一个随身设备,但是你却不需要带着它,也有点像是给自己雇了一个远程的 ar 秘书, 但这个秘书是能够直接使用你的电脑来帮你干活的,而且你还不需要给他付几千块钱的工资啊,这个想想还是非常香的,哈哈。第三个场景,我电脑里面长了一堆视频效果的参考图,有的是截图,有的是下载的,还有一些是别人发给我的,乱七八糟放在各个地方, 然后我想把这里的所有的图片效果整理成一篇 pdf, 方便发给我的剪辑小伙伴做参考。然后我就跟他说,把效果库文件夹里面所有的图片效果找出来,生成一篇 pdf 目录好,可以看到。他就开始在我的电脑里面查找识别归类, 你看他身材,分清楚了哪些是视频效果,哪些是图片效果,最后把所有的图片效果生成了个 pdf。 好, 我们点开看一下,可以看到所有的图片效果都全部整整齐齐的放进去了,确实非常省事。像这样一整套工作,我原本需要一个一个筛选,再一个一个复制粘贴,然后再反手的排版,现在一句话 mark, 全部帮我搞定。 四个场景,我之前有一个习惯,就是每周会到 github 上面去看一看这一周有什么热门的 ai 项目。那以前的做法呢?是手动打开 github, 然后再一条一条去翻,再一个一个点进去看,看着是挺爽的,但其实还是挺费时间的。现在我可以直接跟 mars 说, 搜一下这套本周热门的 ai 项目,再生成一个可量化的 html 页面来展现这些项目,页面要简约风,黑白配色。然后他就开始搜,大概一两分钟以后,就给我生成了一个完整的 html 页面,打开看一下,每个项目都有名字简介,还有点击能直接跳转,整个页面还是非常清爽的。 以前需要花几个小时的事情,现在只需要一句话,一分钟,这个效率提升可以说是直接起飞了。第五个场景我打算下个月出去玩,所以我在对话里面跟他说,帮我在非常准里面查一下六月十五号杭州到西安的机票价格, 过会他就给我查出来了,不过我看一下当天的价格还是有点贵的,但是我又不想每天来问他一遍同样的问题,所以我就跟他说,从明天开始,每天上午十点帮我查一遍价格,同时发给我, 然后他就给我创建了一个定时任务,点一下执行,往后的每天他都会转点跑,转点发给我,可以看到他现在已经在后台默默的帮我跑这个任务了,完全不用我自己操心。这个就是刚刚跟大家说的,你可以直接在对话框里面直接简单的说一句话, 就让他帮你把自动化跑起来,像盯着屏幕刷价格,这样的机械又无聊的工作就应该交给 ai, 这样的话我们就有更多的时间来去做一些更加有价值的事情。 ok。 以上就是对 mars 的 介绍以及我的几个使用场景,经过这段时间使用下来呢,我会觉得 mars 就 像是你把你的电脑给了一个非常强大的助手, 让他来替你干活,这个跟现在的各种指示在你电脑上的一个小小的非常受限的 ai agent 是 有非常大的区别的。 而 mars 的 这种操作系统层级的模式,我觉得才更像是未来的 a r a 键该有的样子。最后如果你看到这里,我强烈建议你自己亲自去下载体验一下 mars 这种操作系统层级的 ai 智能,那我们今天这个视频就到这里,我是川哥,我们下次见,拜拜。

嘿,欢迎回来!自从出了本地卖电脑安装 open call 的 分享后,后台收到好多 windows 用户的私信,希望能够在 windows 安装部署使用。 今天他来了,本期就 windows 系统下如何安装 open call, 从环境准备到配置上线,一条视频讲清楚,就算你是完全零基础的新手宝宝, 跟着我的步骤走一样能跑起来!全程实录,不含废话,准备好了吗? let's go 很 一安装须知安装之前我们先检查一下电脑环境,看看是否符合。一按安装步骤,这里一共分为六个步骤。 第一步,安装 w s l 加 a b o 图,以管理员的身份进入 windows 终端,将命令贴进来并回车,此时系统开始下载 linux 系统及 u b o 图,等待安装。 第二步,出示画瓢,公主下拉会提示创建账户名和密码,输密码是看不见的,正常敲就行,请注意记录下来后续用的着哈。接着跳出收集使用日制运行数据的授权弹窗,选择默认的 y, 此时 wsl 即泵出,安装工作就完成了。第三步,更新系统及安装必备底层依赖在 wsl 终端中,将复制的命令粘贴并执行。这一步是为了确保系统依赖完整, 防止一键安装脚本报错。接着会提示输入第二步,设置的 open call 密码,输入后回车即可,下来就等待一会会。 第四步,官方一键安装 open call, 继续在终端贴入安装命令并执行, 执行过程中不要关闭终端,耐心等待,脚本会自动完成 open call 的 安装, 全程自动完成,无需手动干预。安装完成后,中框出现绿色的提示, open code and so successfully 到此, open code 安装完成。第五步,出场 open code 本地账号接下来是配置了默认选择 yes, 启动模式选择默认 quick start。 模型提供商,我选择了自定义模型提供商,输入 api pixel 和 api 点 on point compile beauty, 选择 arp nai。 接着输入我配置的模型 minimax m r seven, 它是不支持图片输出的,选择 no。 接下来会让我们配置通信方式、联网搜索技能赫兹等。 之前的教程有分享过,这里就不演示了,选择跳过,再看到网关服务已安装好了启动方式,选择更为友好的 v b y。 第六步,浏览器访问 openclock 控制台,登录电脑浏览器,我们来问他一个问题,你是什么大模型? 看那回复是 mini max m 二 seven, 并且说明了是通过自定义 api 接入的,跟前面配置完全一致。看到这里分享也快到尾声了,我们来回忆一下, windows 电脑需要先安装 ws 二和乌崩兔, 同时更新系统及安装必备底层依赖,并演示了自定义模型厂商的接入方式,后续官方一键脚本自动完成安装 始化 opencall 本地账号和 mac 上是一样的,这里我也准备了学习资料,如果觉得有帮助,请记得一键三连哦。另外你们还有啥想听的也可以告诉我,我们下期见了。

马总的马雷斯已经上线了,那就一起来体验看看。先是官网的一些介绍,本地模型,手机控制,一句话完成电脑配置之类的, 然后就安装了一些硬件要求,我这里之前下载过,然后我就安装一下。其实从安装的这个画面来看,马总还是很想把产品做的更普通,话就是好看好玩最重要, 安装完成就直接进到主页就是新对话,这个就跟所有的 agent 没什么区别。 然后是一些常规的功能,自动任务, skill, skill。 这个页面里面的东西还是比较全面的,办公插件的一些东西这些都先跳过吧,办公室就是搞了一些动画给你看看,实际没什么用,所以他还是想做的好玩一些。然后我登录一下, 哦,这里还有一些设置, ai 模式, 隐私安全,这里应该是添加一点动作边界。其实要我说,大家都有用过马哥的产品了,都无所谓了,个人信息是一定保不住的,但是是安全问题,是一定不会害你的,这点我觉得是没问题的。 好,接下来我给他一个场景啊,我是两台电脑,一台 mac, 一 台 windows, 这个很多人习惯不一样,我已经习惯 mac 的 快捷键了,让他帮我调整一下。 好的,他的结果出来了,没什么毛病。这里其实就是对电脑小白用户来说就很方便了,因为很多设置你不愿意研究,不愿意碰,但用着又不顺手。以前就是要去搜教程怎么改设置,现在跟他一句话就 ok 了。那我之前其实是手动改过,就不叫他动手了, 叫他帮我查一下我之前的设置, 结果也出来也是没什么问题的,反馈的速度不是很快,但无伤大雅,不要钱的都能接受,看一下花了多少头根, 接近七万,这个数据就当个乐子看,也不是很准的,反正他目前是每天是送一千万。就这样的自动化操作,大家自己换算下可以做多少事吧,做做电脑,整理文件,发票规章,应该是比较轻松的。 官网介绍说是手机可以操作出,好像没找到入口,问一下他,嗯,要什么 tx 应用宝,这个东西我之前装过,不是很好用, iphone 上也装不了,应该后续产品迭代后还会更新的吧。 最后总结一下,马总的这个产品还是非常针对个人入门的,目前呢,更像是一个电脑管家电脑的设置啦,排查一些电脑的问题啦,做一些办公的 paperwork 啦,都没什么问题,是不是做的出色,做的好是另一回事,起码带掉一些繁琐麻烦的事情。 所以后面的趋势, ai 产品肯定会越来越轻量化, ui 更简洁,上手难度也会越来越低的,包括 codex、 claudio 等,在出了桌面版之后,明显加速普及和安装率的。总之先就这样,拜拜。

嗨,欢迎回来,今天这期视频跟大家聊点硬的,我将手把手带着大家部署 open call 最新版本,全程实录,不含废话,准备好了吗? let's go! 首先进入启动台,找到终端并打开。 接着呢,将准备好的命令行覆之后粘贴到终端内回车,此时会出现安装的窗口,点击同意。接下来就会进入到 xq 工具安装过程,整个过程大约耗时七分半钟。 到了这里终于来到了安装成功的界面。来到第二步,安装 uber, 将准备好的命令行复制后粘贴到终端内回车,此时要求输入密码,输入的密码是不会显示的。接着等待安装中, 大约三分钟 homebrew 就 安装好啦,这里我再兴起一个终端。来到第三步,安装依赖 no 记 get, 老规矩,还是将命令贴近终端回车,等待安装。大约三分半钟,安装好, 我们来验证下输入命令分别得到 node 的 版本号,至此依赖包已成功安装。接着第四步,官方一键安装 open call, 我 们将安装命令复制粘贴到命令行。这次我们安装的是最新发布的五月七日版本,等待自动安装。 接下来是配置了默认选择 yes, 启动模式选择默认 quickstart 模型题工商,我选择了 cai, 也就是智普 earth method 选择 c。 嗯,接着来到智普 ai 开放平台 a p i t 值贴到命令行 默认模型这里选默认的回车。接下来会让我们配置通讯方式,联网搜索技能 hux 等,这里暂时不配置选择跳过,后续我们会专门出一期讲解。 现在看到网关服务也安装好了,启动方式选择更为友好的 ypui, 到这里可以看到安装已经完成啦,这里安装一起看看也就四分钟左右,现在我们打开浏览器看看通了没?来问一个问题, 已没反应,也应该是选择的默认大模型,没有续费,我们来设置一个免费的模型,测试一下,把命令行贴进来,重启一下,查一下修改成功没? ok, 已修改为 glm 四点七 flash。 接着来到聊天界面,刷新一下,问个问题,一开始反应有点慢, 但是有回应了,再来问问今天星期几,追到正确的反馈,追下来就能够丝滑的跟他聊天了。 最后我也准备了部署资料,另外你们还有啥想听的也可以告诉我。好了,今天的分享就到这里,如果觉得有帮助请记得一键三连,我们下期见啦!

分享一个重磅消息, hermes 终于能连接个人微信了!只需要五分钟,就比之前用龙虾方便多了,消息走长轮询,不需要公网 ip, 不 需要 pay webhook, 扫码就能连!为什么这个更新这么激动?就是因为用了两天 hermes 之后,我发现它比龙虾强太多了。既管理上, hermes 能自动更新,而龙虾要手动维护。 skill 创建方面, hermes 可以 自动创建龙虾,还得手动配置。任务规划能力也不同, hermes 能规划八十步以上的复杂任务,龙虾步骤就多了,就容易崩, token 消耗上, hermes 也更省。如果你已经部署过 hermes 的 话,升级只需要一项命令,那就是 hermes update, 停止正在运行的 hermes, 输入命令回车等待更新完成就行。小警启示啊, hermes 更新时,如果检测到本地冲突,会自动帮你暂存, 而龙虾遇到冲突直接报错,在手动处理。更新完成之后,系统会提示恢复本地更改,记得先选,然后手动恢复。嗯啊,把微信配置完再说。然后这次更新还带了新技能,比如 ideation 创意头脑风暴工具。微信配置需要走交互式安装,向导输入 harvest getway setup, 这个命令同时支持微信飞出,起微可以一起配。然后选了微信啊,输入外确认终端会生成一个二维码链接,复制链接到浏览器,打开,用微信扫码就可以绑定。嗯, 不过有个重要提醒,如果你的微信已经绑定了其他 open kleo 产品,扫码后会自动解绑微信 boss, 同时只能对接一个 ai 助手。 扫码成功后会进入权限配置兑换权限建议全部放开,群聊配置同样建议放开所有群主通道。选择上推荐选,比如说飞书,哎,这样飞书消息卡片更美观。但如果选这个,比如说微信,哎,所有回复就都走微信配置完成后,输入当退出 最后一步,重启网关, harmless get 入微 restart, 然后在微信里发一条消息,测试看到 harmless 回复就成功了。 harmless 加微信的组合终于让个人 ai 助手真正随身了,不用开电脑,不用切 app 记忆自动同步这个技能自动创建,这才是这个 ai 助手该有的样子。

大家好,我是大叔,只说真话,只做实在事,只给干货。上期视频大家已经学会安装 hermes agent 了,但是装好了之后还需要对接通信渠道才能真正用起来。 今天这期我们先介绍一个比较简单的微信接入,也是大家日常使用场景里最容易上手的。后续如果大家有需要,我们可以再出一期接入飞书或者 qq bot, 看情况。先说清楚这个是什么? hermes 信件的微信接入是通过腾讯官方的 iink bot api 来实现的,专门针对个人微信账号 划个重点。企业微信要去找 wecom, 那 个是配器,这个是专门给个人微信用的,别搞混了。简单说就是通过 iink bot 接口,把你的微信账号变成一个可以接收发送消息的 bot, 不 需要你有服务器,不需要开端口,也不需要配置 webbook。 整个接入过程只需要三步安装,依赖扫码登录、启动网关,没有复杂的配置,没有坑。不过在开始之前有个重要限制,必须先说清楚, 这个搞不清楚后面功能用不了,别怪 hermes。 扫码登录之后,你的微信账号会绑定到一个 i link bot 的 身份,不是你原来的微信号本身。这个区别非常重要,直接关系到你能用哪些功能。 i link bot 无法像普通联系人一样被拉进微信群, ilink 通常也不推送普通微信群的消息给 hermes。 即使你在群里提及你扫码的那个微信账号,也不等于提及 ilinkbot, 它们是两个独立的身份群,相关的配置只有在 ilink 真正推送群事件时才生效。如果 ilink 本身不推送,设置什么都没用。说白了,微信群消息这设不是 hermes 的 问题,是 ilink 本身有限制。根据官方文档和社区反馈,个人微信账号接入后私信对话是最稳的 群消息。如果 i link 不 推事件过来,那就真收不到。所以如果主要想在一堆聊天,完全没问题。想玩群聊机器人,要先测试 i link 是 否给你推群事件。 git 会启动时,如果 waxing group policy 不是 disabled 的 日子里会打 warning, 提醒你注意这个限制。 如果设置了策略蛋,群里完全收不到消息,就是 i link 那 边的限制。别死磕配置了。好了,限制说完了,开始。第一步,安装依赖。开始之前确保你有一个个人微信账号,然后安装两个 python 包, 就这些,第一个是 a i o p, 用于网,网络通信。第二个是 cryptography, 用于微信媒体文件的解密。微信的文件传输走的是 a s one twenty a d c p c 加密。这个包必须装,命令行 跑一下 piping store, aotp cryptography 两个一起装。如果想在终端里直接看到二维码渲染,可以额外装 hermesign messaging, 这个是可选的,不想装也行。扫码链接会打印出来。 aotp 和 cryptography 这两个包,微信和 telegram 这类平台基本都要用到,装一次以后都省事。 依赖装好了,现在第二步,扫码连接最简单的方式是用官方提供的交互式向导,全部流程自动化,你只需要拿手机扫个码,运行 hermes gateway setup, 向导会提示你选择平台,选择 wixin, 然后向导会自动请求 i link bot api 的 二维码,二维码显示在你的终端里,或者打印一个 url 给你。用微信手机端扫这个二维码,手机端确认登录凭证自动保存到指定目录,扫码并确认之后,终端会显示 account id, 这个 account id 后面配置环境变量要用,记不住也没关系, 已经存在文件里了。在 hermes slash dot f 文件里加上 waxen account id, 等于你的 account id, 如果想限制谁,可以私聊 bot 加上 waxen allowed users 群策略默认式 disabled, 保持默认就好。三步都走完了,来看看微信接入具体支持哪些能力?第一个,长轮询接入消息,通过 http 长轮询拉取,不需要服务器开放端口, 不需要配 web 家秘。微信媒体文件走 cdn 加密传输,自动加解密,全程透明,不需要你手动处理。 第三个,完整媒体,支持图片、视频文件,语音消息全支持语音,有文字稿的直接拿文字,没有的保留音频。第四个, markdown, 保留发出去的 markdown 消息,微信里能原声渲染,标题、表格、代码块都能正常显示。 第五个,智能消息,拆分消息,超过四千字的才会拆分,没抄的保持一条发出,不破坏阅读体验。第六个,输入状态只是 ai 处理消息时,微信里会显示对方正在输入,体验更自然。 第七个,自动重试,遇到临时的 a p i 错误会自动退币,重试偶发的网络抖动,不会丢消息。第八个,上下文词久化对话,上下文 token 存在词盘上,重启网关后对话连续不丢上下文。第九个,去从机至五分钟滑动窗口内相同消息 id 不 会重复处理,防止网络抖动导致双头。不知道你最感兴趣哪个功能?我 个人最关注媒体加密和上下文词九画这两个最实用功能。看完了,现在看第三步,启动网关。配置好了之后,一行命令启动网关,微信接入就完成了,跑 hermes get 为网关,会读取保存的凭证,恢复微信连接,连接 l p i 开始涨轮询,拉取消息并发分发给 ai 处理。最后来说说常见问题, 列了十个最常见的,对号入座就行。第一个,运行 hermes get 为启动报,缺少 a o, t p 和 cryptography, 解决方法是 pip install aop cryptography。 第二个启动报, token is required。 解决方法是重新运行 hermes gateway setup, 完成扫码登录。 第三个启动报, account id is required。 在 一点一 n v 里加上 waxing account id, 等于你的 account id。 第四个提示另一个网关正在使用此 token, 先停掉另一个 hermes 网关,十例同意, token 只能同时被一个,十例使用。第五个 session expire 错误码负。十四,登录太过期,重新 hermes gateway setup, 再扫一次码。第六个二维码过期,二维码会自动刷新,最多三次, 如果持续过期,检查网络连接。第七个 bot 不 回私聊消息,检查 vaxindian policy。 如果设置的是 allowist 确认发送者在允许列表里。第八个 bot 完全收不到群消息,见第二页的限制说明。 ilink bot 身份本身不支持普通微信群消息,这是 ilink 测的限制,不是 hermis 的 问题。 第九个,媒体文件上传下载失败。确保 cryptoography 包以安装,检查网络能否访问微信 c d n 域名。第十个终端二维码不显示,从新安装 hermes agent messaging, 主键 十个问题基本覆盖了。如果还有其他的评论区留言,遇到问题先看 get 位日制。如果设置了群策略弹,日制里完全没有收到过群消息的,原始事件基本就是 i link 这边没推过来,可以排除 hermes 策的配置问题了。日制会告诉你一切排错的。第一步永远是看日制,不是反复改配置, 配置改来改去,日治里末收到消息就是平台测问题,改配置没用。好了,本期内容就到这里来,快速回顾一下今天学的三步。第一,第一步,安装依赖运行 pip install aotp cryptography, 把两个包装好。第二步,扫码连接,运行 hemi skytwo setup, 选择 vixen, 用手机扫码确认。 第三步,启动网关,配置好 wixin account id, 然后运行 hermes gateway。 整个过程没有复杂的配置,记不住命令没关系,用到的时候回来翻就行。如果对你有帮助,欢迎点赞转发收藏,你们的支持是我持续更新的最大动力,有问题欢迎在评论区留言,看到会尽量回复,我是大叔大,我们下期见!

你的微信读书其实可以变成 ai 的 个人知识库。最近值得关注的是 weird skill 这类工具,它不是帮你刷阅读时长,而是让 agent 读取你的书架、笔记、划线和最近阅读记录。公开的 warred c l i 方案里,常见用法是,先扫码登录或者配置 warred 下划线 cookie。 登录后可以执行 warred list 查看带笔记的书, warred shelf 查看书架 warred get。 导出某本书的划线和想法 这件事有三个价值,第一,解锁个人阅读历史。你不用再凭记忆翻书,可以直接问我以前在哪本书里标过组织能力。第二,整理笔记、 划线、书评章节信息,可以导出成 markdown 或 j s o n, 再进入 obsidian notion, 或者交给模型做主题剧类。第三,生成学习路径。比如你想学大模型, agent 可以 先看你的书架里有什么再推荐。从动手学深度学习,到机器学习,再到大模型和应用开发的路线。 技术上,他通常调用微信读书的书架、笔记、划线、阅读摘要等接口,再包装成 agent 能理解的命令或 m c p 工具。但这里要注意两点, 第一,这类工具多是社区项目,不等于微信读书官方开放平台。第二, cookie 和登录状态很敏感,不要随便上传到云端,也不要把环境变量发给别人。适合谁用?重度读书用户、研究人员、内容创作者、企业知识库维护者都很适合。 总结一下, weird skill 的 核心价值不是多一个导出工具,而是把你读过的书、划过的线、写过的想法变成 ai, 可以 解锁、整理和附用的长期记忆。点赞转发关注,一起学习!

hermes 装好之后直接开用,我跟你说,那你最多发挥了三成功率,模型没配好,会报错,工具没开全会缺功能,人格没定义,就像跟一个没有性格的机器人聊天,今天我手把手带你走一遍。装完之后该怎么配?让你的 ai 助手真正为你所用? 装完之后有六大块要配,第一,主模型和提供商。第二,搜索声图、视频这些工具。第三,辅助模型,也就是后台干活的那些小模型。第四,备用模型,主模型挂了自动切换。 第五,人格文件定义, ai 怎么说话。第六,配置修改的安全流程一个一个来。 首先是主模型,两种方式,第一种,终端里输入 hermis model, 它会给你一个交互式界面,选模型,选提供商,跟着走就行。 第二种,如果你用的是自定义提供商,比如自己搭的代理服务,那就在 config 点 ym 里找到 custom 下划线 providers 这一栏,把提供商名称、 api 地址密钥填进去,再把 model 点 default 设成你要的模型名。配好之后可以用 hermis doctor 检查一下连通信。 第二款工具终端里输入 hermes tools, 会出现一个列表,每个工具后面有起用和禁用的状态,网页搜索、图片生成、视频分析,浏览器自动化,这些都是按需起用的。 起用之后,有些工具还需要额外的 api 密钥,比如网页搜索,你得在 e n 福页里加上搜索服务 d i 密钥, e n 就是 专门放密钥的地方,跟 config 点 iml 分 开管理,一个管配置,一个管密钥。 第三块,辅助模型,这个很多人不知道, hermes 除了主聊天模型,还有一堆后台任务在跑, 比如你发一张图片让它识别,用的是视觉模型,对话太长了。自动压缩用的是压缩模型,给绘画起标题用的是标题模型。这些任务不会自动用你的主模型,它们有自己的一套配置。 在 cf 点 excel 的 excel 部分,每个任务可以单独指定用哪个提供商和哪个模型。建议用便宜快速的模型来做这些杂货,把主模型的算力留给正经对话。 第四块,备用模型。主模型不可能永远在写 api, 有 时候会挂在 cf 点 emo 的 four bytes 下划线。 providers 里可以配多个备用模型, hermes 会按顺序尝试,第一个不行就换第二个,再不行换第三个。建议配两到三个不同提供商的,这样即使一个服务商出了问题,其他的还能顶上,别把鸡蛋放在一个篮子里。第五块,也是最影响体验的人格文件, s o 月幺点 m d。 这个文件决定了你的 ai 怎么说话,什么语气,什么风格,有哪些规矩。我的做法是用问答的方式来收集需求,先问语言中文还是英文,再问语气专业正视还是轻松随意,再问回复长度简短还是详细, 然后问行为规则,比如操作前要不要确认出错了,是自己排查还是问你,最后问禁令有没有你特别讨厌的行为。全部问完之后,整理成结构化的文件写进去,每次新对话都会加载这个文件,效果立竿见影。 最后一点,也是最容易踩坑的。改配置文件必须走五步流程,第一步,备份原文件, c p 一下就行。第二步,查官方文档,确认格式,别凭感觉改。第三步,动手修改。第四步,校验语法, y m l 文件可以用 hersy check 来检查。 第五步,重启服务,让配置生效。这五步,一步都不能跳,跳一步出了问题,排错的时间比你省下的多十倍。 配置好了, harmis 才真正属于你。模型是大脑,工具是窗手,备用方案是保险,人格,文件是灵魂,花半小。

别再纠结是 codex 还是 cloud code 了,我在实测了数十个 agent 之后,发现真正决定生产力上限的不仅仅是 agent 工具,还有你手里的 skill 配置。如果你的 skill 没配对,换再强的 agent 也是在浪费时间。 所以我根据实际开发场景和我的日常使用,筛选出了这四组最核心的顶级 skill, 包含了原能力扩展、工程化开发、前端设计和内容创作。 它们完全不挑平台,不管你以后切换到哪个 agent 装上都能用。先讲最根本的两把钥匙,我称为原 skill。 你 可以把它理解成让 ai 自我进化的能力,它不负责具体的活,而是专门用来扩展 agent 的 能力边界的。不管你用 ai 做什么,这都是你第一天就应该打好的地基。 第一个是 skill creator, 来自 antropic 官方。如果你想把一套成熟的工作流变成一个新的 skill, 便于后续调用,那么选它就对了。 以前想自己做个 skill 特别麻烦,得先去研究半天复杂的格式,不然可能写出来的 skill 还会报错。就算写出来了,使用效果也不一定尽如人意。但现在有了它,你不需要去研究什么复杂的格式,也不用手动改文件, 你只需要像给同事交代工作一样,用大白话把你的流程说一遍,或者直接把你的操作手册丢给他,他就会自动帮你起草、测试、反复迭代。在你自己完全不用看开发文档的情况下,一分钟就能写出一个既标准又好用的 skill。 安装和使用方式也很简单,在安装完成后, 只需要在 agent 里选中 skill creator, 然后输入你的需求,和它一步步地进行沟通就好。建议直接局安装,这样无论你在哪个项目里,都可以随时进行调用。第二个是 find skills, 大家千万别把它当成一个普通的搜索插件, 觉得还得自己手动去查。真正的用法是你直接给 agent 派任务就行了。比如你让他帮你做个 ui 设计,要是他发现自己不会,他就会自动把你的需求拆解成 ui 抵赞你这种关键词,然后自己去全网搬救兵。他在后台连接的是 skill 点 s h 这个平台,他会自己查看哪个 skill 安装量大,哪个作者靠谱, 然后挑出最好的那个供你进行选择。在你选择好之后,它还能直接一行命令帮你安装上 skill。 creator 是 让它能自己造工具,而 find skills 是 让它能去外面找现成的,这两个配合使用,一定能大大提升你的 agent 的 工作效率。接下来是针对具体场景的 skill。 先说软件开发, 我选了这三个, superpowers, j stack 和一个前端大神的 skill, 它们针对的场景略有区别,但核心都在解决同一个问题,就是终结那种看似逻辑闭环,实则无法落地的代码幻觉,帮你守住工程底线。第一个 superpowers, 他的杀手锏在于他把测试驱动开发这套严苛的工程标准,直接变成了 agent 必须遵守的硬规则。其实很多人刚开始用 ai 编程,最容易上手的场景就是让他写测试,而 superpowers 顺着这个逻辑直接把开发流程给正规化了,他 会强制 agent 进入一套标准的红绿重构循环,先写一个必然失败的测试,证明功能还没实现,然后写最少量的代码,让它变绿,最后再进行优化, 而且它非常稳。 agent 写完之后,它会自动开启两轮内部审计,一轮看代码,实现跟你的需求对不对的上。另一轮则专门盯着代码的质量挑毛病。这种慢思考的模式能帮你抓出很多隐藏的边界问题。 虽然看起来多花了一点点时间,但因为它第一遍就能把代码写到八十分以上,省掉了后面无数次反复抵 bug 的 时间,长期来看反而更省头肯也更省钱。它的整个工作流程大致如下, 首先他会拉着你做头脑风暴,把需求细节彻底磨清楚,先出一份整体的设计文档。然后他会把大任务拆成一个个几分钟就能搞定的小碎活儿,每个活儿都有明确的验证标准。接着就是让紫 a j 特自己去跑, 他自己写,自己查,严禁跳步,你只要在旁边关键节点确认一下就行。最后等测试全部通过了,他会把选项丢给你,是直接合并代码,还是先留着分支,或者觉得不行直接丢掉?第二个是 j stack, 作者是 y c 的 总裁 gary 谭。如果你还不知道 y c 是 什么,简单说,它就是全球最牛的创业孵化器,像 airbnb、 dropbox 这种巨头都是它孵化出来的。所以这位大佬出的工具,骨子里带的就是那种硅谷创业者的实战基因。这个工具有一点不同, 它不是那种功能单一的 skill, 而是在 agent 里内置了二十三个不同的专家角色,从 ceo、 设计师到发布工程师,你都可以通过斜杠命令直接调用,这相当于给 agent 配齐了一整支团队,让他不再是单兵作战。为什么要搞这么多角色? 因为真正做商业系统,代码行数不值钱,能跑通才值钱。有了这群专家帮你交叉审计, agent 就 能在不同的专业视角下, 把你揪出那些隐藏极深的问题。我来向你介绍一下它的实战流程。首先,在你动手写第一行代码之前,先跑一下 office hours 命令。这就是 yc 最出名的灵魂拷问。 ai 不 会立刻写代码,而是像个严厉导师一样, 反问你六个最尖锐的问题,把不靠谱的假设先掐死。接着可以用 plan ceo review 命令,让 agent 站在 ceo 的 高度审视计划,看看有没有更优解。到了代码复合阶段, review 命令就是你的资深工程师,他不光找小 bug, 更盯着那些 c i 能过,但一上线就可能爆炸的工程隐患。另一个具有实战特色的是 q a 命令,以前 a 阵呢,只能在代码里纸上谈兵,但这个命令是真的,会打开浏览器,像真人测试员一样去点击验证, 直接把 bug 抓出来修掉。最后活干完了,直接执行 shift 命令,它会自动同步跑测试、推代码、开 pr。 整套发布动作一气呵成。该瑞坦统计过,二零二六年,它的代码产出是二零一三年的二百四十倍。这不是说 ai 写的代码行数多就是厉害,而是同样的需求, 他一个人现在能顶一支小团队在干活,这就是角色分工带来的本质变化。第三个是一套前端大神 mod, 自己日常工作用的 skill, 作者是 typescript 的 布道者,如果你平时前端开发比较多,那么可以试试这个。 这套工具重点解决的是人与 agent 之间沟通对不起的问题。 mark 总结过,如果没有好的引导规则, agent 写代码很容易陷入几种困境。首先是理解偏差, agent 可能根本没听懂你需要什么,或者写得太啰嗦,废话很多。然后是执行失败,好不容易写出来的代码,结果发现根本跑不通。最后是架构隐患, 虽然代码能跑,但因为缺乏整体规划,后期维护起来会非常痛苦。所以他的这套 skill 核心逻辑很简单,宁可在前期多花几分钟对其需求, 也不要在后期花几个小时去处理这套低质量的代码。具体到这套 skill 里面的指令,我建议你重点关注这几个。首先是 graeme 系列的命令,这就是刚才提到的拷问模式,当你提了一个模糊的需求,比如说想加个登录功能,他不会马上动手,而 是会回过头来不停地拷问你细节。可能问完之后,他发现你真正想要的是 sso 环境下的多租户登录,这就把隐患消灭在开工之前了。接着是 tree 命令,也就是 aure 分 诊,他会帮你把所有的任务都过一遍, 分清楚轻重缓急,确保你不是在修一些细枝末节的小 bug, 而忽视了真正堵塞进度的核心问题。最后还有一个 improve 命令,这是代码库的架构急救包, 你可以每隔几天就跑一次,让 agent 站在大局的视角审视你的代码库,找出那些以后可能会越来越难改的地方,并给出重构的建议。接下来是前端页面设计,这是最开始编程 agent 出来时,他做的最差的一个领域之一。 agent 化 u i 出来的永远都是那些固定的套路, 固定的字体,蓝紫色的渐变背景、圆角卡片、特定的按钮样式。你在网上看到的那些 ai 生成的界面,十个里面有十二个长的都一样。解决这个问题的 skill 有 两个,第一个是 frontend design, afropic 官方出品。如果你受够了那种千篇一律的 ai 审美, 那它就是你的救星。以前的 ai 画 ui, 一 眼看过去全是圆角卡片加紫色渐变,就像是在共用一套廉价的模板。 而 front and design 的 核心是帮你洗掉这些 ai 位。它不是机械的套用组建,而是根据你的产品调性去推敲更有质感的纹理,或者尝试那种更有呼吸感的非对称布局。比如你给他提一个具体的风格要求,想要一个杂志感带点硬核感的页面,他给出的方案里, 字体的比例和模块间的留白都会处理的很到位。有了这种对视觉细节的把控,你的 ui 就 从一眼 ai 变成了真正意义上的耐看。 第二个是 u i u x pro max。 如果说前面的工具是帮你找灵感,那这个就是直接帮你配了一个设计总监。它的特点在于,它不是在靠直觉画图,而是把专业设计的那些条条框框全部变成了底层的逻辑。比如你要做一个金融或者医疗类的界面,它会非常明确地告诉你 什么样的配色能体现安全感,什么样的字体更显专业。他甚至还会给你列出一份避坑指南,直接点出哪些设计在商业场景里是绝对不能碰的。之所以能这么专业,是因为他后台内置了一百六十多个行业的深度规则, 不管你遇到多冷门的业务,他都能拿出一套成体系的方案,从交互细节到动效走位,都给你安排的明明白白。 而且它有一个很实在的功能,就是能帮你生成一套可以持久化附用的设计系统。有了这套规范,你下次再开发新项目, 直接把文件丢给 agent 就 能用,不用每次都从零开始打磨风格。而且它的上手门槛很低,无论是装插件还是用命令行,都能快速跑起来。 这两款工具的分工也很明确, front and 底钻负责把画面画得出彩,而 u i u x pro max 负责把产品做的更专业。有了它们, ai 的 输出就再也不会有那种廉价感了。最后一类,内容创作。如果你用 agent 做内容创作,那这组宝玉老师的 skill 我 一定要强力推荐给你。 它首先解决的就是内容本身的高质量产出,比如它能帮你生成一张极具审美,完全不输专业设计师的封面图,或者把一大段枯燥的文字直接变成一张高信息密度的格式化信息图。 在内容做漂亮之后,他还会顺手帮你搞定后面那些讨厌的碎活,比如说转格式、做排版,最后还能直接一键发布到各个平台,他把从生产到发布的全流程都打通了,有了它,你就能真正实现生产和发布一体化,把所有的精力都集中在打磨好内容上。 宝玉老师的这套工具箱里包含了十几个好用的 skill, 我 这里简单带大家看几个。首先是用于生成封面图的 cover image skill, 它最强的地方在于有一套五维控制系统,从构图类型、色调方案、渲染风格到文字排版和情绪基调, 全都能精准调优。这七十七种预设组合,能让封面彻底告别开盲盒的随机感,每一张出来的效果都像是为你的文章量身定制的专业设计。 如果你平时觉得画逻辑图、架构图很头疼,那这个信息图相关的 skill 绝对是神器。它内置了二十一种专业的信息布局,像分析原因的鱼骨图、做转化的漏斗图、梳理层级的金字塔图应有尽有。更聪明的是, 它能自动读懂你文案里的逻辑结构,直接推荐最合适的布局方案。以前要在设计软件里磨半天的信息大图, 现在只需要几秒钟就能产出出版级的可量化成果。如果你经营小红书,那么可以使用小红书 image skill, 它能将长文章自动拆解为一到十张卡通风格的轮播卡片。通过内置的十一种视觉风格和八种排版模式, 如对比、清单、流程等,可以快速生成符合平台排版习惯的图文内容。针对排版环节, 这个 markdown to html 的 skill 解决的是一个非常具体的痛点,那就是在微信公众号这种不支持 markdown 的 平台上,如何保留精致的排版。它内置了多套公众号主题,能自动处理代码、高量和数学公式。 最实用的一点是,它能把文中的普通外链自动转为文末的底部引用,彻底解决了公众号里链接打不开或者被截断的尴尬。如果你平时还有翻译文章或者精读外文资料的需求,那这个翻译 skill 就 派上用场了。 他最强的地方在于提供了一个正式出版级的模式,这个模式不是直接进行翻译,而是会走分析、翻译、校正再到润色这整整四步的流程。 而且他有一个非常人性化的功能,就是能让你指定你的读者是谁。比如你告诉他你的读者是资深开发者,他就会自动省略掉那些庸愚的解释, 翻译出来的语气读起来就像是真正的圈内人写的。最后,当你把内容全部准备妥当,可以通过发布微信或者发布微博这两个 skill 来实现一键跨平台分发。 它区分了不同的分发逻辑,你可以发长文形式的文章,也可以选择只发几张图片配一段摘药的贴图模式。它把那些复杂的后台操作全都变成了 agent 里面的一行指令, 从本地草稿到最终发布,整套流程都可以在 agent 里面直接闭环完成。今天分享的这些 skill 只是个开始,其实最关键的是大家要根据自己的工作流程和使用场景,去打磨出真正适合自己的 skill。 如果觉得视频对你有帮助,别忘了点赞和订阅,我是俊旺,我们下期再见!

这是我在海鲜市场三百多淘到的小主机,今天我手把手教大家如何淘到二十四小时流畅运行龙虾的小主机 流畅运行这些功能。话不多说,我们直接开始。如果你搜小主机这三个字,那么很多都是 ddr 三的老年机,所以搜的时候最好带上 cpu 的 型号,或者直接带上品牌 g p q 型号,从横到拉我打在屏幕上。内存最好选 d d r 四往上的,内存大小要八 g b 往上的四 g b 很多更能用不了。要想捡漏同款低价,一定要选版载内存的,因为这些它的内存没有办法拆下来卖, 所以你能省下一个内存钱。要找相对价格低的,你就要优先看个人卖家的,要判断的话,你就直接看他的个人主页有没有挂其他东西是不是挂了。很多同样产品,买之前一定要问好功能是否完整。 刚刚我搜的是 n 系列的,所以会贵一些,但如果你搜的是其他的,那么三百到四百元就可以拿下一个八 g 内存的不带硬盘的小主机,只需要再花六十元,再淘一个一百二十八 g 的 硬盘,那整个主机就大功告成了,总共花费不超过五百元。

免费了,不要三四九九,也不要九块九,不包手机的平替智普的开源项目 open auto gm, 配合它的开源模型 auto g o m 九 d, 咱们也能实现手机 agent 的 自由。我用手上这台安卓手机和 mac 电脑搭好的环境,让他来帮我购物, 这是执行效果,提示词是在淘宝上找到帮宝适黑金刚 l 码最低价的商品,加入购物车,然后发微信告诉我商品选好了。我来看看。这套开源方案和豆包手机最大的区别有三点,第一, 一,运行级别不同。开源方案只能在前台运行,豆包手机可以在后台自己默默的运行。第二,手机的便携性不同。开源方案手机和电脑必须用数据线连接,或者是在同一个 wifi 下,豆包手机可以只拿着手机到处走。三、智能程度不同。 开源方案接的是九 b 参数的小模型,能完成大部分的基础场景,但是极限智能比不上豆包手机。推荐两种适合的使用场景。 场景一,操作电脑忙不开的时候,比如快下班时提前叫车,当同事还在等车的时候,你已经上车回家了。场景二,需要在手机上多个 app 之间切换,收集数据,分析并且最终操作手机的场景。比如说在双十二购物选择最低价格商品时,我的微信收到消息了,任务完成。 牛逼!那么这么牛逼的手机, a 镜的方案会不会很难配置呢?完全没问题,我摸索了一套极简方案,只需要一行命令和一句话就能配置好。 首先看我这期视频,一行命令把 cloud code 安装好,然后打开 cloud code, 告诉他这句话,一路点同意就能安装完成整个配置过程,需要用数据线把安卓手机 在电脑上这么简单都能就能搞定,快去配置一套试试吧!你还有什么场景想用手机 app 来解决的?详细的安装过程和常见问题我会总结成文档,方便大家查看。关注我,玩转 ai 编程。

嗨,欢迎回来,今天这期视频跟大家聊点硬的,我将手把手带着大家部署 open call 最新版本,全程实录,不含废话,准备好了吗? let's go! 首先进入启动台,找到终端并打开。 接着呢,将准备好的命令行复制后粘贴到终端内回车,此时会出现安装的窗口,点击同意。接下来就会进入到 xcode 工具安装过程, 整个过程大约耗时七分半钟。到了这里终于来到了安装成功的界面。来到第二步,安装 uber, 将准备好的命令行复制后粘贴到终端内回车, 此时要求输入密码,输入的密码是不会显示的。接着等待安装中, 大约三分钟 homebrew 就 安装好啦,这里我再兴起一个终端。来到第三步,安装依赖 no, 即 get, 老规矩,还是将命令贴近终端回车, 等待安装。大约三分半钟,安装好,我们来验证下输入命令分别得到 node 的 get 的 版本号,至此依赖包仪成功安装。 接着第四步,官方一键安装 open 口,我们将安装命令复制粘贴到命令行。这次我们安装的是最新发布的五月七日版本,等待自动安装。 接下来是配置了,默认选择 yes, 启动模式选择默认 quickstart 模型题,工商,我选择了 c a i, 也就是智普 earth method 选择 c。 嗯,接着来到智普 a i 开放平台, 我演示一下,新创建一个 a p i t 命名随意,然后靠屁 a p i t 值贴到命令行 默认模型,这里选默认的回车。接下来会让我们配置通讯方式,联网搜索技能 hux 等,这里暂时不配置选择跳过,后续我们会专门出一期讲解, 现在看到网关服务也安装好了, 启动方式选择更为友好的 ypui。 到这里可以看到安装已经完成啦,这里安装一起大概也就四分钟左右,现在我们打开浏览器看看通了没,来问一个问题, 已没反应,也应该是选择的默认大模型,没有续费。我们来设置一个免费的模型测试一下, 把命令行贴进来,重启一下,查一下修改成功没? ok, 已修改为 glm 四点七 flash。 接着来到聊天界面,刷新一下,问个问题,一开始反应有点慢, 但是有回应了,再来问问今天星期几,追到正确的反馈,追下来就能够丝滑的跟他聊天了。 最后我也准备了部署资料,有需要的朋友可以在评论区留言, 另外你们还有啥想听的也可以告诉我。好了,今天的分享就到这里,如果觉得有帮助请记得一键三连,我们下期见啦!