粉丝1.2万获赞1.8万

open clone 就是 龙虾,我觉得不适合大部分使用,为什么呢?首先第一个 open clone 它确实代表了一种趋势,它是一个自主性的,我目前就是它一出来我就研究了,就开始使用,然后也用它的所有的变体的版本去做。因为 open clone 它性能有点差,我比较倾向于做这种 边缘计算式的处理,但我发现它有几个问题啊。第一个就是说,如果说你的模型用的差的话,它的效果非常差,那你模型如果说用的好的模型呢?那你就处理一个简单任务,它所消耗的 token 是 非常大的。 我不知道你对于大部分人的业务是否愿意支撑,那我们比方说我们程序员,我们是愿意支付的,比方说我们程序员甚至愿意花费一个月说不定十万块钱买 token, 很多都是愿意的,因为它确实带来了效益,但大部分任务它没有那么高的效益,你如果买那种高端的 token 的 话,就不太合算。 然后那你如果想节省成本呢?你用低的,那效果差的,或者甚至于用本地的推理,本地的推理目前来说你除非配那种高端显卡,你也只能用这种三十多币或者是这一级别的模型,而且设备也很贵。然后拿的效果呢,其实比那种你用普通模型 效果更差。所以在这里呢,就是我觉得是玩的成分居多,我觉得所有的开发者都应该去使用试验一下,但是你想让他去解决问题,我觉得有几个几个点要解决到 本地推理其实也是可以的,我觉得在一段时间之后啊,就是这些设备的性能提升,然后模型的进步, 我们一定要能做到本地推理,比方说本地能达到一百、两百,呃,一秒钟两百个 token, 然后做这种多模态的处理的时候,都做得很好的时候,哎,我觉得机会就来了。 呃,这个我就最多一年吧,我们的本地设备就能跑比较好的模型阶阶段,但是阶阶段大家可能也要去试。为什么要试?就是你得先进去知道这样的一个趋势,就像最早的 angel 出来的时候一个趋势,现在 open klo 这种 自主性的模型他又是一个新的趋势,我们还是应该尽早关注,但是不能对他有过多的期待。

普通人要 openclaw 有 用吗?说句实话,不要看别人拉屎就钩子痒。 openclaw 对 普通人来说其实基本没什么用,它最大的亮点也是核心优势只有两个, ai, 自问自答加定时任务。 缺点也有两个,一,疯狂烧托肯。二,除非用顶级 ai, 否则智商不够。不够的后果就是疯狂烧托肯。营销号们鼓吹的一人公司坐拥十几个动画员工,全自动写自媒体做视频等等, 看似很赛博,实际上你看的这个视频都得自己剪辑自己做,还谈什么全自动赛博员工?你看看现在网上鼓吹的 open color 应用场景是什么?自动整理邮件,只有老外才经常用邮件沟通,国内你见过几个用邮件的企业? 还有整理笔记,整理干货,毫不夸张的说,我去年收藏超过七百五十个抖音短视频干货,可是我到现在都没回看学习过。现在让我用 open color 去整理一些永远用不到的信息,我是真的沟子痒了才去,还有日程提醒, 难道我每天背着电脑等着电脑提醒我?还是我手机闹铃铃声不好听?每天自动剪视频写字?媒体赚钱?你觉得平台傻还是用户傻?所以最 终几个亿的偷更玩玩 open 酷狗最大的体验指挥,有一个 ai 厂商才是最大受益者。简单来说,以前你用二十美刀订阅后几乎无限使用,而推广这个后,用户偷更消耗飞起, ai 厂商赚的盆满钵满。而折腾玩一圈的用户获得了什么?本质上和之前的一问一答唯一的区别就是 家可以每天清晨自动给你推送新闻,让你获得了当领导的快感,提供了情绪价值。真正用到了它的人都在干嘛呢?程序员用来自动跑脚本,批量处理服务器。 第二种是对隐私极度敏感的人,公司涉密、律师、金融体制内等。第三类是大量重复电脑操作的人,比如电商运营、改价查数据,行政财务用来处理大量表格 表单导出,还有科研导,批量爬回线处理数据。而普通人的日常是什么?上网聊天、追剧、网购完全用不上。普通人真正值得用的 ai 工具是什么?是点开就用,真省事,不折腾的那种。

哈喽,大家好,我是小温啊,今天想和大家分享一个我最近这样的成果,就是如何用阿根廷打造一个能自动运营小红书的这样一个 ai 助手啊,你没有听错啊,就是那种他能够自己浏览网页,然后管理文件,甚至登录小红书,帮你发笔记的这样一个 ai。 那 我也是从零开始一路踩坑无数,自己都没想到他终于跑通了, 现在呢,他可以帮我搜热点,写文案,看评论。那整个过程呢,我总结成了三大模块,第一模块呢,它叫做安装配置,安装阿根廷的配置与环境。第二阶段呢,我教他这个权限赋语, 让我们的 ai 能够拥有管理文件和网页这样一个权限。最后呢,我把它叫做这个集成小红书的 m c p 服务,那这条视频请大家一定要看到。最后,我把所有的关键步骤和避坑指南都整理好了。 首先在第一阶段呢,呃,我们要做的是一个欧根可乐的基础安装和环境配置,那在安装欧根可乐之前,大家一定要安装一个 note g s, 我 这里呢是用我们的 mac 来做一个演示,你如果是 windows 版的话,那我们的效果呢,是一样的,步骤呢,也都是一样的, 在在安装我们的这个欧本可乐的时候,用这样一条命令就可以安装好。那这个验证安装成果啊,用它来做欧本可乐,看一下它的 warren, 刚刚 warren 如果它的版本是可以的话,那么我们就能够做到正能说。哎,我的 warren 可乐已经安装了,那我的呢,安装的是三月二号的版本啊,也是很新的, 安装完之后要做的是一个出使画向导配置能够的这块呢给大家演示一下,在出使画向导的时候呢,他会问你选什么模型,然后呢后面可以手动改成第四个, 这个问题都不是很大,我这边就不再往下走了,因为我已经配置过了,如果再敲的话,我或许要再重新配置一下。我建议啊,对于小白而言啊,我们呢就因为我也说小白,我说这个东西很麻烦,所以我建议大家先选择先问,后面呢再配一个飞书,这样呢我们就可以在飞书上随时随地的和我们的这个呃 欧鹏可乐来交流和沟通了,那我这边先退出。装完之后呢,我们可以敲一下这个命令,看一下他是否装完了,那我就比如说我可以敲一下欧鹏可乐,然后呢该到位,该到位, 然后呢 space 就是 来判断我们这个现在和分可料的一个运行状态,当你看到说 running run time 没 ok 的 时候,就说明我们的这个分可料它现在已经正常的在跑了。那在第一阶段的最后呢,说到一个模型选择啊,这边呢给大家推荐的是千问和 deep stack 呢,我个人建议大家可以先用千问完成最基本的配置,到后面呢,我们再用 deep stack 去再用我们的配置软件手动改成我们的 deep stack。 那这边呢,我们大家可以用这个命令打开这个 oppo 可乐点这一个文件, windows 用户呢可以直接点开,我们只需要在这个 oppo 可乐点这一部分替换进去就可以了。需要注意的是这个 api key 这个字段要替换成,要替换成你自己的那个 api key, 并且这个 key 呢,请大家认真去保存起来啊。 替换好这个配置文件之后,重启网关,敲章一下命令,他就可以实现了。那我来演示一下敲的效果, oppo 可乐开启位置 star 啊,就是重启我们的 oppo 可乐服务,当它出现这样的时候,就说明我们的 oppo 可乐已经重重启好了。 那第二阶段呢?我们要做的呢,就是赋予我们 ai 的 一个手脚啊,你完成第一阶段,你可以跟他聊天,你可以跟他介绍你自己是谁,你可以命名。为什么什么都可以啊?那到这一步呢,他只能跟你聊天,那我们需要用模块二来赋予我们 ai 做一个文件和网页权限。第一 步呢, openmind 管理权限,管理文件权限, openmind 对 文件操作有着精细的这样一个权限管理,最简单的方式是使用官方预制的扣定配置机,你可以直接敲这样一条命令,也可以在我们的配置文件里面去。 呃,去设置都可以。那如果你是卖电脑的话,你需要关注一下啊,如果你今年的 oppo 卡里配置还不够,你需要去系统里面给你的 oppo 卡里赋予一些权限。权限完之后呢,我们需要给 oppo 卡里做一个网页浏览和自动化的这样一个功能,那也是用我们的相关的强命令安装一些浏览器的的技能就可以了。那我这里面用的是这个 play right 杠 mcp 吃了很多,我觉得这个是比较简单并且能够实现我们的效果的。 当他做完了以后,命令来也是命令来验证一下,验证一下我们的温克斯 q 里面,他的进库里面有没有这样一个 play right mcp, 那 我这个地方呢,始终显示的是一个 missing 啊,大家,大家可以不用管你,你那边可能是 ready, 可能是 missing, 都有可能。最终一件事你可以验证,你可以去这个我们的 t y 里面跟给他发消息说帮我整理说明的文件,按类型放到不同文件夹里面。 这个地方呢,需要来着重强调一下,如果你对你电脑,对你的办公电脑的话,我建议大家把把 ai 的 权限范围只控制在他的工作空间和你桌面上的某一个文件,比如说我这个地方,我只给他控制在了他的工作空间和桌面的一个叫 nano nova 这个文件夹里面,这样的话呢,他不会乱动你的文件,保证你文件的一个安全。 那第三阶段呢,就是安,就像为我们多功能口袋集成我们的小红书 m c p 服务,那大家可以按照这样的步骤去往一端下载,下载好以后呢解压,解压好以后呢可以安装到单独的一个文件夹里面,那给大家看一下安装 m c p 服务之后的效果啊, 那我这边呢就是安装在我们的这个主目录下面小红书和 mcp 这个文件夹里边啊,给大家看一下,安装以后应该有这样几个文件,并且呢都给相关的可执行文件赋予他们的一个可执行权限,我们就要用我们这个工具来登录我们的小红书,这一步它会自动打开一个窗口,需要你去扫码登录小红书,我们可以开始用这个工具运行我们的小红书工具, 能够看到这样的输出的时候,说明该服务已经成功了。那最后呢,我们要将我们的可乐和我们的这个小红书本地 mcp 服务关联起来,用的这样一个工具来做啊, 具体步骤呢,也是先安装,然后测试,我们能够看到我们那个小红书工具已经被集成到里面去了啊,最后呢,全部都安装好以后啊,也是重启网关,然后验证受限,再到最后大家就到了我们激动人心的时刻了啊, 你可以对着你的 ai 下指令说,帮我检查小红书登录状态啊,帮我搜索爆款笔记,帮我生成并发布一些吸引人的一些呃,标题的小红书啊。

最近全网都在聊一只开源龙虾 openclaw, 它不是某家大厂独吞的产品,而是真正火遍全球的现象级 ai。 先讲清楚它是谁? openclaw 最早是奥地利开发者 peter steinberg 的 个人开源项目,后来由 amantis machina 推进,现在是 mit 许可社区治理基金会运营,没有任何一家公司独家持有,独家控制。 peter 是 谁?他曾创办 pspdfkit, 是 真正的技术大牛。而 opencloud 完全开源,任何人都能免费使用,自由修改,国内也跟上了。有道龙虾就是面向国内用户的商业化版本,格式化界面简单好上手,深度适配中文办公场景。 为什么这么多大厂都在抢?因为龙虾真的太能打,腾讯云在跑他的服务头部公司有 tiktok, 支持飞书打通工作流,连富盛都连续用了三周,天天离不开。 一句话总结, openclaw 不是 玩具,是能帮你干活的 ai 代理,不是封闭系统,是全球共建的开源生态, 是昙花一现,是下一代 ai 的 方向。龙虾虽好,可不能贪多,肠胃也要能接受的了,也许在过段时间会更肥美呢。记得点赞加关注!
![搭建自己的manus 安装包地址:https://github.com/mannaandpoem/OpenManus
使用一个AI编程工具,把下面的内容发给AI去执行:
···
参考下面的安装说明,安装开发环境:
创建一个新的 conda 环境:
conda create -n open_manus python=3.12
conda activate open_manus
克隆存储库:
git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus
安装依赖项:
pip3 install -r requirements.txt
···
然后调整配置:
···
我现在需要配置工程,我查看了配置文件,我没有claude的api key,我可以使用deepseek的API key,请按照配置说明帮你调整出调用deepseek的API的配置,其中的base_url需要修改:OpenManus 需要对其使用的 LLM API 进行配置。请按照以下步骤设置您的配置:
在目录中创建一个config.toml文件config(您可以从示例中复制):
cp config/config.example.toml config/config.toml
编辑config/config.toml以添加您的 API 密钥并自定义设置:
# Global LLM configuration
[llm]
model = "gpt-4o"
base_url = "https://api.openai.com/v1"
api_key = "sk-..." # Replace with your actual API key
max_tokens = 4096
temperature = 0.0
# Optional configuration for specific LLM models
[llm.vision]
model = "gpt-4o"
base_url = "https://api.openai.com/v1"
api_key = "sk-..." # Replace with your actual API key
···
#人工智能 #干货分享 #manus #微笑着前进Bright](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/427543ec2d01f679f5ca8a7f32de519d~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2092158000&x-signature=TLm4ebGJU5%2BY4kt%2FDIWpnOvzawo%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=202604220313548560134D3A5EC829037D)

最近网上 openclore 特别的火,然后我在二月二十号左右,我自己也去下载了一个 openclore, 从零到一,自己完全的去部署和摸索, 从最初不知道如何部署,然后再到提示词全面的去调试, 就是所谓的这个养龙虾嘛,然后再到呃整个的这个多团队 a 梗这个配置,然后再最终到了呃,就是用不同的任务去 让 openclaw 自己去调用不同的这个模型去处理复杂的这个任务。嗯,其实我在接触 openclaw 的 时候呢, 我一个最大的感触就是它真的是一个知识屏权的这个工具,你只要把权限完全的开放给他,他可以做很多很多,我们 很多人不想,就是没有办法去做,就是技术门槛很高的很多事情,你比如说,呃,我们不擅长去做这个呃, ppt 你也不会,或者你没有接触过,你只要告诉他帮我去搜寻相关的这个内容,内容的主要内容,内容里面的提纲大概是怎么样怎么样怎么样,然后让他去生成专业的用于做什么的 ppt, 他 会很迅速的 去生成你想要的,然后去提交结果给你去审核。那 opencore 给我最大的感受是什么呢?就是 它跟 ai 智能体完全不一样的点在于 ai 智能体是你给他什么指令,他返回什么样的结果。那 这边有个很重要的点,就是他不会去帮你去考虑其他的东西去给你参考。但是 open club 不 一样,他支持长线任务和短线任务,你给他一个具体的目标和方针,他自己会去学 相关的技能和插件,甚至会编辑自己的这个技能去完善,从而达成做到这件事情的这个目的。你比如说,呃,我们要去分析某个行业它的数据支撑支撑,但是呢 你以前你是从来不知道这一个东西数据从哪里来,然后要考虑哪一些问题, 分析的要从哪一方面去分析。但是 openai 出来了以后,你完全不用去考虑这个事情,然后它会遇到问题了,它会驱使你去提供 他要完成这个任务所需要的这个东西。你比如说我要让他去查我的抖音的粉丝列表和粉丝画像, 那他在遇到问题了,他第一个遇到的问题就是抖音账号和登录是否开放权限给他,还是说让你登录好了告诉他,然后他进行操作,然后中间你就不用管了,他会把最终的结果报告返回给你, 就是一句话的事情,你不用去考虑太多。所以 open crawl 呢,跟智能体最大的不一样就是它可以支持长线的任务,然后还有一个最大的感受就是什么呢? 使用 open crawl 最大的限制在于你自己的想象空间和规划整合的这个能力, 才能最大程度的去调动他为你去做事。有些时候你没有 创业过,那创业上会遇到哪一些问题和哪一些瓶颈?你需要的元素和资源有哪一些?你不能完全的去描述清楚,就导致 open crawl 它的完成度不好,或者是你根本就想象不到那一个领域的事情,从而去开发它的这个功能。 给大家看一下我这边我自己养的这个龙虾,然后它可以完成非常非常多的这个工作,然后每天我会要求它把工作和报告任务给我。


给大家来介绍一下,我们今天整个内容是介绍类似于 open cloud 这种系统级的 ai 智能体的完整的实现啊,为什么我们说是百万年薪的前端全站 ai 修炼啊?毫不夸张,因为现在呢,像类似于 open cloud 或者是 melus, 大家只要稍微去有点呃这个概念啊,了解的新闻都知道,这些产品都是属于现象级产品, 只有往这个产品的方向去走,接下来他的技术的溢价才会高很多很多这个企业呢,他其实都在去招聘这方面的一些开发所具备有技术的一些技术人员啊,那所以呢,这个只要你能够学会一些大概的架构和实现的思路,其实你去面试是很有帮助的。 那么我们从三个问题来给大家展开,当然过往的话有很多呃,近两年的公开课啊,大家如果说之前没有来听过的话,可以去课后找咨询老师去领取,之后呢,比如有某一节课拿到之后详细去看一看。 好,然后呢,我们会从三个问题来给大家展开,当然这三个问题呢,是完全贴近前端的啊,我们不会逐逐原码的去分析这个 open cloud, 我 们主要呢把它完整地的开发的一个范式。还有呢,我们怎么样去基于 nonchart 或者 non graph 结合终端工具啊,结合这个 web 结合服务端把他们三端打通啊,一个是 web 端,服务端和控制台这三端打通啊,然后呢,我们会围绕三个问题,当然这三个问题呢,其实是面向于不同阶层的同学,目前呢,可能很多同学呢没有接触过智能体,那么我们会把它分为三部分, 第一个的话,作为前端开发,有没有了解过 ai 智能体?有了解过的话,那类似于 codes 或者是 malice 这种通用智能体的话,它的区别是什么?这种是偏认知,偏在面试过程中你要给面试官侃侃而谈的一些点啊。然后呢,在中高级的问题, 大家很多同学可能现在都在用 call code 或者是 codex 或者这些产品,对吧?那么像这一类的系统级的一些 ai 智能体,如果让你来去基于 nonchan 或者是 command 来实现的话,大概的思路是什么? 然后第三个专家级的问题,如果让你来从零到一去开发类似 open cloud 这种系统级的 ai 智能体,有没有具体的思路啊?大家可能呢,平常有学过什么 long chain, long graph 这些框架,但这些框架真正如如果用,让你来去开发一个复杂的智能体, 具体的实操怎么来做?很多同学呢,可能不清楚啊,那其实真正现在学习的一个高高价值的点就在于这啊,就是怎么样去把 ai 落地。那么呢我们会围绕几个点呢?第一个呢,是智能体的任务拆解策略啊,因为其实任何的智能体,它的本质就一个公式, agent 等于大模型加规划加记忆,然后呢加工具调用。大家记住这一个点啊,不管是你以后看到千奇百怪各种各样的智能体,它最终的形态都满足这样一个公式, 都满足这样一个公式。就比如说很多同学可能以前去呃了解这个 react 的 源码的时候, react 的 源码其实就会有一个点叫 fn 等于 这个呃就是 ui 等于 f state, 对 吧?会有这样一个公式,就是状态驱动,试图更新,但是其实真正我们在做智能体开发的时候,它的这个通用化的公式其实基本上都是围绕 大模型加规划, planning 啊,叫 memory, 这个是记忆化,不管是上下文记忆啊,还是这个持久化记忆,然后再到工具调用,当然在工具调用这一层呢,又衍生出来了很多东西啊,在这一层,工具调用这一层衍生出来了 m c p, 衍生出来了 skills, skills, 这些其实都是囊括在其中的啊, 特别是这个 skills, 它其实就是这个提示词的一种变体啊,就这样去理解的话,其实你把工具把这些内容呢去整合来去理解, 会更清晰一些啊,这是一个通用公式,以后如果面试问到你对于 agent 的 理解,那就围绕这个公式,大模型加 planning memory 啊,然后呢工具调用工具里面呢,可能还会涉及一些比如 m c p, m c p 的 服务端的开发,客户端的对接,然后呢,那个 skills 的 一些开发和使用 就是围绕这个点,所以其实说破天了, agent 开发呢,就是围绕这个公式来进行模型选择,什么模型对吧?有纹身图,图身图,然后呢?纹身视频,数字人,那这些都是模型的选择,然后呢,再到 planning, planning 规划这一层呢,其实你的智能体的开发的一个模式是什么样的啊?比如说有 react 模式啊,还有其他的模式, 然后记忆的话,那有比如说基于 rack, 有 上下文的存储的工具这一层呢,有工具调用的,基于,比如基于 nunchin 的 工具开发 mcp 和 skills 呢,相信大家同学们看的比较多一点啊, mcp 和 skills, 所以 都满足这样一个公式,就是第一点给大家会详细拆解 呃已有的这些智能体啊,比如像扣子的这种工作流行智能体, melus 的 通用智能体,还有一些垂类智能体。 好,第二个呢,就是比如说基于 react 思路下的一种自我修复循环和跨进程的通信啊,这个呢其实主要体现在比如说 non graph 的 这些这个框架里面, 然后呢还有就是多 agent 的 协助,多 agent 的 协助呢,这个概念其实现在也被炒得比较火热了啊,就不管是 agent teams, 还是以前说的这个智能体蜂群等等,都是解决多智能体的问题, 包括呢还有智能体的继承啊,它有很多延伸出来很多干概念,但这些概念呢,你如果理解了它本质以后,其实会发现万变不离其宗啊。 好,那么呢,我们接下来就会给大家去详细的去按照这三个问题详细展开,一个初中级,第二个中高级的问题,再是专家级的这个问题,三个问题,我们最后呢会实现一个简单版的 open call, 那 么我们在实现之前。