粉丝1663获赞7154

这个国产龙虾 coco 是 一点也不输 open call 啊,兄弟们,上次讲了它可以轻松的一键完成部署,对国内的用户是非常的友好。这次啊,我没写一行代码,就把我之前一个项目里的功能就是一键下载视频和转文字的功能做成 skill, 方便我用手机调用。先看一下最终效果啊, 当我刷到一个比较好的视频,就比如这个,我点击分享,然后复制链接,然后在我配置好的钉钉里粘贴发给我的大龙虾。好,龙虾已经开始工作了,我加速播放一下, 好,可以看到啊,龙虾告诉我视频已经下载好了,现在开始转写。 ok, 转写完了,我们看一下转写的内容啊,有一些错别字能接受,相当能接受,对吧? 好,接下来我就演示一下我是如何一行代码都没有写,就把这个功能做成 copop 的 skill 的。 我们先点击 coco 左侧的技能菜单,先看看 coco 默认的技能是怎么设置的,就比如这个最常用的 d o c x。 大 概的翻阅了一下,它其实也是用 python 写的一个工具,然后再用文档声明它的使用方式。 ok, 我 们复制这个文档作为参考范本。好,打开我的项目,把刚刚复制的文本粘贴到一个文件里,引用这个文件直接问 ai, 这是 coco 里的一个技能,我希望把我们的一键下载视频并转写文字的功能也做成一个 skill, 是 否可行? ok, ai 开始思考了,这里不耽误大家的时间,我就直接跳过这个过程,看看 ai 是 怎么回答的, 太可以了,而且非常适合做成 skill, 只需要把什么时候调用,怎么调用?常见失败如何处理?固化成规范即可。而且 ai 和贴心的已经帮我完成了文档。好,我们直接把 ai 生成的 skill 点 m d 的 内容复制出来,粘贴给 coco, 告诉他这是一个一键下载视频并转写文字的 skill。 ok, ai 开始思考,大概 two thousand years later? 开玩笑啊,应该也就几分钟。 coco 告诉我,现在已经可以把这个技能完全集成到我的 coco 工作区了,可以随时调用好。我还需要继续编排一个工作流,问一下 ai 是 否可以为我增加一个流程?如果我在钉钉上发送一个视频的分享文本,你就自动下载并转写,然后把转写的结果发给我。 ok, 等待 ai 处理好的 ai 说已经帮我部署好这个自动化流程了。怎么样,兄弟们?全程没有写过一行代码,甚至一行配置都没有写,就可以把以前开发过的功能直接添加成 copilot skill, 而且中间完全没有遇到任何困难。 顺便说一下,我那个项目也是一行代码都没有写,全是 ai 完成的。 ok, 建议各位收藏起来啊,试试给你的龙虾装上手脚。各位有什么疑问或者是后面希望交流什么内容可以评论区留言,我会尽可能的回复大家。

tik tok 一 周热点汇总第一百零六期本期的内容呢,包括了阿里的 open cloud 替代 wifi 感知人体活动实时的全球情报监控代码仓库生成知识图谱和字节的多智能体框架。那最后呢,还是分享两份资料,如果觉得内容不错呢,也别忘了点赞和关注。 扣炮啊,是通用实验室推出的一款可本地可云端部署的个人 ai 助理,看一眼界面呢,应该就能猜到啊,他对标的是谁, 最熟悉的感觉啊,当然是 openclaw, 随着最近啊 openclaw 的 热潮不断地发酵,它已经超过了二十六万 star, 是 github 上 star 最多,增长最快的软件类项目。那现在大厂们呢,也开始纷纷下场去参与竞争了,你觉得大厂们能撼动 openclaw 的 地位吗?在使用上呢,可以通过一条命令来去完成本地的部署,也可以通过啊 piping 来去安装。那安装好了之后呢,执行 cocopinit 来进行一下配置, 那其实这个配置当中的很多内容啊,如果你没有想好的话,可以不配,后面呢,到外部 ui 里再配置也是可以的。最后呢,执行扣炮 app 来去打开服务,就可以用浏览器呢到八零八八端口来去使用扣炮了。 功能上呢,扣炮可以连接像钉钉啊,飞书, qq, discord, message 等聊天软件,支持呢定时任务与主动的心跳,通过 skill 的 机制呢来去实现无限的能力扩展。 这个呢,和 openclock 的 思路呢,基本上是一致的,那它内置了一些 skill, 也可以自己呢去创建和导入。 coco 内置了主流的云端的模型支持,比如像摩达和 dice crop 最新的升级里面呢,还支持了自定义的模型供应商和欧拉玛,更加方便了。 同时呢,最近的升级啊,也实现了 prompt, hook tools, memory 等核心组建的模块儿,按照自己的需要啊来去组装自己的 agent。 那整体来看呢, coco 目前实现了 openclaw 的 整体的框架,但是呢,也能看出来啊,现在实现的还是稍微有些粗糙,很多地方呢还需要继续的打磨。 那好的地方呢,是目前的外部 ui 啊,在使用上我觉得比 openclaw 要顺手一些,至少呢更适合国内的使用习惯。其实啊,要说项目将来会怎么样,关键呢还是看他后续是否能够持续性的和高速的迭代。 real 呢,是一个非常有意思的开玩笑嘛,它通过 wifi 信号而不是摄像头呢,来去实现人体的感知能力,比如呢,像人体姿态的评估,呼吸的检测,心率的监测,还有存在的检测。那简单来说呢,它的目标啊,就是让普通的 wifi 设备变成一个隐形的传感器, 它可以感知到房间里人物的活动状态,而不需要呢任何的摄像头和穿戴的设备。那听起来是不是很神奇,对吧,那它的核心原理呢,就是利用 wifi 的 csi 信道状态信息,当人体移动或者呼吸的时候呢,会改变 wifi 信号的传播路径还有向位, 那路由呢,通过信号的处理和机器学习呢,来去分析这些变化,从而啊推断出人体的姿态,还有呼吸的频率和信率。 所以如果你想要玩儿的话呢,那一定要选择啊,支持 csi 的 设备安装的话呢,可以使用项目提供的 doc 来去快速的上手,那有哪些实用的价值呢?比如啊,可以看一看以下的这些场景, 像智能的建筑当中啊,可以用来做房屋的占用检测,那医疗的检测当中呢,可以做这种非接触式的呼吸和心率的检测。还有呢,像一些安全检测和工业的环境当中,可以在烟雾或者有遮挡的情况下去进行人员的检测。那目前呢,我没有这个支持的设备,大家可以根据自己的情况来去试试效果。 vivo 的 猫腻特呢,是一个开源的实时的全球情报监控仪表盘,我想呢,大家都知道啊,最近的世界啊,又不太平了, 某某和某某呢又打起来了,所以很多朋友呢,都非常关注实时的信息,那沃瑞的 monitor 呢,把新闻,地缘政治数据,市场信息,还有全球的关键基础设施数据啊,整合到了一个可直观的界面当中, 让用户呢可以像作战指挥大屏一样,快速的了解到世界各地正在发生的事情。那你可以呢,先到项目的几个 live demo 里去体验一下效果。比如呢,第一个 demo 里啊,大家最关注的就是伊朗的信息, 那如果啊,想要在本地使用的话,可以到 release 里去下载适合自己操作系统的版本。然后呢,使用时啊,会需要配置大模型的 a p i k 也可以呢,根据自己的需要去调整展示的模块,还有信息的来源。那总体来看啊,说实话,这个东西呢,其实不算难,很多博主都分享过这种类似的全网信息采集的这个思路, 但是呢,这个非常实用,而且呢它的这种啊作战指挥室大屏的这种样式啊,让男生非常的喜欢,谁小的时候啊,还没有过那种指挥千军万马的梦想呢。 get nexus 呢是一个非常有意思的开发者的工具,它可以把整个代码仓库呢自动的转换成知识图谱,帮助开发者呢用图结构啊去理解代码之间的关系。 你只需要呢把一个 get up 仓库或者是 zip 包拖进去,系统呢就会自动地去生成代码依赖的关系,模块的结构以及交互的关系,并且呢提供一个可适化的探索的界面。那系统内置了一个 graph rag 的 agent, 可以 基于生成的知识图谱呢来去回答问题。比如呢,像某个函数在哪里被调用啊, 哪些模块存在依赖的关系? get nexus 比较好的呢,就是这些工具啊,几乎都是零服务器架构,它完全可以在浏览器当中运行,包括了像代码的解析,图结构的构建,还有向量的编辑和查询的分析,都在客户端去完成。 因此呢,代码呢不会去被上传到任何的服务器,对隐私呢非常的友好。除了外部 ui 以外呢,它还有 c l i 的 模式,那你可以直接通过啊 c l i 加 m c p 去分析了, 这种方式呢可以具有更好的扩展性。那项目呢,也详细介绍了自己的技术站,还有架构的情况,感兴趣的朋友呢可以去深入研究一下。 第二, flow 呢是字节跳动开源的一个 deep research 的 多智能体的框架,目标呢是让 ai 呢不只是简单的回答问题,而是呢能够自主的去研究收集信息,分析数据,并且生成完整的结果。那它呢,把大语言模型啊,和一系列的工具,比如像 web search, 网页爬虫, python 执行环境等结合到一起, 让 ai 呢,可以实现复杂的研究任务。它的核心能力呢,包括了像 deep research 的 自动化,多智能体协调的架构,还有呢,工具与技能的系统,还有杀伤的环境。那目前的 dear flow 呢,是二点零的版本,它是从零开始,从构的与唯一呢,没有共享任何的代码, 主要呢基于 python, long graph 和 long chain 来去构建。那通过 d a g 工作流呢,来去组织多个 agent 的 执行的流程,并且呢支持长时间的任务和记忆机制,还有任务的检查点。那使用上啊,主要针对于像深度研究,内容创作,数据管道,还有自动化的场景。 那最后呢,还是分享两份资料啊,第一份呢,是塑造自己的下一个版本,二零二六前沿科技趋势,腾讯研究院出的报告,人工智能还有各领域的前沿科技呢,正以前所未有的速度去引进,社会的发展呢,正在努力的适应, 但人们的内心呢,依然忐忑不安,甚至感到迷茫。那来看看这个报告,关注一下前沿的趋势,来思考一下如何应对未来。那第二个是 openclaw 自我研究,一点零报告,看这个说明啊,这是一个 openclaw 自己完成的对自己的研究。那我对这个 ppt 的 风格啊,是非常的喜欢,这种机甲科技风啊,真的很不错。 那内容总体来说呢,不算太有深度,小白呢,可以当成科普来去看一下,还凑合,有需要的呢可以告诉我。以上呢就是本周的全部内容,那我们下次再见。

阿里刚开园的 q 泡桌面智能体,我替你们实打实踩坑实测了,一句话总结,咱们普通小白想上手,真的再等等,别着急,跟风折腾。 最开始我想本地部署,跟着豆包给的步骤一步一步来,全程全是代码操作,要配置各种环境,跑好几个网站下载对应的安装包。对我这种不懂小代码的小普通小白来说,真的巨复杂, 前前后后折腾了快两个小时,最后还是因为环境不兼容,直直接卡死,只能彻底放弃。然后我就去试了阿里云官网标注的五分钟一键部署,结果踩的坑一个接一个。首先就是大家最关心的费用问题, 别看模型本身是开源免费的,但实际用起来有不少消费调用大模型需要开通阿里百链服务,首月套餐七块九,包含一万八千次请求。这个倒是不贵, 但想在云上部署,必须租赁阿里云服务器,我选了最基础的入门配置,最低要先充值一百块,按量付费,折算下来一小时差不多七毛钱。 这里必须给大家提个醒,也是我自己踩过的坑,这个服务器不是你关机,不用就不扣费了。我折腾完关机放了一晚上,第二天一看啥操作也没做,又扣了好几块。 后来才搞明白,他默认状态下关机还是正常计费,只有手动开启节省停机模式,才能免掉算力部分的费用。而且就算开了这个模式,系统盘的存储费用还是会持续扣除 大家,大家如果只是临时测试用,用完一定要直接删除释放实力,不然钱不知不觉就被扣没了。 呃,钱的事还是其次,最折腾人的是他对咱们普通小白真的不够友好,操作手册的很多关键步骤对新手来说说明不够详细,就比如开通密钥,手册里只提到了开通编程密钥, 我照着操作折腾了半天一直报错,后来问了千问才搞明白,调用大模型需要开通的是大模型专用密钥, 就这一个没说明白的细节,白白浪费了我快一个小时。好不容易部署完成,我把它关联到钉钉上,想着手机上也能随时用,结果刚用第二句就出问题了,我先给他发了个文章链接,让他提炼核心要点,倒是很顺利就完成了。 紧接着我用语音发了一句,把这个内容和要点生成一个 ppt, 发出去直接就报错了。后来我问了技术支持才搞明白, 这根本不是我操作错了,是这个刚开源的初识版本本身就还没开发语音识别功能,原声只支持文本输入,不支持语音消息处理,属于版本本身的功能缺失,咱们普通人根本改不了,只能等官方后续更新版本。 整个折腾下来,我最大的感受就是这个工具真的只适合技术爱好者,懂代码的专业人士拿来测试学习。 对咱们这种只想拿它来干活、写文案、做内容的普通创作者来说,真的不建议。现在着急上手,到处都是没说明白的细节,不知道下一步 就会不知道下一步哪就会报错,时间全花在调试上了。有这功夫,用豆包、 deepsafe 那 些都写完好几篇文章了 其实,呃,跟我之前测的 mini max agent 一 样,这些新出的智能体对懂代码、懂逻辑的专业人士来说确实自由度高,很好用,但对咱们普通人来说,真的是步步都有门槛,体验感很不好。 最后给想试的朋友提三个新手一定会遇到的问题,大家记好避坑。第一,普通小白别轻易碰,本地部署操作门槛非常高。第二,开通密钥一定要开大模型专用的,别只开编程密钥。 第三,当前版本不支持语音识别,别在这上面白瞎白费功夫。给咱们普通人一句实在的建议,想玩这些新的 ai 智能体真的不用着急,再等等,等他们出了正式版本,功能完善了,哪天 咱们在应用商店里直接能下载到了再去用也不迟,现在跟风折腾,最后大概就是浪费时间浪费精力,还没办成事。 嗯,接下来我也会回归内容本身,把我用 ai 写头条、做自媒体的真实心得和实用技巧毫无保留的分享给大家。想跟着一起用 ai 做自媒体,少走弯路,不瞎折腾浪费时间的点个关注,咱们一步一步慢慢走。

cpa 作为国内一款与 open core 对 标的智能体,我认为在功能设计上比 open core 更易用,整体界面比较简洁。当然 copi 的 功能确实没有 open core 强大,但是在安装时 open core 就 比 copa 复杂了一些, 因为彼人一直都是用 one pinning 安装,点击下鼠标就行了,安装方面就没有什么区别了。 copi 的 需要在界面上配置大模型,任意选择 open codes 安装时就需要配置,但是在操作界面这里就不能更换大模型了, 只能通过代码配置对接。渠道方面, openclip 内置的基本没有国内可用的应用,想对接钉钉、飞书、 qq 就 得通过代码配置了。 coca 就 不同了,内置的都是国内的应用, 不需要配置代码就能对接这些平台。如果是钉钉的群聊机器人,可以在得到机器人的 web 之后,直接在聊天框里让它对接这个钉钉机器人,它就自动完成了。这两个智能体都是可以做到的。配置 skill, 也就是技能。没有研究过 open code, 看着这个界面真是不知道怎么下手, 但 coca 只给了一个提示,你就知道怎么操作。这里有几个 skill 的 网站,那么你就可以在这些网站上找想要的 skill, 把网址复制到配置框中就可以。虽然欧文科可以在里面搜索想要的 skill, 但只有五十一个,而且有些还是有限制的,这就和 coca 的 毫无对比性了。 配置 m c p 方面, coca 的 控制台是可以直接配置的, open class 没有入口,需要通过代码配置增加了使用门槛。但一些辅助安装的平台会做一些易用的功能,比如说 one panel, 它就提供了直接对接飞书等平台的配置界面, 免去代码的繁琐。除了 m c p, 还有心跳。 open class 在 网页控制台没有配置心跳的入口,只能通过命令,又提高了使用门槛。不过这个功能用处不大,定时任务基本也可以实现。最后总结一下,如果你代码能力比较强,喜欢研究钻研 或是对智能体的深度探,所有想法就选 openclo。 在 前段设计上, coco 比较容易上手,适合国内用户或不懂代码的小白入门。但是这段时间对 coco 测试,彼人也遇到了各种小 bug, 比如对话框无法切换、对话长时间没反应等问题。 如果阿里云开源的这个智能体不只是用来蹭热度,而是当成一个长期重点维护的项目,我相信这种差距会越来越小。并且 coco 里确实每天都在迭代版本, 应该不会让我们失望,哪怕后面你搞一些付费插件,持续支撑项目的发展,我相信很多用户也是能接受的。好了,今天就到这,我们下期再见。


windows 部署抠爬加接入非书超简单,准备工作必用 power shell, 别用 cmd, 提前配代理或科学上网,避免下载卡顿。步骤一,安装抠婆 自定义路径可选环境变量抠爬 home 等于指定安装路径执行安装命令。 um 管道 ex 自动装抠爬加 uv 工具卡,顿时检查网络或代理。 步骤二,初步化配置输入命令 call 为内双横线的 force, 用默认配置,后续可改终端出现安全提示,输入 yes 确认积蓄。步骤三,启动 call 应用基础启动 call pro up 默认监听八零八八端口 浏览器打开进入配置界面,自定义端口或地址可选改端口。 copop 双横线 pro 九零九零允许外部访问 copop 双横线后四零点零点零点零双横线 pro 九零九零步骤四,配置大模型 api 配置页点左下角模型选科室自定义点设置,填入 base url, 加 api key 保存后返回点添加模型,输入模型名如 gpt。 四、 call 三,确认保存即可使用。 推荐阿里云百链新课首月七点九元起,一万八千次请求。步骤五,接入飞书核心五、小步一,抠爬端配置配置页点频道飞书设置,填写 ipad ipc 课程,后续飞书开放平台获取。 二、飞书开放平台创应用登录飞书开放平台创建企业自建应用填名称描述图标完成创建。 三、配置机器人权限,启用机器人能力权限管理,批量导入指定此权限代码申请开通。四、配置事件回调事件与回调事件配置订阅方式,选长连接添加接收消息 v 二点零事件。 五、发布应用加添加机器人,创建并发布应用版本飞书工作台添加常用搜索创建的机器人名称,添加后即可对话。 避坑小技巧,安装失败必用 power shell 检查网络或代理启动报错。换端口检查防火墙端口限制非书无响应核对 api 凭证,确认应用已发布权限或事件配置正确。

过年放假了,大家都不在公司,同事呢,又想远程搭建一个项目,所以就找我部署的 openclaw 帮忙,结果把指令发给 openclaw 之后,接下来离谱的事情就来了, 项目里的大模型 apikey 需要修改,干脆就让 openclaw 自己去改。刚把密钥发给他,结果 好家伙,他直接理解错了,改的不是项目配置,是 openclaw 自己的配置,改完之后居然还主动重启了网关,直接给自己干报废了。之后不管给他发啥 openclaw 都只回复四零一,彻底摆烂, 硬生生等到我们开工删除了所有无效配置,重启 openclaw 之后才把他救回来。 ai 说,嘿,我亲手干掉了我自己,就问你服不服?


让 ai 一 次写一千行代码,里面有五个 bug, 怎么找出里面的五个 bug? 你 是不是蒙了?今天教你一招,让 bug 无处可藏!很多人让 ai 写代码,上来就说帮我写一个完整的登录系统, ai 很 听话,刷刷刷的帮你写了一千行代码,但是你一运行我错了,然后你盯着这一千行代码, bug 在 哪里也不知道。 ai 查来查去,问题越来越多,是表单的问题,是验证的问题,还是接口的问题,根本找不清楚 ai 写代码的最大的问题是什么,不知道自己错了,而且还特别自信的说,这次你运行一定不会再出问题了。最主要的是,代码越多, bug 藏的越深。 正确的做法是一次只做一件事情,不要说帮我写一个用户登录系统,要拆开说。第一步,先写登录表单的 u r、 e, 写完了跑一下,没问题了才进行下一步。第二步,再写一个表单验证的日期,写完测一下,没问题了,继续下一步。第三步,再写 api 调用,写完再测一下,最后一步 写错误处理,每一步写完就测,测完再进行下一步。这样做有什么好处呢? bug 出在哪里你立刻就知道,刚才还好好的,这一步坏了,那问题就出在这一步。不用一千行代码里大海捞针,很容易就知道问题出在哪里 了。所以小步快跑,步步验证,不要想一口吃成胖子,关注我,下期教你为什么一定要让 ai 解释他写的代码?