兄弟们,这是一个近期在 github 上势头很猛的智能体项目,它有点像 openclo 和 cloud code 结合体,你既可以用 telegram、 discord 等通信渠道给他远程派发即时或定时任务,让他自主规划长时间干活,完成复杂任务。 也可以像用 cloud code 那 样,直接在终端通过 t u i 界面或 c l i 命令跟它交互。不过它并不是一个缝合怪,它有自己的独到之处。首先是强大的自我进化能力,它内置了学习循环,会在干活过程中主动总结经验,生成技能, 并在后续工作中不断优化这些技能。其次是原生,支持多种运行环境,不止能跑在本地,还能跑在隔离容器、远程服务器,甚至以 service 方式跑在云上。当然,当前 agent 的 标配功能它也都集成了, 比如支持 skills mcp 接入工具使用模型自定义 sponge agent 并行干活,还有记忆管理等等。这个项目采用 mit 协议,完全开源,免费。
粉丝7665获赞7.1万

open 克拉梅部署上,没关系,因为腾讯版小龙虾正式上线了,主包先体验一波。作为一个连电脑都玩不溜的人,写代码这种事简直天方夜谭,但现在, ai 将打开我的数字世界。 在今天之前,主包从来没想过自己可以设计小程序,只知道当年有个羊,那个羊很火,一直很好奇作者是怎么开发出来的, 写好代码后原来是用这个东西进行调试,嘿嘿嘿,好神奇哦,打开了一个白痴的新世界大门。如此之难的代码,现在他全部帮我写好了,让我们来预览下效果。首先要在开发工具里导入他写好的代码路径,已经完整提示给我了。 哇哦,手机桌面模拟出来了,有点写公众号的感觉,正在自动调试。咦,怎么只有标题?来问一下他真棒!他开始检查了, 找到了,真聪明,开始帮我修复。不对,是人家给自己写的代码修改,哈哈,好稀奇,左边的开发工具也在配合工作。哇塞,出来了,人生第一个设计的简陋版小程序,初见雏形,测试一下,顺便安利。应该不会有人没看过我男神的经典神作黑客帝国吧。 这个海报尺寸框架还要再调整。嘻嘻嘻,看来这个东西可以好好设计一下了。先这样测试下 workbaby 的 效果吧,对新手小白还是很友好的,大神们用起来应该更自如了。不过别看用的丝滑龙虾,可是要先给钱再干活的,比我们牛马硬气多了。 腾讯给新注册用户都送了五百积分,都不白来熬煮包,刚刚那个过程就花了二十多,看看明细可得悠着点花。

hello, 下班了,今天跟大家分享一下我日常是怎么用 codebody 的, 那么我前两天也说过,就是 codebody 是 腾讯的一个 ai 工作台,那这两天也相距推出了像 workbody 这样的产品,那么我也分享一下每一天我都是在怎么进行我的工作。 首先呢就是 workbody 或者是 codebody, 我 们常用的哈,其实它就是一个 ai agent 工具,但是呢它是一个在你电脑里面住着的一个助手,那你可以给他指定一个文件夹,那这个文件夹就是他工作的一个目录, 这个文件夹就是跟你电脑的文件夹一样的,所以你登录上这个 word body 之后呢,实际上你就可以给他指定一个文件夹,比如说这个项目的名字就是这个文件夹的名字,然后呢你就可以开始工作了。怎么工作呢?就是用自然语言去跟他聊天, 比如说举个例子,我要写一篇文章,我要写一篇调研报告,然后这个时候呢就会涉及到他的一个搜索功能, 它怎么能够搜索呢?当然原装的它可以有一些 m c p, 那 么这个 m c p 呢,又是一个新概念了,叫 model context protocol, 就是 相当于你用了一个标准的协议去对接到网络上的一些资源,相当于你 把本地跟网上的信息联系起来。我最近常用的叫 super s e r p e r 这个 m c p, 它是可以用谷歌的搜索,那这个非常重要,因为你用了这样的搜索,你就可以提高信源的质量,这是第一个。 然后我日常的工作状态是什么样子呢?就是首先我上班的时候会跟 ai 说今日规划,然后 ai 就 跟我说, ok, 启动这个 daily focus 的 skill, 这个是我提前预定好的一个 skill, 那 啥叫 skill 呢? skill 就是 技能包的意思,那么怎么做一个技能包呢?就是你可以跟 ai 说啊,我要做一个让我聚焦每天工作优先级的一个 skill 啊技能包,那你要帮我去做一下,但是我现在还不是特别清楚这个过程是怎么样的,然后你来问我一些问题,这样我可以告诉你我的需求,然后就可以开始启动这个 skill 的 制作。 ok, 等到 ai 写代码写,写了好多东西以后啊,然后把这个文档 skill 的 文档写好之后,你就可以开始每日工作规划了。然后大概能做到的呢,就是让你每天先把脑子里想的所有东西都倒出来,然后它就根据你的优先级进行排序。 那当然这个优先级可能就会涉及到记忆系统,那这个记忆系统可能又是另外一件事情,那这个稍后再跟大家说,然后你就可以开始根据你的优先级排好今天的任务,然后你看看是不是要这样规划。 相当于我有一个秘书就每天都帮我在做任务规划,然后每天我完成工作的时候,我跟他说总结一下今天的情况,就帮我生成了一个 今天工作规划和完成任务的一个文档,我今天的文档就是应该是三月十号吧,对,这就是我今天的一天的工作回顾。 有的时候呢,我会用另外一个 skill 叫深度研究,对我这个深度研究就跟他讲的就是他可能去网上搜很多信息,帮我搜一些报告回来,然后帮我去做一些系统化的梳理,这个过程中呢,你可以参与,也可以不参与, 你不参与呢就等着他给你报告之后你再审查就可以了。如果你参与呢,就是过程中你其实是可以看到他每一项任务,他在怎么 怎么执行,搜了哪些文献,做了哪些总结,这个过程你是全程可以看到的。这个时候你跟他说 你现在搜的这个方向不太对,你要去搜一些英文的文章,最新的论文等等,你会可以跟它去调整它的搜索的方向,然后搜回来你就可以去再做新一轮的调整和校对和审查,这是一个协同 工作的一个过程。当然这个深度研究也是一个我提前定义好的 skill, 那 这个 skill 里面除了搜索之外,除了总结文章之外,我还给他提供了一些建议。比如说你搜完之后,你首先要批判一下 你搜的这些内容,你要从不同的角度来去看一下他是不是合适。那比如说你从一个严谨的逻辑学家的角度,从一个演化经济学家角度,从一个创新专家的角度,从啊一个历史学家角度,都分别给我一些建议, 对这个文章进行一个评论,然后你再去重新校对和输出一轮,看看有没有事实错误,看看有没有严格的这种逻辑问题。然后这个时候你再把成果输出成一个文档给我, 那因为 codebody 和 wordbody 就是 都在你本地电脑中工作,它是可以把一些文件的内容写到你电脑中去的,就变成了一个 markdown 文档,那这个时候你就可以基于它的产出再继续工作,继续干活。 所以我每天上班的状态就是打开 codebody, 然后跟它对话,然后现在的对话呢,之前还是打字,现在完全不用打字了,都是在说话。 然后我接入的是微信输入法的语音功能,就是在微信下面有一个开关,你可以设置一个快捷键,然后按住那个快捷键,你现在在输入,他就可以变成文字。那这个好处呢,就是说话比打字是快很多的,然后你在他说完以后,基本上就是通过嘴指挥电脑干活。 然后我们现在日常上班就出现一种很有意思的状态,就是我跟我的同事,大家两个人都在非常小的在在在说话,指挥电脑,所以这个也是一个常用的能力。当然我还有一个最常用的就是这个会议就要转写, 或者是录音的转写,然后这个呢,我之前呢都是在网上用腾讯会议来去做文字的转录,后来呢,我发现可以本地装一个模型,在本地就完成这个会议内容的转写,这样呢其实它更可控一些,而且就都完全存在本地, 相对来说更私密一些,所以就又下载了一个模型,每次有新的语音进来之后,我就跟 coldbody 说,你帮我进行一个转写,当然这个转写也是一个 skill, 就是 他提前提前跟他说好的,每次遇到这种情况,你该怎么处理,用什么脚本,他已经都固定好了,规划好了 好,这是几个常用的给我的能力。另外还有像我刚才说的记忆系统,这个之前我也有一期视频专门跟大家讲过,就是怎么搭建你的记忆系统,其实并不复杂,然后很多朋友说想看看具体是怎么搭建的,但实际上就是你跟 ai 对 话,你就跟他说我要搭建一个记忆系统,你的目标是什么?你就是想把 你的日常的偏好,就使用 ai 的 偏好,或者是日常跟它对话的记录,以及它提炼出来你的核心特征, 到底你希望他记住你的是什么,你就跟他说就好了,他就可以帮你写一个记忆框架。然后这个时候呢,你再跟他说,你要去网上帮我找一找有没有其他非常好的记忆系统的推荐,他就会给你一些推荐,然后你就说那参照这个来写一下吧, 对,就完成了。那这个记忆系统的好处就是每次我打开的时候,他都会优先的去调一下我的记忆系统中,最近我在帮我排一些优先级,所以整个的工作流程现在 就对我这么一个屁人来说非常的灵活好用。对,因为今天的 workbody 的 上线呢,就是非常的火爆哈,然后包括我们今天上午的云服务器都挂了,用户量太大了, 所以就是也是跟大家分享这些这些这些小的方法,就核心其实就是把它作为一个你电脑中的一个工作助手,让他帮你去 读文章,写文章,修改文章,跟他去讨论,做一些思维的互动。然后整个这个过程中,其实第一个阶段还是人在环中,它跟 openclop 不 太一样,就是还是希望你要参与到整个工作流程中, 当日后等你的工作流打磨的熟练之后,可以用一系列的 skills 把这些工作流串起来,这样的时候你就再把这个自主性更多地给到 ai。 对,所以其实我们跟 workbody 的 团队合作非常的密切,然后之前也一路看着他们的这个产品成长起来,我们给他提了很多建议,包括我这个带货哈,就经常给他,他们家这个产品啊带货我们也一路打磨,就觉得还是非常好用的,目前的一个状态,所以大家不妨去下载一个 workbody 去试一试。 刚才我讲到的很多 skills 听起来很复杂,但是你只要跟 ai 说你帮我做一个什么什么什么 skill, 它就可以帮你完成, 所以其实一点都不难,然后动起来和真正用起来是最难的一件事情。然后过两天我们继续在研究院和腾讯的官网上会有直播,大家说周四晚上,到时候大家可以看一看,拜拜。

嗯,五分钟,看我一分钟教会你。 ok, 首先打开我们的 coldbody 国内版,点击第一个,然后在左上角点开它的官网,我们点击乘中国站选择下载, ok, 下载完毕之后,我们打开这个文件,我们进行安装,点击同意,然后一直下一步,下一步,下一步我要安装,我要安装,我要安装。 ok, 现在已经安装完毕了,然后我们点击完成,它就会自动运行。 首先我们需要登录一下我们的账号,点击登录,因为我们是国内用户,所以我们直接用微信扫一下就好了, 扫描完毕之后,我们就自动会登录完毕,然后我们在这边就可以跟他说我们想制作一个什么样的网站,这里我跟他说请制作一个简单的视力网站吧, 他就会开始自动运行,我们稍等一下他就做好了。好,我们点击这边的集成,选择这个云部署,再稍微等待一下, ok, 他 已经部署完毕了。那左边就是我们的网站,然后右边他有一个访问的地址,可以点击一下, 这个就是我们的网站了。同样我们的网站链接也可以分享给我们的伙伴,包括这个是我在手机上进入链接的状态啦,那今天就到这里。

兄弟们,这是一个给 cloud code 准备的现成智能体合集,它的仓库里目前整理了五十五加个专业智能体,覆盖研发、设计、产品、营销等九个领域。以研发为例,里面细分了前端开发、后端架构、移动端开发以及 devops 自动化等各种角色。 这些智能体并费用几句简单的通用提示词构成。它们源于 ready 的 上众多 ai 发烧友的讨论,然后经过作者数月迭代并在生产环境验证后得到的成熟版本。 每个智能体都有明确的人设和行事风格,具备扎实的专业知识,同时包含了具体的代码事例、可执行的工作流以及清晰的交付标准。 使用起来很简单。把这个项目的工程拷贝到 plato 的 agents 目录下,然后重启一下 c c 之后在对话里直接点名想要用的智能体,它就能立刻进入角色帮你干活。

今天这期视频我们只讲一件事,就是普通人怎么用 codex 开发一个小项目,并且部署上线。很多人可能一听到 code 代码就会产生畏难情绪,但你肯定听说过之前的 open cloud, 很 简单,在手机上给他发个信息,他全自动的就给你干完了,但是他贵啊,帮你发一个小红书就可能花你几块钱, 更别说开发一个工具了。但是 codex 作为 ai, 一个 open ai 的 出品,不但可以像 open cloud 一 样帮你完成几乎任何事情, 而且赠送的免费额度就能满足日常所需,如果你是会员,那更是用不完了。更重要的是,学会这种最顶级的 ai 工具,你就具备了做任何产品的能力。这期视频是 codex 的 入门视频, 我会带你从零上手,从怎么安装 codex, 怎么启动 codex, 如何与 codex 对 话,然后我会带着大家从零开始构建一个电影评分网站,并且部署上线。注意啊,就算你完全不懂开发也没关系,这期视频就是为你准备的。 我们开始首先在开始菜单中搜索 cmd, 打开命令行,这是我们与电脑和 codex 沟通的窗口,我们所有的对话都会在这里完成。与此同时呢,我们需要打开一个 check gpt 的 窗口,因为我们都是新手嘛,怎么用这个命令行都需要让 gpt 来告诉我们。 第一个问题,如何在命令行中安装 codex。 他 告诉我,首先确保安装了 node 点 gs, 我 这里已经安装了,如果没有,你可以让他告诉你怎么去安装,这里就略过了。第二步,复制他给我的安装命令,然后 ctrl 加 v 复制到命令行中, 命令行没有报错就说明安装完成了。在命令行中输入 codex, 如果能打开这个界面,就说明我们成功启动了 codex。 第一步,登录 codex 通常都会选择第一个,通过网页端完成登录,登录后回到命令行页面, 点击回车。继续我给大家讲一下最基础的配置。首先点击键盘上的这个斜杠,你可以看到 codex 的 一些基础配置项就出来了,比较重要的是模型选择和权限设置,模型我一般都会选择最新的思考时长,选择 extra high, 这样生成的质量最高。 第二个 permission, 我 选的是 full access, 所有的权限都交给 codex, 不 然它在执行任务中会一直让你去授权,很麻烦。当然这样也是有风险的,有比较小的概率它会删除你的文件,网上就有人遇到过,但是我目前还没有啊。 接下来我们就正式的来做这个电影评分网站,真的超级简单。首先我们创建一个文件夹,作为整个项目的根目录,然后我们要让 codex 进入我们这个项目,怎么操作呢?回到命令行,连续按两下 ctrl 加 c, 退出 codex, 然后复制我们这个项目的地址,打开 gpt, 问他如何让命令行进入这个地址,按照 gpt 的 指示进入后呢? 输入 codex, 这样就在电影打分的这个项目中打开 codex 了。每次重启 codex 后啊,都需要重新设置一下权限,改成 full access。 接着很关键的一步,执行一次启动命令斜杠 i n i t。 执行完毕后,它会在项目下生成一个 agent 点 m d 的 文件,这是 codex 的 一套默认行为规范手册,它会根据文件中的行为规范来完成你的具体任务。 后续你玩熟了,就可以按照自己的要求来修改这个文件了。现在呢,咱们暂时不管它,然后我们就可以来描述具体的需求了。我是这样写的, 由于豆瓣网站的电影评分已经严重失真,我打算做一个新的电影评分网站,基本实现电影的评分和评论功能。你需要完成整个项目的完整开发,并且部署上线。 你需要自动抓取豆瓣上正在上映的电影自动更新。这是一个完整的项目,你负责完整流程,最终交付给我。部署后的网址,你可以利用相关的部署 skill 来帮助你完成。如果没有这些 skill, 你 可以自己去网上搜下载下来用回车发送。 你看,他已经开始自己执行了。突然我想起来忘了跟他说一句话,按一下键盘左上角的暂停键,然后我跟他说,在交付前用肉眼检查一下,没有问题再交付给我, 这样他就会自己用浏览器打开看一下,确保没什么问题。接着他执行了大概二十分钟,最终你看他给我交付了上线的地址,后面简要说了一下他具体交付的内容,我们立刻把这个网址打开,看看效果咋样。 嗯,整体感觉还行,春节档的这几部电影也都在,不过很多图片没有加载出来,界面呢,也不怎么好看。这就是后续你需要不断地跟 codax 沟通来优化迭代的了,包括你后续想用自己的域名,也可以通过跟 codax 沟通来帮你实现。 好了,这期 codex 小 白教学就到这里了,其实还有很多使用的细节技巧,我没有涉及到,你都可以直接通过 codex 或者和 gpt 聊天快速掌握,赶快用起来吧!我是阿猪,关注我,让我们一起在 ai 潮头冲浪!

十分钟教你如何做个通用 ai 智能题,十二个步骤,十二个 demo, 让你搞懂智能题!引擎、工具调用、 skill、 地图、 work tree、 隔离等核心原理,堪称我见过最简单的 ai 架构实战拆解教科书,每一篇都图文并茂,代码安利,教学文档应有尽有,绝不拖泥带水。就是这个轮科奥扣的开元两万颗星,真香!

挑战,每天讲透一个 ai 知识点,今天是 cloud code 基础命令。好,然后完了之后的话,接下来大家需要掌握的话就是 cloud code 的 一些基本命令与配置,这个是一个最关键的一个过程。 那在这里的话,首先我给大家介绍一下最常见的一些命令啊,比如说清空上下文啊,比如说我们前面聊了很多,是吧?那我现在我要去做一些清理啊,反斜杠啊, 这里这个命令的话是有一些智能提示的,大家直接输入这个反斜杠,比如说可令啊,然后敲一下这个 table, 这个命令就出来了,这是把当前的上下文给清理一下,也就说我们之前对话完成了很多,需要把对话给清一下啊。然后, 呃,这个 compact 的 话是什么呢?它的话是一个压缩对话啊,就相当于我们要把这个对话整个做一个什么呢? 做一个啊,可以大家可以把它理解为一个复制的一个过程,就这个里面的话,比如说我们现在要去复制一个对话,对不对?我要把当前这个对话啊压缩一下,等下我们要去做一个还原啊,就这个意思相当于复制一个对话, 然后 cos 的 话是计算花费,比如说我们现在这个 token 消耗了多少了,是吧?大家要去看一下它整个的消耗,比如说消耗了多少美元,或者是零点零零七二美元啊,它会计算你当前整个对话消耗的一些 token 啊,输入的 token 跟输出的一些 token 的 一些情况, 这是基本的一些这个命令啊,还有包括这个登录登出,我们其实就用不上了,这个是用 cloud code 云服务的时候,大家可能会用这种方式啊,就你购买了官方的服务,这两个命令用的比较多,如果是你用 api key 的 话,这两个命令基本上用不上啊。然后模型的话,这个呃,大家可以去切换一下,比如说我们这个 model 啊,它可以去呃,去看我们当前用的一些模型啊,这是它默认的 第一个模型的话是性价比比较高的啊,然后第二个是速度最快的,第三个是效果最差的,但是成本最低的啊,就价格最便宜的,一般我们现在用默认就可以了啊。好,这个是 model。 呃,然后什么 state 是 doctor, 这个我们就基本上用的比较少啊,除非你的 cloud code 有 问题的时候,大家去看一下这两个东西,一般的话也用不上。 好,然后的话就是我们大家要去把,比如说我想把 cloud code 集成到 vs code 里面去,或者 cos 里面去,行不行呢?可以的啊,大家可以打开这个 coser 啊,就是如果说你不想在啊这个整个命令行里面去打开的话,你可以打开 coser, 大家可以去搜一下这个有一个什么呢?有个插件啊,直接搜 cloud cloud, 搜 cloud 的 话,第一个就是啊 cloud code 放 wiscode 的 一个插件,大家把它装一下,装完之后的话,哎,比如说我现在要在这个 cursor 或者叫 wiscode 里面去用这个 cloud code 的 话,怎么办呢?装完之后大家点开右上角有一个这样的一个图标啊,这个是 cloud code 的 图标,我们点开 点开的话,大家就可以看到这么一个页面啊,这个页面的话是最新版本升级过的啊,之前的那个版本的话,它其实也就是个命令行啊,这就是打开命令行,后面它升级了一个版本。现在有这种交互的这种对话了啊,以前是没有的, 比如说大家直接我可以让他干嘛呢?比如说请帮我实现一个快速排序算法,基于 python 实现,大家看这个就是 cloud code 开始去生成代码了,去干活了,然后它的这个效率的话也非常高。呃, cloud code 工作的一个逻辑是什么呢?它其实就是一个 agent, 这个 agent 的 话,它首先的话它会帮我们干嘛呢? 在这个里面他首先的话,他会去帮我们去做一个任务的理解,理解完之后他会告什么呢?做叫 update 呢? to dos, 他 会把这个任务拆分。比如说你让他去写这个快速排序算法的话,他首先得去分析一下你这个任务的话,大概要有几项啊?这个叫 to dos, 就像我们要去完成一个项目的话,你得把项目拆成细分的任务,对不对?那么他帮你去实现这个快去快速排序算法的话,他会拆任务出来,但是他这里只拆了一个任务啊,因为写这个算法非常简单啊,就是一个任务就完成了,你如果说让他开发一个游戏的话,他会把它拆成非常多的步骤出来。 所以说啊,这个里面的话,根据你的需求,这里会任务的话会不一样啊。大家看,你看,现在他就开始去写代码了,是吧?你看这个代码是不就帮我生成了,非常简单吧?然后并且完了之后的话啊,他还可以帮我去做一个测试, 所以说整个过程的话会非常的顺畅啊,这个是完全基于命令行的,你看他现在会帮我去运行这个了啊,但是这个里面有一些乱码啊,没关系,他如果识别到这些乱码的话,他会自动的去修复这个大家不用关心这个什么乱码的问题,他会自动识别到去做一个修复,所以说这也是他比较正的一个地方啊。 所以说啊,如果说大家在用这个里面,你看它是不是帮我们去实现了一个算法了,是吧?然后包括主要特性啊,核心算法特点啊,测试用力啊,这些个点的话,其实都已经帮我们做了一个实现了,对不对 啊?还是非常智能的啊?用 cloud code, 所以 说这是一个非常简单的一个使用啊,就是大家可以在 cursor 这种 ide 软件里面去把 cloud code 去做一个集成, 当然你要在派叉里面去装也可以,但是派叉里面的这个插件的话,呃,可能版本比较低啊,它还是那个命令行版本啊,你看我在 cloud code 里面啊,就在派叉里面装的这个 cloud code 的 话,它就是一个命令行啊,所以说,呃, vs code 或者是 coser 的 话,它的这个版本是升级过的啊,之前的话最开始也是命令行,后面做了一把升级,所以说大家可以把这个 cloud code 集成到我们的这个 coser 或者是 vc code 里面去,这样我们可以把 多个编程工具结合起来用啊,就 coser 跟 code 结合起来用的这个效果的话会好很多啊。

ai 编程助手 codebody 向一个随时待命的编程专家,以全链路 ai 重构开发范式,让创意一键落地,不止写代码,更打通产品构思、设计、编码部署全流程,告别多工具切换,一人成对,高效上线。一、 全流程 ai 驱动一站式开发,区别于紧聚焦写代码的单点 ai 工具, codebody 打通产品构思、设计、编码部署全链路, 无需切换多平台,大幅提升独立开发者与小团队效率。二、国内合规加数据安全,行业刚需,支持国内模型运行过等保三级认证代码不出境,不用于第三方训练,轻松通过企业法务审批,适配金融、政务、军工等高安全要求场景。 三、腾讯生态深度融合,高效协同,与 cloudbase、 cloud studio、 edge、 one pages 企微深度集成,无需跳转平台即可完成开发部署,协助全操作,降低切换成本。四、多模型自由切换能力,无上限,不绑定单一模型,国产国际版适配腾讯混元、 deep seek、 cloud gpt 等主流模型, 按需选择最优模型,适配不同开发任务,从想法到上线,用 ai 解放开发。如您也想借 ai 实现降本增效,欢迎留言。

你写的 agent 代码到底在干什么?如果你还在用提示词练拼凑,那根本不是 agent。 今天拆解 cloud code 的 全部架构,十二个课程,从零搭建真正的 agent harness 路上学 ai, 深度解读 ai 工程实践。觉得有收获请点赞关注。 所有 agent 的 股价就是一个 while true 循环。用户消息进入 messages 簇组,发给 l l m l l m 返回 stop reason。 如果是 to use, 就 执行对应工具,结果追加回 messages 再循环。 如果是 end turn, 就 返回文本。循环结束。模型自己决定何时调用工具何时停止。你的代码只是执行模型的要求。 工具怎么加,只需要一个 dispatch map tools 列表用 json 描述每个工具的名字参数用途。 dispatch map 就是 name 到 handler 的 映设。 l l m 返回 to name 和 input 以查 map 调 handler, 把结果包成 to result, 追加回 messages 循环继续加。新工具,只加一个 handler, 循环不用动。 harness 由五个要素组成, tools 工具, bash, read, write, edit, glove, grab, browser, knowledge 知识, cloud md 和 skill md 通过 tool result 按需注入,不塞 system prompt observation 观察 get deep 错误,日制浏览器状态, action 行动, c l i 命令 a p i 调用 permissions 全线沙乡隔离核审批流。 cloud code 有 八个 harness 机制,零 agent 逻辑, agent loop, 我 要加 stop reason 判断七种内置工具, bash, read, write, edit, glob, grab, browser, skill 按需加载,通过 tool result 注入 三层上下文压缩换来无限回话长度。此 agent 独立 messages, 不 污染主对话任务,系统团队协助 worktree 隔离。它不是 agent 本身,它是给 agent 造的世界。 十二个课程分四个阶段,阶段一,循环 s 零幺 agent loop 加 s 零二 to use 阶段二,规划 to do right, 指 agent skills 压缩阶段三,持久化任务系统加后台任务 阶段四,团队协议自制 work tree 隔离。从一个工具进化到十六个工具,循环始终不变,机制逐步叠加。 harness 工程师到底干什么?第一,实现工具原子化,可组合的 tool handler。 第二,策划知识按需加载,不前置塞入。 第三,管理上下文指 agent 隔离加压缩。第四,控制权限沙箱加审批加信任边界。第五,收集任务过程数据,这些数据是微调下一代 agent 的 原材料。 三个最容易忽略的关键机制, skill 加载 skill md, 通过 tool result 注入,不占 system prompt 配额,按需拉取 上下文压缩三层策略摘要,丢弃保留任务持久化 crowd 加依赖图写入词盘。这三个机制决定了 agent 能否长时间稳定工作。 同一个循环可以落地到任何领域。农业模型加土壤气象加灌盖控制,酒店模型加预定系统加客户渠道 医学模型加文献检测加实验仪器制造模型加产线传感器加智控物流造好 harness, agent 会完成剩下的 bash is all you need real agents are all the universe needs。

大家好,这两天我讲 ai 智能眼镜的视频评论区总有人说 ai 编程做不了产品,比自己写还累。 今天跟大家分享一个我这两天用大概两三个小时做的小玩意,再次声明,我一句代码也不会写,完全是用 code body 加上 cloud 模型完成的。其实我一直想做一个研究,就是中国民居的眼睛谱系。这是一个巨大的学术工程,学院里很多老师和同学都在做相关的工作。 做过几年中国传统村落的评委,也算是半个专家,但很多类型还是没有现场去看过。虽然有不少学术专注论文,但我想要的是一个在地图上可以看到流变脉络的完整的谱系。这在以前是一个极大的科研课题,叫做大量人工的文献和图纸标注工作。 这次去云南,我第一次看见了哈尼蘑菇房和傣族的土场房,非常惊喜,但后者之前了解很少,险些错过,更让我有幸致做这个应用。我始终没有给过模型任何知识输入,就是基于模型自己的知识和自行去网络搜索, 这是网页版啊。在中国地图上可以看到几十种民居类型和典型案例,点击任何一种民居地图,会自动放达到它的分布区域,展开所有的代表性案例,可以看到哪些是国保单位,哪些是中国传统村落。 更关键的呢,是浦西连线。你能看到这四十九种民居之间的氧化关系,用不同的现行和颜色区分,哪些是直接氧化,哪些是纤细遍体,哪些是气候适应,哪些是结构升级。可以说,这就是一张中国民居的知识图谱,铺在真实的地图上。 举个例子,你能清晰看到北方合院体系怎么随着人口南迁移过南渡,逐步演变成南方的天井式民居。 甘蓝式建筑怎么从傣族竹楼、侗族甘蓝一路分化出苗族吊脚楼、土家吊脚楼,合院怎么在客家人手中变成卫龙屋,最后变成福建土楼?这些演化脉络以前散落在几十本专著里,现在一张图全都能看到。 至于这些眼睛关系呢,我也让模型详细列了出处,很严谨的分了三类,学术专注、明确论述的学界有共识,但没有单一专注、直接定义的,以及缺乏直接学术论证的建筑学推断。 第三类,经过跟我的沟通的模型删掉了,其中比较牵强的一些,左边有个侧边栏,可以按十一种建筑大类筛选,也可以按省份筛选,右边点开详情。每种民居有二十多个属性维度,结构体系、空间格局、屋顶形式、墙体材料、气候带、 地理单元、起源年代鼎盛、朝代核心特征全部结构化展现。还有个小程序版本,这也是我做过第一个正式上线的小程序, ai 自己测试修改并通过了代码审核和被爱。 你去某个地方旅行,想看看附近有什么传统民居值得去参观,打开就能用。小程序功能跟网页差不多。目前一共有四十九种民居类型,覆盖十一个建筑大类,几百个具体案例。 每种民居二十多个属性维度。目前的封面图和典型照片是 ai 自动生成的,我几乎没有做任何整理和校验。作为一个产品,当然还有很多的工作可以去完善,但这样一个东西以前只能停留在我的想法里,不会变成一个工具。但是现在 ai 三个小时就可以实现, 而我要做的只是时不时看一眼,确认一下或者修改要求。多年前,我在团队做过很多类似的小程序和 app, 现在没有了科研经费和程序员团队,我也可以自己快速实现了。 我们先不讨论 ai 对 程序员的意义,但对于非开发者或者我们每个普通人来说, ai 编程呢,不是让你去当程序员,而是 ai 用代码帮你做所有想做的事情,包括刚聊过的写作和这种广义的科研。而你呢,要把精力放在真正重要的事情上,定义问题,调整逻辑, 设计交互。大家有兴趣可以在微信搜索民居浦西小程序体验,也建议大家都去实现一个自己的小程序,现在真的很简单了。感谢关注未来博士,我们一起去跨界的视角,看懂未来的方向。

大模型可以称之为大脑,沃克巴蒂和库德巴蒂更像是手和脚,我们迎来了自己的龙虾,今天给大家介绍两款由腾讯云推出的 ai 智能助手,沃克巴蒂和库德巴蒂, 他们能够真正的帮你干活。沃克巴蒂和库德巴蒂和我们常说的大模型有怎样区别和联系呢?首先来说一下库德巴蒂,它是一款新一代的 ai 代码编辑器,专门为开发者设计。它能够提供智能代码补全、错误诊断技术问答性能优化。 这是 python、 java、 script、 java、 私家家等主流编程语言。根据官方的数据, codebody 可以 提升编码率百分之九十, 降低代码错率百分之三十五。但是它不仅可以帮你写代码,还能够理解你的整个代码库。什么是 workbody 呢? workbody 是 腾讯云 codebody 团队在今年三月份正式推出的全场景职场智能体 桌面工作台,它的定位是 ai 原生的办公助手,面向所有的职场人群,特别是适合非技术背景的用户。 oka 八提最大的特点是什么?它是一个安装在你电脑上的独立软件,能够直接操作你的本地文件。你只需要一句话描述需求,比如说帮我分析这个月的销售数据并生成报告。 oka 八提就会自主的规划任务,执行操作,最后交付给你一个可以直接使用的结果, 支持生成文档、表格、 ppt、 数据分析多种办公任务。而且还能够批量处理发票,整理文件夹,甚至可以通过飞书、钉钉、企业微信远程控制。更重要的是它内置了高维操作拦截机制,确保你的数据安全。 oracle 八的与我们常说的大模型,比如说 dbsek、 豆包有哪些区别呢? 核心的区别主要是大模型更像是一个大脑,它是一个知识渊博的顾问,能够回答你的问题,提供方案。而 workbody、 colbody、 ai 智能体、 ai agent 则像是一个真正的助手,不仅可以理解你的需求,还能够自主的规划步骤,调用工具,操作文件, 最终把任务完成。举个例子,如果你问 deepsea 或者豆包帮我分析一下销售数据,他会告诉你该怎样做。但如果你对 wordbody 说同样的话,他会直接打开你的 excel 文件,进行数据的清洗,生成报表,输出分析报告,把结果直接交给你。 大模型可以称之为大脑, wordbody 和 codebody 更像是手和脚。大模型是思考引擎, coldbody 是 专为开发者打造的智能编程小伙伴, walkbody 是 面向全职场人群的桌面办公智能体,它们都是基于大模型构建的。 a i a 智能不仅能聊,更主要是它们可以完成任务,直接展示给你要的结果。 如果你想体验,可以访问腾讯人的官网,下载即可,双击就可以安装。快去体验你的桌面办公智能体吧!快去养你自己的龙虾吧!

兄弟们,如果你正在使用 open code, 那 这个插件一定得装上它彻底重构了 open code 的 工作流程,让你不再像玩回合制游戏一样和单个智能体一问一答编辑代码,而是直接拥有一支专业的开发团队,不同成员各司其职,互相协助,即便开发大工程也能轻松 hold 住。它本质是一个多模型多 agent 的 编排框架,它会往 open code 中集成十一个专家 agent。 例如 sisyphus 作为总指挥,负责任务分解、进度管理、协调其他成员。 prometheus 则是规划师,通过访谈式交互与你沟通深层详尽的执行计划。此外,还有专门负责架构设计、前后端研发、文档生成以及代码库探索的各类 agent, 使用时非常灵活。你在对话框中输入任务需求,总指挥 sisyphus 会自动规划分配给对应 agent。 你 也可以显示地 at 某个 agent 去完成特定工作。例如一种常见的用法,先让 prometheus 出一份详细计划,再让 atlus 照着计划去调度执行。 当然,你还可以同时艾特多个 agent, 让他们并行工作。如果嫌麻烦,他还提供了一种懒人模式,在对话框里简单说明任务,例如重构整个工程,然后输入 ultra work, 它会瞬间化身卷王,所有 agent 都会被启动,持续执行,不会偷懒,直到实现任务目标。 另外,它还有个很灵活的特性,你可以预先配置任务类型和模型的映涉关系。例如让 gpt 处理架构设计任务,让 kimi 处理写作任务。在执行阶段,指派的 agent 会根据任务类型加载对应模型,从而每个任务都会被适合它的模型处理。

打工人救命,报表报销堆成山,加班到崩溃!腾讯直接给你送一个 ai 同事! workbody 主打以自然语言驱动办公自动化,只要一句指令,它就能自动帮你做文档、做表格、画图表、做 ppt, 根本不用你自己动手, 对标 openclaw 更省心更安全,而且公测送五千 credits, 小 白零基础也能秒上手!话不多说,直接上教程!首先下载安装,一分钟就能搞定。 打开浏览器,搜 work buddy 官网,根据自己的电脑系统选对应版本,点击下载,然后快速安装。安装完打开客户端,用微信快捷登录,进入 work buddy 界面,功能模块清晰,一目了然。在新建任务中,点击 auto, 可自选内置大模型, 在该界面可以进行代码开发或者日常办公的对话。例如,我让他帮我开发一个基础的 to do list, 他就会根据我下达的任务指令,先去创建一个 web 应用,然后启动本地服务器预览应用,并且为我打开预览界面。在右侧的预览界面中,可以尝试着添加一个代办事项,例如查看最新的 ai 资讯,可以看到该代办事项被成功添加进来, 勾选该代办事项表示已完成。做到这里,我不禁想到一个进阶玩法,给他设置个定时任务,让他每天提醒我还未完成的代办事项有哪些, 再也不怕忘事被领导催,这对打工人不要太友好!周汇报、月汇报,每次都要做 ppt 都很头疼怎么办?别担心, work buddy 可以 帮你一键生成 ppt, 比如我让它生成四到五页关于 ai 知识的 ppt, 并且要求风格简约大气,它就会根据 ppt skill 来创建符合我要求的 ppt, 并且在右侧打开 ppt 预览界面,生成的 ppt 基本符合我的要求,也可下载使用。除此之外,生成数据分析报表、转写文档等功能根本不在话下,大家可以动手尝试一下。 进入 club 界面,支持连接企业微信、飞书、钉钉或 qq, 我 们后续接入企业微信机器人的聊天消息就同步到这里。 点击插件就能看到目前已安装的插件列表,有处理 pdf 的 创建 ppt 的 编辑 word 文档等基础类插件。右侧是插件市场,可以搜索并安装你想要的插件。下面我来教大家如何接入企业微信机器人。 在接入之前,你需要准备一个拥有企业管理员权限的企微账号,然后进入企业微信管理后台,在安全与管理模块中找到管理工具。点击右边的智能机器人, 点击创建机器人,可以让 ai 帮你自动生成机器人。我们选择左下角的手动创建编辑机器人基本信息,设置可见范围。 鼠标滑到最下面,找到 api 模式创建连接方式,选择使用 url 回调,在下方随机获取 token 和 encoding a e s key, 并且复制这两个参数值。回到 workbody, 点击右上角头像,找到 cloud 设置,打开企微 ai bot 集成配置按钮, 填写刚刚复制的信息。点击注册,系统就会自动生成一个 webhook url。 点击复制,回到企微管理后台,将刚刚复制的 url 粘贴到这里,点击保存,这 儿我们 workbody 小 助手就创建好了。下面我们进入企业微信通讯录界面,在智能机器人中找到创建的 workbody 助手,就可以直接进入对话窗口,问他今天上海的天气怎么样,他能够正常回复,那后续就可以和他在企业微信中随时随地聊天啦。 同时我们每次对话的思考过程都可以在 workbody 中查看,它会记录在 call 中。以上就是本期视频的全部内容啦,现在下载 workbody 就 有五千 credits 免费送,不用白不用,赶紧去薅鹅厂的羊毛!

小伙伴们大家好,今天感冒了,声音有点奇怪,最近聊了好多期腾讯的小龙虾。 coldbody 和 workbody, 其实是一个产品的两个版本,好多粉丝跟我说用它完成了不少以前不敢想的事,后面我可能也会请他们来分享各行各业的案例, 但也有不少人说根本什么都做不出来。今天我刚刷到一个做三 d 打印的博主,特别典型,他让 coldbody 帮他建一个三 d 打印用的汽车模型,结果搞了一坨像肥皂一样的东西,他就录视频说产品太差。 我今天就以这个为例,还原一下我是怎么用 codebody 从踩同样的坑到最终做出来,再把整个流程沉淀成一个可费用的 skill 的。 先说那个博主的核心问题,他跟 codebody 说了一句,给我设计一个铃木维特拉汽车的三 d 打印模型,并把 s t l 文件发给我,然后 codebody 就 开始干活了。 我也是一样这样操作的。酷狗八的会怎么干?他不是三 d 建模师,他是程序员,他的本能反应是找一个可以用代码驱动的建模工具。我这边选 open s c a d 开源的 三 d 建模软件,纯代码写模型,不用鼠标拖来拖去,这个选择有没有问题呢?理论上没有, open s c a d 确实能做三 d 打印模型,业内也有人用它做机械零件。酷狗八 d 很先是很认真的做了一份工作,计划从车身到轮毂、车窗、灯组、保险杠,一路排下来,像模像样的。自己上网搜了维特拉的各种细节尺寸,还生成了几张 ai 参考效果图。 接下来就是写代码,核心思路就是画三十图的轮廓,然后把这三个轮廓各自拉伸成三 d 实体,然后用波尔计算去交集。理论上交集的部分就应该是车身的形状了。听起来挺合理的,结果一渲染出来,我都 起效了哈。三个二 d 轮廓本身就很抽象,侧面像条鱼,顶面像个棺材板,前面像半个鸡蛋。三个一交集出来的东西确实像块肥皂,轮,轮子还是横着的。这就类似那个博主看到的东西,到这步为止呢。那个博主说的是对的,确实做不出来,但问题是那个博主停了,他下了个结论,走了, 我没走,扣对不对?还不死心,继续在这个肥皂上加轮毂,加后视镜加天线,结果更离谱了,所以一定要变形。失败的大巴 问题不是 code body 不 行,是这条路不通。 open s c d 的 中交交集法本质上就很难做出光滑曲面,这个汽车的曲面需要的是 nervous 或者吸粉曲面。 open s c d 连这个概念都不支持,那它做汽车就像用 excel 画油画,工具选错了, 那正确的工具是什么呢?其实有两条路,第一条是用 m c p 接管专业建模软件,现在已经有 blender m c p 这种项目了。就是,哎,通过 m c p 协议去操纵 blender 这种专业三 d 软件,用自然语言指挥它建模画图 啊。如果你追求的是精确的参数建模,那像机械零件,工业设计,这肯定能实现。但我没走这条路。为什么?因为我 做了一个经验判断,三 d 打印的车模土生,三 d 一 般就够了。你想三 d 打印出来东西本身就有曾玩巴掌大的车模,你用 blender 轻雕细琢,和土生三 d 两分钟出来的模型打印出来,肉眼根本没区别,投入产出比 完全不在一个量级。所以我选了第二条路,直接调腾讯会员三 d 的 api。 会员三 d 有 个功能,叫土生三 d, 你 给他一张图片,他给你生成一个完整的三 d 模型。 而且这个 api 现在有免费使用额度,我直接把 api key 贴给 codebody。 当然过程也不是一帆风顺,图片、 传餐的格式、文件解压之类的坑还是有一些的。但好在 codebody 踩完坑能立刻改代码重试,整个调试在对话里就闭环了,不用我自己去折腾,我也不会。搞定 api 之后呢,它先生成了一张维特拉的参考图,红车身、黑车顶的四分之三视角提交给会员三 d。 两分钟以后,模型就下来了。 这个火山、大灯轮、后视镜这些细节都很清楚,有些地方因为角度问题有些误解,所以我就让他重新生成了一遍,换了张银色侧面的效果图做参考图第二版,整体更匀称,细节也更到位。从那个肥皂块到这个完整的车模呢,核心区别就一个,换了条路径。 那这一步其实也可以交差了,但我多做了一步,把整个流程沉淀成了一个 codebody 的 skill 技能包。那什么是 skill 呢?可以理解为一个经验包啊。把我踩过的所有坑,写好的所有脚本,总结的所有注意事项打包成一个可附用的模块。下次再做任何物体的三 d 打印模型, codebody 就 可以自动加载这个 skill, 不 会重新踩坑,也不用每次再把生图、接口、地址、 api 这些重新配给它。 所有的东西呢,跟具体的车型就无关了,你给他一张椅子,他也能生成三 d 打印模型。为了验证呢,我当场又做了一个我家的这个标志,五零零八,从生成参考图到最终拿到 s t r 文件,全程是给我自动执行,不到十分钟, 最后还让库德贝里做了一个对比,网页单页面的这个腹部流滚动,五个版本一次排开,每个版本都能三 d 交互浏览,都有对照图可以展开看。所以回到开头,聊几个我觉得很重要的事。 那个博主的问题呢,不是 codebody 不 行,是它的用法不对接。这个案例呢,我想总结几条用 agent 的 心得。第一呢,有了 agent, 人不是没价值了,你让他反复去尝试收 token, 他 大概率早晚能给你做出来。小龙虾就是这个逻辑,但实践成本和 token 成本会非常高。 而我在这个过程中做了什么呢?我看了一眼 open cad 渲染出来的轨道,立刻就知道这条路有问题,不尔交集,做不出来。为什么?我知道?因为我二十年前学建筑的时候学过画画几何,熟悉三 d 建模,了解三 d 打印和图上三 d 的 基本逻辑和术语,看得出来问题在哪。一句话把方向纠正了, 所以对人的要求变了,不是要你技能全面,什么都会做,而是你要有通俗性的了解,知道这个领域大概有哪些工具,哪些路径,哪些坑。你不用亲手写代码,但你得看得懂方向对不对。 你的认知决定了天花板 a 阵子的效率,决定了完成速度。第二,遇到问题别问我,问 code buddy。 这段时间好多朋友用 code buddy, 遇到问题会来问我,说实话,我给的答复基本都一样,你把问我的这段话直接发给 code buddy, 不是 敷衍你吧?他是一个对话式的工具,你跟他说这里报错了,这个效果不对,换个方案他能理解,而且他比我懂的多啊,很多时候你觉得他不行,其实就是你没跟他说清楚。 第三,是把 ai 当成一个新来的同事,这个这个很重要,他能力很强,学东西很快,但他是新来的,他不知道你工作的具体细节,所以一开始你要有耐心得花时间跟他磨合。 但一旦他学会了一件事沉淀成 skill, 下次再做同样的事,他就非常高效了。就像这次,第一辆折腾一个多小时,第二辆十分钟就搞定了。而且一定要从简单的事做起。 我见过很多人有两种心态,简单的事觉得用不着他,我自己干,复杂的事觉得跟他说清楚太麻烦,还不如自己做。这两种想法加在一起,你就永远有理由不用他。 但如果你从简单的事干起呢?先了解他的能力、边界和脾气,慢慢加满,你会发现他能接触的事越来越多。说到底,那个博主如果不是看一眼就走,而多说一句换个方法,结果可能完全不一样了。也欢迎大家分享自己用 what 的 角度看懂未来的方向。