collorico 的 教程第一课,你有没有遇到过这种情况?每次让 cloud 干同样的事,都要重新描述一遍,要求写 commit message, 检查代码,整理文档,这些重复操作一天能说好几遍,效率很低。 slash commands 就是 把常用操作封装成快捷指令,输入一个斜杠命令, cloud 自动执行预设流程。简单说,它就是你的 ai 版红脚本。 slash commands 有 四种来源,内置命令, cloud code 自带五十五个以上 skills, 你 自己写的脚本文件 plug in 命令,安装插件后获得 m c p 命令,来自 m c p 服务器。这篇文章重点讲前两种,内置命令和自定义 skills。 内置命令覆盖了常见场景绘画管理有 clear 清空对话 branch 分 支绘画模型配置有 model 切换模型 effort 设置努力程度,代码调试有 diff 查看改动 doctor 诊断问题。输入斜杠就能看到完整列表,不用死记。 自定义 skills 的 核心是一个 skill md 文件,放在 cloud skills 命令名目录下,文件内容就是给 cloud 的 指令, cloud 读到就知道该做什么。 skill m d 开头的 y m l 配置快教 frontmatter name 是 命令名称。 description 描述用途,帮助 plod 判断何时使用 allowed tools 指定允许的工具,不用每次授权。 disable model implication 设为 true, 可以 防止 plod 自动执行有副作用的命令。 skills 最大的亮点是动态上下文,用感叹号加反引号包裹命令的语法执行 shell 命令,把实时结果注入 prompt, 比如感叹号 git status 会先运行 git status 把输出插到指令里,这样 cloud 就 能看到项目当前状态,不再是死板的预设文字。 来看一个实战例子,创建 commit 命令,先 page 页目录,再写 skill。 md 文件里用感叹号语法注入 git status、 git diff, git log 的 输出,然后告诉 cloud 根据改动生成符合 conventional commits 规范的提交信息。 保存后输入斜杠 commit, cloud 就 自动帮你写好 commit message。 命令还能接收参数, 全部参数用 arguments, 比如斜杠 fix issue 一 百二十三,传入 issue 编号分参数用 bin z s h, 比如斜杠 review p r 四百五十六号传入 p r 号和优先级。这样一条命令就能适配不同场景 几个最佳实践命令。民用动词 description, 写清楚触发条件有副作用的命令,设 disable model invocation, 用感叹号语法注入动态上下文,避免为一次性任务创建命令。硬编码敏感信息,跳过 description 字段 flash commands, 把 cloud code 从好用变成高效。当你发现自己重复说同样的话,就该把它封装成命令了。现在就去创建你的第一个 skill, 把最常用的操作自动化。下一课我们讲 memory, 让 cloud 记住你的偏好。
粉丝389获赞2478

这期视频我将带你手把手的安装 cloud code, 然后来一次实战开发,不用写一行代码,只需要用自然语言就可以现场写一个微信聊天记录,批量打码的一个小脚本,最后我还会教你如何把它上传到你自己的 get 哈。 另外我还会分享一些关于 qq 的 账号,以及一些中转 api 的 种类,以及。呃,小坑。这条视频依旧有一点长,但是我已经给这个视频做好了标记点,如果你想看哪一个部分,直接滑动视频下方的进度条,拖到对应的部分观看就可以了。 当我们进入 coco 的 官方网页的时候,你会发现他是英文的,如果说你看不懂的话,左上角这里可以把它更改成简体中文,然后其实他这里是把你所有安装的一些命令都给列出来了的,我们只需要 直接在这里复制,然后打开你的终端,比如我这里是苹果,我就直接搜索终端,然后输入这一个命令行就好了。 然后在这个时候呢,有可能啊,因为你的网络环境这一步会出现像这样子的,这个意思是说在当前你的地区不能使用就是你的网络环境的原因啊。 呃,这一步需要你自己去解决。当你解决好你的网络环境的时候呢,你就再一次输入这一个下载命令,然后回车,当出现这个样子的时候,他就是这里是版本号,然后现在就是已经是安装好了的一个状态,这个时候我们只需要输入 cloud 回车,它就会进入到登录的一个页面,这里是选择主题,你可以选择不同的主题,它是会有变化的。 ok, 然后这里是三个,第一个是选择登录你的账号,比如说你是开的 pro, 或者说开的 max, 或者说开的是 企业账号之类的一些东西,然后第二个呢是一个 a p i, 这个这里是官方的一个 a p i, 第三个呢是一些其他的,呃,亚马逊之类的一些第三方的 a p i, 然后这里我们就选择第一个就可以了,他会弹入到网页,如你需要提前在你的网页上面呃,登录你的 开了会员的账号,由于我这个账号目前是没有开通 pro 和 max 的, 所以他提示我需要升级。当我们苹果电脑的安装完成之后呢,我们进行 windows 的 安装, 然后 windows 是 有一个前提的,就是你的 windows 必须需要先安装这个 get, 先打开你的浏览器,然后把把 get 给下载下来,选择你的版本,然后下载就好了。 我们可以看到 windows 是 有两种方式的,首先第一种是 power 小, 我们首先以这个 power 的 这种方式来装,把它复制之后, 在你的电脑里面找到这一个,然后打开它鼠标右键就可以直接把它粘贴的进去了,然后回车就行。 ok, 现在就是下载完成了,和苹果电脑是一样的打开方式。 ok, 当你的电脑上如果说出现这一步啊,是因为如果我们是使用这一个命令的话,它会默认给你安装到一些比较安全的位置上面, 所以你直接使用 ctrl 打开它是找不到这一个位置所在的。这里呢有两种解决方式,第一种是你自自己到环境编辑里面去把它添加,第二种呢是输入一些终端命令,如果你不知道 这个时候你的终端命令应该怎么输,你就把它全部复制,然后找到任意一个 ai, 比如豆瓣就可以,它就会给你对应的回答,你只需要把它给到你的终端命令,把它复制进去,然后同样回车。 这个时候它是不会出现任何的反应的,但它再一次出现这个的时候,就意味着它已经成功配置了,这个时候你需要关闭它,然后再重新开一个,然后输入 cloud 来,就可以正常的启动了。然后我们现在就接着来讲。呃,另外一种 windows 的 安装方式,也就是 cmd, 这一种的话,你只需要打开你电脑上的 任意一个搜索框,然后输入 cmd 就 可以了,也是同样的,把下载命令放进去,然后回车。 ok, 现在就是已经下载好了,我们来打开试一下, ok, 直接打开了。这就是苹果电脑和 windows 电脑的安装方式,就是其实它安装是特别简单的, 然后使用也特别的简单,就只需要你有一个账号把它给登录就可以了。接下来我们就来聊一下账号的方式吧, 现在是有很多模型都可以使用 cc, 不 只是官方的,首先官方的呢,我尝试过很多的方式,首先是新加坡的银行卡,然后包括虚拟卡,包括优卡,包括苹果内购和谷歌内购。 最后呢,我得到的最稳定的一种方式,其实就是美区的一个苹果内购啊,在我能够接收到的资源里面,首先他的一个方式就是注册一个美区的苹果账号,然后在支付宝购买礼品卡充值到你的账号里面,然后在里面去进行订阅, 如果说是使用苹果和谷歌的话,会有额外的一些呃,过路费之类的东西。 pro 呢是二十刀,然后五倍是一百二十五刀,二十倍是二百五十刀。如果说你是网页支付,网页支付的话就需要一些银行卡, 真实的一些卡片,然后国内的卡是不能够用的,网页支付的话是 pro, pro 是 二十刀,然后五倍是一百刀,二十倍呢是两百刀,所以多的这一些是你交给苹果或者谷歌的税。当然也有一些低价区,比如尼日利亚,五倍差不多是七十多刀, 但是这些是极容易封 id 的, 如果你是一个小白的话,这种方式是完全不推荐的。第二种是 api, 市面上常见的 api 有 三种封类,第一种呢就是官方的 api, 也就是在克拉的官网购买的那一种,那种是特别特别贵的,呃,离我们普通人接触到的 配不上就别想了。然后第二种呢是中转 api, 这里是我重点会讲的。首先中转 api 的 水是特别深的。首先第一个是宣传的官方渠道,但是注意这里只是宣传上面,因为你根本不知道背后的模型厂商给到你的到底是什么模型。 然后第二种渠道就是云闪山渠道,比如说,呃,亚马逊、微软这些渠道的本质原理呢,就是 a 社允许他们部署自己的模型,然后部署后按照 api 的 一个形式去计价收费,然后自模型部署,也有大概两个渠道输入,他们的价格和表现力也不一样。第一种是部署的一个专属模型,这种是一对一的,意思就是 他们的 api 是 拿出来供给团队使用的,也就是一些大量的企业去购买的,比如说我们知道的一些呃,特别大的云,特别大的一些 api 终端商他们的渠道。 然后第三种就是逆向渠道,这个就是最便宜的一种,就是从包括 coser 啊,然后 ky 呀,或者说反重力啊的一些工具里面逆向出来的。 但是这一类渠道他就是说白了就是花低价去薅平台的羊毛,然后来开这些服务,然后通过一些返利平台去售卖他们的 a p i, 优点就是便宜,然后缺点就是表现效果是非常差的,他就会 和真正的官方的账号就是完全不是一个层级的东西,因为他们逆向出来的 a p i 会携带软件自身的提示词,能明白这个意思吗?比如从反重力里面逆向出来的, 他是会携带一些反重力里面本身自带的一些相关的专属提示时,所以他是会污染你的上下纹的,表现效果是非常差的他。然后这里是有一些最大的坑,这些坑是什么呢?在一些厂商或者说大的中转站, 他们在上游渠道没有账号之后,他们会给你夹杂一些其他的模型,懂我意思吧?就是说虽然你在 c c 里面看到的模型是 oppo 四点六,但是他不一定是他后面有可能是 其他的一些比较比较拉的模型,懂我意思吧? ok, 我 们说完三种 api 的 种类之后呢,我们来讲一下如何通过国内的模型去使用 cc 呢? 就是 cc 他 其实是一个应用,但是他能够搭配的模型是其他的任何的模型,最好的效果当然是他自己本身的模型,但是我如果说你实在没有办法购买到账号,也没有办法 使用到好的 api, 然后或者说你手里有一些闲置的国内的模型,你就可以通过国内模型的方式去使用。 以我我这里就以智普为例,因为我,呃有一个智普的,我看一下,我看一下过期了没有 啊?没有到七号,我这里是有一个智普的包月计划的,所以我这里就以智普为例,我们在他的一个呃 任何一个模型,他肯定都会有这种安装文档的 api 文档的,所以你只需要找到这一个文档,他的这里面会接入的地方会很详细。如果说你不想使用智普,或者说你购买的是其他的,然后你也没有找到这一个 api 文档, 你也不会去配置的话,这里有一个神器叫做 cc switch, 在 给他哈巴页面里面搜索,然后在这一个位置把它点开点击,然后直接滑到最下方, 根据你的需要,根据你的电脑版本去安装对应的版本就可以了。 ok, 然后我的手里正好呢是有一个项目的,所以我就直接咱们就从零开始,从 skill 的 创建,直接就开始如何去做一个项目。好吧,首先我们进来肯定是要先安装一个 skill 的, 就是这一个 skill creator, 它呢是创建 skill 的 一个技能,安装完成之后把这个给启动, ok, 现在就已经是启动的状态了。然后打开咱们的计划模式,给他说现在的需求, 我现在有一个需求,就是我需要进行微信聊天截图的批量打码,只打码对方的,然后以及打码文字中的一些人名和公司名之类的东西,然后打码完成之后呢,输出一个 适用于发朋友圈的文案,文案的类型我后面会发给你,我们先解决打码的这一个功能。 呃,这里就直接选择你想要的一种方式就好了, 这里工具形态是他想知道你是在哪些地方使用,然后如果说这里你不够确定的话,就像我现在, 呃,我现在其实也不太确定,我其实更想的是制作一个 skill 的 形式,但是里面呢包含了一些脚本,我想要的整一个炼炉是这个样子的, 所有的截图我放入到一个文件夹中,然后我在这一个文件夹里面启动这一个 skill, 这一个 skill 呢就会自动的帮我把里面的图片进行打码,最后呢产出对应的文案给我。 呃,在这个计划模式开启对话的这一个过程中呢,他会不断的去问你一些问题,然后如果说你觉得 他没有把你的意思理解到位的话,你需要不断的和他进行对话,然后产出最终的一个计划再进行执行,这就是计划模式的一个好处,这时候他的计划已经写出来了,这个时候我们就可以对他的计划进行一个查看, 看一下他的内容对不对。当你有任何其他的问题,或者说呃 其他的东西的时候,你都要进行一个补充。 ok, 我 们可以看到啊,他其实这里是识别到了我刚刚 我们安装的那一个技能创建的技能,当你觉得计划没有问题的时候,就可以让他进行工作了。开始之后你可以看到下面他变成了这一个符号,他的意思呢是说 在不涉及一些工具调用的情况下,他会自动的去进行工作。和计划模式的区别在于计划模式是先理清楚需求,然后这个他会直接开始动工。 呃,在这个过程中他会频繁的跳这种问题。这个问题的意思是说,比如说他现在想要打开这一个文件,如果我们只选择第一个 yes 的 话,他就只打开这一次。 如果说我们选择第二个的话,他下一次再想打开这个文件,他就不会再问你了,他会自动的去呃允许,然后进行打开。如果说我们想要 减少这一个时间的话,那就是你的需求,你的计划,你的步骤,你的方式都要 尽可能的详细。这就是 ai 的 一个边界的问题。因为刚刚我的给出来的计划和需求其实是比较模糊的,所以他会进行大量的测试,然后大量的优化。 但是如果说你知道了一些地方本来应该怎么做的,你直接告诉他,那么他就会直接就以正确的方式去执行了,他就会呃更快的去工作,然后当速度更快的时候,那么使用的托管数量也会相应的减小, 同时上下文也会减少。我觉得现在我们的一个上下文其实有点点残了,所以我现在其实是想让他 停止,停止了之后呢就继续给他补充现补充信息。 你现在是到哪一步了?呃,我发现你一直在做一些重复的优化,然后 又继续识别,然后又是重复的优化。你现在有任何的问题,我希望你来问我。然后有一个点就是,呃,因为我们是要批量化的,所以说,呃图片少还好,如果说当图片多了呢?比如说五十张、 六十张的时候,你现在的这一个速度和现在的这一个方式就 会特别的慢,因为你从开始到现在已经过去了,呃,快二十分钟了,然后这二十分钟从我这边看到的你一直是在进行不断的 优化,然后创建优化,然后创建,但是你甚至没有考虑到上下文的一个问题,所以现在我,呃,虽然中断你了,但是我都不确定你现在做到哪一步了。 当你中断他的时候,就让他给你汇报一下进度,然后你会发现他卡住的地方是在哪些东西,然后他会问你更多的问题。在这个过程中其实我们是可以随时中断他的,可以中断他的并不是说 就让他一直这么跑下去。 ok, 但这个时候你和他再一次进行对话的时候就是,呃,要注意一个点,就是千万不要在你现在已经 已经出现问题的这一个上下文里面进行对话了,你需要额外开一个上下文,但是如果说你额外开一个上下文,他并不知道你这一个上下文进行了哪一些东西,你就可以像我现在这样做, 呃,我现在需要新开另外的上下文窗口来进行重新的呃执行,所以我需要你把现在你已经做好的以及你未来要做的和你 已经修改的东西,呃列成一个完整的清单给我,这样子让我保证我在另外的一个上下文窗口对话中能够继续执行。 ok, 这个样子给他说,然后他会输出来一些执行的计划,或者说清单之类的东西,然后我们就可以重新开启对话,到另外一个窗口中去执行,而不是一直在这一个上下文窗口中反复的去 对话和调试。等他把清单完全列出来之后,他甚至会给你说清楚你下一个对话框应该怎么说,所以我们就只需要,所以我们就只需要输入命令,然后到另外一个对话窗口去执行就可以了。 ok, 到现在他就已经完成了。然后我们来看一下他做的一个效果吧, 这个时间是四点四十二,也就是刚刚首先标题打上码了,然后这里也打上码了。呃,无关紧要吧,然后头像也打码了,然后我们看一下另外的图, ok, 名称这里也打上了,还不错。嗯,都不错。 ok, 现在他处理完成了,他的效果,呃,至少在目前看来是不错的。 然后但是因为我们工作的时间比较久了,如果说现在我想出去,或者说现在我想去做其他的事情,我想退出这一个终端,或者说我想休息了,然后这个时候怎么保存进度呢?那么就来到了我们的啊,一个 就来到了我们很重要的一个东西,就叫做上传到你自己的 github, 或者说让他 can meet 一下,就直接告诉他, 然后这个时候它会检测你的这一个呃文件是否已经进行过 get, 如果说没有进行过 get, 那 么它就会指引你呃登录你自己的账号,或者说呃做什么, 比如说现在他说当前还不是 get 仓库需要说实话,那么你就给他说, ok, 当他说完已经提交的时候,我们就可以去呃 关掉这一个终端,或者说去休息了。那么如何上传到自己的 get 哈普呢?这个时候你就可以给他说上传到我的,如果你是首一次上传的话,他会呃需要你去 授权他一些密钥之类的东西,他都会给你指引的,所以完全不用担心。 ok, 我 们可以看到他现在已经是推送到了我自己的 github 的 一个私有仓库里面。 如果说你想把这一个 skill 或者说你想把你自己创建的一些小应用分享给别人使用的话,你一定要在这里给他讲清楚, 我想要把我把这一个仓库给公开 给他说,那么他就会把你的仓库进行公开,你就可以把你的仓库页面分享给别人,我打开你的网页进行搜索一下,看一下能不能够搜索的到。 ok, 是 可以搜索的到的。呃,但是它里面你会发现没有什么文档之类的东西, 这个时候你也不需要担心,因为你可以直接把这一个仓库地址复制给你的克拉的扣的,然后帮我安装这一个仓库里面的所有内容,并教会我使用, 这个时候你就回车给你的克拉的扣的,他就会帮你安装,并且呃教你使用,因为他会便利里面的代码是怎么进行的,便利里面的文档是如何进行的,他就会给你说清楚。 其实你会发现做一个呃小程序,或者说做一个脚本,或者说做一个十六,他其实是特别简单的想清楚你的需求,以及在这一个过程中你会不断的和 ai 进行边界的一个探索, 然后后面的话就是完全取决于你自己的一个想法,能够有多高,你就能够走得多高。那么今天的视频就到此为止,再见。


大家好,我上一期给大家分享了我的 oc 点加肯诺的的工作流,然后生成全自动 ai 复盘的工作流,这一篇已经目前已经快一千的点赞收藏了,然后反响非常的好。今天啊也想和大家分享一下如何结合这一套系统, 然后自动生成自媒体的视频脚本,就是你目前在看的这一期,我下一期的话大家也可以评论区告诉我。然后之前为什么我觉得这一期非常的好呢?就是我之前写一篇是 自媒体的视频脚本,要多久以前你要素材的整理,然后从头写竹字稿,写着写着可能和 a n l 一下有可能就不太对,然后你又再推翻重来,再写提词提词器的版本,然后想标题写简介做白板,对,然后就等于 半天可能就过去了,然后现在的话,因为打通了 abc 加可洛点的这个,然后我就和 a n l 就 三件事,就是你告诉我,呃,我这一周可以做什么选题,因为他已经知道我这一周发生了什么事情,然后并且告诉我,呃,给我生成我拍摄的一个脚本,然后包括标题简介都给我 全部生成,然后再修改一些细节就定到,然后这样大概就是二十分钟啊,今天给大家实操一下,就是,嗯, 可以关注了我的小伙伴可以看到我上一期分享了一个,就是,嗯,有位建筑设计思想转行数据分析来找我做了一场咨询,我把这个视频也分享出来了。那这一块的话,我 整个做自媒体的视频的脚本是怎么快速生成的呢?给大家看一下。我首先就是,呃,就是我把这个,呃这个,比如说腾讯会议的主资稿告诉他,我这个做了一个,呃咨询,对,你还记得吗? 然后这个可以做一篇分享吧这么一句话,然后他就去读我那一个生成的竹子稿,他说啊,我记得,然后啊你这个里面你们讲了什么内容?然后这一篇的啊价值可以,对转发出一份新诗的人是很干货的。然后我就说, ok, 那 就做这篇吧,帮我生成视频脚本,因为你已经有我们视频脚本的 sop。 然后 他里面说的不太好的,我给他简单的修饰一下,然后就说重点不要太多,就三个吧,也不要很长。他说好,那我们按照 sap 直接出全套,然后他就直接把我的视 框架,你的钩子问题第一、第二、第三点写什么,然后结尾的一个京剧就全部就生成出来这个主字稿了,然后非常的方便,而且给我还生成了这个提词器版。因为我有时候,呃,大家可以看到我有时候不是全白板,也会直接就是对着视频来录制,然后他把这个关键词能录到开拍里面的也给我直接生成了, 对,然后还包括标题简介,呃,就是推荐的形式,你直接帮我生成这个文稿吧,放在这个下面, 那就说好的,我已经帮你生成了这个文稿,然后调整了这个白板的这个模式,然后你就直接在这个拍,所以这个大家可以看到我左边的这个就是他直接生成的,包括刚刚那一个整个的框架, 对,然后还把我就是生成白板的这一个,呃,这个标题和文案和图都已经画好了,所以我就直接复制到白板就 ok 了, 这一步也都神了意向,我可能是自己一个个去打字,然后如果说我想,因为我也有告诉他 s o p 是 我们共创的嘛,然后我有告诉他,呃,我有时候会用煎饼奶去帮我生成,因为煎饼奶用的都不可要用啦啦不啦啦,它生成的效果挺好的,所以我他也把这个提示词都给我生生成好了,如果我想直接去生成也都 ok 的, 还有完整的一个主字稿,然后我可能 大概看一下,因为都是我自己说的内容,所以我讲出来的话其实也是会比较方便的。还包括提词器的版本放在拍拍里面怎么录,还有标题也给了好几个的一个备选,还有简介,对,然后话题标签,然后录制的建议是不是非常的一个方便,所以你整个直接拿来拍摄就 ok 了 啊,所以我觉得话就是这一套工作流,我现在真的是在持续的用,非常建议大家就是用起来是真的会啊,实际的落地去节省了我自己的时间,因为我这个也是 些啊,一步步实操过来的。然后个人生产力系统的话,就是我的 ai 会越来越懂我,因为我在 opc 点里面我的上下文足够的多,然后这个 ai 它就会足够的懂我,产出就越来越像我自己,包括我们的市场视频的 sop, 你 可以看到市面上很多人都说是卖 tiktok 啊,或者卖什么,我觉得就是大家要不断地去试用,找到最适合自己的视频的 sop。 对,然后这套系统我也在持续的做,比如说周期化,然后选择题的一个策划,我咨询记录的一些整理阅读的一个复盘。对,然后这就是啊,这一次的直接帮我生成视频脚本的这一个的工作流啊。本期的分享就到这了,如果大家对这这套系统感兴趣的话,也可以也可以在下方留言,我们下期再见,拜拜。

直接说结论, cloud 在 昨天更新的 computer use 这个插件是没有办法投入生产的,现在还远远没有达到可以用的程度。 昨天推特上 cloud 更新了一个 computer use, 我 看到这个推送,我就迫不及待打开电脑尝试了一下,那具体的打开方式呢?就是在你桌面的这个 desktop 的版本里面,然后打开 cloud code 里面有一个设置,你把这个设置里面的 browser use 下面的 computer use 给它打开,打开之后你就可以使用了。然后我也尝试在 c u i 里面打开它, c u i 现在是不支持这个插件的,那我对于这个场景非常感兴趣的点,呃,就用这个个人微信回复去做了一个测试,这个就是你们看到的测试结果, 呃,我让他给我微信里的一个联系人发送一条消息,你中午吃了什么?我在这里给大家做一个这个详细的这个讲解。第一是他直接输入了消息,因为他这个时候打开了我的电脑, 那其实它后面识别到这个群聊不是我想要发送的联系人,它就再次切换到这个我想要的指定的联系人的对话框。但这里问题来了,我就发现了这个 computer use 它真正的这个操作逻辑,它是在不断的截图,然后截图识别图像上面的要素,然后判断这个控制点,然后通过键盘操作的方式 来进行选用。那键盘操作会有个什么问题呢?就是我最终其实这个进程没有跑完,我就给他放弃掉了,他会遇到一个非常严重的问题,他在搜索框里面搜索我想要联系的这个联系人,一旦这个联系人搜索的结果是多个,因为微信的搜索联系人一定会出现多个,只要你跟这个人有群聊, 那出现的第一个结果就是,呃,这个你,你的这个联系人第二个结果就是你跟这个联系人存在的一系列的群聊,那这个时候这个键盘的搜索就会一直出错,就导致我只是让他简单的在微信里面给我的这个联系人发送一条消息,这件事情都做不到。 所以 computer use 它真正要落地在你的电脑里面去操作你的软件,这一条路我觉得还有很长的路要走,但是我觉得 browser use 已经非常好用了,因为 browser use 明显它对于控件选举的精确度是要非常高的。

测评, callopus 四点六模型,零基础开发,全程没有协议性代码,到小程序,到 up, 到后台管理,到接口开发数据库对接,全开发教程,全程干货准备发车。打开我们的开发工具,布置客户需求文档,提 供给 ai 进行分析,获取按权。这分类的功能清单 清单、技术要求和开发规范一并交。 代码已编辑完成。启动项目运行,进行功能测试,调试,修复问题。 打开 navik 客户端工具,连接到目标数据库,右键点击数据库连接或数据库名,选择运行 s q 六文件,选择要执行的 s q 六脚本文件,点击开始执行完成。创建数据库, 等待 maven 依赖下载完成。找到主启动类,带有 spring 不 application 注解,点击类旁边的绿色三角形按钮,选择 run 启动,查看控制台输出,确认启动成功。 找到前端项目 c m d, 进入项目目录,执行命令 m p m install, 等待依赖安装完成。执行命令 m p m 任意启动前端项目。复制前端地址,如, h t t p 冒号斜杠,斜杠抖 o c l h o s t 冒号三零零零,打开浏览器,访问该地址,进入管理后台项目 模块一,系统登录模块二,首页数据统计模块三,用户管理模块四, 商品管理模块五,订单管理模块六,预约管理模块七,轮播图管理模块八,新闻资讯管理模块九,文化内容管理模块十,展品管理模块十一,帖子管理模块十二,评论管理模块十三, 管理员管理模块十四,系统配置模块十五,收入统计报表模块十六,订单统计报表模块十七,商品统计报表模块十八,用户统计报表模块十九,访问统计报表启动小程序项目 首页模块,文博图快捷导航历史文化推荐新闻资讯商城模块,商品分类商品列表商品详情加入文化展示历史文化制作工艺数字展馆展品详情 社区模块,帖子列表发帖评论、点赞、预约体验、在线预约预约管理状态追踪、用户中心登录注册、个人资料、收货地址、订单管理。这不是巅某,这是一个可以直接上线营的完整产品。 太震惊了, ai 已经这么强了,我也想学怎么开始,能帮我开发一个小程序吗?多少钱?不信, ai 写的代码肯定一堆蹦。评论区,告诉我你的想法,每条评论我都会认真回复。

在右边的资源管理器里面我们看到了这些代码,这就是可浩克的一个源码,一共五十一万行,既然有的源码,我们来启动一下,让他在本地运行,首先安装依赖, 六百八十一个依赖,安装成功之后,接着让他生成构建的产物,也就是在我们电脑上跑的一些命令,看一下目录,在这边他生成的 d i s t, 这个就是它的脚本文件,我们在电脑上面行的就是这个脚本文件,那我们将脚本文件启动一下,输入这样的命令,点击回车,我们看到这个图标,说明通过野马翻译的 cloud code 已经启动成功, 来测试一下。哈喽,他这边有成功的回复,我们可以通过一种有趣的方式,就是通过 cloud code 去解读 cloud code 的 源码,在这边鼠标右击面板位置,我们调整为右,在这边我们可以通过提问的方式去解读 cloud code 的 源码。有很多粉丝想知道这五十一万行代码里面到底藏的什么,我们可以在这边提问这个项目源码 它的设计架构是什么?首先它告诉你它这个 code 文件,我们可以点击它,既然它是 code 文件,我们看一下这里面有没有个 main 函数,可以通过搜索的方式 在这边输入 main, 然后这边六十行代码,这边有个 main 函数,这是整个项目运行的第一个函数,也是入口函数,它的架构主要分为这么几层,第一个是 api 层,这层主要调用的是 osloopy api, 也就通过这一层我们和大模型进行连接, 这个是查询缩影查询函数工具系统路由状态管理层,上下文构建查询引擎,主要负责单次的 api 的 请求工具调用循环工具系统, 每个工具独立目录,统一托管接口。 ui 层是 react 主键在终端渲染状态管理是全球应用状态,包括消息权限 m c p 的 在上下文构建成, 它提供了 cloud md 这个文件,这是 cloud code 系统提示值文件这边列出了它的基础站,运行时使用的是 bun 这个工具, ui 选的是 react inc provide, 它支持四家,这个是官方的,还有这么三家。我们再来问一下, 和同类型的 ai 编程工具相比较,你的优势是什么?它这边对比了市场上几个主流的 ai 工具,得出的结论,它是一个终端原生,深度代码库结识,这就是它的定位,终端原生,它无需日离开工作流,直接在 c i c d 进行运行, 配合 get c i, c d 等无缝集成。第二个优势是全代码库的理解,它不止看当前的文件,能够理解整个项目结构,依赖关系和历史上下文。第三个是真实的执行能力, 可执行运行命令、编辑文件、执行测试等等。第四点支持长上下文多步骤任务。 kolok 的 本身模型的上下文窗口比较大,适合复杂跨五件的 重构任务。第五点是权限控制透免,它每个工具的调用都需要得到用户的确认,安全可控。当然它有不足之处就是 kolok 的 短板是没有 g u i, 对 于习惯图形界面的开发者来说,上手成本较高,但是对于熟悉中段的工程师,他是目前自主性最强,上下文理解最深的编程助手。 我们再来问一下,该项目中还隐藏着哪些功能没有发布,而这些功能在规划中发送,他回复说,让我深入扒一扒原版里面的隐藏功能。这边跟我总结了这么几个,一共有八个功能, 我们来看一下。第一个是云端的多智能体规划引擎,是一个最重磅的隐藏的功能,就是将复杂的任务上传到云端,使用的是 opus 四点六的模型本地刊,通过桥接协议 实时轮行远程结果,整个的流程就是通过本地终端发送命令,在云端分布式 agent 群里面进行执行,接着将结果回传过来。第二个是多 agent 协作者模式,应该就是我们熟悉的 agent team, 多个 agent 通过消息队列进行协助,支持共享工作区。第三个是 auto chain 后台记忆自动整合的功能,当积累足够多的绘画后, 它会自动触发,通过呢创建一个指的 agent, 执行梦境的整合,它可以回顾所有的历史绘画,将重要的知识呢写涂到记忆文件里面, 整个过程无需人工的干预,自动维护长期记忆。第四是事件驱动的主动行为,它不需要等待用户的发消息,监听外部的事件后,它自动触发任务,这个是实现 clone 的 主动的一个基础。第五是支持桌面和 web 端的双向通道,这样可以通过 clone 的 ai 页面 直接远程操控本地的终端。第六点实现团队的共享记忆,可以实现跨用户跨绘画的一个团队级的知识库,这个知识库与个人的 memory 文件是分离的,支持团队的协助场景下上下文的同步。第七点是长时间的任务监控, 它是一个长时间运行任务的一个断点,续传状态持续化管理的一个系统。第八点就是定时任务,结合 gmail 模式实现无人值守的定时 ai 任务调度。 上面这些功能都是存在在我们的脚本文件里面的,只是呢,暂时被设置为 false and slogic, 正处在微度测试的阶段。到目前为止,上面这些功能还没有向公众发布。我们再来问一下, 你和 open clone 有 什么区别?哪个更加强大?这边给你的回复是,它们的定位是完全不同的,是两个不同类型的产品,没有可以直接可比性。 clone code 是 定位于编程助手,而 open clone 定位为个人 ai 助手,跨平台的消息网关。很多粉丝想知道 clone code 的 系统提示值是什么? 你的系统级别的提示值是什么?发送系统提示值其实很简单,就是我这边打开的文件一共就有一百一十五行,主要有六个部分构成, 首先是身份的一个定义,接着是行为的规范,接着是项目上下文环境的信息,以及记忆系统和可用的一些技能列表。好了,本期视频就到这里,希望对你有所帮助,关注我,分享更多 ai 技术和玩法。

很多测试朋友想做自动化,又觉得写脚本难耗时间,写半天还跑不通。其实现在有 ai 帮忙,自动化根本不用死磕代码,用对工具效率直接翻倍。今天给你讲一个超实用组合, play right 加 cloud code。 第一,用克拉的 code 直接生成脚本,你把需求告诉 ai, 比如打开网页,点击按钮,输入内容,断言结果, ai 几秒就能给你生成完整可运行的 playwrite 代码,不用你自己丛林敲。 第二,用 playwrite 直接运行,稳定不报错,它比传统工具更稳,支持多浏览器,不用折腾驱动复制代码就能跑, 新手也能轻松出自动化用力。第三,每天用这个方法优化一个工作场景,把重复的登录、查询、提报流程写成脚本以后,点一下就自动跑完,省下大量时间去提升核心能力。 自动化不是靠硬写代码,而是靠 ai 加工具提效用。豪华 write 加 cloud code, 你 会比别人更快进阶自动化。想学习更多 ai 测试提效方法,点个关注我,每天分享实战技巧!

想搞懂 cloud code 底层原理吗?推荐一个最近 github 上一点九万 stars 的 开源项目 then cloud code, 这个项目实现了 cloud code 的 迷你版,它特别适合初学者学习。为什么推荐它?因为它把复杂的 agent 的 架构拆解成了十二个由一到难的 python 脚本, 它是真正的从零到一。第一课教你怎么写最基础的对话循环,第二课教你工具调用是怎么回事。第五课教你 skills 到底是怎么监听式批录,跟着跑一遍,你就能把 agent 的 每个零件都摸透。当你学完这十二课, 最后还有一个 s four digit 等着你,他把前面所有的知识点串联起来,这就构成了一个完整的 ai 编码 agent。 你 会发现所有的黑科技无非是 l l m 加提示词加流程控制的组合。别光看理论,淘宝代码才是最好的学习方法。想了解 ai 应用开发的,拿这个项目练手绝对不亏。地址我放评论区了。

大家好,我叫风清子,今天这条视频我想跟大家聊聊我是如何使用 colocod 的 分享。先说一下我对于 colocod 的 理解,你可以把 colocod 的 当成一个会写代码,会帮你处理任务的 ai 协助的助手,他不是单纯的陪你聊天的工具,而是能在工作、日常编程、脚本处理等场景里,真正 帮你提高效率的 ai 助力的小伙伴。所以这一期视频我先不分享太复杂的玩法,只是分享一下我如何使用 colocod, 帮你更好的使用 colocod。 平时也会把我的一些安装的方法,踩坑的经验多整理在我的飞书文档里,果如果后面你们想看,我可以继续整理出来,评论区留言或者私聊我都可以。第一步,我推荐大家安装一下 vs code, 因为安装一下 vs code, 我 觉得后面很多的你和 cloud code 的 很多交互,我觉得可以直接放在 vs code 里面,可能会更顺手。安装其实也很简单, 大家只要登对应的 vs code 的 官网,然后去下载你对应系统的版本即可。安装完 vs code, 我 推荐大伙安装两个插件,一个是 chinese 的, 一个中文的插件,另一个是 cloud code for vs code。 安装这个插件我们就是可以更好的在 vs code 环境中和 cloud code 进行兑换,包括后面的很多操作都可以直接在 vs code 中完成,比如这里按键的插件 就是这个,第一个是 cloud code 和 vs code 的 这个插件,第二个是 chinese, 把你这个 vs code 的 中文话。其实这种方法安装的时候,其实我是让大家小白更加友好地使用 cloud code 的 这种工具, 比如后面我们一些和 cloud code 的 交互,我们就可以直接在 vs code 中进行使用了。第二个我推荐给大家安装的是一个 python 的 环境, 因为你后面如果你想玩 colocore 的 一些进阶功能,比如说 commands, agents, hooks, skills 等一些高级的玩法的时候,很多时候我们需要用到 python 的 环境或者 python 的 一些包,这时候我们就提前的把 python 的 环境安装好,对应的安装文档你可以参考一下我这里的飞书上的文档就可以了。 patent 对 应的配置了国内的一些代理。第三个,我推荐大家安装的是一个 git 的 小工具,因为你后面很多很多的项目代码脚本都放在 git 号上,不管是你后面拉项目还是自己同步自己的代码, git 还是很常用的,安装的本身不复杂,直接下一步就即可以,然后对应的安装的手册也在这里。 第四个,我推荐大家安装一下 node js, 因为后面关于 cloud 的 升级,版本的升级,还有一些其他 node 的 一些工具,本地我也是使用 node js 安装了我的 cloud code 的 时候,因为我推荐大家提前安装好。第五个,我推荐大家安装一下 c c switch, c c switch 就是 个这样子的工具, 因为 cloud code 在 接入的环境通道套餐里面,尤其是在国内的网网络环境中可能会涉及会不可不可达,所以在很多时候国内就会出现很多中转站,那时候 c c c c switch 的 作用就是帮你更好的做切换,比如说今天有些通道今天能用,明天就不稳定了,这些坑我也曾经也踩过,所以我觉得提前准备好会省很多麻烦。好,今天这期的视频分享到在这里,如果你想把 cloud code 的 用顺, 前面先把 v s code 的 相关的插件 python, git, node js 还有 c c, switch 多安装好, 后面你再去学 cloud code 的 使用命令,还有一些更高些的玩法,才会更轻松。下一期我再继续给大家分享 cloud code 到底怎么用,以及我的一些实战的理解,谢谢大家。我是风信子,我们下期见。

ai 编程已经远超出了编程本身的范畴,它实际上是在做项目管理,这个视频我们就把整个完整的项目开发流程走一遍。我们打开 control 以后,首先切换到 command 模式,这时我们需要按一下 shift 加 tab 这个组合键, 注意观察最下面这个地方,它会变,从 word 模式变成了接收编辑模式,再按下 shift 加 tab, 又变成了 plan 模式,再按 shift 加 tab, 又回到 word 模式。 word 模式下, 当 cloud 打算去读写你本地的某一个文件,打算去执行一个下脚本时,他会先询问你要不要执行,但这样一个问题,你扔给他一个任务,然后你切换窗口去干其他事情了,结果十分钟之后回来一看,他停在了半中间, 他问你要不要去打开一个文件,你始终没有回复,导致呢?程序始终停那了。所以为了避免这种情况,你可以切换到编辑模式,这样的话他就会直接干了,就不会再询问你了。 而我们今天讲要切换到这个 plan 模式,就是说在一个项目最开始的时候,你给他一个任务,先不要让他急于的去写代码去执行, 而应该让他先把完整的计划先列好,他列好之后,你还要再 check 一下,看这个计划是否对是否周详,圈好之后再开始执行,再开始写代码,所以这个就是规划模式。来到规划模式,我们开始给他发任务了, 那这个任务你不管,告诉他你打算实现什么功能,同时你还给他框定一个大概的基础方向, 比方说要使用什么语言,要使用什么库,看我写的这个指令,我说请使用 playwrite 这个库,写一个 b 站自动发布视频的脚本,所以这个是核心任务。但中间一些实现步骤有一些要求,比如说 它要通过获取库克文件来实现自动登录,需要用户填写内容呢?从配置文件里面提取,需要有日制文件,每天完善信息, 需要进行截屏,便于事后检查好。这是我最开始的一个需求,然后 cloud 收到这个需求之后,它还要进一步地跟我进行明确,因为我这个需求可能还不是特别详细,基本它开始去加载一个 skill, 叫做 brainstorming 头脑风暴。 它之所以会去加载这个 skill, 是 因为我事先安装了一个插件,就是这个 super owners。 那 怎么安装插件呢? 这实际上是 cloud 官方那个插件,我们直接在这个地方输入斜杠 plug in 回车。最上面有一个 discover, 就是 发现新插件,还有一个 installed。 啊,你已经安装了哪些插件?大家看一下。我这个地方应该是安装了一个 super owners, 你 看这些都是 cloud plugin official 嘛。官方插件有做这个 code review 的, 还有做代码简化的,还有一个 feature dev, 就是 产品功能嘛, flag 嘛, 前端设计还有一个 skill creator, 它帮你去生成 skill。 这边有一个 super owners, 对, 这都是我提前装好的。那怎么装?我们先切换到这个 discover, 然后往下翻。比如说你想装这个 commit commands, 按下空格键就选中了。 比如说下面这个按下空格键而选中。当你把多个想安装的全部选中之后,按下 enter 回车键这地方,它会询问你是安装到什么地方,是安装到当前用户,还是安装到当前项目?等等, 你选一个范围啊,就可安装了。安装完之后我们按住 escape 先退回来,好,退回到这个主界面,我们需要重新加载一下,输入一个 plug 音, 下面有一个什么 reload plug 音,执行一下这个命令,就把刚才你选中的那几插件彻底的安装好了。 所以这边他实际上起用了那个插件进行一个头脑风暴。他说我先来了解一下当前的项目结构,看看是否已经有相关的代码或者配置。因为可能我们昨天已经就这个项目讨论过了, 他已经生成了移动代码或者配置文件,那我们之前已经形成的这个结果肯定不能把它退,他要看一下之前是否已经有这样的一些成果了。好,我已经了解了目前的项目结构,还有几个问题需要跟你确认,所以你就感觉这个 a 他 更像是一个外包团队, 你给了他一个比较粗略的需求。第一他要来跟你去沟通更详细的细节,这些细节既包含了需求本身,也包含了实现方案。 比如说他先问我,你打算使用 python 实现还是使用 node js 啊?我说我想使用 python 实现你希望什么格式的配置文件。 他这个地方实际上是给我列出了几种常见的配置文件格式,我当时选择了节省,那么发布视频要填一些子段呢?他给了我这么几个选项,第一个是说只填一些必填子段,第二个是必填,应该选填都填, 那我选择的是都填完整信息,还问我关于测试要使用哪种模式,要么就是说他只负责填信息,最后发布那个按钮,让人工去点, 要么就是代码自动的帮你去点那个发布按钮,要就是所谓的智能模式啊,在测试阶段 他不去点那个发布按钮,测完之后他去点那个发布按钮,所以这一些实际上是在沟通需求了,那么需求沟通清楚以后,他给了我三个实现方案,这个属于技术方讨论了。 第一个是单脚本架构方案,就所有功能全部放在一个拍摄文件里面,直接搞定。 这个方案有什么优点?有什么缺点?范二,模块化架构,让什么配置文件?浏览器操作网址截图,不同功能放到不同模块里面去,这样你的项目结构、文件目录就会更多一些,扩展性更好一些。 他有什么优点?有什么缺点?还有第三个方案更加复杂,他会带一个管理后台, 还会带一个报警机制,这就是一个大型的很重要的一个项目了。到最后他说推荐采用方案二,但是我最后选择的是方案一,他说好我们采用单脚门架构,下面是详细的设计方案,上面还是在讨论一个 粗略的方案,下面才是更详细的方案。那么对于单脚本架构来说,整体结构包含的这个脚本文件是什么?使用什么库?配置文件在哪里?已知文件在哪里? 操作截图在哪里?配置文件好,包含哪些个字段?那注意现在已经进入到详细设计阶段了,那么你要逼自己 去改他的详细写方案是你一定要把他每一句话,每个字仔细过一遍,因为如果这个详细方案里面有纰漏,那么将来他根据这个方案实现代码就肯定是有纰漏的。 你如果不想改代码,你就把这个方案给整好。比如说我就发现他这个配置文件里有几个字段需要改, 这个定时发布时间不需要精确到秒到分钟就可以了。比如说这里面的是否允许评论,是否允许下载这几个字段,我觉得可以,不要 直接使用那个默认值就可以了,所以我希望他删除这三个字段。下面是功能模块,读取配置文件,预制输出到终端和文件登录验证, 这是登录后要验证一下是否已经登录成功了。视频上传后要进行截图,填完基本信息之后要进行截图, 上传完封面之后要进行截图,所以这边是详细的步骤,包括这边他还说 要检查一下是否所有的必填字段已经全部填写完整了。最后一步还要做测试验证,对整个网页进行一个完整的截图,检查一下信息是否完整。工作流程,第一步做什么?第二步做什么? 先上传什么?后填写什么?目录结构脚本在哪里?配置文件在哪里?日期和截图在哪里?六、比较有意思的是它这边还有一个 apple 的 file, 上面这一些文件也好,目录也好,全部是他帮我规划好的,他生成的,而唯独这个 app file, 这个是我在最开始 我自己创建了一个这样一个目录,把我要测试使用的视频文件和封的图片我已经放在了这个目录下。最开始的时候他不是说他会去了解一下当前 u 的 这个目录结构,所以他在那个阶段就已经发现了 有这个目录,他理解了这个目录下这两个文件是干嘛的,他在做这个设计的时候就直接附用了这个目录,还是很智能。问我,你对这个方案设计 是否满意?我说需要调整,他说请告诉我需要调整哪些子段吧,我说不需要,填写互动选项配置文件中的三个 enable 子段,请删除。定时发布时间精确到分钟即可。好,然后他开始改这个方案了, 他说关于这个配置文件已经简化了,我已经删除了这三个字段,发布时间已经精确到了分钟。这是改之后的配置文件格式,我工作流也做了修改,他说我已经删除了互动选项这个步骤, 其他的保持不变。 ok, 那 么这个详细的实现方案对好之后,我这边说符合, ok 了, 抄近了。他开始要把这个记写到文件里面去。先创建了一个目录,我开始去写文件。我们整个流程中间,每一个里程碑,每一个阶段的重要成果,一定要落实到文件里面,因为整个流程可能会随时打断, 那么打断以后,之前已经达成共识,他可以直接去读文件,就没必要从头开始交流沟通了。 好,这个开发计划已经保存到这个 md 文件里面了,下一步该按照计划执行了。而这个执行它又分成两种模式, 第一种是 subdivision, 第二种是 subdivision。 那 么对于我这个任务来说,任务比较小,所以更适合采用 subdivision。 那 什么意思?简单理解,可以认为这个 subdivision 更像是多进程模式,而这个 subdivision 更像是一个多进程模式。 当你的整个任务很大时,你有很多比较独立的模块,那么你可以使用这个 parallel session。 那 每一个模块之间它们是完全独立嘛? 它们的 context 上下文是完全独立的,每一个绘画之间它是不怎么交流的,它们的文件是不共享的。所以 当他把每一个独立的任务完成之后,还需要人工的去进行合并。比如说你要开发一个电商网站,有人负责开发订单系统,有人负责开发推荐系统, 最后你还需要把这项目全部合到一起,并且这个大型项目怎么拆分也是需要人去拆的。 而对小型项目来说,更适合使用 subagent, 它会有一个主 agent, 主 agent 负责去拆任务,去分配给每一个子 agent。 虽然说每一个子 agent 也享有独立的 context, 但是子 agent 可以 通过主 agent 进行一些协调和通信人的话会比较轻松。你不用去考虑怎么拆分任务,怎么合并,结果都不用管。 我这边选择了 safari 的 这种模式,我将使用子弹类模式来执行这个计划。第一步,先完成一些前置准备,他要去安装一些第三方。这个时候他启动了这个 feature div code review 和归性审,因为刚才给大家看过,我其实已经安装过这个 feature div 插件了嘛, 他要 pip list 看一下这第三方库是否已经安装好了。这边说环境已经 ok 了, 正式开始执行第一个任务,基础结构和配置读取执行之,他会去进行一个合规性审审,他每做一步都会自己检查一下,他之所以会自己检查,原因是在于我安装了这个插件 code review 好, 那么他进行完这个合规性检查之后,发现有问题,他说 让我进行一些修改,他要去修改实现。好,那修改之后他要再次的重新进行评审,发现还是有问题,让我直接按照计划来重新实现这个任务一。 好吧,他重新开始实现这个任务一了,到最后啊,他终于说这个任务一已经完成,已经完全合规了, 开始执行任务二,任务二完成执行任务三,任务三完成执行任务四,任务四,任务五。好,最后全部任务已经执行完毕,这个时候他还要进行一个最终的代码审查,审查合格以后,他说 这个自动发布视频功能已经全部完成了,我已经实现了这么多文件和目录,每一个文件目录到底是干嘛的? 表格全部给我列好了,最后还很贴心的给了我一个使用步骤,说你第一步要去安装这个第三方库后,要去修改你的配置文件改好之后,你就可以通过这个命令来运行测试了, 这边需要加一个 test 测试,测试没问题,之后只通过这个命令来运行就可以了。所以整个过程是什么?它就是一个完整的从开发到交互的一个生命周期。从最开始 我们要去对需求,到最后产品完成了,那么这个相当于是一个质检报告,是吧? 一项向对哪项功能完成了,就打个对勾,这个是一个产品形态说明书,这个现在是一个产品的使用说明书好,那么整个过程非常完美,执行计划非常详细,是不是意味着他最终写出来的这个 pass 代码就大差不差呢?咱们下期再见。 插播一条上岸信息,我录制了一些编程课程,包括 python, 勾元,区块链变化,还有智能体。我是一个人,一个公司没有立即变轻的压力,所以呢,我可以花更多时间去打磨一门课程,我做事情可以考虑的更长远, 所有课程都是经过我的精心剪辑的,尽可能让大家花更少的时间达到一个更深的高度。感兴趣的可以进我主页橱窗进行了解,或者呢,直接私信咨询。

最近在解析规范时,发现从国家官方网站下载的规范带有水印,对规范内容的识别造成了非常大的干扰。于是我让 cloud code 写了一个一键移出水印的脚本,现在分享给大家。 ai 开始工作了, 他通过图像识别找到了水印,准备通过像素的方式去除。我们打断一下他,让他更换一下思路,先从 pdf 结构数据中分析水印的可能。哇哦,他识别到了有一个 j big 的 对象,可能是水印。 他完成了脚本,我们验证一下。咦,将正常内容去掉了,只留下了水印,我们反馈给 ai 优化一下。 优化好了,现在再来验证一下成功效果完美。我已经将脚本开源为 proptools, 欢迎大家使用。后续我将继续更新关于工程 ai 应用方面的视频,欢迎评论、点赞、收藏和关注,谢谢大家!

goho 上三点一万星的 scripling 爬虫库,配合 qq 可以 原声调用,一个负责脑力,一个负责体力。以前写爬虫要对着网页 f 十二研究半天选择器,现在 ai 自动写代码,在 qq 巧用 scripling 帮我写个抓取某站房产信息的脚本, qq 会自动调用 scripling 的, 可以几秒钟出稿就出来了。网站改版也不怕,最强的地方在于自适应解析, 即便改了 html 结构,它能靠网页元素的指纹自动找回位置,代码根本不用重写原声。绕反爬遇到 call firs 这种硬骨头,它自带的隐身模式能让脚本像真人浏览一样, 省去了折腾代理和请求头的烦恼。这套组合拳真的能把采集维护成本降到接近零。感兴趣的朋友欢迎评论区交流。

hi, 大家好,我是无名刀,那今天又出现了一个非常好玩的事情,就是这个 ansope 的 cloud code, 它的源代码的一个泄露,而且是非常好的付钱出来的。我现在就带大家看一下怎么做到。 首先呢就来到我们的 terminal, 我 先创建一个文件夹,耶, 然后呢我们来使用这个脚本,哦,它不需要这个版本的,我们来这个 n p x 来看一下, 我们就直接下载这个包 啊, n p m 来,我们就下载这个包。 ok, 然后我们再来解压这个文件, 现在它就有了这个 page, 我 们只要一个 page 打开。 然后呢我们再来这个脚本脚本的链接,我会放到我的视频简介里面。先来创建, 然后把复制粘贴, ok, 然后打开我们终端 以后来到我们这个链接。呃,你要确定你这个 c l i g s magic 它的大小要有这个五百多兆。 ok, 然后我们回正, 哦,对, 然后把这个复制粘贴进去。 好,然后我们继续。 嗯,然后就在这个宝里面可以看一下,它有这个 s r c 文件, 非常多 t s 啊,这个是未未经过那个混淆过的 t s 代码, 这就非常好玩了,哼, ok, 那 本次分享就到这里。

大家好,跟大家聊聊最近的工作。最近两个月几乎没干别的,几乎就被 ai 死死的按在电脑前面了,就是反复摩擦呀。 所以今天从一个老程序员的角度总结一下我这两个月来使用 ai 编程的一点体会。我几乎是市面上所有 ai 的 会员,包括 gpt 啊, gmail 啊 cloud。 最近我基本都在跟 cloud 的 高强度的拉扯。 去年我尝试用 ai 去编程的时候,它只能写一些小的应用,我会用它写一些 python 的 脚本去处理一些重复性的工作或者清洗数据。我以为已经非常高效了。直到二六年元旦之后,我开始使用 club。 我用 class 其实很早,但是后来转向主要使用 gemini。 gemini 主要优势是它超长的上下文,它是一个非常称职的个人助理,也能帮你处理很多的工作和业务逻辑。后来我看到 class 出了那个 solo, 四点五, 在 mac 环境下,它可以使用 code 模式。嗯,所以我就尝试它去做了两个稍微复杂一点的 demo, 效果非常好。 然后我一直在尝试给他更复杂的指令,直到我认为他足可以替代一个六到十人的开发小组, 我便开始决定用 cloud 去开发一套商业软件。我在国内的时候开发运营过一款超过八年的萨斯软件, 业务逻辑呢,非常复杂,我现在的目标就是把它的海外版给做出来。要是放在几年前,这种体量的重构和出海绝对是个大工程,哪怕开发里面一个相对复杂的模块。 我算了算,起码得拉上五个人,先开会商讨技术方案,再分头去调研,再回来重新碰头定调子,最后才去敲代码。光前期准备就过去一星期了,你功能上线测试起码两周起步吧。 但现在我的工作流变成什么样了呢?我先用专门的帮我做技术分析和架构选型,大方向定了之后,直接把这个任务扔给 cloud, 它就会自动执行编码。现在你只要给它下命令,它就能给你一套完整的方案,不但代码给你写好,自动化测试做完,甚至把代码推送到 github 和 workers 上, 完全不需要你自己动代码。这一个月,我已经用 cloud 的 扣定了大概二十万行的代码了,完全零手写?我基本上不是基本上就是完全零手写代码, 而且它扣定出来的东西,包括前端后端,只要你觉得不满意,一句话重做,第二套方案马上就出来了。 而且他往往想的比你还全面。一个复杂的指令大概需要执行二十到四十分钟吧, 这往往是两三个程序员两三天的工作量。我甚至有时候在晚上睡觉之前会给他一个超大的任务,比如说我会跟他说,你有足够的时间去检查代码,把所有的方程自测一遍, 然后把整个程序做成多语言的。我现在整个项目做了中英西日韩五种语言, 我完全是让 ai 自动去处理的。做完之后,你再给我一个今天一整天的开发报告,然后帮我规划一下下一步的开发方向,我去睡觉了,你慢慢做。第二天早上起来,几千行代码的修改和两个完整的文档就整整齐齐的放在那里。 我现在用的是 next js 的 架构,这我之前是一点都不会的,但我现在完全是零代码写项目。真的,原本你一个二十人的技术团队,现在完全可以缩减到两个人,就一个技术,一个产品加设计。甚至你作为一个有代码经验的产品经理来说的话,一个人就把这事干了。 艺人公司现在真的是成为可能了, ai 这几年的进步太疯狂啊。接着聊聊最近圈子里吹上天的 open crow 就是 大龙虾,我也跟风去试了。说实话,我觉得它没有传说中那么神奇,也不一定适合所有人,它更适合 一些事务性的工作。它的核心突破呢,是改变了人跟 ai 的 交互方式,它可以操作你已经配置好的设备,去调用各种的 ai agent, 然后通过截图分析的方式把结果发到你的聊天软件里。这样呢,你再通过聊天软件的聊天框给他发送指令,他接着干。这个过程听起来很酷,对吧?但是如果你像我一样是一个全职开发,其实用它就太浪费算力了。 如果是写代码,直接接管 ide 的 效率要高得多。相比之下,我还深度去用了 google 的 as studio, 这两个的定位是完全不一样的。我的感受是,如果你想低成本的去验证一个想法,做一个初级的产品,尤其是小型的交互或者游戏, google a s studio 的 表现甚至要比 club 还要更好。 前几天,在没有任何美术和产品设计的前提下,我就完全靠嘴盾在 a s 丢丢里面深深地描述出了三个游戏,那个完成度极高,试错成本几乎可以忽略不计。而且 a s 丢丢是按量计费的,你是用才会产生费用, 不像其他的 ai 一定要包月。说到钱呢,克拉的订阅费,官方普通的月租大概是二十美金左右, 如果你是全职开发,这完全不够用。我是在确认他能帮我把工作完成到我满意的程度后,我订购了两百五十美金的版本。这也有个坑啊,就是我是在苹果的 apple store 里面订购的, 最后我发现直接用信用卡在网站上支付是两百美金,但是我在 apple store 里面订购是两百五十美金。但是凭良心讲,如果你每天能够坐在电脑前面高强度的使用三个小时以上,这笔钱绝对是物超所值的, 相当于花了点零花钱就雇了一个不知疲倦的顶级程序员。嗯,但是这还有一个坑,就是在开发的时候,我有时候需要调一些三方的接口或者是 ai 的 能力的时候, 我就让卡拉 ok 去直接帮我去做测试,让他自动调通。结果呢,他倒是挺努力,遇到报错就疯狂的重试,毫无节制的调用了其他 ai 的 接口和还有克拉的 flyer 上的资源。 直到上周,我收到了两两份账单,加起来要一千四百四十美金,效率是上天了,但钱包也破产了, 相当于这个月一千多美金的费用就扔给了 ai 的 账单和运服务器的账单了。所以其实这个费用也是可以省掉的,就是你去搞一台设备,让他从在本地去做测试,不要去直接调用云上的资源。 ai 确实能让你一个人活成一支军队,但千万要给这支军队设置好 api 的 消费上限,不然它很容易把你吃垮掉。这就是我最近两个月跟 ai 反复摩擦的一点经验和建议吧,希望对你有帮助。

最近这几个月,我把百分之九十的 ai 工具使用时间全部从 chat、 gpt 转移到了 cloud 上。为什么?因为最近 cloud 实在更新了太多神仙功能。 如果说以前的 ai 只是一个陪你聊天的机器人,那现在的 cloud 已经彻底进化成了一个能帮你处理本地文件、写代码、做图标的全能数字同事。 如果你是刚接触 ai 的 新人,小白别划走。今天这期视频就是我希望自己在半年前刚用 qq 时就能看到的保姆级避坑指南,带你解锁 qq 最核心的几个隐藏玩法,让你的效率直接起飞!第一部分,万能提示词公式别再随便提问了, 很多人觉得 ai 不好用,其实是因为你的指令没写对。大佬们在用的完美提示词通常包含五个部分,一、设定角色,比如你是一个资深的自媒体爆款文案高手。 二、明确任务,比如帮我写一篇关于时间管理的干货笔记。三、目标受众,比如写给刚入职场经常焦虑的新人看。 四、限定格式规则,比如要求语言轻松幽默,多用短句,以小标题形式输出。 五、最核心的必杀技在开始输出之前,请先问我几个问题,以便你更好的了解我的具体情况和需求。 加上最后这一句,你会发现 ai 的 回答质量会有质的飞跃,因为它不再是盲目瞎猜,而是针对你的具体情况对症下药。第二部分, projects 打造你的专属外挂大脑如果你在使用付费版的 cloud, 千万不要错过 projects 这个王炸功能。 简单来说,它就像是为你不同的工作设立的专属文件夹。以前我们用 ai 每次开新对话,都要把背景资料重新发一遍,非常心累。但在 projects 里,你可以 上传背景资料,比如把你公司的产品手册或者你个人的简历、工作篇号写成一个文档传进去设定权局指令,告诉他在这个项目里,你是我的私人助理。这样一来,只要在这个项目库里新建对话, cloud 就 会永远带着这些记忆跟你交流。 你可以建一个自媒体运营库,一个英语学习库,一个私人生活管家库,数据互不干扰,越用越懂你。第三部分, artifacts 小白也能敲代码这是我彻底爱上 clogs 的 最大原因。传统的 ai 只能给你返回一堆枯燥的文字,但在 clogs 里,它拥有强大的 artifax 功能。 什么是 artifax? 就是 它能把复杂的信息直接变成可视化的图标、网页甚至小工具。比如,你直接对他说,我今年有十万块存款,帮我做一份可视化的图标、网页甚至小工具。比如你直接对他说,我今年有十万块存款,帮我做一份可视化的图标、网页甚至小工具。比如,你直接对他说,我直接对他说,我今年有十万块存款,帮我用丙图展示投资分布 只需要十秒钟。 cloud 不 仅会给你理财建议,还会直接在右边窗口生成一个精美的可以交互的财务看板。 你不需要懂任何编程知识,只要会说话,就能让 ai 帮你把脑子里的想法变成真实可见的网页和应用,这绝对是小白的福音。第四部分,未来的工作方式 co work 如果你想稍微进阶一点,可捞的最近还推出了 co work 等极其硬核的功能,它可以直接读取你电脑里的本地文件夹,帮你自动整理截图、分析几十份商业报告,甚至直接在你的电脑上写代码改文件。当然,对于新人来说,这部分可以慢慢探索, 只要先用好前面提到的万能提示词和项目库,你在这个 ai 时代的起跑线就已经领先百分之九十的人。