上线七天就狂揽三万 star? 硅谷 y c 掌门人 gary tan 竟然把自己的创业通关秘籍写成 ai 外挂开源了!如果你也在使用 call code, 那 么这个 gos tech 绝对不能错过。这个项目为啥这么牛呢?想想看, 平时咱们用 ai 写代码,是不是总觉得他像个半吊子,做个小 demo 还行,意上复杂项目就根本没法看?其实原因很简单,默认状态的 cloud 只是个全能实习生,啥都能聊两句,但啥都不深。而这位硅谷大佬的破局思路,就是给 cloud 来一次外科手术,他把 ai 切割成了十五个性格刁钻的行业专家。比如在你输入 office hours 后, ai 就 会化身冷酷的 yc 合伙人,在你敲下第一行代码前,他会疯狂逼问你,你的目标用户具体叫什么名字?职位是什么?痛点在哪?你这周能收钱的最小版本长啥样?这一套连招下来,直接从源头帮你掐断那种自嗨式的烂需求。而且这十五个专家并不是孤立存在的, 他们连起来就是一条完美的软件开发流水线,什么时候让 ceo 敲定方向,什么时候让技术总监定方案,什么时候交给偏执狂工程师去写代码,最后再让发布工程师一键打包。上线 工极其明确。就像 gary 探索说,我们正处于一个改革的开端,一个人就能完成过去需要二十人团队才能达到的开发规模。未来做产品,你只需要做好决策,剩下的让十五个 ai 专家替你落地。
粉丝9.0万获赞134.9万

顶级的 skill 长什么样?最近 yacomenter 的 ceo 开源一个神级的 skill, 就是 gstar 这个开源项目。你会发现这个有六百二十一行的 skill 直接能让你当 ceo。 内置的十五个 ai 角色,包括创始人,设计师,工程经理,质量保证工程师等等,让你拥有一个完整的虚拟工程团队。你看,给我的龙虾装上这个 skill 以后, 他已经为我的项目整整跑了两个小时了,只要给他一个验收标准,他就能做到全自动闭环。如果说这个 skill 是 给 ai 的 打工规矩大权,那么里面最重要的一条是 boiler lake 的 原则,让 ai 做事情绝不会偷工减料。其次是给他定了一个 think plane, build review, test, ship, reflect 的 工作流程,结合十到十五个 spring 的 定型能力, 让你一天就能产出两万行代码。更牛的是,不仅仅是血橙须,你还可以用这套方法迁移到其他领域,比如商业教育,它真的能给你一套完善的解决方案。以前我们说一个人活成一只队伍是在开玩笑,但现在 g stock 让它成为了现实。

一个神级 skill 最近由 y c ceo 开源的 g stack 火了,短短六百六十七行代码,内置了 ceo、 设计师、工程经理、发布经理等十五个专业的 ai 角色,只需要丢一个验收标准,这帮 ai 员工就开始全自动闭环工作。还内置了一条 boil the lake 原则, 限制 ai 干活偷懒,再配合它超强的并行能力,一天就能帮你产出两万行代码,感兴趣的朋友赶紧去试试吧!

yc 的 ceo 这两周开源了一个现象级 skill, 两周时间 get up, 狂揽三万多星标,直接把 yc 那 套价值千亿的创业方法论全部封装成了 ai 技能,人手一个 yc 导师,这是一人公司的究极密码。总结下来两个亮点, 首先,这是 y c ceo 的 思考框架体,以后不用排队申请考核,直接让 ai 用 ceo 模式拷问你的想法。比如我这个赛道真正的机会在哪?该扩张还是该砍需求。第二,这个 skill 把你的 qq code 变成一家虚拟科技公司,十五个专家角色随时召唤。比如 ceo 负责战略重审,工程经理锁定架构 设计师,抓 ai 幻觉,像偏执狂一样找生产环境 bug 的 代码审查员。每个角色都封装了一种顶尖的思维方式,你不是在用工具,你是在用一套经过千家公司验证的工程管理操作系统。有创业者直呼,在某些方面,这比和他本人聊三十分钟更高效。

这几天大家都在热烈讨论的一个在 github 上开源的一个 skill, 是 yc 现任 ceo 的, 呃,开源的代码,它不是一个工具,是一整套 自己,他就是他自己日常写代码的工具。十三个 askill, 每个扮演一个角色啊,从这个 ceo 审查计划开始,在你写代码之前,用 ceo 计划审查你的开发计划。质疑前提,挑战范围覆盖盲区,确保方向是正确。 我觉得能够在开始前去进行质疑和挑战的项目就是好项目,他就会问说,这是正确的吗?如果什么做都不做会怎么样? 呃,十二个月之后,你希望这个东西是什么样子的?我研究了一下,让我的 cloud 做了一个汉化的格式化,呃,它有这个四大运行模式。 这个就是在说,呃,在你写任何代码之前,先从根本上质疑你的计划,之后呢? 啊,他就具体就怎么质疑呢?前提,质疑就说这是正确的吗?真正的业务或者用户成果是什么?然后第二个就是复用检查,那这些都完成以后, 他就给你一个四个模式让你选,就是 a 范围扩展,让这个梦就往大了做,往十倍的方向想。 b, 选择选择性扩展,就是守守,守住精准范围锁定不动。 嗯,但挑几个进行拓展。 c 范围锁定啊,就是说范围锁死,打磨到极致, d, 砍到骨头,只留 mvp 啊。这个就是前面说到的去 o a, 前提之一, o b, 嗯,现有代码复用检查, o c, 梦想肽硬射, o d 模式 专属分析,挑几个我觉得有意思的来聊一下。呃,二十八条 ceo 认知模式,那这个地方就挑有意思的来讲。分类本能,按可列性和影响力分类每个决策单向门和双向门。 双向门就是说做错了能够回来快速决定,单向门回不来慢慢想。大多数决策其实是双向门,但很多人把他们想,当,把他们当成单向门处理,结果就是什么都慢,逆向反射。 呃,每问一次怎么赢,就反过来问一次,什么会让我们失败。不是乐观不乐观的问题,是你要知道地雷在哪。这个话就是芒查理。芒格说的是每个都是一个 ceo 的 认知。第四个,聚焦集减法。乔布斯回到苹果的时候,三百五十个产品 砍到了十个核心价值,不是说决定做什么,是决定不做什么。我也听到前领导他会在四十多岁说人到中年就是要做减法,生活也是这样。 嗯,这有十八个 ceo, 就是, 那他们都会去给你的产品过一道。这十八条不是贴在墙上的标语,是 ai 审查你代码计划时候的思考框架,它会真的按这个逻辑来质疑你。比如你做了个不可逆的架构框架, 架构决策,他会用贝佐斯的单项门的逻辑来追问你。我觉得有意义的地方在于,这些思维方式本来就是人的经验,现在被结构化了,变成了 a a i 的 一个审查清单。某种意义上, ai 在 替里请了个顾问团, 嗯,然后他生成了一个必须产出物的一个清单,主户废水。这个是 这个人的一个核心哲学。他说以前写代码做到百分之九十和做到一百成本差别很大,最后 百,最后拿百分之十可能要多花一倍时间处理边界情况,写测试,做错误修复这些完整的工作啊,又累又没有成就感,所以大家都习惯了。差不多得了,但是这个 ai 改变了这个结构成本, 呃,作者给了 ai 一 组数据,呃,样板代码测试、功能开发、 bug 修复等等。 嗯,完整的成本被压缩了几十倍差,所以这个意味着说差不多得了,它就不是一个合理的选择。它标记了几个反模式,就是说,呃,以前偷懒是理性选择,因为完美要花太多时间, 现在偷偷懒反而显得不理性,因为你做了订阅,它有大量的托肯,你就可以让它直接都跑完。嗯,然后就对比了一下,后面就是一些数据的对比,这个是开源的,是 大家都可以去 get, 淘宝上看,不过它比较适合有 cloud code 的 基础的人。好,就到这里。嗯,我等一下也会把这些转化成图片,进行一个文字的分享。

最近 yc 的 ceo 亲手开源了一个 skill, 两周时间, github 直接冲到三万星。这个项目干的事情很直接,就是把 ai 往一只完整的软件团队去推,里面有 ceo、 设计师、工程经理、 qa、 发布经理等十五个角色和对应的技能。这个项目我觉得有两个点很值得看。第一个点是一人公司的工作流, getstack 想做的就是把这条原本要多人写作才能跑起来的链路交给 ai 去接,你只需要提出一个想法。后面产品经理开始聊需求和痛点,设计视角、看界面和体验,工程测继续往下拆任务,最后再交给 qa 和安全去兜底,整个流程会顺很多。 第二个点,他把 yc 那 套看项目聊需求的方法封装成了 office hours 这个 skill, 你 可以把它理解成 yc 平时怎么聊项目,怎么看需求,怎么判断优先级。现在被它揉成了一个能直接调用的流程。很多人做产品不是没想法, 是脑子里一堆想法缠在一起,根本不知道这个需求值不值得做,有没有用户痛点,应该先做哪个版本,下一步到底验证什么? office hours 干的事就是先帮你把问题聊清楚,重要的是这个项目开源免费。

这是 y c 总裁亲自开源的一套顶级 skills, 让你一个人像二十人团队那样干活,开源一周时间狂揽四万多星标。 y c 总裁使用这套技能包,每天生成一到两万行代码的同时,还兼职运营 y c。 它能让 ai 暗角色分工,有思考产品的 ceo, 有 做架构的工程经理,还有审查漏洞的质保等等。 更狠的是,他还内置了浏览器自动化,让 ai 能真正跑起来看效果,而不是只停留在代码层。如果一个人加 a 能干掉一个团队,你觉得这是真生产力还是在自嗨呢?

来看这个封神项目 g stack, 目前在 github 狂揽三点八五万颗星,全网爆火,他到底有多牛?一句话,一个人吊打一整个技术团队,自带全套虚拟开发小组,为什么他突然刷屏?顶级 ai 大 神 kepa 公开说,我从去年十二月开始,再也不手写一行代码了!还有大佬靠 ai 硬生生做出二十四点七万星的爆款项目 open! 看到这儿, ic 大 佬直接出手打磨出了这套 g stack, 实测有多猛,六十天干出六十万行,上线可用代码,一天轻轻松松产出一到二万行,效率碾压传统开发。从构思规划、写代码、审代码测试,再到一键上线,全流程 全自动,最后告诉你谁最适合用它。创业创始人、独立开发者,刚上手 cloud 的 新手,还有技术负责人,完全开源免费无脑装,普通人也能跑出大神速度。

我非常建议每一位创业者都把 y c 的 技 tech 这个 skill 装进你的电脑,任何新项目、新产品都跟他聊一聊,相当于你把 y c 的 创神请回家帮你看项目, 他一定能够给你高于你认知维度的启发。这个 skill 在 github 上非常受欢迎,一周就拿了四十 k 的 收藏。安装方法非常简单,大家只需要找到我截图上面的这个网址,复制给你的 aintech。 技 tech 有 大概 二十五个 skill, 哪怕你只安装最前面的这一个 office hours, 你 就已经相当于有了一个咨询费过万的顶级顾问。住在你的 ai 里面。 我也把使用的完整流程分享给大家。那现在这是我 curses 的 界面,我做好了一个品牌视觉的应用,叫 kris。 kris 还有需要优化的地方。那我就想看一下, kris 是 不是可以在它的帮助下变得更好。 首先呢,它是会读取我的背景信息,因为我所有的代码都在 cursor 里面,所以它能够读得比较完整。这个产品的定位、核心功能它都已经显示出来了。接下来,我们进入 officears, 这个 skill 的 作用呢,是模拟 y c 的 产品辅导,它会质疑我的产品框架,提出方案, 真正让我的产品变得具有商业的潜力。第一步,它问我做 create 这件事的主要目标是什么?不同的出发点,它后面的问题也不一样的,那肯定是 a 喽。它现在开始计划下一步。 然后第一个问题,如果 cream 明天消失,谁会真的慌?他们会因为找不到替代品而受到实际损失。这个真的很那个投资人视角哎,我已经回答给他了哦,好犀利哦,直接说这些在 y c 的 语境里一文不值哇,还好我不是玻璃心的创始人, 我需要的证据,有没有人付过钱给 kry? 有 没有在 kry 出故障不好主动联系你抱怨?这四个问题通通都是 yes, 把我给问兴奋了, kry 看来是很受欢迎,很 ok 的。 好,给你一个值得关注的洞察, kry 不 只是工具,本身是工具加品牌视觉认知的打包。 现在第二个问题就是,我的目标用户的上一个解决方案是什么?花了多少钱?花了多少时间,哪里让他们最痛苦? 我也告诉他了,他给我总结出来了,他甚至发现了我前后矛盾的地方。他说我的用户其实两类人,实际上我在服务的是第一类人,但是我描述的最大市场痛点其实来自于第二类人。确实是这样,就我脑海里是有这个认知的,但是我没有去透透的想过他。第三个问题, 用一句话描述谁在做什么具体的事情,愿意为 kry 付钱。我来回答他,他又发现了一个需求方向不一样的点,这确实很大模产品。第四个问题,老扎心了,你有没有亲眼坐在用户的旁边,看一个用户在不受我指导的情况下,独立打开 kry, 看它是怎么使用的,就是有没有被卡住了? 哦,没有这样观察过,确实还没有它这个提醒非常好。这直接给了我一个启发, kry 的 内测我不应该放到线上,第一次要做成线下, 这个启发价值上万。他真的看到了 kry 很 深层的一个问题,我感觉 kry 的 内测要退后了,朋友们,哈哈,要是面对一个真实的投资,我都快要冒汗了,我这才第一个 office。 二啊,我都还没有进入 ceo 视角,根本都不需要去看 ui 部分了, 因为这几个问题问完肯定就是产品结构上的调整。然后最后结合我现在的情况,给了我三个非常落地且直接的解决方案。建议有三条不同的路, 一,以方法论为主导,把课程和工作流放到正中央, create 作为课程的配套工具来销售。是是是,方案 b, 把专业认知嵌入工具本身,对努力就 do x l, 一 旦实现,竞争壁垒极高, 翻 c, 先找到工具能独立跑起来的最窄场景。我喜欢这样的反馈,犀利且专业,一针见血。他的每一个问题其实都指到一个真需求和刚需上面就是,看完这我就完全知道我的 core 应该往哪个方向去进一步思考和迭代。有,他现在给了我一个建议,顺序求求我的执行计划, 简直就是一个创业导师。第一步,本周找用户线下观察。第二步,观察完之后做 u n 上的调整。我觉得这个价值太高了。建议大家不管有任何的想法,还是你有完整的产品,都交给 fox。 二,看一下,如果你想和我交流更多 ai 工具的应用,请留意评论区,我们下次分享见,拜拜!

这个开源项目让我有了自己的一百六十四个员工,短短几天就超过五万颗星。他们不是普通的提示词模板,而是一百六十四个 ai 角色。每个角色都有自己的身份,设定专业技能、工作流程和交付 标准。他们被分为了工程部、设计部、市场部、销售部,甚至还有学术部等十三个部门。从工程师 到增长黑客,从设计师到产品经理,你能想到的岗位都在这里了。打造创创公司 mvp 用哪些人,举办营销活动用哪些人,企业功能开发用哪些人,一目了然。支持主流的 ai 原声编程工具。有了它,你就有了一整个公司的 ai 员工手册。

三个工具让你的 open code 每天进化越来越强。第一个, self improvement 自我提升系统,它会记录经验、教训、错误和纠正措施,踩过的坑不会踩第二遍。第二个, evo mimp 净化网络,你的能力可以变成 dna 进行上传, 全世界的 open code 都可以继承。反过来你也可以使用别人的精髓。第三个, memos 持久记忆系统,给 open code 一个永久记忆,它会越用越聪明。装上这三个,你的 open code 将会主动学习进化。

最近六个新手必装的 skill, 没有它们,你的 openclaw 将会很难用。第一个 skill creator, 这是官方认证的所有 skill 的 来源,它可以一键帮你自动分析你的工作模式,打包成可附用的 skill。 第二个, rawflop, 它能自动循环执行你的任务,遇到问题它会自己解决,不需要打扰你来手动处理,直到任务完成。第三个 code syncfile, 再也写不出使啥代码了。它会自动简化复杂逻辑,优化代码的结构,按照最佳实践写出优秀的代码。第四个 file skill, 它能够精准理解你的意思,从 skill 商店里面快速找到你想要的高评分 skill。 第五个, uix pro max, 专业级的 ui 设计,五十多种设计风格,而且还提供了二十五种图标类型,一百六十一种产品类型模式,适用于网站、落地页、仪表盘和 管理面板, ai 写的页面再也不会丑到哭。第六个, document skills, ai 处理文档首选它可以直接帮你处理 word、 excel, ppt, pdf, 装上它, ai 的 基础能力又提升一大截。大家如果有什么好用的 skill, 可以 直接分享在评论区。

你知道吗?我们开发软件的方式可能正在经历一场天翻地覆的巨变。 yokenage 的 ceo gary tan, 他 最近就提出了一个观点,他说,我们正站在一个新时代的门口,而这个新时代的核心就是竞争力的一次大爆发。 所以这就引出了一个听起来有点疯狂的问题,一个人靠自己真的能干得过一个二十人的工程师团队吗?你可能觉得这怎么可能,但这个问题恰恰就是我们今天所有讨论的核心。 为了让你感受一下这个生产力爆发有多夸张,来看看这个数字,六十万行,这个不是什么随便写的代码,是生产级别的代码。更夸张的是,这是 gary tan 在 短短六十天里利用他当 y c ceo 的 业余时间写出来的。你没听错,业余时间? 那他是怎么做到的呢?难道他是什么超人吗? gary tan 自己说了,他说还是那个人,但时代变了,唯一的区别就是工具,所以关键就在于工具。 好了,那这个开启新时代的神器到底是什么呢?今天的主角要登场了,它叫 get stack, 你 可别把它想成一个简单的工具,它更像是一个,嗯,一整个软件工程。 stack 的 核心想法,说白了就是把人工智能变成一个你可以直接管理的虚拟工程师团队。 他的目标不是让你写代码写得更快。不是的,而是让你从一个敲代码的人变成一个管理者。一个,嗯,一个 ai 团队的 leader。 好, 既然是个团队,那总得有成员吧?咱们就来认识一下你的这个 ai 团队。我觉得 g stack 最妙的一个设计就是他没把 ai 当成冷冰冰的工具,而是给他们分配了具体的角色和身份,就像真人团队一样。 你看这个表是不是很有意思?你不再是跟一堆复杂的工具打交道了,你想重新思考一下产品方向?行,你只要打个斜杠命令,就能召唤你的 a i c e o 来跟你头脑风暴。 想测试一下应用?没问题,你的 q a 负责人会直接在浏览器里帮你点点点,每个角色分工明确,听你指挥 好。团队成员咱们认识了,那这帮 ai 同事到底是怎么一起干活的呢?光有人还不行,得有流程对吧? g stack 可不是一盘散沙,它有一套非常结构化的工作流程,就像我们常说的敏捷开发、冲刺。 整个流程你看非常清晰,总共六步,从思考开始,然后计划、构建、审查、测试,最后发布。 这个结构特别关键,因为它把 ai 强大的但有时候又不太可控的力量给框定在了一个高效可预测的流程里。 咱们先看第一步思考。在动手写代码之前,你先用一个叫 slash office hours 的 命令,这时候 ai 就 会扮演一个产品策略师的角色,他会挑战你的想法,问你一些尖锐的问题,帮你把问题本身想得更清楚,这一点非常重要。 好问题想清楚了,就建入第二和第三步,计划与构建。这个时候,你的 ai 团队里的 ceo 啊、工程经理啊、设计师啊,就会一起上阵,帮你把整个软件的架构、数据怎么流转、测试方案等等都给确定下来。 这样一来,在真正开始写代码之前,你手里已经有了一份非常扎实的蓝图,然后呢,就是审查和测试阶段了。 我觉得啊,这才是 gtech 真正厉害的地方,不同的 ai 专家会来帮你把关,比如说那个资深工程师 ai, 他 特别擅长发现那种嗯,自动化测试跑不出来,但一上线就出问题的深层 bug。 最后一步发布,当所有东西都准备好了,你只需要敲一个命令杠, ship, 就 这么简单。然后你的 ai 发布工程师就出场了,他会帮你搞定所有繁琐的收尾工作。什么跑测试、合并代码提交、 pr、 全自动, ok, 刚才我们聊的是 g stack 的 工作流程,可以说是一个非常高效的系统,但接下来要说的才是它真正的超能力,也就是让它可能改变游戏规则的东西。 具体来说有三个,第一,大规模并行处理。第二,多 ai 的 第二意见。第三,也是最酷的一个可视化 qa 测试。咱们一个一个来看。 先说大规模并行,你想想看,因为整个流程都是标准化的,你一个人就可以同时开启十到十五个开发冲刺。你的角色就像一个真正的 ceo, 你 只用关心战略和决策,而不是现在每个人物的细节里,这效率简直是指数级的提升。 第二个,超能力。第二意见。这个也特别有意思,你可以先让一个基于 cloud 的 ai 来审查代码,然后再叫一个基于 open ai 的 ai 来找茬,从完全不同的角度去挑战它。 这就像什么呢?就像你团队里有两个等级高手,他们互相 review 代码,那质量肯定高啊。这就大来一个问题了,也是以前很多 ai 工具的痛点, ai 只能读代码,它是个瞎子,它又看不到界面,那它要怎么测试一个有视觉界面的 app 呢? 答案非常震撼,就像这句话说的,现在 ai 有 眼睛了。 gstack 的 qa 机器人,它真的可以自己打开一个浏览器,像真人一样盯着你的 app 看,用鼠标去点那些按钮,然后告诉你,哎,你这有个 ui bug, 这真的是一个巨大的突破。好了, greystack 的 具体功能和这些超能力我们都聊得差不多了,那咱们现在站得远一点,从一个更大的视角来看看,像 greystack 这样的东西,对我们整个行业的未来到底意味着什么? 其实 gistech 最核心的价值可能还不是 ai 本身有多聪明,而是它提供了一套流程和规范,它把 ai 那 种原始的有时候甚至有点混乱的力量给驯服了,变成了一种可靠的、可预测的生产力,这才是关键。 所以,这就给我们留下了一个特别值得思考的问题,如果一个人的创造力真的不再被团队规模所限制,他能像一个二十人团队那样去构建东西,那你想想看,未来会有多少曾经我们觉得太复杂、太庞大而不敢去想的点子会被创造出来? 也许啊,下一波创新的巨浪,就是由这些一人团队掀起的。

今天给大家汇报一下之前说的做 ui agent 的 那个项目,它主要的功能是由人录制视频,然后由 agent 去执行,并把执行出来的这个过程轨迹去把它整理成一个 rpa 加 agent 共同进行执行的一个过程。 它我现在已经把它开源了,叫 curl s 杠 uis, 但是整体是这样一个项目,其实是借鉴了这个嗅 ui aloha 和那个 agent s 三这两个项目来构建的,然后也借鉴了 rpa 的 相关的一些内容。 主要的方式有三种,第一种录制视频由人为去录制,录制了之后它自己会学习轨迹并进行这个 edit 的 执行,然后还有一个就是纯 edit s 三进行执行,然后就是 edit s 三执行了之后,它会生成这种 rpa 加 edit s 三的协作的脚本, 然后可以进行执行。第四个是人工录制了,直接把人工录制的整个过程把它编辑成一个脚本,然后下一次可以附用这个脚本。 第五个模式混合执行的脚本可以直接进行重复的使用,比如说这两个生成的脚本可以重复进行使用,他会更加快一点和便宜点,他会很多托管,他是没必要去做消耗, 但是这个里面使用起来都还是比较简单。模型的话目前使用的两个模型,当然如果一个模型也是可以的,但是我个人建议用国内的一些多模态的模型去做执行,特别是他在微信这种国内的一些生态,他会识别的更好一点。还有 可以配一下国外的一些模型,比如说 jammy, 比如说 gpt 这种模型,它在元素定位它会更加的准确一点,但是它在具体执行的时候效果没有国内的模型那么好。 然后这是详细的介绍,其实这个东西它的准确度还是不高,特别是后面生成的那个脚本,准确度还是有限的。 为什么要做这个东西?是因为 ui 帧它的速度会比较慢,而且它的准确度是可以的,但是总体来讲还是没有那么好。 这前面是修 ui 和 loha 的 一些内容,我们的这个内容是建立在这两个之间的,但是它还是属于呃,效果没有想象中那么好。我尝试去做了一下,特别是它在这个混合执行 r p a 加 ui agent 进行混合执行的时候,它翻译出来的内容还是有时候它会把某些参数,灵活的参数,它会把它 硬编码。还有就是它的这种泛化性还是没有 ui agent 那 么好,但是它可能会更加快一点,因为很多步骤它直接使用了 rpa 的 方式,但是它虽然出现了问题之后,它是由 ui agent 进行兜底的,但是它恢复到之前那个步骤,它的泛化性还是没有那么高,可以给大家演示一下。 这个用起来也是比较简单的,我们可以让他先跑一下,其实就是到微信发一个消息,然后我准备这种脚本的话就可以直接生成,生成了之后以后就可以附用,比如说你给谁发一个什么样的消息,就可以生成这样的一个脚本,以后就可以附用 整体的一个框架,就是这样的,整体的一个思想是希望人教一次,然后机器学会了之后,可以把它弄成一个脚本,脚本的话它会更加机械一点,这个脚本不光有 rpa, 还有 u i agent, u i agent 可以 在 rpa 出问题的时候,或者说有一些是需要灵活操作的时候,可以把它填充进去, 可以看到这就是 u i agent 的 进行操作的。这个任务的话,相当于是先让 u i agent 的 进行一遍,然后自动把 u i agent 的 整个轨迹把它翻译成一个 那这种混合执行的脚本,然后这个脚本再能去做执行。现在 u i 镜头可能会稍微慢一点,它发送一套一条消息,这样整体的一条消息,我算了一下,应该是在三分多钟左右,每一步都需要消耗 token, 编辑出来也总共的时间大概在五分到十分钟。 如果是编辑出来的 r p a 加这个 agent 和 s 三的混合执行的话,应该在四十秒钟左右,它速度还是可以的,但是比如说它有一些特殊的情况,比如说有一些消息把它打乱呢,这些乱七八糟的时候就有可能会报错,我给大家可以演示一下,可以看到这就直接再跑了。 现现在他还没执行完,那下面应该会点击发送,发送了之后他应该就执行完了,执行完了他就会开始翻译这个混合执行的脚本,重点是把这个混合执行的脚本把它翻译出来,其实他也就类似于一个 rpa 的 脚本了。 好,这相当于他就已经执行完了这个纯 ui 进程的操作。 ok, 我 们也来继续看一下这个东西,五种运行模式,一种是人类去录屏,然后整理成轨迹,然后由这个 ui 进程去执行任务,这样他的可能准确度就会高一点,特别是你用一些比较好的模型,但是像 kimi、 kimi 这些模型 准确度都还是算蛮高的,特别是用了这个 ui agent, 这个 agent s 三的这个引擎它执行准确度还是蛮高,但是速度很慢。还有这个就是纯 agent s 三,也没有什么录屏操作啊,这些直接一个任务描述,就像我刚才一样,让他给这个发一个消息,这个就是一个纯任务描述的, 直接发消息他就可以完成这个任务,这个纯任务描述的他可能自己的能力要求就比较高一点。如果你没有录屏,我们刚才执行的就是第三个模式, 任务描述描述了之后 x 四三执行,使用这个多模态大模型进行翻译,翻译了之后做成一个混合的脚本,后面可以重放,这个就是重放第四个人类录屏,然后解析成一个轨迹,然后直接用这个 v o m 进行编辑,然后混合的脚本大家可以按照自己的一个想法进行操作,但是整体讲只能说它可以用, 但是想要达到非常成熟的效果还是有一定欠缺的,因为它的泛化性还是我个人感觉还是没有办法达到顶尖的。这种 ui agent 的 操作它没有办法达到,比如说你用 gpd 四点五,然后去执行 ui agent 的 效果,但是它比 rpa 它的泛化性要高一点,速度要比 rpa 要慢一点, 反正它就介介于 rpa 加这个 ui 镜头的中间,不管是优点还是缺点都是这样的。目前是用的双模型的架构,一个模型是这个 jimmy 的 flash, 它做定位会好一点,因为很多我是使用的这个图像定位,我甚至没有用这个 uid 这种 元素的 uid 数这种去定位,就用的纯纯图像定位的方式来做的,因为像国内很多这些软件啥的,它都是没有非常清晰的 uid 的 方式来做的,因为像国内很多这些软件啥的,它都是没有非常清晰的方式来做的,因为像国内很多这些软件啥的,它都是用的 kimi, 然后整个架构也是比较简单。最后其实这个轨迹生成执行这个脚本执行的时候还会有一个自动化,自己把它这些执行度弄来编辑出来。如果你执行非常多次的时候,那个步骤他会记录一下他之前执行的准确性,特别是有些元素,他点击起来,如果准确度比较高的话,他也会进行记录下来, 然后后面其实你是可以进行拆分的,希望大家如果有感兴趣的也可以进行二次开发。总结来讲,这个东西 r p a 的 部分直接进行生成,它还是没有那么好, 所以说这个东西也有点烂尾了,也有点烂尾,可能有两个比较好的点,就是录屏,然后用 ui 点的去操作,但是这个是羞辱秀 ui apollo 已经完成的。 还有一个比较好的一个点,就是 r p a 加这个 agent s 三进行协助运行的,这个混合引擎是已经成熟了的,如果哪一步执行失败,然后这个 agent s 三它会自动的衔接去兜底,把这一步进行执行,然后再进行 r p a 的 下一步。 但是这个不能接受特别大的变动,比如说前面的所有步骤都失败了,然后这一个步骤要把前面的步骤全部去实现,而且要实现到能做下一步的这种程度,这种就达不到 ok。 但是他这个翻译啊,翻译这个脚本,这个混合执行的脚本还是时间非常长的,可以看到我们在三分多钟的时候已经执行完了,但是他现在翻译还没有翻译完好,现在他已经翻译完成了,差不多就消耗掉了十分钟左右。然后可以看到他一共其实是六步, 然后它把它整理成的是五步,其中点击微信的这个使用的 rpa 搜索是使用的 agent, 还有输入也是使用的 agent, 最后发送按钮和最终的验证,这个过程其实它没有翻译特别多的 rpa, 有 时候它会翻译多一点,有时候会翻译少一点。这个是纯多模态大模型,它自己提取的,这一次它 提取参数,其实按理来说它是可以把这个名字和对应的小本里面的内容我们可以执行一下, 整体来讲它的效果还是没那么好的,只能说功能实现了,但是实际的这个方案的效果,呃,没有想象中那么好,因为它首先这个用多模态大模型去做判定,这个是不确定的事情, 而且它的这种泛化性或者说准确度,它是没有 u i a 的 直接进行执行它的确定性那么高的,但是它的速度又没有 r p a 那 么好, 他说正好就介于了两个之间。如果说自己手动的去调整一下这个 rpa 的 一些功能,或者说重新用用这个编程智能体去改一下,去加一下,这样的话它的准确度可能会更高一点,把这个 rpa 的 部分可以写得更加的稳定一点,可以看到它现在就在执行了, 由于它是使用的这个 ui 键的,所以说它的速度非常的慢,它只有两个 rpa, 只有第一个这个任务栏的微信图标点击的时候使用的 rpa 和最后一个这个使用的 rpa, 所以 说它速度太慢了, 确实也是使用这种多模态模型的一个不确定性。还有就是提示词它要优化的也很多,可以看到它现在已经输入进去,然后进行了发送。其实由由于它这个选择 rpa 的 步数太少了,所以说它的速度并没有提升特别多。 整体来讲这个东西还是属于一个玩具,没有办法达到自动化的很很好的实用性,使用的效果不是那么好。 总结就是这样,这也是实际试了一下,呃,测试出来比想象中的这种难度还是很大的, 特别是它在这种多模态大模型的一些调整里面,它的难度还是非常的大,而且它功能实现起来是很简单的,而且速度也很快,由于现在有可拉的扣这些变成程序来实现,但是它能 编辑出非常好的 r p a, 非常稳定的 r p a 和图像的选择这个东西,呃,不管是提示词也好,还是那些也好,它的效果调整都还是比较麻烦的,整体来讲这个效果不是特别。

给兄弟们找来了一款免费的支付系统,基于 spring 部和 vo 三开发的支付解决方案,支持多渠道聚合支付、商户管理、代理、分润等完整支付生态,汇集了十几种支付方式,非常适合入门学习支付开发。它同时还是一个开源项目,开放了前后端源码和项目演示地址, 但是商用还是建议不要使用第三方,不管是运营端、商户端、代理端还是 a t 五小程序等多端系统均可进行使用,满足多种业务需求。有需要学习支付开发的兄弟们不妨可以了解一下。

六十天六十万行代码 y c ceo, 免费开源的虚拟团队 getstack y c ceo, 开源的软件工厂,把 openclaw 变成十五人虚拟团队 ceo, 帮你 rethink 产品工程主管,锁定架构设计师检测 ai slop staff 工程师,找生产 bug q a 主管,用真实浏览器测试发布工程师自动推 pr 技术作家,更新所有文档,三十秒安装,五分钟上手十到十五个 sprint 并行跑 github 搜索 g stack, 一个人等于二十人团队。关注虾哥学习 ai。

给大家分享一个最近比较火爆的 skills 啊,这个名字叫做这个呃 gistac, 然后它的作者呢?是 yc 的 一个 ceo, 叫做 呃 gary tan, 它在过去的六十天里编写了超过六十万行的代码,二零一三年总共提交了七百七十二次的代码,二零二六年三个月就已经提交了一千二百三十七次代码。 那为什么呢?他自己说这个核心的原因是工具,然后他就是用这个 g stack 来实现的,那他在这个里面定义了很多的这个角色和专家。那比如说这个 office hours, 就是 在你编辑代码之前,通过六个关键的问题先去挑战你,质疑你,然后让你把问题想清楚。 那这个 plan ceo reveal 就是 会让你去重新思考问题。这个 ceo 可以 通过一些方法论,比如说扩展、选择性扩展、保持范围缩减等等,来去挖掘你的需求里面可能会有什么样的产品机会。 然后面的话就是偏向于工程业的,比如说是工程管理啊,然后设计师啊等等等等。还有代码的 reveal 之类的,总共是有十五个左右的角色吧, 大家可以去尝试使用一下。其使用的方法也很简单,你其实直接把这个项目的这个地址发给到 ai, 然后让 ai 来帮你安装这个项目就可以了, 然后你就可以通过这些命令来去把这些 skills 调用出来来去使用了。那我自己使用了一下,效果还可以的,因为我自己刚好在做一个这种一键的公众号排版的一个工具,或者调用这个工具让他帮我去做一些思考,你看他会给我去分析这个项目 优先级该怎么排布,哪些事情现在最好先不要做等等,它是按照一个 ceo 的 视角来去帮我去分析的。那这个 skills 适合谁呢?它在这里也已经写了适合 创业者、 ceo, 然后第一次使用 cloud code 的 一些用户,还有就是技术负责人和工程师团队,那我觉得每个人都可以去尝试使用一下。

卧槽,这个前端开源项目已经成了很多团队做后台和萨斯界面的默认选择。莎莉 c n u i 组建已超过一百 k 的 收藏,如果你在做管理后台、低端平台、 ai 产品界面这些精致的数据图绝对用得上它并不需要你手动携带,完全支持 ai 帮你来完成它。内置 skills 和 m c p 等服务, 只需要快速安装项目,依赖环境,再搭配官方出的 ai skills, 直接帮你快速使用。萨里茜使用前提也需要先安装 skills 才能给你的 ai 附加这个技能包,不安装 skills 也可以,也支持 m c p 服,当前 ui 组建简直就是 ai 神器,直接让你不再手动编辑后台代码,也能统一规范。

我发现一个问题啊,微信新出的龙虾机器人,他每次只能出了一个码,只能扫一个微信。我下午分析了一下,把他这个协议给他扩展了一下,搞了一个开源软件。你看这个我只要点添加微信,他就可以一直加我的微信,这样的话我一个龙虾就可以支持好几个微信了。 这个代码已经放到 github 上了,大家需要的话可以去下载点赞。对,另外我在想这个功能的商业价值是什么?我想了想,如果我能把一个龙虾变成十个、二十个微信可以扫,而且我前面再做一个网页, 我一下发给我朋友圈,发给我好友,他如果一扫出来,哎,弹出来一个码要付钱,付十块二十块,然后付完以后就可以和我的瞎聊天,哎,我觉得这个还蛮好的。大家感觉这个功能有需要吗?有需要的话可以回复一下啊。

大家经常用 cloud code 的 可以去 github 上面看一下这个 everything cloud code, 国外的一个开发的八点四万新十大的,它这个里面的话可以有很多 skills, 我 们可以看一下它中文, 它里面有很多可以学习的地方,比如说 tokens, skills, 还有 m c p 这些 配置起来很简单,你像有有代理,有 skills, 然后有 commons, 然后还有 roles 这些 基本上是只用一到两行命令就可以安装相应的你需要使用的 skills。 经常用 cloud code 的 大家可以去试一下,用起来很方便。后面要是有机会的话,我给大家逐一讲解里面比较常用的几个技能,大家可以在评论区里面留言。