在找到他之前,我已经踩过无数的坑了。先说一个例子,当时的时候我想让他做 ppt 的 时候,我想直接问库德沃克的之前的版本,我说你能不能出一个 ppt, 他 也给我出来了一个版本。但是这个 ppt 感觉就像 两千年的风格,就是像 windows 两千的那个时代的那个风格,所以根本没办法用,所以我一直在找一个更加 合适的方案。嗯,后来我也是在阿里的内网上找到了 one day, 就是 h t m l 的 方案。嗯,直到昨天出来之后,带给了我巨大的惊喜,就是他出的 ppt。 今天晚上大家可以看一下我之前用别的平台的一个 ppt 跟现在用 ai native 工作台的 ppt, 我 感觉现在已经是。 如果说是我之前踩过五个坑,那么现在在我心里的排名, codewalk 的 ppt 能力已经排到了 number one 了。所以说,那你怎么理解这个 ppt 工作台到到底是什么?像平时我们都是 传统打开 powerpoint, 对, 现在就在 cooke 里面做,对不对?嗯,对,之前我们的形式是自己有了想法,打好草稿,在 ppt 里面一页一页的去呈现,是每一步都会非常耗时间,而且很多时间我们的想法非常完美了,之后就是更多的时间发在调格式上,对,这个我认为是非常低效的。 但是现在有了 cooke 的 这个工作台之后,有了它的这个幻像片的能力之后,我们只需要把我们的想法 告诉给 codewalk, 不 停地给它输出我们的想法,它会基于我们的想法先整理成结构化的 ppt 的 这个结构,这是第一步。第二个呢,就是生成一个 prompt, 基于这个 ppt 的 结构,我们再通过幻能片的这个技能就让它生成幻能片,那么一份 既美观又简约的 ppt 就 直接达到了可用的地步,这一点是我在之前的产品里面从来没有看到过的。其实这个要说回来了,那这两年做 ppt 的 ai 软件不少,各种 ppt 插件用 codewalk、 ppt 工作台,这个时候你要来帮我们比一下了,和这些 ai 软件做 ppt, 它到底区别在哪里?是的, 目前在 ppt 上是有三种的技术实现方案,第一种是 skill skill, 因为是有了龙虾之后, skill 成了我们这个时代的一个硬技能。 skill 是 现在有两个,像 ppt master, 这个是一个非常火的一个技能。第二个在前端圈里也有一个非常火的技能,叫 brand n 的 design skill, 这个都是蚂蚁的同学给我推荐的,都是前端的大拿。我试了这两个 skill 之后,它们本质的逻辑是 h t i m l, 它的优点是由于网页的灵活性,配色的灵活性,它会非常的 简约,而且它还因为是 html, 它还比较容易传播分享,它就是一个网站。但是它也有明显的缺点就是它不可你随意编辑更改,因为 html 的 代码对于运营对于产品来说几乎是不能懂的。对,所以这个是第一个 从通过 skill 根本解决不了的问题,这是目前的第一种的实现方案,第二种的实现方案是 ppt 模板。 ppt 模板怎么来理解我对于酷狗之前的印象, 因为我是在库德沃克刚发布内测的时候,我就直接是加入了我们内部的三万人的天使群,这当时我也听过阿大老师唐三三哥的这个直播,他们是对于 ppt 的 技能做出了特别的介绍。对,所以我立马就去试用了。当时的那个版本就是生成 ppt 一 点零的 ppt, 那个 ppt 生成的这个结果其实就是跟我们的原来的泡泡泡,它没有任何区别。跟你排版布局是生成一个,我为什么说两千年的风格根本就不是 ai 时代的作品,所以我一直跟三哥说,我说三哥,我觉得我们要进步。为什么?因为是豆包, 我也用过豆包,我说豆包这个免费的产品生成的结果已经比我们好太多了,我说我们是要努力一下。三哥说,这个问题你交给我,是我把我豆包生成的三份的 ppt 都发给了三哥。三哥是, 但直到前天他跟我说,兄弟,上线了,试试吧,不是上线了,我一试,我说兄弟,是你现在在我心里的 ppt 的 排名,你是 number one, 你 是第一,这个是,那就回到了第三个,现在的 ppt 的 直线方案是怎么实现的?通过大模型的理解,它首先是把你原来输入的提示词又做了再次的结构化,所以它在内容上做了一层 转移。这是第二个呢,它会联网去搜一些,以及通过图片生成的技能去生成非常漂亮的主题,嗯,还有背景图,嗯,所以是在整体的风格上来说,比之前的那种大白板,嗯,要好出来太多, 它是有设计感的,根据你主题匹配的一个背景,嗯,在色调,所以在 ppt 的 风格上,嗯,不是套模板了,嗯,第一个的差异点。第二个在排版布局上来说,无论是流程的排版, 对比的排版,还有是三个这种重复的,这种排版全都是符合我的预期,如果说生出来 ppt 就 能用,我就觉得这是现在 coco 沃克给我的感觉。生出来 ppt 我 可能只需要改几个错别字,英文字 名字,这个 ppt 在 非正式的场合我就可以敢直接分享了。当然像一些比如说你正式的汇报内部的数值晋升这种,我还是建议大家要再三的 check, 但是在我跟我的朋友之间做这种方案完全没有问题了,所以我认为是昨天的 codewalk 的 这个版本应该是五点几的,这个版本的发布在 ppt 上已经达到了 顶流的水平。当然我还有个小建议,我昨天试下来之后,是在消耗的 credits 上还是有点多的,速度上还是有些慢的,我还是希望是我们还是有巨大的优化的空间。 ok, 那 现在我们这个 ppt 能给我们展示一下吗?它往后翻会是个什么样的?来,你说一下你感受。可以啊,这个 ppt 的 大家可以看一下,这个 ppt 是 豆包的,这个并不是 codework 的, 嗯,这个 ppt 是 豆包的,嗯,之前我给豆包打八十分,我认为它是 ppt 名的顶流,大家可以看看这是豆包的这个效果。说实话,我当时给三哥说,我说我们能打到豆包的这样的简约排版的,这种对齐我就满足需求了,但其实给了你一个 更多的,但是我们可以看一下,这个是昨天,嗯,我用抠的沃克来生成的 ppt, 我 给大家演示一下, 这个是我的商户的一个他做的一个系统,他也是用 ko 的 ko 的 做的一个应用,然后是我把这个他给我介绍了这个产品是什么,我说你稍等,我会用 ko 的 最新的 ko 的 work 帮你生成一份你的产品的介绍,之前的话你只是口头描述功能,现在的话你可以把这个功能去给他传播了。 ko 的 帮我起了一个他的名字,这些他都没有名字哦,他说叫苍蝇,然后选了几个叫苍蝇。然后这个针对于 目前呃前置仓的商家,就是美团跟淘宝闪购经营的商家,然后是做的这个产品的完整的介绍,你可以看看这个流程图,这个对比图, 这种左侧的这个图片,哎呦,全都是库德沃克的在这次的新版本里面生成的。所以如果说是我说,当时我说如果说我给豆包打八十分的话,你至少八十一分,你比他多一分。这个是库德沃克在昨天刚热新鲜出炉的版本, 很有意思。是的,对,那你能不能给我现场举个例子,比如我们今天要给老板做一份周会的汇报,从打开 ppt 工作台到出一份能用的 这个 ppt 大 概需要分几步?可以,非常棒。这个点的话是也就是目前很多同学来问我的这个点,就是做 ppt 分 成几步,那个就好比对 对,我们把大大象关冰箱里分几步,然后一样。我们做 ppt 的 话也是有步骤的,目前的话是我是分了三个步骤。怎么来说呢?就是第一步的话,我会跟酷狗的话来输出我的想法,输出我的想法。 然后是比如说是我今天来到了直播现场,是 coldwork 邀请我来分享 ai 的 主题,主题,主题为什么叫我来呢?因为我在阿里有大量的 coldwork 的 实践 时间,基于此帮我生成一个 ppt 的 框架框架提示词,我将用 codework 来生成 ppt。 来吧,兄弟。 哦,然后的话是这样的话,是他会基于我的诉求来帮我生成 ppt 的 提示词。我不是直接来生成 ppt, 而是生成个 ppt 的 提示词,过程中他会给我有一些提醒,比如说是多长时间,多长时间?我说了五分钟。对,你给我生成个五分钟的 ppt, 然后是这个五分钟。 为啥?你说是听众有谁啊?混合人群?对,然后是安利为主啊,继续,这个就是那个抠的本身对于你的这个语义的理解,语义的理解。对,他需要来补充他的这个内容,然后这样的话是他就在 生成了这个。我看,你看看,我来生成一个适合的 ppt 框架提示词。对,我不会让他直接帮我生成 ppt, 而是先把我的想法,因为我的想法是散乱的,是灵活的。虽然是可能背后有一条主线,但这个主线在我的 想法面前,它是一个散点的。对,我需要通过酷狗 word, 我 不断地给他输入我的想法,让他帮我整理出来一条,呃,真正的主线,结构化的主线。对,就好像你面前有一个帮你做 ppt 的 这个设计师。对,你先告诉他大概一个东西,他其实也会反问你,那你这个需要什么?那个需要什么?他帮你整理。好。 好,可以看看,已经出来了。对, ppt 的 框架的提示词的话已经出来了。然后是它叫 ai 助推 codework 实战分享。反正是这个,就是咱们刚才直接来的,我就不直接说了,说是生成指令在这里,那个 prompt 在 这里了。嗯,那理论上来说 我大概过一眼,因为基本的话都是我的输入,我都非常了解它大概是什么嘛,所以我基于我的刚才的输入,我很少 check 这个。呃, prompt, 所以第二步的话我就会直接拿到它的提示词选择 codewalk 的 能力。 codewalk 的 话是刚才这个技能的话,在这个页面上,在这个页面上有个通用的话,有个换灯片,换灯片,在换灯片里我直接把那个提示词给它粘贴好。 ok, 然后是模型的话,你可以任意选,当然旗舰版的话是消耗的 credis 是 最多的,所以我们现在选择一个企业专属的千万的模型, 然后点击。其实目前我在 ppt 上实战上没必要用最顶级的模型。对,就是普通的模型,也可以帮你产生一个非常好的效果。我们可以看一下这个结果,你看现在的话是这个页面,他在是帮你思考。对对, 他会再次帮你整理一下这个 ppt 的 分析的框架。这个过程大概需要多久?对,就是刚才,就像我说的,整个过程的话是大概是三到五分钟吧,然后之前做 ppt 可能是一两个小时甚至一两天,现在的话是绝对让你出一个 可用的 ppt, 你 朋友圈里可以拿的值得出去炫的 ppt。 那 我们想继续问一下,假设出来的某一页我不满意, 比如说你想换个布局配换个配色,加张图,可不可以继续用对话改吗?还是只能自己手动又恢复到过去的方法去调?非常棒。这个问题,这个问题恰好我昨天遇到过,遇到过。对,然后是这个它的产品名字呢?可以大家可以看一下我的投屏,帮忙切一下这个,这个我的队。 之前的话是我在给这个产品起名字的时候呢,嗯,实际上是有三个选择,嗯,我说是我们现在三选一,然后,但是呢,他当时没有回复,我就先把他选了一个,嗯,然后是 他叫什么?闪,闪策,嗯,闪电仓的测试就是策略,嗯,闪策,我就给他说了,他说我们不要起这么高端的,要要贴近用户。嗯,对,然后是那个,他说是我改,再改成苍蝇吧, 然后是因为我已经生成了 ppt 了,就叫闪策,嗯,所以的话我直接跟库德沃克对话,我说,嗯,把产品名字改了,嗯,那个哥们的话是不要这个名字,嗯,要改成苍蝇,你全部都检查一遍,都给我改一下吧。然后是不到一分钟吧,全部改好。然后是所以 ppt 的, 无论你想改哪一页,改什么字, 然后是你甚至都不用告诉他到哪一页,你直接说你的诉求,他会自己改好,对,他会自己把这所有 ppt 页面里面的关于苍蝇的这个都都都改过来,大家可以看到从首页的标题到左下角的这个标题,然后是真的是这个是全都改了,我检查了一下,没有任何的错误。 ok, 好 的好的,这个就是我现在的体验,我们还有一个 ppt, 我 们可以看一下。对,对的,然后大家可以看一下扣的沃克的话已经刚才帮我生成 ppt 了,虽然刚才我们只是简单的几句话,我们看一下它的效果,这个是已经是帮我生成了这个四页的 ppt, 嗯,然后是我们可以分别看一下吧,这个是他的主页,主页他的第二页可以需要补充一些的,第三页的这种对比, 第四页的话,这种维度我觉得是这个。没有没有啥问题,就是直接改改就能用了。对,我再给他聊几句的话,这个 ppt 就 出来了。对,我们看到这个结果了,然后他导出的时候可以导出三个类型,像 ppt、 像 pdf、 html 都可以,传播上非常方便,希望大家 多多使用。酷狗 word 的 这个对应的 ppt。 我 记得他也可以直接换灯片,直接就在这放了。哦,直接放映。哇,对,我记得,太棒了,太棒了,又 get 技能了。我记得是的,太棒了。嗯。
粉丝2.5万获赞4.1万

兄弟们平替 cloud co worker 的 国产工具来了,国内直接访问,他就是阿里的 codework, 并且有了 codework, 你 也不用再花四千块去买 mac mini 折腾 cloudbot 了。哈喽,大家好,我是阿亮, 二零二六年的 ai, 已经从聊天进化到了能真正操作电脑干活的智能助手,如果说二零二六年,应该就是这些模型开始真正的落地干活的。原年 虽然 cloud code work 很 火,但大部分人呢,都没有体验过,因为 osraker 这个公司呢,对我们真的是太不友好了,更别提还有一百美金的订阅门槛。 好在阿里这次的跟进速度非常的快,就在刚刚,他们发布了搭载全球顶尖模型的 code work, 注意是全球的顶尖模型, 定位很明确,国产版 call work 就是 让每个人都可以拥有专属的 ai 助理。 call 的 work 呢不仅可以帮你进行日常的文件管理、数据处理,还可以写作画图、做 ppt, 甚至能帮你调研上市公司的财报,输出、投资建议。 第一时间我就上手进行了测试,真的实战能力非常非常的强,很能打,用户体验也是一级棒。 接下来带大家亲自上手感受一下。界面很清晰,符合我们的用户习惯,左侧是任务列表,右侧是对话区域, 然后最右侧这里还有一个可以折叠的区域,是对整个任务的进度监控。这个设计非常非常的人性化,后面再给大家详细的介绍这个功能。开始之前呢,我们可以选择一个文件夹,让 go to work 呢,知道你在哪里干活,生成的文件应该放哪里,当然呢,不指定呢,也可以正常使用。 先安排一个简单的任务,这个目录下面有很多的图片,我需要按照文件大小重命名,从小到大依次是一点勾 p g, 二点勾 p g, 三点勾 p g, 这样子。 把目录拖进来,告诉他要求点击发送,就开始干活了。这个速度非常快,大概十几秒钟就搞定了,并且全程是中文的,沟通很丝滑,看一下结果,哎,这个就是我想要的,大概十几秒钟就搞定了,并且全程是中文的,沟通很丝滑,看一目了然。 接下来整一个稍微复杂的,让他把下载目录整理整理,太乱了,我呢也不敢随便的删。把下载目录拖进来,我让他按照文件类型归类 好了,开始干活了。这里有思考过程是英文的,然后他会请求授权,这个设计的很安全,可以避免很多误删误改的情况,哎,没一会我整理好了,他说这里告诉我们是如何整理的,看一下结果, 一下子清爽很多了。 codework 呢,支持自然语言创建 skill, 我 们可以做一个整理文件的 skill, 下次直接调用 skill 就 能整理。直接告诉他做一个 skill, 哎,然后就开始自己创作了,中途可能会询问你的意见,一分钟不到就搞定了,还贴心的告诉了我们存放的目录功能特点,使用方法。右侧这里呢,有整个任务的计划产物呢,就是最终交付的内容以及使用的技能,也就是告诉我们 ai 到底干了啥,让我们做到心中有底。 当然 photoshop 呢,是无缝支持 cloud code 的 scale, 使用方法也很简单,比如我这里有一个 youtube 字幕下载的 scale, 把这个 scale 直接拖进来,告诉他用这个 scale 处理这个链接,就这么简单。 然后呢,他会提取到这个 scale 的 名字理解功能,稍等一会儿就处理完了,有保存路径生成的结果。打开看一下,完美 把时间托都去掉了。我测了下,这个速度呢,比 color code 要快将近两倍。我这里呢,还测试着让他用写作 skill 把字幕写成了一篇阿亮风格的文章。他会先学习阿亮的风格,整理参考资料, 然后输出五个标题让我选择,接着询问大纲是否满意,按照规定的字数输出了文章还会呢,自动审校,去除 ai 位,等我确认满意后,最终输出了可以直接发布到自媒体的图文,比例是三比四,来看看效果 是不是很赞。这些都是 skill 做的。这几天刚好有个电商的朋友呢,想让我帮他写一个程序,分析一下二五年的账目。肉眼看到这些数据真的是头大,十二个月的数据明细,每个里面呢有上百成千条,但对于 codework 来说, 分分钟搞定。选择目录,告诉他分析二五年的总额,平台扣除的税,退款总额,以及每月的销售情况等等。非常聪明,他发现了这里是有十二个月的数据,然后说开始写脚本,分析了 大概一分钟左右,详细的结果就出来了,整体的业绩,月度销售趋势,还输出了一个 t x t, 不 过这个 t x t 看起来呢,不够直观,我让他输出 excel, 再输出一个图标试试,十几秒钟就搞定了。看看效果,我只想说一个字,绝! 专业的财务,我估计没两小时也根本搞不定,越用越上瘾啊。刚才在帮我做一个春节云南游的方案,把需求告诉他,云南十日游,三个大人三个孩子,制定一个完美的租车自驾行程,要非常详细,最后做成 ppt, 我 真的有点期待这个行程安排呢?是否合理以及这个 ppt 呢?会长什么样子?好了,已经处理完成了,这个处理速度真的是没得说,来看一下效果吧, 有经验的小伙伴帮忙看看这个行程合不合理。 ppt 确实是够用了,里面还搭配了精美的图片,今年的旅行就从这个 ppt 开始了。深度使用了一段时间的 codework, 还挺激动,就像是托尼拥有了装载假维斯的钢铁战衣,瞬间感觉自己的能力都变强了。 还有一个值得强调的点,阿里的 codework 呢,价格非常非常的便宜,我相信未来,甚至就是今年,每个人都会配备一个能帮你干活的 ai 助理,而 codework 就是 一个非常好的选择,强烈推荐你去试试,大家点点关注哈,跟着阿亮学 ai!


以卡拉布特火爆全网之后,阿里也正式推出了自家的桌面端智能助手可的沃克。当前这款产品仍处于官方测试阶段,我也在第一时间获取到了内测资格,今天就为大家带来全网超详细的深度体验测评。从基础上手到核心功能全解析本期内容是被人群十分广泛,不仅面向开发者群体, 哪怕是没有任何编程基础的职场办公桌内容创作者以及学生和科研人员都能从中挖掘实用价值。废话不多说,我们直接进入正题。 首先介绍 codework 的 安装与简介,我们进入 codework 官网,根据自身电脑设备型号,选择设备版本,完成下载与安装。然后使用报名内测后补名单时绑定的邮箱登录, 登录后的界面简洁直观,整体做到开箱即用,即便新手也能快速上手操作。 codework 的 核心功能主要覆盖三大场景,文件整理、内容创作、文档处理。 我们直接在聊天窗中输入我们的需求,和 coderwork 对 话就可以直接使用了。我们点击设置,在设置里面我们可以看到 coderwork 设置了很多的 secure, 我 们和 coderwork 对 话的时候,如果触发对应类型任务,系统会自动匹配并调用相关 secure。 同时, coderworkwork 还集成了多款 mpc 服务, 包含 excel 数据联动、图标工具、 pdf 解析、浏览器连接等实用能力。接下来我们针对 codework 的 核心功能展开实操和演示。第一个文档整理, codework 的 文档整理功能可以一键解决文件杂乱、查找困难、重复劳动等办公痛点。 我们只需要在聊天窗口中输入我们的需求,比如把我桌面的文件进行规整整理, call to work 就 会理解自然语言自动化的执行任务,遇到关键节点还会主动询问你的下一步操作,全程流程清晰可控,完全遵从你的命令。同时, call to work 还会生成一份 to do list 的 标注,出来,调用了哪些 skill, 整个执行过程一目了然。任务完成后, codework 还会输出一份整理报告,最后桌面文件就全部归档完成了。我们除了让 codework 按照文件类型进行归档,我们还能让它清理重复文件,批量重命名, 比如读取相册目录下照片的 excel 信息、获取拍摄地点和日期,统一命名为日期、地点序号的格式,它都能完美执行。更实用的是,你还能把这套整理流程保存成 sku, 后期一键调用,省心又高效。第二个,内容创作。 codewalk 的 内容创作功能能够帮我们全流程生成演示文稿、文档和多媒体内容。比如我们直接在聊天框输入生成一个演示光的照射的文档和动画视频, codewalk 就 会精准理解你的自然语言指令, 自动调用相关 skill, 一 步步帮你完成任务。和之前一样,在这个过程中同样遇到关键几点, codewalk 以可选的方式让我们决定下一步如何执行。最终, codewalk 帮我们把 ppt 和演示动画视频都生成了, ppt 的 生成效果还不错,有需要微调的地方,我们手动修改就行。演示动画的效果也很出色,画面清晰,通俗易懂,完全能满足我们的需求。 第三个,文档处理。 codework 的 文档处理能力真的做到了,一句话搞定复杂的文档数据处理任务。比如,我想把一个 pdf 文档的每个章节的主要内容提取出来,并且汇总到一个 word 文档里,我们直接输入指令, codework 就 会找到这个 pdf 并执行任务。 在这个过程中,他会调用 pdf 和 doc 四 q, 这两个四 q 是 docworks 内置的。最后, docworks 就 帮我们把 pdf 的 核心内容完整提取并汇总到了 word 文档里,整个过程高效又省心。 除此之外, docworks 还能帮我们进行多文档对比,找出多个版本之间的差异,生成修改报告,速度比人工对比快十倍以上。会议记录处理,快速地提取决策点、行动向负责人、截止日期、合同审查、识别关键条款、风险点、金额、有效期, 大大提高准确率,减少遗漏隐患。最后,我们总结一下 computerwork 的 优缺点。优点一,零门槛上手,开箱即用,不用写代码,不用学复杂操作,只要会说中文,会打字就能用,新手也能快速上手。优点二,本地化执行隐私性强。 每个用户在个人终端上都能拥有一个实打实办事的 ai 助理,他的任务执行环境全在你的电脑本地,不用把敏感文件核心数据上传到云端。优点三, skill 生态丰富,执行过程安全可控, 内置非常多的 sku, 可自主安装 sku, 扩展最佳实践执行过程显示授权可控性较强。缺点一,复杂任务处理能力有待提升,处理较多较大文件的项目时效率下降。 缺点二,积分消耗较大,新用户会赠送三百积分,大家需要关注一下积分消耗。缺点三, a 进的执行稳定性还有待打磨,偶尔会出现操作失败现象。总之,当前版本的酷狗 work 更偏向一款轻量化的办公, a 进的助手权限管理更谨慎、更安全,一切都是可控的,更贴合国内用户使用习惯。

你是不是也遇到过想用 ai 自动化财务工作流程,但是用 deepsit 或者是 chpt, 他 们往往只能给我们一段拍上代码,然后让我们自己去跑。 但是我们很多财务人其实并没有编程的基础。这两天我测试了一个新的 ai 工具 all the work, 它是阿里研发的新的桌面 ai 工具,不需要我们跑代码就可以帮我们处理了很多繁琐的工作,真的像一个人一样。这 期视频我会用三个案例来给大家演示一下都可以做哪些事。首先先介绍一下这边的界面,当我们打开之后呢,会看到左边这栏有两个,第一个就是我们熟悉的这种对话框的形式。 第二个 skills, 大家可能会有一点点陌生,大家可以简单地把 skills 理解成一个领域内的 best practices, 比如说 file organizer 是 如何去更好地整理我们的文件,直接在这边点击安装我们就可以用了。接下来我来演示一下在 fpa 或者是其他财务工作中,我们可能会碰到的一些非常繁琐的工作。我们看第一个案例, 在这里有从 sap 里面拉出来的每个月的费用报告,有 costant 的 信息,还有费用大类的信息。呃,我们每个月都要根据这样的明细去做我们的费用报告,看一下 code word 能不能帮我们实现自动完成报告,或者可以先给我们一个草稿。呃,我们点击一下新任务,把指令复制给它。 那目标是可以基于两个月的费用明细生成一个出版的报告,一个是 excel 文件。然后还有一个就是我们在月节汇报的时候,一个讲稿的大纲, 那具体的要求分成五步,第一个就是先读取名系,然后在如今的统一和数据的清洗,比如这个月份,有时候表格拉出来可能会有一些不同的格式,那第二个是汇总的维度,一个是从组织维度,比如说部门,呃或者是产品线。第二个是从费用的维度来,根据费用的类型做统计,最后就是生成一个 month, over month, 也就是阅读的对比报告,一个是总费用的变化,一个是组织维度的变化,还有一个是 top drivers, 比如说哪个部门,哪个费用科目是花销最大的,还需要输出一些 exceptions, 比如说大额的单笔支出, 还有一些异常的文本。第四个是告诉他最终的输出文件要放到哪个文件夹里面,包括 excel 表格, excel 大 纲是一个 word 文档,最后可以要求一下这个输出的风格,比如说不要编造原因,所有的结论都是可以追溯的。最后要求他可以先直接输出一下一个汇总的数据,选择一下工作目录, 这边也会出来一个任务监控的栏目,可以非常清晰地看到目前在座的以及代办的事项,还有他产出的那些文件的,目前为止已经全部执行完毕了,可以看一下这边的任务监控,他一共做了这些代办,也是用了代码去执行我们的任务,用到了专门处理 excel 文档和 word 文档的 skills。 在 输出的部分,他这边也给我们一个总结性的报告,一共有多少费用,变化是怎么样的?前三个最大的费用类别是什么?以及需要关注的三个异常?我们先来看一下这边的 excel 表格, 这边一共给我们输出了七个 sheet, 第一个就是 summary, 是 比较简略的总费用以及它们的 variance, 然后看一下这边的 department, 每个部门的费用和差异,这边是 by category 以及这边的 主要的差异。下面一个 exception tab 是 告诉我们可能有一些异常的费用。最后一张是我们的 data cleaning 数据清洗的一个制记录,就是我们拉出来的 raw data 里面。在这些字段下面有哪些是呃缺失率比较高的,那我们可能就要去系统里面或者是报告里面看一下这些缺失率会不会影响我们做报告或者是汇报。 那总体来说报告是比较全面的,但是呢,它出来的产物是比较简单的,其实我们也没有给到它特别多的关于公司的信息和产出的报告的格式,大家也可以测试一下,如果你可以给到它公司比较常用的一些报告的模板,看看它是否可以产出同样的格式,那我们再看一下它给到的汇报的大纲, 第一部分是结论,第二部分是 top drivers, 第三个是异常和风险,第四个是 q n a 预案,就是其他同事在会议中可能会提到的一些问题, 我们可以提前准备。最后是一个口径的说明,其实格式和大致的内容都已经非常的完善了,那我们只需要针对我们自己公司的一些要求,再进一步的做一些规范就可以了。 平时员工报销拿的发票,我们可能还需要做一道检查,就是要查虫,在我之前工作过的几家公司的一个比较常规的操作,就是把员工拿来报销的发票都统一录入到有效里面,然后再进行查虫的处理,这样的话就会非常的麻烦, 因为我们每次都要手动录入发票信息,那我们现在试一下它能不能帮我们做这项任务。我们在技能这边有一个 invoice organizer, 我 们可以使用一下它,看看它的整理发票的功能怎么样 好。选择好这个技能之后,把我的指令发送给他,首先我给他设定了这个路径,但是我们还需要在下面这个选择工具目录中去设置一下文件的路径, 然后再告诉他目标是要识别重复票据和异常票据。具体的要求,第一个是要便利所有的发票文件,然后再提取下面的这些字段。第二步是 提取字段之后,把这些信息生成一个 excel 文件,包括完整的发票台账、重复票据的清单,异常票据的清单 啊。查虫的逻辑是一个是强匹配,也就是如果发票相同的话,那就肯定是判断为重复,弱匹配的话,如果这些信息都相同的话,就判定为一次重复。第四个对于异常规则就写尽着 exceptions 叫文件,也就是那些我们可能因为图片质量原因没有办法识别到具体的信息,这样的话还是需要人工去处理一下。最后就是要求它展示的结果要友好,可以设置输出的表首行冻结之类的格式,最后执行完毕后让它直接输出这些我们想要立刻看到的一些信息。呃,那我们现在就直接发送让它去处理一下这个任务, 我们可以看到它这边每一个步骤,以及到目前为止进行到哪个进程了。 好,我们看到这边已经执行完毕了,所有的代班事项都已经完成,它这边产物是生成了一个 piecing 代码,也就是用 piecing 去执行我们刚才的任务。那我们来看一下它的输出结果。强重复组是有三组,也就是那些发票号码是完全一样的,还有弱匹配组是零组。 呃,异常的票数是十四张,可能是因为图片拍的不清楚,所以看不到那些关键的信息。好的,我们先来看一下这个文件夹里。首先是 invoice ledger, 也是所有的发票的信息都已经统计在这里了,包括发票号码、开票日期、金额等等各种信息都已经统计在这张表格里面了。 我们再来看一下这个查重,这两张是发票号码一样,但是金额和销售方是不一样的, 可以找到这两张看一下。那确实是这两张的 invoice number 是 一样的,但是扣的又不太一样,我们就要去调查一下到底是怎么回事。还有第三个文件是 exceptions, 也就是那些异常说明可能是缺少一些信息,或者是 ocr 不 太确定,没法提取到。然后还有一些是照片的质量问题,就是这边的这几张,比如这张是 pdf, 它写的异常是 ocr uncertain。 好, 还有这个具体是哪个信息不太确定,那我们可以去人工审核一下 它这边写的异常情况是 invoice number 包含了 o 而不是零。我们看一下啊,这个也是我故意设计的,它居然真的可以识别出来。还有一个是它说 invoice code 包含了空格, 那也确实是这个也识别出来了。当然如果你的某一串数字里面它确实是含有空格的,你也可以在输入指令的时候就跟它说这一串代码本身就是含有空格的,那 那么在输出这个 exceptions 的 文件的时候,他就不会把这个当成是异常的情况了。然后这一项任务执行的非常的完美。那在这个 case 里面,我们所有的发票其实都已经是整理过的,它的命名非常的整齐,一眼就能看得非常的清楚,而且也已经归类到相应的年份和月份的文件夹里面了。 但是呢,在月结的时候,我们可能会突然收到很多业务给的发票,可能是这种比较正常的电子发票,有可能是一些他们随便发的 supporting 的 文。 在外省的话,可能还会有一些类似于这样格式的去国外出差收到的发票,然后他的密名也是乱七八糟的。如果我们要手工具一点点整理,然后把所有信息再转移到 excel 里面的话,可能要花非常多的时间。那我们可以利用一下我们刚才安装的这个 file organizer, 把我们的需求贴进去。我是先给他这个目标,就是要整理下我们的文件夹,然后具体要求。第一步是要先保存原文件类型,然后进行分类,也告诉他这个目标的结构应该由哪一些文件夹组成。 在对发票文件进行重命名,我这边要求的格式是这样子的,最后再输出清单和日制,那给到具体的指令之后,我们还要选一下这个具体的文件夹,设置好之后我们就可以让它去完成我们的任务了,它在执行任务之前都会确认一些新的权限,也是确保数据的安全性。这边我们可以看到它每一步的步骤, 到这个阶段我们可以看到它说所有的文件已经读和生成文件夹了。 好,可以看到它已经执行完成了,给了我们文件夹的整体的结构,以及我们之前要求它生成的一些文件。我们看一下,首先它是没有动我们原文件里面的文件,而是生成了一个 output 文件夹,就和我们给他的指定是一样的, 它里面有三个,一个就是我们刚才所有的 raw data, 第二个就是我们要求它整理的文件分成 invoices、 supporting documents 和其他 invoices 也是根据我们给他的格式重新命名了,随便检查一个,比如说这个是滴滴的日期是三月二号,明 名称是滴滴,金额是九十七元,发票号码也没有问题,然后也是电子补票,这些信息抓取都没有问题,有一些无法识别的,嗯,它是写了 onno, 比如说我们这一张是没有办法识别它的日期,确实这个 invoice 里面是没有的,那我们可能就要继续去调查原因了,这张发票是有问题的。好的,这个 invoice 是 没有问题, 我们再看一下 supporting documents 里面,它也是帮我们把所有的说明文件都放到了这个文件夹里面。然后 others 是 无法分类的,跟我们这个 invoice 完全没有关系的一个文件,那如果确实是呃放错了,可以把这个从我们这个文件夹里面删掉。 接下来第二个文件是我刚才让他做的记录,也就是执行完毕后要输出所有的未归类的原因。他帮我们找出了这三张有问题的英文,也告诉我们是哪些原因。这三张都是因为缺少了日期的信息,还有这个 rename log 是 原文件的名称和新文件的名称, 以及最后 scope notes, 就是 告诉我们这次都做了哪一些动作,非常的清晰,对于我们后续追溯有用,它甚至还做了统计招标,真的非常的智能。这个 notes 它也根据我刚才的要求输出,甚至更加详细了。那除此之外,它还有其他的 skills, 也是在不断的更新中,比如说这边有很多的企业里面的 role, 比如说 developers, marketers, 还有我们的 finance 可能会经常用到的一些 skills, 比如说要处理文档,要处理 pdf, 甚至还有 pricing strategy, 除了 fnes 之外,还有 hr, lego 之类的角色。这次测试下来感觉还是比较流畅的,只要我的指令给的够详细,够全面,它完全可以按照我的想法完成任务。如果你的工作中也有类似的,需要很多手工操作的脏活,可以交给他试试看。

当所有 ai 厂商都在告诉你,把数据交给云端吧。阿里做了一件相反的事,把 ai 塞进你的电脑里。 coderwork 桌面端本地优先智能体 macos 和 windows 双平台,支持一句话,驱动自动完成复杂办公任务,所有文件操作在本地沙盒完成。敏感数据不上云,支持离线处理。 你以为这只是隐私保护?不,这是对云端霸权的一次叛逃。当 ai 开始真正进入你的工作流,处理的是合同、财务代码、客户名单。云端再安全,也不如你自己的硬盘安全。 阿里算明白了一件事, ai 的 未来不是让所有人把数据搬到云端,而是让 ai 搬到你家里来。所以, codework 的 真正意义不是又一个智能助手,是他递给你一把钥匙,让 ai 为你工作,但不需要你知道任何秘密。答案写在本地那个沙河里,你的数据永远不需要走出这扇门。

你敢信吗?这几件事全是 coverwork 替我做的,定好任务,早报准时远程发我微信, 把我的工作 sop 做成 scale, 随时一键调用, 分析数据,创建图标,直接输出 word 文档。 hello, 大家好,我是阿亮,熟悉我的人呢,应该都知道我日常使用比较多的呢是 cloud code, 但 cloud code 呢,是一个命令行工具,门槛很高。那么普通人应该用哪一个? 我觉得首选就是 cloud work, 基本上平替 cloud code。 现在的 cloud work 呢,非常强大,首先它在全球顶尖模型,支持 scale, 可以 执行定时任务,最牛的是支持接入微信,飞书等 r m, 可以 说是全能 ai 助手了。 划重点,所有任务都是本地运行,数据不上云,安全放心。你可能想问,工具配置麻烦吗?需要懂代码吗?效果又如何呢?数据可靠吗? 我给大家逐个答疑。首先,免配置,下载完打开就能用。其次,效果确实不错,用的是全球顶尖模型,估计你能猜到是哪个。最后呢,是安全,本地环境运行,所有的文件都在你的电脑上。 老规矩,接下来带大家手把手体验,看看它到底适不适合你。先说下如何安装,打开 codework 的 官网,根据自己的电脑下载安装包,然后安装。接下来呢,双击打开就可以了。首先我最喜欢它的功能呢,是定时的任务啊,并且呢,它可以将结果发送到我的微信。 我给他安排了一个每日早报的任务,把 a n 圈最新动态, github 热门项目帮我整理好,早上九点自动运行,然后发送到我的微信。 这个很实用,能节约大量的刷手机的时间,你可以根据自己的需求定制内容,这里呢,我要重点给大家介绍的就是他的 r m 集成,我目前呢是集成的微信,当我不在电脑旁的时候,这个功能呢就非常实用。我 给大家演示一下如何进入微信,在这个地方 r m 集成,找到微信频道,用手机微信呢,扫一下这个二维码,显示已连接就搞定了。 那么信息有了,做内容呢,还有一件更头疼的事,就是选择题。 codework 呢,完美支持 scale, 它这里内置了很多的 scale, 我 们也可以制作自己的 scale。 针对选择题,我有一套自己的流程,然后我把这个流程呢做成了 scale。 现在我只需要给他一个选择题的方向,他就可以自动搜热点,直接出评分清单。而我需要做的只是选择把你每天重复的工作,让 codework 做成 scale, 然后你就可以一劳永逸。 我用 codework 比较多的一个场景呢是数据分析,我会把销售报表甚至财务报表都给到他,这个数据比较重要,我一般不会上传到网页的一些工具。 codework 呢,是本地处理文件,不上云,所以呢,放心很多,给大家演示下, 扔进去一个 pdf, 让他给我分析核心卖点,目标用户与现有方案的差异,看一下这个输出的效果是我想要的。再看一个分析 excel 的 案例, 我们扣顶一款 app 呢,很简单,但是难就难在推广,需要去调研一些关键词,哪些词有流量,竞争没那么激烈,竞品在用什么词?这件事呢,我就已经完全交给了 codework, 让他读取关键词数据,按搜索量、竞争度相关性分层,帮我找到那些蓝海词。 codework 虽然不是专门的编程助手,但他也有这个能力,并且出来的效果还不错。假如我们日常有个小工具要做,他是可以胜任的。比如我让他帮我做一个翻译小助手, 可以把 word 文档中的内容保留原始排版,翻译为英语、法语等等大白话,告诉他我的要求,然后他就开发,最后呢帮我去部署,还启动了, 一气呵成,给大家看下这个效果啊。给一个原始文档让他处理,就看看翻译出来的怎么样,哎,大家对比一下就是不错。 再给大家看一个我日常的使用场景,很多粉丝会问我,我的这种图文是拿什么工具排的,这里呢给大家统一的解答一下,是 codework 帮我做的,这是原始文档,给到 codework 输入,帮我重新排版, 然后就出来了这样的效果。其实它是调用了一个 scale 来做的,这个 scale 呢,我也整理到了文档里,有需要的呢可以找我要。 我有个朋友是财务,他每个月要给大家发工资条。我那天看到他花了一下午的时间,把一张大表拆分成了上百个小表, 他没封,我受不了了,接着扣的 work 一 分钟就搞定了,只需要把大表拖进去,让他拆分成每个人一个独立的工资条 excel。 然后现在他把这个工具呢,也推荐给了他们公司的 hr。 最后一个案例,先给他安装一些 scale, 然后把你的要求告诉他,给他产品参数,让他根据我提供的产品参数表生成一份产品使用说明书, 然后开始干活。相信我,出来的效果你一定会惊讶的。当然,我也把一些写作相关的 style 整理到了文档里面。阿亮可不是叫你偷懒,而是这个能力确实给力。 ok, 通过这些场景呢,你应该对 codework 呢有了大概的了解, 那么一句话总结,它是可以直接交付结果,为真正解决问题而生的 ai 助手。大家点点关注哈,跟着阿亮学 ai。


哈喽,大家好,这里是风声解读,不知道大家有没有注意到啊,过去的话,我们熟知的 ai 工具啊,它本质上都是对话式的,这种辅助用户呢,抛出问题, ai 去输出答案,用户再去手动的去复制啊,修改啊,整合呀,落地啊 ai, 它始终是停留在一个参谋的一个层面,无法真正地去代替人工去执行任务。而今年彻底出圈的这个桌面办公 ai agent, 它直接打破了这层壁垒, 核心变格只有一句话,他从你问我答的被动对话,直接升级为了你提需求,我全流程交付的这种主动的执行。这类原生的桌面智能体,不再局限于文本生成这一托,内置的抠钉的能力,专业的技能包,以及行业专家 去深度的操控本地的一些设备啊,文件啊,数据啊,独立的完成数据分析,包括文件的整理,内容的创作以及问题的排查等全链条的这些工作,直接输出可以直接落地的文件。 目前在国内市场中,呃,像腾讯的 workbody、 qcloud 以及字节的吹 solo, 阿里的 qdwalk 这四款工具,基本上包揽了目前桌面办公 ai agent 的 赛道的一些核心的流量, 它彻底重构了我们职场人的一个办公的一种方式。传统 ai 的 痛点极其明显,它有思考,没有执行,有输出呢,没有交付。 你让传统的 ai 去写报表,他只会给你一段数据的总结,你需要自己去建表格,填数据,做这些可适化。你让他去整理文件呢,他只会告诉你整理的思路,你需要手动的去分类,重命名,规档。 你让他去做数据分析呢,他只会给你输出结论,你需要自己去清洗数据,还要去核对逻辑和生成报告,全程依赖人工去兜底, 效率提升极其有限。而新一代的这种桌面的 ai 智能呢,它补齐了最关键的执行的短板,核心的突破在于它的三大能力,第一的话就是它原生的 coding 的 自助能力, 它不需要用户去写指令,调代码 agent, 它可以自主的去编辑运行,去调试脚本,搞定数据清理,批量处理逻辑预算,彻底的去解决这种复杂办公的技术门槛问题。第二的话,它就是全流程闭环的交付, 呃,在接收到一些自然语言的需求之后呢,它可以自主的去拆解任务,然后去规划流程,落地执行,并且在执行的过程中呢,它还会自查纠错, 最终向用户输出 word、 excel、 ppt, 或者说报表、图片、 html 文件等等。第三的话就是专家的技能内置化,搭配了细分领域的专家模型,还有一些专属的技能, 并且覆盖了办公数据、研发、运营、法务等各种各样的一些场景,你不用去切换工具,也不用去额外的去配置, 可以在这个工具里面一站式的去解决你的多样化的一些问题。简单的来说,像以前 ai 的 话是帮你去想, 现在的 ai 的 话是替你去做综合这些主流的这些产品,通过我个人的实测体验来看,以及一些目前行业内的一些数据,我这里给大家推荐使用腾讯的 workbody 作为桌面办公 ai agent 的 首选, 它呢也是目前国内增速最快,使用量最高的一个 ai 原生的办公智能体平台,可以去真正的体验这种需求直达成果的这种 ai 办公的这种体验,用最快的速度完成我们职场效率的升级。 像未来的这种办公竞争的话,不再比拼谁的 ai 一 阵他更会聊天,而是比拼谁的 ai 更能干活,更能精准交付,更能去替代人工,去做这些重复性的劳动。这里是风声解读,我们下期再见。

国产 ai 智能体真的开始崛起了。五月十五日,阿里发布了 coder, 一 点零实现了多智能体的系统,直接给你提供了一只编程小队,前端、后端数据库各管一摊儿,非工干活,互不打扰。你一个人可以撑起整个产品研发任务 code 的 任务委托模式,你可以直接放手不管。 你打开任务窗口,输入一句话,比如做一个赛博朋克太空射击游戏 code 不是 直接开始写代码,而是先进入分析模式,几秒钟内自主拆解出游戏循环、视觉特效、音频合成、 u i 交互十几个子任务,生成完整的技术方案。然后你点一下执行,它自己从头到尾干完,它自己把项目端到端交付。 code 里面不只是有一个 ai, 而是有多个角色化的智能体。后端智能体负责数据库和接口,前端智能体处理页面和交互,后端智能体还管数据库恢复和重启, 他们就像真人团队一样并行工作,你在一个界面里同时推进多个任务,并行,互不阻滞。这意味着你一个人可以前端、后端数据库一起推进。不再是一个 ai 陪你写代码,而是一个 ai 小 队替你打工。为了更加懂你, q 的 提供了知识引擎, q 的 会从代码和对话里沉淀经验。在生成单元测试的页面, 会先解锁记忆库,解锁你的代码规范,思考后说让我先获取相关约定,理解你想测试什么,并不是在套模板,是在学习你的工程习惯。你写 java, 它记住你的命运风格。你写 python, 它记住你的异常处理方式。 越硬越像你自己带出来的兵,这是真正的自动化智能体,不是每次从零开始,而是带着记忆上岗。当大语言模型能力卷到极致,智力的提升对于完成现实任务的影响正在鞭策递减。 agent 的 智能体,才是真正为普罗大众创造价值的形态。这场效率革命,中国玩家坐在主桌上。


首先 codework 是 什么? codework 就 如它的名字一样,是我们呃 codework 团队开发出来的,面向所有人开发的一个产品,我们五个人七天上线, 然后在这个项目组里面呢,其实我们没有明确的角色划分,我们没有明确的前端工程师,后端工程师都不分,我们管这个过程叫无代码, 以前我们说叫写代码,一个字一个字敲,或者一行行去写,到后面我们做一些补全代码,那到这个项目里面我们发明了一个词叫胡代码,就是代码是一片一片写出来的,那这个怎么样才能够一片一片的把代码写出来呢?这个主要是依赖我们扣的理论能力,叫 quest, 我 们第一天是把所有人关到了项目室,我们去做共创, 就是我们这个产品的 mvp, 边界到底是什么?哪些是做的最小的?可行产品是什么样子?这是我们先确定了一个边界, 基于这个边界我们就开始拆解模块,这个模块应该怎么样,具备什么样的功能,应该怎么去写这样的功能描述技术、约定接口定义、验收标准这些基本的能力,我们去把它描述出来,描述出来之后我们就开始说这个简单的这个 spec, 是 一个简单的 spec, 技术人员根据这对需求的理解,开始写一些简单的 spec, 这就是相当于这个 spec 如果做完 ok, 我 图里面这个框功能模块就完成了,那么它和对外怎么去去约啊?这是我们在白板上去讨论定存这么个流程,这就是整个基于 quest 去胡代码这样一个过程。然后这些 搞定了之后,我们就开始去做一些打磨了,就是我们如何去自己测试我们自己的版本,我们项目组内开始去自己测试自己,如果有问题我们就开始去写 spec, 让让好让快速的去修这样一个过程。那其实 q a 团队在背后也在帮我们去做对应的。那 q a 团队呢?它是 根据我们在写这些 spec, 它会生成一些单元, test case、 测试用力,然后基于这些测试用力,它们会写一些也是基于快速写一些自动化测试的一些脚本,然后我们会把整个一个东西通过自动化测试去做。那同时呢,我们人肉也会去测,比如说我们最开始讨论的功能是什么样子, 我们就开始人肉地去把这个东西测,这个就是在吃自己狗粮这么一个过程,尤其是我们同时兼容了 mac 和 windows, 所以 说在这个整个跨平台兼容方面,我们要做很多这种交叉测试去做。 最后啊一天就是我们最终要做集成打包发布,那我们在二零二零年的一月三十号,我们就开始正式上线。其实我们回顾了一下这个,我们自己还是觉得蛮正经的,就是五个人,我们 估算了一下,如果按照我们传统的研发模式,我们这样一个工作量起码要十五到二十人,干好几周才能把这个事情做完,但我们其实只干了一周就把这个事情做完了, 那我觉得这就是 ai 给程序员带来一个红利。那我们做 codework 的 初心也来了,就是说我们用 ai 给程序员赋能,那程序员继续去把这个整个赋能的范围变大,让 ai 能够普惠到每一个用户,这是我们做 codework 的 一个初心。

呃,那个大家下午好,那个我是 coder 这边的那个产品解决方案架构师啊,我的花名是雅木啊,今天很高兴跟大家一起交流一下, 然后我今天交流的内容的话,大概是分了三部分,第一部分的话就是这个大家可能最近听得很多了啊,就是 ai 现在这个发展很快,对吧?到底有哪些 啊?这个趋势?但是我今天可能啊,更多的还是从我个人的角度啊,就是我见到的我的客户,对吧?或者是我们自己在实际的工作中,到底对我们的工作有哪些影响。 然后第二个的话就是,呃,整个 ai 口径,对吧?这个可能也是大家今天来关注的重点,就我们整体的一个解决方案,主要是面向于因为今天我们来的很多的这个同学都是企业用户,对吧?所以我们今天会重点去讲啊,企业级相关的一些能力啊。 然后第三块的话,就是我们会去看一下整个的一个客户案例,然后,呃,那我们先先看一下第一部分啊, 就是这个是我这两天在网上刷了一个帖子啊,最近好像这个帖子比较火,不知道有没有同学看过啊?就是这一刻,就是我突然理解了当年的父亲,对吧?这个什么是当年的父亲呢? 就是我相信可能我们今天来的很多同学,我们的父辈可能都是,呃,六十年代或者是七十年代的,对吧?其实他们那一代人是完整的经历了改革开放的这个大周期的,那改革开放是一个什么样的年代呢?就是我们现在大家回过头去看,对吧? 改革开放那个年代是属于各行各业都在蓬勃发展,对吧?那个时候其实只要我们认为啊,我们现在看,对吧?我们的父辈可能稍微努努力,对吧?稍微动动小手,那样可能我们今天在座的各位都已经都是富二代了,对吧?就他们自己都已经成功了, 那这个时候我们再回头去看我们的父亲的时候,我们会不理解,对吧?为什么我的父亲当时没有努力,或者是当时他没有抓住这个机遇啊,把我们自己变成富二代,那其实这个问题在 ai 这个时代,大家想一下,其实是不是跟那个时候是类似的啊? 我不知道有没有同学去统计过,说现在我们啊大模型的这个发展的这个频次啊,或者是发版的频率,就我们就是单纯看这种大的版本或是机模,对吧? 我,我前天啊,我昨天刚刚用 ai 去统计了一下,像 astropik, 对 吧?或者是 open ai, 或者是我们的这个千问系列啊,在短短的三个月之内,基本上每个厂家的发布频率都是超过十次的,大家可以想一下,这是一个什么概念,对吧? 基本上每一次大的模型的发布啊,我们认为它对每一个角色,每一个行业,对吧?譬如说前段时间像 gpt 它的那个 emoji 模型发布了,对吧?那设计同学觉得它的天塌了,对吧?那前段,前段时间那又有一个像我们的这个 happy house 发布了,对吧?那我们又觉得这个短视频像这短剧演员的天塌,天塌了,对吧?感觉每一次这个大的模型发布,总有一个行业被颠覆,对吧?但是每一次 模型的发布,对我们研发同学来讲,好像我们每次都会被波及,对吧?感觉每一次模型发布好像对研发这块又是一个不断的一个新的颠覆啊。 据说我们今天可能来的同学可以想一下,对吧?可能,呃,再过二十年,等你们的孩子长大了之后,对吧?他会不会也会提出这个疑问?说 啊?当时在这个 ai 大 模型时代,对吧?那为什么我的父亲当时没有抓住这个 ai 的 这个 这个这个机遇啊?把他自己变成富一代,那是不是他现在也就不用努力了?所以说我们今天下午可能我这一趴跟大家聊的还是希望能够跟大家去交流出一些火花,然后后续大家在自己的不管是工作也好还是生活也好,对吧?可能都会有一些感触吧,啊? ok, 然后我们绕回到我们的这个 ai coding 这个领域啊,因为我们刚刚讲了,对吧?就是 ai 现在可能对各行各业都有颠覆,但是其实现在感觉 啊,影响最深啊,范围最广,或者是说最卷的一个赛道啊,就是 ai coding 了,就是我这边的话其实是从二三年,二三年就是就开始在这个赛道里面啊,然后最近我跟我的这个同事们在聊,对吧?我们自己的一个感触就是 学不完,根本学不完,对吧?就各种各样的一些概念层出不穷,譬如说我们在二三年的时候,可能大家还在讲这个 啊,讲微调啊,讲 reg, 讲我们的提示词工程,对吧?然后到了二四年的时候,那我们开始啊,讲 agent, 讲我们的这个 m c p 啊,讲我们的这个 skill 啊,讲 raw, 对 吧? 啊?终于到了二六年的时候啊,我感觉是吧,我这些东西是不是差不多了,也够我们企业去落地了,然后现在又开始出了啊?像我们新的这种哈尼斯,对吧?这个最近大家聊得特别火, 那这里面可能对我们自己的几个影响啊,会是什么?这个给大家看一下几个具体的例子啊。 首先第一个的话就是开发范式的转变,这个我我我相信啊,可能很多企业,尤其是中小公司会走的快一点啊,就大家都在往这个方向去走,但是可能大家的感知没有那么明显啊,给大家举一个例子, 就是五人七天,就是 codework 这个从想法到现实啊,这个例子大家可能听过,或者是我们这个产品我相信大家 有的同学也用过,那这个例子的话,其实就是在节后,对吧?大家都知道小龙虾爆火了之后,对吧?就那老板肯定也有想法,对吧?那阿里我们也要做一个我们的这种产品,那这个产品的话,其实就是从节后 那大老板有了这个想法啊,说开始做到最后发布上线,总共啊就是花了五个人七天的时间,那其实这个东西 我们做完了之后回头去看啊,实际上我们这五个人七天的工作量,大概按照传统的这种方式去评估的话, 其实大概相当于十五到二十人那数周的这么一个工作量,但是我们五个人七天就搞定了,那在这里面的话,其实我觉得有两个差异点啊,有两个差异点,第一个点的话其实就是胡团队,胡团队我相信 我们现在很多企业也在往这个方向去走,什么叫胡团队?大家可以想一下啊,如果说我们这五个人还是按照我们所谓的传统的这种模式去开发,对吧?那我分一个人给产品, 分一个人给设计,分一个人给前端,分一个人给给后端,然后我再分一个人给测试,那可能,对吧?这五个人七天过去了,他的那个设计文档 搞不好都没有评审完,更不用说上线了,对吧?那现在有一个趋势是什么呢?其实,呃,在很多的公司我了解的就是大家现在对于研发角色啊,都在做模糊化,其实就是我不会再去区分说 你是一个前端啊,你是一个后端,或者是说你是一个什么样的一个编程语言或者是技术站的,对吧?只要你进了我的这个团队,那我统一就一视同仁,对吧?大家的目标就是你帮我端到端的啊,把这个需求或者是把这个项目啊给搞定。 这个是第一个就是我们所谓的胡团队,这个我知道的是现在我们确实接触了一些客户公司啊,就已经往这个方向在走了。 然后另外一个就是包括我们自己啊,因为 coder 其实最近在内部确实是一个比较火的产品,对吧?就是我们最近也一直在招人,那我们现在其实在招研发的时候,我们其实是不去区分这个研发之前它是什么样的编程语言,什么样的基础站,它是前端还是后端的, 只要他有比较好的我们所谓的这种编码规范架构思想,对吧?其实我们就欢迎这种人就来到我们的团队,因为本质上你最后写代码的时候,他自己写的也很少嘛,对吧?他更多的还是通过 ai 去写。 然后第二个差异点就是跟我们的传统模式的差异点其实就是胡代码。什么是胡代码?大家想一下,如果说这五个人,对吧?我让他按照传统的手敲的方式去写 啊,基本上大家想一下累死基本上也七天也干不出来嘛。那这个时候的话,其实这五个人在这七天里面,他们做的更多的事情其实是写 spec, 就是 我们所说的这个 sdd, 对 吧?就是他们花了很多的时间再去做这个所谓的规范的编辑上,那规范编辑出来之后,对吧?我就把这些规范扔给我的这个 coder 的 快速模式,然后让它并行去做这种开发,开发完了之后,对吧?研发去做相应的这种验收合并,然后有了整个的 mvp 之后,研发去吃狗粮,如果有问题,那我再倒回头去继续去优化和修改啊,我的这个 spec, 那 最后我们在 第七天的时候啊,确实把这个功能给交付掉了。 然后第二个例子的话,其实就是呃,角色上的,角色上的就是呃,前段时间其实我在跟杭州的一个游戏公司的一个负责人在聊的时候,他问了我一个问题啊,就是他说雅木,你觉得现在 ai coding 这个发展的趋势,对吧?他对哪个角色 啊?是最有利或者是最友好的?我不知道大家有没有人考虑过这个问题啊?我当时的回答是说他其实 对于我们的这种啊,架构师同学啊,架构师同学是非常友好的啊,刚跟那个其实潘凯老师也在聊啊,其实大家有没有发现就是说后续 啊,只要你自己的编程的基本功,你的编程的这种思想啊,你的架构的理念是比较充足的,对吧?就我们之前可能很多积淀了很多年的这种老的架构师,他们现在这种知识 都是有的,而且非常的充分,那他们其实唯一解决的一个问题就是精力不充沛,对吧?可能随着这个年龄的增长,对吧?确实没有办法,就是,对吧?天天去去写这个代码,那这个时候其实 ai 的 出现就是极大的会立好这一波人, 只要他们有想法,对吧?他其实有想法有场景了之后,他可以快速的基于我们的这种 ai 认证啊,去做这种场景和想法的落地啊,其实最后就会达到我们所谓的这种商业化变现啊。然后这里的话其实举了一个例子,跟这个也是类似的,对吧? 就是小龙虾之父啊,小龙虾之父他其实有一个特别夸张的点,对吧?大家都知道,其实小龙虾这个产品就是他 花了几个月的时间给搞出来了,对吧?大家可以想一下,如果说没有啊,这个所谓的 ai 认证在底层去帮他支撑着啊,去天天二十四小时给他写代码,对吧?他有没有可能性说我在几个月的时间把这么一款产品 啊给做出来,而且我们也做了一下这个数据的统计啊,就大家可以想一下,就是我们在正常编码的时候,对吧?就或者是说我们现在可能很多同学 也在用 ai 了,对吧?大家可以对比一下,你用 ai 的 这个力度和他用 ai 的 这个力度的一个差距啊,就是他可以一天提交六百二十七次代码, 那这个数字大家这么单纯看好像没什么太大的体感,对吧?你可以换算成分钟,就我们一天大概是一千四百多分钟,对吧?那相当于 这个人他每两分钟就可以做一次有效的提交,不吃不喝不睡的情况下啊,这大家可以想一下,对吧?就哪怕我们可以一天两天不吃不喝不睡,对吧?那你长期这么搞,我们是不是可以撑得住,对吧? 然后第三个场景的话,就是编程能力的彻底普绘化,这个其实我觉得是,当然不是给大家制造焦虑啊,就是这个是我最近在跟很多客户的这个 研发同学在聊的时候,研发同学就经常会去问我的一个问题啊,就说那后续啊,我们研发同学到底应该往哪些方向去 进化也好,或者是往哪些方向去发展也好,对吧?为什么大家会有这个焦虑呢?其实大家可以想一下,对吧?我们可能作为研发同学,我们之前很深的一个护城河是什么? 是我们会写代码,别人不会,对吧?那我能做的事情他是做不了的,因为这就是你的护城河嘛。但是其实现在随着我们的这些大模型的不断突破,对吧?他在编码能力上像我们刚刚说的啊,越来越强,那这部分能力其实是在被逐步抹平的 啊,被逐步抹平的给大家看一个例子啊,这个是我自己的一个实际的例子,就是我之前因为我相信不光是我们这个角色啊,就是各行各业大家都避免不了,因为大家肯定都有竞品嘛,对吧?不可能说我有一个行业,对吧?我只有我自己这一个厂家,对吧?那,那这个 确实应该是比较少啊,那大家都有竞品,那我们经常要去做的一个事情就是去做竞品分析嘛,那在 ai 这个赛道,那这个事情 啊,就会变得更加的频繁和重要,因为大家都知道,我大概数了一下啊,就现在在全球范围内 ai coding 的 这种,就是我们就说非常热门的啊,就不说冷门的那些,就已经逐步被淘汰的非常热门的、主流的。 呃,全球范围内的 ai coding 工具不少于十个,这个大家可以数一下啊,不少于十个,那这十个工具大家都知道,就拿 coder 来举例子,基本上我现在每次打开 coder, 每次打开 coderwork, 它都会提示我要重启更新 这类工具,现在的这个整个的一个发版频率是非常非常恐怖的,是非常非常恐怖的,那这个时候的话,我又需要,对吧?因为我们的很多的客户经常会去问嘛,包括之前我们 在其他厂子交流的时候,对吧?我们就也会有同学直接就问,对吧?那你们跟某某厂家,那你们有什么差异化的优势啊?那你们对比人家,那你们有什么?为什么要选你,对吧?那你的能力上有什么差异点啊?那这些的话我们要去实时的掌握这种信息,我们肯定就需要啊,有这么一个东西,对吧?我靠人肉,现在大家想一下,肯定是 来不及去做这个事情的,对吧?我,我不太可能把时间都耗在说我天天去翻这种官网上, 我之前这个事情是怎么做的呢?就是在没有 code work 之前啊,我是通过 code 啊,通过完完全 web 定的方式,相当于让他写了几万行代码,对吧? 以代码的方式去抓取或者是去爬,对吧?这个研发同学应该都很清楚啊,这个就不用讲细节了,就是去帮我去做了这个事情,但是这个事情它有一个什么问题?如果我之前有编码经验,对吧? 啊?这个其实还好,因为我知道说我大概要做成什么样子,那我本地需要什么样的环境啊?我怎么样去做相应的边缘运行,对吧?这个其实都是可以搞的, 但是这个事情大家可以想一下,其实这个工作很多是放在了我们所谓的非研发同学身上的,因为并不是所有的这种竞聘分析的同学,对吧?他们都有这个编程经验,那这个时候他就需要有一款工具,对吧? 我完全不需要感知你中间的这个执行过程,就是你,我不管你这个代码或者是你中间是怎么实现的,我要的是一个成果,这个其实也是对于后续大家最近讨论的比较激烈的一个问题,对吧?到底什么是企业的核心资产? 在 ai coding 发展的极其迅速的今天,代码到底还是不是企业的核心资产啊? 那这个时候其实我就有了第二种方案,就是我有了一个叫我从 web coding 啊引进到了叫 webworking, 那 这个 webworking 的 这个方案里面呢?我相当于就是完全没有写或者是没有感知,因为我也不感知,对吧?我也不需要感知 任何一行代码,我直接让 codework 相当于帮我封装了四个 skill 啊,就把这个事情给搞定了,给大家看一下, 那这里面它是怎么做的呢?这个,其实,呃,这个场景不光可以用在非研发的场景,其实在研发的场景下也是一样的啊,因为不管是非研发和研发,大家在使用 ai coding 工具的时候, 无非就是我们说的这些,对吧?就是你的 rule 规范,你的 skill, 你 的工具的调用, m c p 以及现在大家说的自动化的 harness, 对 吧?其实本质上都是这些东西,只是说在不同的场景使用的时候,大家的方式和使用方法可能会有点区别, 那我给大家看一下,就是我这个场景我在 codework 里面是怎么去做的,它其实本质上就是四个 skill, 然后这个 skill 里面最核心的一个就是 lm wiki 这个 skill, 这个 skill 我 不知道有没有, 呃,或者是这个理念啊,我不知道有没有同学听过。就是前段时间卡帕西应该是在二月份还是三月份时候,他分享的一个就是说因为之前我了解很多企业说我去对接我们的私域知识的时候,对吧?我们其实接的更多的是我的 reg 知识库啊,大家之前都是以 reg 的 方式接的比较多,但是 reg 大家会发现一个是它的这个头产出比 是比较低的,对吧?因为我在用这个东西之前,我是要去做这种知识结构化。另外一个的话就是我会觉得它的召回的效果也没有那么理想,所以说就会有了这个 m wiki 的 这个东西啊,其实它的这个核心理念就是一个自进化的一个知识库,那我这里的话,其实我没有做更多的事情啊,我就是把 卡巴西的那个文章拿过来,对吧?我直接丢给了 codework, 我 说你去理解他这个文章里面的核心思想,然后帮我去做一个 skill, 后续的话我可以去沉淀我自己的个人的私域知识库啊,私域知识库, 那有了这个核心的 skill 之后,那我后续会去解决三个问题。第一个问题就是权的问题,因为大家都知道这类竞品竞品分析如果大家有做过的,有一个非常忌讳的点,对吧?你可以这个东西呢?你可以,呃, 比别人差,对吧?但是你不能胡说,就是切记的东西就是你 ai 去给你伪造了很多的这个数据啊,插入到了你的这个真正的这个竞品分析报告里面,那这个时候我要保证它这个数据一定要是准确的,并且一定要是新的。所以说在这里面我做的第一个事情就是 我写了一个 skill, 这个 skill 他 只做一个事情,就是他把我们刚说的这十个 核心的这种我们的这种竞品所有的网站的结构啊,去做了这个获取,获取了之后的话,他会逐一每个页面去获取他网站里面的这些内容,然后把这些内容再交给我们的第一个 核心的这个 lm wiki 这个 skill, 然后去做这个知识的获取啊,做本地的私域知识化, 然后有了大而全的东西之后,那下一个就是解决的新的问题,因为这类产品我们刚刚说的,对吧?就是它的发展特别快,可能每隔一两天,对吧?它都会有更新和同步。那这个时候我又做了另一个 skill, 就是晨志 log 的 一个增量的一个追踪列啊,一个追踪列,那这个 skill 它的核心就是我会不断的,对吧?我可能每隔一两天,因为在 codework 里面,其实我们现在是支持了定时任务嘛,我可以设置,对吧?我每天定时的,我就让它去 检查我的这些竞品到底有没有新的更新,如果有我就把这些知识也获取回来,放到我的这个本,这个我自己的知识库里边。 那这两个知识保证了最新和最全之后,那我第三个保证的就是最可靠,就是我再让他去做竞品分析的时候,我自己相当于先内嵌了三十个竞品分析的维度,就是让他去对比,那这个其实就很涉及到我们自己 啊分析人员的这个所谓的业务知识了,对吧?就是你自己首先要能明确,那我希望他从哪些维度去分析,那这个时候我把这些维度灌输给了他,那他在分析的时候呢,也会基于他自己获取的这些知识去梳理啊。比如说,哎,某个竞品 他这个能力很好,对吧?但是其他的竞品是没有这个维度的,他会在我的这个维度之外,也把我的这个 维度就是他自己发现的这个维度给他加进去。那最后的话,就是他基于这一整套的流程,会把我的这个竞品分析整个的一个内容给我做输出,这个底下的话其实就是 他给我输出内容啊,这个大家可以看一下,就是第一个的话,他会把 coder 和剩余的那几个竞品每一项的这个差异维度对比出来,然后另外一个的话他也能自动地去给我获取相关的这种推荐。就说 coder 现在基于他的分析,他跟的一些友商产品,对吧?到底有哪些 劣势?这个其实对比的主要是劣势,就是他会按照 p 零、 p 一、 p 二给我把我的这个需要尽快去补齐的这些产品能力推送给我,那这个的时候我会把这些能力同步到我们的这个产业空间啊。 ok, 上面的话其实简单给大家去介绍了几个例子,然后接下来的话我们来重点看一下,就是那我们的企业级客户实际上再去落地 ai coding 的 时候,那我们到底有哪些的问题,或者是大家关注的点,或者是对 我们企业级用户的一些阻设点啊?到底应该怎么去解决?首先的话我们先来看一下就是 coder 整个的一个产品的一个全景图啊,产品的一个全景图,因为我发现确实啊,包括我们可能有一些有部分的一线同学对这个东西有点模糊啊。其实 coder 现在我们整个形态上是分了四种形态, 一个的话是我们的 coder 的 ide, 就是 我们默认就支持了一个 ide 的 形态,这个时其实是对前端同学是比较友好的。然后另外一个的话就是我们支持了 jeffrey 系列的一个插件,就为什么要做这个东西,主要原因就是因为大家都知道阿里本身就是很多同学都是 java 系的,对吧?他们 天然的喜欢像 i d e a 这类的呃编码工具啊,他们不想切,那他们还是希望在他们当前的这个编码环境下,能够使用到我们的这些 ai 能力,对吧?所以是我们单独去做了一个 g b 的 一个 呃插件。然后第三个的话就是命令行的形态,命令行这个形态其实实话讲在 c c 出来之前,这个形态其实提的人很少,对吧?但是 c c 出来了之后 我们会发现啊,就是很多企业都被 cc 教育了,对吧?就之前可能在一年前啊,就我们跟很多企业去聊的时候,大家用 cc 的 这种形态,就是用 命令行的形态的同学还是很少的。但是现在其实很多企业我们知道是大家也在逐步地去接受啊,命令行的这个形态,但是命令行的这个形态其实现在我们更多的会把它用在集成的场景。 这个之前跟我们武汉的这个企业聊的时候,比如说大家提的,对吧?就是现在 ai 生成的代码很多,我在通过人工 review 的 方式,这个不现实,对吧?我希望能够让 ai 帮我去 review 啊这个代码,那这个时候我们就可以把我们的这个 c r i 形态嵌到你自己的这个代码库里面, 相当于后续我去再做呃 pr 或者是模尺五块四的时候,我可以直接去调用我们的 code c l i 来去帮大家去做这种所谓的这个代码儿评选,这个是一个非常常见的场景。另另外一个的话就是跟我 d o p s 的 c i c d 的 工具去做集成,譬如说 我让他跟我的这个 c i c d 工具集成,去做一些日制的分析啊,譬如说我编辑报错了啊,我线上环境出现了问题,那这个时候我可以直接相当于把日制接过来,对吧?我直接在我的 theops 工具里面,然后让他去帮我去做相应的定位,帮我去做分析。其实这个我们有一个 呃实际的落地的案例啊,就是大家如果有用过 coder 的, 对吧?我们一般都会跟客户讲说,如果你在使用 coder 的 过程中出现了问题,那我们希望你点击右上角的这个问题反馈,对吧?然后我们会 去处理那这个问题反馈,其实现在整体就已经接入到了我们的这个 ko 二的 c r i。 也就说大家提了这个问题之后,它后台默认的会拉起这个 agent, 自动地帮大家去分析你的问题,然后查你的日制,然后去做这种问题的根音的分析。如果确定它是一个 bug 的 话,它会自己去改这个代码儿, 改完了这个代码之后,它会自动的啊,去提交啊这个 word request, 然后后续的话研发可能相当于我它需要做的就是它来检测,或者是去做最后的这个 验收,对吧?就看 ai 改的到底对还是不对,来去做最后的合并就好了。这个其实大家想一下,对于这类产品这个能力是非常重要的, 因为每天用户提交的这种问题是极其庞大的,就是如果你靠人为去处理,对吧?基本上是处理不完的,而且会极大的去拖垮研发的精力,那现在的话,其实我们相当于把这个事情 交给了 c r i 去做之后,对吧?它整个的效率是从之前那研发自己去分析去判断,大概需要三十分钟一个 e c o, 那 现在大概用 ai 去做两分钟啊,它自己就可以搞定一个啊。 然后最后一种形态的话,就是 codework 这个形态了,这个其实我觉得应该更面向未来啊,当然个个人的一个一一个判定啊,就是因为像刚刚说的,其实, 呃,代码这个东西,它慢慢的其实在 ai 化了今天它会变成一个中间资产,对吧?其实越来越多的人可能不会去关注 啊,你中间的这个这个这个代码到底是写成什么样子,或者是是怎么生成的,大家最后要了其实都是一个交付物,所以说 后续的话我们都可以直接相当于基于 codework 的 这种形态啊,当然对于研发者和非研发者啊,都可以去使用,对吧?因为它的这个界面交互是非常友好的,那你只需要去相当于提出你就是一个甲方,对吧?你提出你的诉求,那他会帮你把这个诉求实现,而你不需要去关注它的这个中间过程。 ok, 然后接下来的话我们实际来看一下,当然这个是我这边可能跟很多企业去聊的时候,大家可能反馈过来可能比较多的一些问题啊主义的给大家去看一下, 就是企业落地这个 ai coding 的 时候啊,到底可能会有哪些的问题?第一个的话就是效果啊,大家可能会觉得,对吧?我在使用这个 ai coding 的 时候,为什么没有想象中的效果那么好? 呃,没有想象中的那么好,主要会体现在几个点,第一个点一般零到一现在都大家都不会去谈,对吧?因为零到一大家都会觉得 ai 的 效果还是非常不错的。 这种一般所谓的效果不好,大家会集中在我企业的一些既有的一些老项目上啊,尤其是这些老项目,可能现在又很少有人去维护了,对吧?那突然说我现在有一个需求或是有一个 bug 要去处理,那大家会发现啊, ai 的 好像效果没有想象中那么好。 还有一个的话就是在一些复杂场景,因为在简单场景下,我至少我现在接触的客户也没有人去挑战,对吧?就是我直接通过 web 扣定的方式,我让 ai 去干,他一般都会干的比较好,但是很多企业都会说,对吧? 我这场景是比较复杂的啊,我是一个复杂场景,因为我这业务就是比较复杂的,那这个时候我有没有什么比较好的方式能够让 ai 的 效果表现的比较好? 这个是第一块儿算,我不拿预期,然后第二块儿的话就是知识管理的缺失。呃,这个的话其实之前提的也很多啊,对吧?譬如说很多企业说, 那我企业有自己的自研的这种前端的这种组建啊,对吧?我有自己自研的框架,那我后续让 ai 去生成代码的时候,你不要给我瞎生成,对吧?我需要你 遵循或者是参考我企业自研的这套框架体系来去帮我生成,那这个时候我应该怎么去做?还有一个的话就是,呃,不管是在企业内部,对吧?我们人去写代码,还是说我让 ai 去写代码, 大家肯定都是希望你能够遵循企业的规范去写这个代码,对吧?那之前可能企业有大量的这种所谓的规范文档,那人在写的时候可能大家就不去看,对吧?但是人有一个好处就是我写的越来越多,我对企业越来越熟悉,那我自然而然就学会了,对吧?那这个时候我怎么来要求 ai, 他去写这个代码的时候,也能够去符合我企业的这个规范的要求啊?这个是上面的两个挑战,然后下面的话就是大家对于基础保障的一些要求了啊,譬如说 安全合规啊,这个是我,我听到了应该也是非常多的,对吧?那到底是我们用你这个产品,我的代码,这个资产的安全性怎么去保障啊? 对吧?那我后续的我有一些敏感信息,对吧?我不想让它去跟模型交互,那我应该怎么去处理啊?类似于这种,那第二个的话,就是,呃,团队的接受度,我不知道大家有没有遇到这个问题啊? 给大家举个例子啊,我之前有个,有个客户啊,有个客户他们之前采购了一套 ai coding 的 工具,但是这套 ai coding 工具企业 发现买回去之后大家不用,大家不用,那为什么不用呢?他们就去调研了几个不用的同学,这几个同学说,对吧? 你这你采购了这套工具呢啊?确实是我需要的,但是呢他的这个效果啊,达不到我的预期啊,达不到我的预期,那他之前可能用过一些更好的效果的一些工具,那这个时候我们现在接触的企业的情况是,如果你的这个工具效果不好,对吧?他可能宁愿不用, 他会自己想办法,对吧?走一些别的渠道,那他会用一些他自己认为效果更好的工具产品啊。 然后第三个的话就是落地策略,这个也是可能大家比较关心的,对吧?那我企业买了这套东西之后,我怎么能够让我下面的同学 啊,能够更好的用起来,而不是去浪费啊?那最后一个其实就是成本了,成本了,呃,我不知道我们同学用 ko 二的过程中有没有人反馈,对吧?就我这边接到的这个诉求,是说大家觉得这个 codis 的 消耗有点快,对吧?那有没有一些所谓的这种实践, 能够让大家把这个 codis 的 这个消耗,对吧?啊?消耗的慢一点啊,这个也会稍后给大家去讲一下啊,那我们逐逐个来看一下。 首先的话就是第一个点效果的问题,对吧?就是尤其是大家反馈说我对一些老项目,对吧?它的效果表现不友好, 那其实在 call 店里面的话,其实我们是专门去做了,因为大家都知道这类 ai 定的工具,它的最核心的啊,一个影响啊,就是模型嘛,这个没有什么好避讳的,对吧?它可能很大一部分的效果都是在模型上,你模型效果好 啊,就会直接决定你这个工具的上限嘛。但是还有一类的话,那除了模型之外,对吧?那大家也会发现说,那你 coder 接了这个模型,那其他的厂商也接了这个模型,对吧?那我为什么要用你?那这个就要看到我们的这个工程化的能力啊, 就是同样一个很聪明的大脑,对吧?那你给他的输入不一样啊,对吧?你给他的输入不一样,譬如说那 coder 我 可以给他 这个问题更精准的上下文,那这个时候他回答的效果啊,也会更好。那我们在这里做的其实就是这个事情,就是这个事情就是我们会通过类似于像,譬如说大家打开 coder 的 时候,对吧?我会基于你的整个的 啊,大的项目啊,去做整个的一个锁影像量化啊,包括去做一些代码图谱,包括你在提交的时候,对吧?我会去做一些可密的图谱,当然这个都是我们内嵌到我们 coder 这个工具里面的,其实不需要大家关注,它会自动的去做这个事情啊。 然后另外一个的话就是,呃,我们的一些差异化的能力啊,就是大家可能会问的,对吧?那你有什么差异化的能力能说你这块儿做的比别人好?第一个的话就是 repowery, repowery 这个其实这个能力是 我们很多企业非常 buy in 的 一个能力啊,非常 buy in 的 一个能力,这个能力它会解决什么问题呢?会解决什么问题?就说 我拿到了一个非常大的一个老项目,对吧?那这个时候大家面临的一个问题,就是说 ai 对 你的这个老项目它的了解是不够的啊,了解不够就会导致说你后续你给他下达了你认为非常精准的这个指令之后, 那 ai 给我们反馈的效果啊,并不如预期,并不如预期。那这个时候我们要解决的就是说我怎么能够让 ai 对 我的这个老项目啊,去做一个更加全面、更加好的理解, 那这个时候就可以用到我们的这个 repoviki, 我 们的这个 repoviki 相当于是说我们在让 ai 干活之前,对吧?我先给了它一个基于我这个整个大的项目的一个全景图,一个全景图,那它后续我再给他诉求的时候,对吧?它可以基于这个全景图去查,去查,譬如说我的这个诉求, 它应该去改我这个代码库下的哪个模块,里面的哪个文件的哪些代码啊,这样的话就会更加的精准。 还有一个的话就是记忆系统,记忆系统,记忆系统这个事情其实,呃,像最近像 astropik, 包括小龙虾会提的比较多一点,但,但是其实在 coder 或者是我们的灵码里面, 我们很早一开始的时候,其实我们就有这套记忆系统啊,这套记忆系统会解决什么问题呢?就是说会让大家在用这个工具的时候,对吧?它不是一个小白工具,就虽然说这个工具能力很强,但是大家接受不了的一个点是说那我每天用这个工具,对吧?我发现它都跟 刚打开一样,对吧?都跟刚打开一样,他完全不了解我,那这套记忆系统其实就是解决这个问题的,就说后续随着大家跟扣点的交互越来越多 啊,他对你的了解也会越来越多,譬如说你的编码风格啊,你的用户的偏好,你的这些项目的一些架构,你的一些踩坑的经验,他可以保证是说你用的时间越久,在模型和工具不切换的情况下啊,他的效果也会变得越来越好,也会变得越来越好。 然后最后一个的话就是,呃, search 了, search 的 话其实相当于上面,对吧?我给他提供了这种充足的上下文,那你后续的话,他再去问问题的时候,他会自动的啊,根据你的这个诉求去调用啊,不同的这种解锁方式啊,去找到他应该找到的这种精准上下文 啊,具体来给大家看一下啊。第一个的话就是这个我们刚刚说的这个 repo, 这个 repo repo 这 repower wiki 的 话,其实大家在这里一般问的比较多的两个问题,第一个的话就是,呃这个 repower wiki, 呃它生成了之后,对吧?我怎么去做这个版本管理?我怎么去做版本管理?这个 repower wiki 大家可以理解为它生成了之后,其实它就是生成了一堆一批量的这个 markdown 的 文档, 这个 macdunk 的 文档其实是可以跟着我们的代码一起提交到代码库里面啊,去做版本控制的。那也就是说后续其实我针对于一个大的项目,对吧?我不需要每一个人针对于这个大的项目都去生成一遍 啊,这个 repo wiki 只需要有一个人生成了之后,你把这个东西提交上去,对吧?那后续其他同学只需要荡下来啊,就可以直接去用了 啊。第二个问题的话就是增量更新,增量更新,那很多同学是说,对吧?我这个项目我因为我会不断的去演绎嘛,我会添加新的功能, 那我加了这种新的功能之后,是不是需要我去手动去增补这个 viki? 这个也是不需要的,就是你的代码发生了变更之后啊,它会自动的去比对啊,看你当前的 viki 和你的代码是不是有差别,如果有的话,它也会可以自动的去做这种同步更新啊。 然后上面是讲的效果的上下文的问题啊,就是对项目的理解的问题,然后接下来我们来看一下,就是, 呃,使用方式的问题,其实这个在二五年的时候为什么说对吧?学不完,根本学不完。其实这个在二五年的时候大家提的还很多,对吧?当时我记得在二五年的时候,很多大家出去分享的时候的这个主题,就是啊,从 web coding 对 吧? 到 s p d, 但是今年你会发现提的人少了,对吧?但是这个其实在企业实际落地的时候,基本上包括我们自己团队,对吧?大家都绕不开,都绕不开,就是因为为什么提的人少了,就是因为我们认为它已经变成了一个基友的实践啊,就大家都在这么去做了啊, 这里面其实落地下来到它的核心其实就是 spec, 然后落地到我们的这个产品能力里面,就是在 头段里面其实我们有一个专门的模式啊,就是叫 quest, quest 的 话大家简单理解就是它是基于我们所谓的 sdd 的 啊这种理念,对吧?去做了一个产品化的能力。再简单的理解就是 我们给大家相当于在这个能力里面封装了各种各样的一些 skill, 对 吧?就不需要大家自己对 sdd 或者这些 skill 有 什么样的了解或者是封装。你直接去用 我们的这个能力啊,它开箱即用啊,开箱即用,你相当于就会按照我们的这个 sdd 的 整套的一些实践理念啊,去帮你去做,实现。我们现在很多研发基本上在一些复杂任务的时候啊,大家都会通过这种所谓的快速模式啊去落地, 然后还有一个的话,就是最近应该就这一个模式,就是专家团的模式,我觉得专家团的模式可能是 更面向于未来的一个模式啊,就是,呃,它其实就是应对了我们所谓的胡团队的这个理念,胡团队胡代码的这个理念,对吧?就是相当于我们在 coder 里面已经内嵌了我们研发需要的各种各样的一些领域的专家 啊,从我们的这个需求分析啊,到我们的这个设计,到我们的这个前后端的代码的编辑,到测试,对吧?他已经把这些专家都欠进去了,那其实需要我们做的是什么呢?就是你只要把这个诉求给他,对吧?他完全可以端到端的帮我把这个事情搞定,那以前大家可以想一下,对吧?我以前在 agent 模式下的时候,那我怎么去做,对吧?我可能先把诉求给他,他跟我交互,对吧?他做完了之后我来去 check, 或者是我再去掉啊,所谓的这种啊 code review 或者是测试的这种智能体,然后再一步步往下走,对吧?但专家团模式不一样, 专家团模式大家可以理解为在专家团模式下,它有个非常牛的啊,一个 team leader 啊,这个任务你相当于就是交给了这个 team leader, 这个 team leader 他的脑子非常好使啊,非常聪明啊,他会去调用,根据你给他的这个诉求,他会完成 本来应该属于你干的活,就所有的沟通的事情啊,你不需要去跟下面的这些一个个的专家去沟通,你只需要去跟这个 team leader 沟通,这个 team leader 相当于他会基于你的诉求去调用下面不同的专家来帮你实现啊,你对他的这个要求, ok, 然后接下来的话就是在呃规范这个规范,这个其实确实在企业内部是一个老生常谈的问题啊,而且这个落地的现在的方案应该是非常成熟的啊,是非常成熟的,就是只要我们企业涉及到我有一些私域的东西,对吧?不管你是编码规范, 还是你有一些自研的这种呃前端的组件啊,中间件啊,或者是你的框架,对吧?基本上都是这套逻辑下来的,就是你可以如果企业我们本身有这种文档规范,对吧?你可以先让 ai 去理解你的这些文档规范 啊,去让它去总结,去抽取,然后啊分装成譬如说我们现在的这种 rule 啊,或者是 skill, 对 吧?然后后续我在这种场景下,让直接让 ai 去基于我们的这套 rule 和 skill 啊,然后直接去生成就好了。那这个时候其实 大家想一下,这个是相当于我前置,对吧?就是我让它在生成的时候就更加符合我的规范啊,就是一开始 还有一种的话是后置,后置就是说我生成完了之后,对吧?我怎么来确保它的质量确实是符合我的规范的?那这个时候你可以再给他加后置的逻辑,譬如说它实现完了之后,对吧?就类似于现在我们经常说的哈尼斯,对吧? 就是它实现完了之后,我再让它去掉相关的这种评测的这种 skill 也好,或者是评测的这种 agent 也好,或者评测的这种方法也好,我让它自己去验证它实现写出来的这个东西到底满不满足我的这个标准的要求,如果不满足,对吧?我就让它再重新写,一直 到它可以满足我的这个标准为止啊。这个是后置,这个现在前后置大家都可以,如果对要求高的,对吧?我们其实都可以往里去加 啊。这个的话是之前因为很多企业去问,对吧?譬如说我要去写这种 rule, 或者是我要去写这种 skill, 对 吧?我们有没有一些比较好的? 呃,大家经常会说,对吧?阿里的所谓的这种实践能够让大家去做一些参考,其实这个我们都已经放到了那个 guitar 上,就如果大家感兴趣的,到时候可以自己去参考一下。但是其实现在 这类内容基本上现在人写的很少了啊,人写的很少了,实话讲就是这类东西现在基本上大家都是我有了相关的诉求,对吧?我把背景知识给 ai, 让 ai 去写, ai 写完了之后我人工去做校验和填补就好了啊。 然后接下来可能有一些期货给大家讲一下啊,就是这个也是企业问的比较多的,企业问的比较多的,因为如果之前有用过领马的这个企业,大家知道之前在领马里面其实我们有一个 叫 reg 知识库,对吧? reg 知识库,那这个 reg 知识库我们现在在逐步的在下线,对吧?主要的原因是因为我们会发现很少有企业,虽然我们上了这个能力,对吧?但是用起来的企业非常少,非常少。原因的话就是像我们说的,对吧?企业觉得这个东西的 投入产出比太低了,就是他前期需要自己做的事情很多,那后期的收益呢?感觉又没有那么高,而且需要他投入自己的这种 精力,就是投入自己的人力去做这个事情。所以说在扩展里面,我们会上一个新的一个企业知识库能力叫企业知识引擎,企业知识引擎,这个企业知识引擎大家简单的理解它它是干什么的?就是我们现在不是支持了个人记忆,对吧?也就说我们的个同学后续再去跟 ai 去交互的时候,它会沉淀很多很多的这种我们所谓的这种踩坑经验啊啊、编码规范啊,或者是你对项目的这些架构理解啊等等这么一些知识。但这个知识现在只是沉淀到你的个人的 pc 端的,对吧?也就说只有你自己是能够 用到这个知识的,或者是只有你自己才能够享受到你的这个所谓的知识积淀的。那后续这个东西它更多的就是说我会相当于把你个人的这些知识进行抽取和总结,总结成企业自己的 自进化出来一个企业自己的这种知识库啊,它是自进化的,不需要你人为的干预,你只需要去把这个能力打开,对吧?它会自己长出来这么一个知识库。那后续的话它有一个好处,就是说 那我后续再有了我的这个新人入职的时候,因为大家都知道新人我拿到了这个工具,他肯定是一个新的,对吧?他没有任何所谓的沉淀,那这个时候他也能够基于我们的这个企业知识引擎,相当于享受到企业现在我们沉淀的这波知识的福利啊。 知识的福利其实极大的,他做了一个事情,就是把我们所谓的这种私域的个人知识去做了显性化啊,去做了显性化,相当于是我们后续新来的人,对吧?啊?他一来他相当于就站在了我们所谓的巨人的肩膀上啊。 然后这个的话是企业的知识引擎后续大概的一个产品的形态啊,这个大家可以先看一下啊。 ok, 上面的话其实主要是讲了两个,对吧?一个是效果,一个是思域知识的对接。然后接下来的话我们来去看一下,大家比较关注的就是企业保障啊,企业保障就是上面那些能力的话,其实不管是 在我们企业段还是个人段,大家都很关心嘛,那这些的话可能是个人不太关心的吧。但是企业非常关心的第一个的话就是安全和隐私,安全和隐私这个基本上尤其是我们的一些大客户,对吧?大家非常非常的关注,所以重点给大家看一下。 第一个的话就是我们在 coder 的 这个 tims 版本里面,其实我们是支持了一个隐私优先的模式的啊,隐私优先的模式,这个模式它是一个强管控模式,也就是说只要我的企业管理员在企业管理后台 打开了这个隐私优先模式,那我企业下的所有的成员默认会被强制为 隐私优先模式,那在这个模式下啊,这个在企业管理后台大家可以直接看到,就是我们会承诺不去存储大家的这个数据,也不会用大家的这个数据去做二次训练。 这里大家问的最多的一个问题就是说那 coder 你 用了全球的 sata 模型,对吧?你怎么来保证说那后面对接的这些模型厂商他不会用你这些数据?我们会跟我们的这些所谓的这种模型厂商去签我们的这种所谓的零数据保留协议啊,就是 cdr 的 协议,这个如果大家用过类似的产品应该都不太陌生啊。 然后还有一个的话,就是在 code 里面大家问的另外一个比较多的问题就是,呃,单点登录,那其实在企业版里面我们现在也支持了,相当于可以直接和企业限额的账号体系打通去做单点登录, 这里会有一个好处啊。第一个好处的话就是我们支持了域名拦截和过滤,也就说你可以提前把你企业这个域名配置到我们的企业管理后台,那后续的话,你再邀请成员的时候,如果他不是你企业的域名的,对吧?比如说我检测到现在新加了这个账号,他的邮箱,他的 后缀不符合你的域名的要求,他会直接被拦截掉啊,直接加不进来。还有一个大家问的特别多的,上午刚聊了一个客户,就就在聊这个诉求,对吧? 有一些企业是说,我只希望我下面的同学,对吧?在我企业的内网环境下啊,就所谓我们自己的这个 ip 白名单的范围之内能去登录我的这个企业的账号,那这个时候就可以结合我们的 sso 加我们企业自己的这种 i d p 服务白名单限制的能力来去实现这个能力啊。 然后还有一个的话,这个也是一个期货的能力啊,但是也也快上了,也快上了,就是这个,现在在阿里集团我们是这样的,因为 我相信很多大的企业大家都有所谓的这种啊仓库秘籍嘛,就是我不太可能说我企一个企业下,对吧?我所有的这种代码仓库或者所有的项目,它都是同一个保密 level 的, 对吧? 嗯,在阿里也是一样的,那我们集团现在相当于我们的代码库是分了 c 一、 c 二、 c 三三个级别,三个级别,那我们目前的这个限制是这样的,就是 c 一、 c 二这类低密集的代码仓库,那我不限制员工,对吧?你爱用什么模型用什么模型都可以啊,随便搞。 那你 c 三类的我们认为是高密集的这种代码库的时候,那我们现在的限制是这类代码库只允许往我们自己摆列上的这种代码库,只允许往我们自己摆列上的这种代码库。那扣点, 因为现在在整个阿里集团我们都在用 cloud, 对 吧?那我们现在相当于在集团内是已经灰度了这个能力,那后续的话对企业开放也是一样的,相当于企业管理员在后台在 cloud 的 这个服务端,它可以去维护两张表,第一张表的话就是可以维护你企业下了这些代码仓库, 它的这个所谓的密集,对吧?它到底是一个高密集的还是一个非高密集的,你可以去维护你的这个代码仓库和密集的这个映设表, 那另外一个表的话就是你可以来维护你不同密集的代码仓库,它们可以走什么样的模型的路由的策略 啊?这样的话其实就可以保障,对吧?后续我们低密集的这代码库啊,我可以用一些所谓的效果优先,对吧?我就是用一些好的模型,那我高密集的这个代码库,那我就可以呃,用一些受我企业信任或者是限制的模型,当然这个能力它在上的时候也会搭配着我们的 b y、 o k 的 能力, 那就是后续我们企业版也会让企业去接一些我们自己的渠道的模型进来啊。 然后再接下来的话,就是也是安全相关的,或者是审计相关的,就是在零码里面,如果大家之前有我们的企业版用户,对吧?就这个审计这个诉求大家提的非常多啊,或者是过滤这个诉求,那之前在零码里面,其实我们是通过这个过滤器去做的,但是在 code 里面,其实我们现在有了新的这个方案,其实就是现在我们大家一般用的比较多的这种 hwk 的 方案啊,就是我可以通过 hwk 的 这种机制,对吧?我再让它在不同的 action 下可以触发我不同的这种脚本 啊,从而我可以去做各种各样的一些设置,对吧?譬如说可能企业比较关注的一个是交互内容的审计,交互内容的审计这个其实尤其是, 嗯,在一些譬如说汽车、金融啊、政企,就大家可能对这类要求很高啊,就是他们会有专门的安全团队啊,就会提这个诉求。因为在这类企业,其实这个工具能不能用它最后的决定权不在我们实际的用户手里, 而是安全团队有一票否决权,对吧?就是他觉得你安全不过关,那他就不同意,那你就用不了。所以说这类安全团队一般他们的一个诉求就是说我是需要能审计的,就是我平常不会去看你的内容,对吧?但是一旦出了问题,我是能够去追溯的,那这个时候他就要求说他要能够把下面的这些交互的信息 放到企业他们安全团队的审计平台里面,他们方便他们后续去做审计啊,这个能力其实现在就可以通过户口去实现。 然后还有一类的话就是敏感信息的拦截,这个也是大家提的非常多的,就譬如说我在跟模型交互的时候,对吧?举个例子,像我的身份证号、银行卡号 啊,或者是我一些敏感人的名字,对吧?我都是不允许去跟模型交互的。那这个时候的话,就是我们也可以通过户客去做拦截,比如说我在让他跟模型交互之前,对吧?我先让他去走一下我的脚本来,去看一下 它里面交互这个内容是不是涉及到了我企业所设置的这种所谓的敏感信息。但这个敏感信息的规则是企业自己配的啊,就是你们想写成什么样都可以,那如果是涉及了,对吧?我就可以直接给他拦截啊,不让他跟模型去交互啊。 还有一个的话就是自进化了,其实这个自进化现在在很多场景下大家都会用到,譬如说像我一开始给大家去做了竞品分析的那个场景,就譬如说我现在在每一轮让他竞品分析了之后,对吧?我都会让他去总结一下他在这一轮的竞品分析里面,他自己反思一下,对吧?他有什么样的问题。 然后每隔一段时间我我会让他把这个问题记到我的一个 markdown 的 文档里面,那每隔一段时间,对吧?我会在 让我的这个呃模型来去读这个 markdown 的 文档去校验啊,我现在用到的这些 skill 到底啊,有没有哪些点是可以去优化的啊?这样的话可以让我这个 skill 啊不断地去变得越来越强。 然后这里给大家去截了几个几个示意图啊,就是在安全合规这一块的吧,就是大家可能平常问的比较多的啊,就譬如说 敏感信息过滤,对吧?这个给这个都是我拿我自己的环境给大家去跑的一些呃演示啊,就譬如说,对吧?我发了一个身份证号,那这个时候它可以直接检测出来,然后我就直接给你拦截掉,然后我告诉你你这个涉及到了企业的敏感信息。 然后还有一个的话就是审计,审计对吧?就是我需要知道那我的这个同学到底和模型交互了是些什么样的内容,当然这个交互内容可以分输入和输出,对吧?就是你可以去审你的输入,你也可以去审模型的输出,这个现在都是可以获取的到的。还有一个的话,这个也是我之前接触了一些 呃大客户,对吧?他们提的就是说他们后续想去做一些所谓的画像,画像,因为大家都知道现在企业内部,对吧?尤其是像 skill 啊、 mcp 啊,自定义的 agent 呀,这些东西很多非常多,那企业想知道,对吧?那我的同学到底在用哪些 skill 啊?在用哪些 mcp 的 工具?在用哪些这种 sub agent? 那我后续希望去做一个全面的统计,而且我也希望形成我的这些用户画像,对吧?譬如说啊,我这个同学可能是这么样一个用户画像,那个同学是这样一个用户画像,而且后续我也希望经过这 些精细化的数据,能够给企业的这些 skill、 mcp 或者是我的 subagent, 对 吧?去提供一些严谨的方向,就譬如说那火了,对吧?我就继续去研究,那大家不用了,对吧?那我就可能就直接下掉了啊,那现在也可以去做这种精细化的这种数据的统计, ok, 然后上面的话是安全合规相关的,然后再接下来就是成本相关的,就是我们所谓的 r o i 了,对吧? 然后 r o i 这块的话,其实是分两部分啊,一块的话是企业在采购的时候我花的钱,对吧?我花的钱就是我,我肯定是希望, 呃,我花的钱越少,对吧?效果越好啊,就是两边抢嘛,就这样的话,它的这个 r o i 最高,然后在花了钱这块的话, 因为定价这个东西,对吧?这个价价格就是在这儿定着呢,我们这个没有办法改,但是我们能改的就是在 credits 啊,一定量的情况下,对吧?我怎么能够把 credits 啊?所谓的这个效益最大化,效益最大化。这里面的话,其实大家可能对模型消耗的一些基础的一些 机制有一些了解啊,就是譬如说我会有缓存,对吧?那我会有我的这个输入有输出,这里面其实最便宜的就是你命运中缓存的时候啊,最贵的就是 你永远只跟模型说两句话,你其他的全靠模型猜,对吧?那他给你一大堆的这种输出的时候,这种情况下下是最贵的,就大家这个基础的这个这个机制还是要了解。那基于这个机制的话,那我们其实下面的这五个所谓的节省许可制的时间也都是围绕这个机制的。 第一个的话就是大家要有呃新开所谓的任务窗口的这个习惯啊,因为,呃有些同学,对吧?就是他可能,嗯 没有这个习惯啊,倒不能说懒,但应该就是没有这个习惯,就是我就习惯了我在一个窗口下,对吧?我噼里啪啦的,反正各种问嘛,就是有诉求我就往上抛,有诉求我就往上抛,但是大家都知道现在模型它整个这个上下文肯定你再大它也是有限的,对吧? 随着你上下文越来越大之后,尤其是本身你的这些任务之间的关联性又不强的时候,他其实会对模型去造成一些干扰啊,或者是污染的。 那这里的话其实一个是浪费钱,一个是他的速度在变慢,另外一个的话是效果在变差,所以我们的建议就是说你不同的,对吧?比如说这两个任务本身也没什么关系,那我就及时的去呃清上下文,就建一个新的任务,在新的任务里面再让他去实现, 然后还有一个的话,就是这个,这个我上来之前我们的这个 s a 同学还特地嘱咐我一句,让我重点讲一下这个,对吧?就是合理的去选择模型,合理的去选择模型,就是我相信我们现在很多企业可能 在用扣带的时候觉得非常有优势的,一一个点就是效果特别好啊,这个确实是这样的,这个我们很多企业反馈也是这样的,主要的原因就是因为我们可以接全球的 sata 模型嘛,但是大家都知道效果和成本 啊,一定是成正比的,对吧?就是它的效果好,那必然是你花的钱也是多的。所以说在这里的话,我们有一个建议,就是说, 呃,虽然是可能后续大家在用的时候都是企业花钱,对吧?但是我们也不建议说大家就是把着我们最好的那个模式,对吧?我们有一个即日模式啊,就是一顿可着即日模式用,因为大家可以想一下, 正常我们的 auto 模式下,它其实背后是有一堆的啊模型的资源池,然后我们前面其实是有一个小的模型去做意图判定,就是它会根据你用户的输入来判定它后面到底调哪个模型比较好。这个 auto 模式的效果其实是非常好的, 就正常我们建议大家一般都是先用 auto 模式, auto 模式的 credits 的 消耗倍率是一, 但是极致模式极致模式它的倍率消耗是一点六,这个大家可以想一下,对吧?就是我同样一个任务,我可能用 auto 啊,对吧?我我可以做一百次, 但是如果你切换成极致啊,那可能就只能做五十次了啊,只能做五十次,所以说我们的建议啊,就是后续我们再去做我们相关的一些诉求的时候,如果你觉得这个事情很难,这个难的判定标准,就说一开始我再让他去给我出 spec 或者是搭建一些框架的时候,对吧?啊?那这个时候我需要他精准,因为我不需要,我不希望来回去返工,来回去跟他讨论,我希望他一次性能够猜中 我想要干什么,并且给我一个我非常认可的这么一套方案。那这个时候我们建议大家就是用极致,但是后面这套方案已经定了,或者是这个框架已经定了,那只是说往里去填血肉的时候,对吧? 啊?说的直白一点,就后面就是,对吧?我照着我的详详设啊,去写代码的时候,其实你这个时候找个 p 五,找个 p 六,找个 p 七,甚至找个 p 八去写啊,它的差别都不大,那这个时候我们就建议大家可以切到, 譬如说我们国内的这些骚塔,对吧?譬如说我们的千万三点六 plus 啊, g r m 五点一等等啊,这些模型上面 还有一个场景的话,就是交叉绘画的场景,交叉绘画的场景这个问的也比较多啊,就是 有的同学会说,对吧?就是我在一个绘画之内,我的内容就是很多啊,就是很多,那这个时候他避免不了,他这上下文就是不够了,我应该怎么办,对吧?这个时候我们建议大家让模型 去做一次所谓的总结和规档,就说如果你确实说我我分不开,对吧?我就是要在这个绘画里面要给他搞定,我们不建议大家一定要去处罚他的这个自动压缩啊,因为自动压缩有时候会去做一些 上下文的丢失,我们的建议是你可以让模型去给你做一些阶段性的总结,但是这个总结你一定要突出你希望它保留哪些重点,对吧?啊?保留哪些重点?那这个时候的话,你可以把它总结的这些内容再带到你的下一次绘画里面啊,作为一个新的上下文的输入就好。 ok, 上面的话是讲的在买的时候或者是用的时候怎么去节省成本,然后还有一个就是这个管理层很关注的,对吧?就是你实际上用了之后,到底对企业啊有多大的这个提效或者是帮助呢? 这个的话其实在之前大概两三年之前,对吧?我们大家到讨论的都还是所谓的 ai 代码生成占比,这个我相信在座的各位肯定对这个指标不陌生啊, 这个 ai 上升占比更多的是局限到你的本地的啊,你的本地的它其实是基于你的端侧的,比如说 ai 到底在你的这个端侧,你的本地环境下 啊,它帮你去生成了多少的代码啊?它的占比是多少?但是对于企业来讲,很多企业反馈的一个问题就是说, 哎,他说雅木这个这个指标好像看着有点高哈,就是感觉很多企业感觉看到这个指标的时候都是百分之六七十,对吧?甚至有百分之七八十的,那跟实际的情况,企业的觉察的情况是不符的,因为企业认为说我实际到运行到生产环境里面的代码,对吧?并没有这么多 是 ai 生成的,所以说我们在 code 里面我们新上了一个指标,叫提交代码的 ai 占比,也就说我们会看它实际提交到你代码库里的代码到底有多少是 ai 生成的,那这个时候它跟我们实际的情况就会非常接近了。 然后这里的话是一个也是一个老生常谈的问题啊,就是我们虽然在 code 里面,包括零码里面,我们会提供一些报表, 但是因为每一个企业后续对报表的这个诉求都不一样,对吧?比如说有的企业更侧重于这个,有的企业更侧重于这个,总会对报表提一些各种各样的诉求。所以说对于报表这一块的话,我们现在更多的一个策略就是在 coder 的 报表里面,我们更多的是透, 更多地去透出一些核心指标,那如果说企业有更多的其他的一些关注的指标,对吧?我们都会以开放 a p i 的 形式啊,开放出来就是所有的这种原数据,对吧?我们开给大家,那你这个报表想做成什么样子,你就可以做成什么样子。 这个就是我们前段时间有一个大客户啊,海信那边啊,他们自己去做了一个报表,就做了,极其的华丽啊,就是基本上企业想看的,对吧?啊?各种维度,譬如说我的这个 credis 啊,哪些部门花了多少啊?每个人花了多少,就因为大家要去做分账、成本分摊,对吧? 啊?或者是我这个 credis 到底是花到了哪些模式下?我极致花了多少?我 auto 花了多少?我这个模型花了多少,对吧?它其实都是可以细化出来的。 然后,呃最后一部分的话就是案例啊,我好像讲的时间有点长了,就是快速把案例这块再同步一下,就是这个是我们 coder, 前段时间其实海信是我们的一个相对还是比较大的一个老客户了,就是他们之前, 呃也一直在用我们的领马,只是后面的话,他们觉得 coder 的 效果,因为他们觉得全球算法模型的效果会更好啊,就切到了 coder 上,其实它解决的问题的话跟我们刚刚讲的那些基本上都是一样的,我们刚刚也都讲过了, 第一个的话就是在一些老项目或者是复杂任务的场景下,对吧?就是我如果直接通过外部抠钉的时候,我效果不达预期,那我这个时候应该怎么做?那我们的建议方式对吧?就大家可以通过我们的这种快速的 s、 d、 d 的 模式,或者是通过我们新上的这种专家团啊,端到端的方式啊,去做一些尝试和改进, 然后效果其实是比较显著啊,就是目前,反正,呃我这边收到的反馈,是吧?就是有人说 coder 的, 可能会有人说 coder 的 creativity 效果比较快啊,但是很少有人说 coder 的 效果不好。 然后还有一个的话就是企业的知识激励和规范落地,其实这里的话,呃,就是像刚刚讲的,基本上这块的落地方案也都是比较成熟的,比较成熟的。第一个的话就是我们会先通过 report wiki 的 方式,对吧?让模型对你整个的大项目 有比较好的一个所谓的大局视野的厘交理解。另外一个的话就是我们会基于,对吧?我们的这个实际的企业内部的情况啊,让 ai 去帮我去整理出来我后续需要用到的这些 raw 啊,或者是 skill, 然后再落地到我实际的啊,下面的这个同学的实际的编码的这个场景里面去来保障,是说,对吧?一个是它可以省头坑吗?省头坑就是 我减少了来回返工的这个这个机会啊,而且的话我因为我有了这些东西的沉淀,就是模型对我本身企业的这些私域场景的理解也更加好啊,也更加好。 ok, 我 这边大概先分享的内容就这些。

我用了十分钟搭建了一个属于自己的作品集网站,不是静态页面,不是图片,而是可以真实交互的网页。最近深度体验了阿里刚刚发布的桌面智能体 coderwalk, 我 觉得特别适合设计师。以前做个人网站最头疼的其实不是设计, 而是不会前端,不会逗笑,不会搭网站。到了 ai 时代,很多设计师还在用 pdf 作品集,很难真正体现自己的专业能力。但这次我直接把我作品内容丢给 coderwalk, 只需要输入简单的风格要求,如果没有灵感也没有关系,里面内置了一百六十加的专业风格资产库,任你选择发送指令。 关键是他不是随便生成,他会和你确认网站的具体方向,比如会问你作品集给谁看,整体的调性,以及需要哪些内容板块是真的在帮你梳理网站的结构,最后生成的结果会直接以画笔圈出来,再输入修改要求, 哪改哪,实时调整。可以看到预览的效果,完成度已经非常落地了。不管你是用来找工作接私单,还是打造个人品牌,都会比 pdf 作品集更有专业感。确认页面风格后,直接让他帮忙发布网站,跟着流程就能快速发布,然后其他人就能访问到你的个人网站了。 而且还可以输出 react 加 vite 工程结构研发,拿着代码就能直接使用,效率拉满。 ai 时代,一个真正能体现个人能力的网站其实越来越重要了,赶紧来试试吧!


我上一个视频说编程的下一步不是辅助编程,而是可托管执行单元。比较有意思的是,视频发出去没几天,这条线突然变得非常明显, codex、 cloud code 以及 agent 都相继上了一个名叫 go 的 功能,用来跑长任务。它们功能上的差异,我给你汇总了一张表格, 不过我发现阿里最近发布的 code 一 零才是把长任务的省略与介入做到了一个新的高度。总体感觉非常适合安排 a 证的团队干活,而且交互体验做得非常好,这可能是目前最好的国产 ai id。 一。 我对扩展一零进行了长时间的实践,两天消耗了一个 pro 账号所有的积分。下面会有四个测试。我使用的是 glm 五点一模型或扩展 auto 模式,每个任务少则二十分钟,多则四十分钟,都有完整从零到一的记录,交互不错, agent 也能力很强。用上扩展一点零的这套 agent harness, 让国产的这些模型也表现出了不俗的效果。 一个 quest 左侧栏是一个任务单元,可并行。 下面我标注了他的整体页面,左蓝导航管理,中蓝绘画流,右蓝产物区,左边能看到任务列表,中间能看他怎么推进,右边能看到知识记忆产物。 第一件我让他做的是 readme 最佳实践研究,因为如果你要做开源项目,要做产品,要把自己的工具发布出去, readme 怎么写,官网怎么写,第一评怎么让人信任,都是需要考虑的。 我们前面是使用 export 专家团队模式来完成这个任务,并且起用了 spec, 这相当于一个任务计划书, agent 会组织团队成员按照这个计划书来做这个长任务。点击 spec 运行,你会看到多个子 agent 的 创建并开始运行, 而且右边有可缩化的画布卡片。在专家全景图可以看到每个子 agent 的 状态。专家团总共有四个成员,有三个调研员,一个全站工程师。三个调研员的角色很有考究, 一个是分析 github 高薪瑞米进行对标采样,一个是搜索行业文章及指南收集,另外一个更厉害,直接去找社交平台经验帖,都是实打实的实践。这三个人组合起来,对同一维度的研究会更加深入且有价值。最后一人负责整合输出 右边子 agent 的 画布,每个上下文都相当于一个聊天窗口,可以实时看到它们的滚动。另外,你还可以切换不同的仕图,可以看到文件最终成果。这些都可以帮助我们审查整个任务执行的中间过程以及产物。 值得注意的是,左侧栏的 quest 可以 同时并行多个任务。 最终的研究报告怎么样呢?我可以很负责任的告诉你,它比任何模型的 deep research 都好得多。如果你不相信的话,可以仔细看一下这个文档, 这与大语言模型直接生成或使用一些搜索引擎生成有明显的区别。当然,能做出这样一份研究报告也并非仅靠这个 quarter agent harness, 这完全是我们最开始提示词中有一份我自己过往做各种主题研究的 md 文档, 那其实是我的一个 skills 里面抽出来的,所以我做这个 readme 研究也完全是我有这个需求。这个文档可以替我省下许多时间。 酷的,还有知识引擎,这玩意如果真的能持续积累,会很适合长线工作。打开 knowledge 面板,自动生成的知识架构规范技术栈,你知道的,写代码是长线工作,做产品是长线工作,做内容也是长线工作。 redmi 任务总共耗费了三四十分钟,后面我们还有三个任务,由于时间原因不再一一演示,因为我把这些任务包含文字和视频,从零到一的写在了一篇文章里,感兴趣的可以去看看。好了,既然看到这了,这里觉得有帮助的话,随手点赞支持一下。想继续看到更多有价值的 ai 实践更新,可以给我个关注,感谢你。看到最后, 对于这个主题有想法的,欢迎评论区交流。

今天继续给大家推荐 q 的 walk 这个工具非常的好用。那这一讲呢,我们给大家分享一下它具体能干哪些工作。我认为把它梳理下来有三大类工作。第一类工作呢,就是整理你的电脑,我相信呢,很多人电脑里面的各种各样的文件是非常的混乱的,自己整理真的是非常辛苦, 但是不整理,你有的时候找一个文件找半天也找不到,那现在呢,有这个工具,它可以快速的把你所有的文件夹进行重新整理,重新分类。那这样呢,你再想找一个你想找的文件的时候呢,就非常快捷,也非常便捷,也可以让你的桌面呢变得非常干净,非常整洁。 第二个呢,它非常适合处理一些大的文档,一些复杂的一些文档。我举一个简单的例子,当然你写三十万字的机会可能不多,但是如果说你公司有二十个业务员,每个业务员 都给你发一个日报,你就可以让 qdworks 同时处理这二十份周报,然后找出中间的问题,给出不同的回复,这个是他非常擅长的。 你也可以在处理一个文档的时候,你突然发现另外一个文件夹里面有一篇文件,有几个表格是需要夹到这个文档中间来的, 你这个时候呢,就可以调用酷的 work, 让它自动添加,不需要你手动添加,这个呢也省去了我们大量的时间,大量的工作,所以说在处理文档上,我认为它是非常强大的。第三个呢就是写 ppt, 我 之前也介绍过很多写 ppt 的 工具, 很多人讲说这些 ppt 的 模板不好看呐,这些 ppt 没有办法做动画啦,这些 ppt 感觉没有那么专业啦!今天你有酷的 work, 它就可以帮你做到更多的工作。当然,现在它还是一个非常初级的版本, 但是呢,它已经可以做很复杂的表格,它可以做动态的一些演示图,它可以把你做的图的视例一集一集的展示出来, 显示出非常的这个专业。而且我认为像 cutwork 这样的一些工具,如果它想得到更大的发展,它一定会不断升级自己。那在 ppt 这一块呢,我认为它会做得越来越好,越来越专业。 那我已经连续三讲给大家分享了,如果你连续观看的话,至少可以帮助你省五百块钱以上的 talk 的 费用。所以说,我希望我的视频对你有价值。如果你觉得还不错,欢迎点赞,欢迎关注,谢谢大家!