粉丝3.0万获赞4.9万

兄弟们平替 cloud co worker 的 国产工具来了,国内直接访问,他就是阿里的 codework, 并且有了 codework, 你 也不用再花四千块去买 mac mini 折腾 cloudbot 了。哈喽,大家好,我是阿亮, 二零二六年的 ai, 已经从聊天进化到了能真正操作电脑干活的智能助手,如果说二零二六年,应该就是这些模型开始真正的落地干活的。原年 虽然 cloud code work 很 火,但大部分人呢,都没有体验过,因为 osraker 这个公司呢,对我们真的是太不友好了,更别提还有一百美金的订阅门槛。 好在阿里这次的跟进速度非常的快,就在刚刚,他们发布了搭载全球顶尖模型的 code work, 注意是全球的顶尖模型, 定位很明确,国产版 call work 就是 让每个人都可以拥有专属的 ai 助理。 call 的 work 呢不仅可以帮你进行日常的文件管理、数据处理,还可以写作画图、做 ppt, 甚至能帮你调研上市公司的财报,输出、投资建议。 第一时间我就上手进行了测试,真的实战能力非常非常的强,很能打,用户体验也是一级棒。 接下来带大家亲自上手感受一下。界面很清晰,符合我们的用户习惯,左侧是任务列表,右侧是对话区域, 然后最右侧这里还有一个可以折叠的区域,是对整个任务的进度监控。这个设计非常非常的人性化,后面再给大家详细的介绍这个功能。开始之前呢,我们可以选择一个文件夹,让 go to work 呢,知道你在哪里干活,生成的文件应该放哪里,当然呢,不指定呢,也可以正常使用。 先安排一个简单的任务,这个目录下面有很多的图片,我需要按照文件大小重命名,从小到大依次是一点勾 p g, 二点勾 p g, 三点勾 p g, 这样子。 把目录拖进来,告诉他要求点击发送,就开始干活了。这个速度非常快,大概十几秒钟就搞定了,并且全程是中文的,沟通很丝滑,看一下结果,哎,这个就是我想要的,大概十几秒钟就搞定了,并且全程是中文的,沟通很丝滑,看一目了然。 接下来整一个稍微复杂的,让他把下载目录整理整理,太乱了,我呢也不敢随便的删。把下载目录拖进来,我让他按照文件类型归类 好了,开始干活了。这里有思考过程是英文的,然后他会请求授权,这个设计的很安全,可以避免很多误删误改的情况,哎,没一会我整理好了,他说这里告诉我们是如何整理的,看一下结果, 一下子清爽很多了。 codework 呢,支持自然语言创建 skill, 我 们可以做一个整理文件的 skill, 下次直接调用 skill 就 能整理。直接告诉他做一个 skill, 哎,然后就开始自己创作了,中途可能会询问你的意见,一分钟不到就搞定了,还贴心的告诉了我们存放的目录功能特点,使用方法。右侧这里呢,有整个任务的计划产物呢,就是最终交付的内容以及使用的技能,也就是告诉我们 ai 到底干了啥,让我们做到心中有底。 当然 photoshop 呢,是无缝支持 cloud code 的 scale, 使用方法也很简单,比如我这里有一个 youtube 字幕下载的 scale, 把这个 scale 直接拖进来,告诉他用这个 scale 处理这个链接,就这么简单。 然后呢,他会提取到这个 scale 的 名字理解功能,稍等一会儿就处理完了,有保存路径生成的结果。打开看一下,完美 把时间托都去掉了。我测了下,这个速度呢,比 color code 要快将近两倍。我这里呢,还测试着让他用写作 skill 把字幕写成了一篇阿亮风格的文章。他会先学习阿亮的风格,整理参考资料, 然后输出五个标题让我选择,接着询问大纲是否满意,按照规定的字数输出了文章还会呢,自动审校,去除 ai 位,等我确认满意后,最终输出了可以直接发布到自媒体的图文,比例是三比四,来看看效果 是不是很赞。这些都是 skill 做的。这几天刚好有个电商的朋友呢,想让我帮他写一个程序,分析一下二五年的账目。肉眼看到这些数据真的是头大,十二个月的数据明细,每个里面呢有上百成千条,但对于 codework 来说, 分分钟搞定。选择目录,告诉他分析二五年的总额,平台扣除的税,退款总额,以及每月的销售情况等等。非常聪明,他发现了这里是有十二个月的数据,然后说开始写脚本,分析了 大概一分钟左右,详细的结果就出来了,整体的业绩,月度销售趋势,还输出了一个 t x t, 不 过这个 t x t 看起来呢,不够直观,我让他输出 excel, 再输出一个图标试试,十几秒钟就搞定了。看看效果,我只想说一个字,绝! 专业的财务,我估计没两小时也根本搞不定,越用越上瘾啊。刚才在帮我做一个春节云南游的方案,把需求告诉他,云南十日游,三个大人三个孩子,制定一个完美的租车自驾行程,要非常详细,最后做成 ppt, 我 真的有点期待这个行程安排呢?是否合理以及这个 ppt 呢?会长什么样子?好了,已经处理完成了,这个处理速度真的是没得说,来看一下效果吧, 有经验的小伙伴帮忙看看这个行程合不合理。 ppt 确实是够用了,里面还搭配了精美的图片,今年的旅行就从这个 ppt 开始了。深度使用了一段时间的 codework, 还挺激动,就像是托尼拥有了装载假维斯的钢铁战衣,瞬间感觉自己的能力都变强了。 还有一个值得强调的点,阿里的 codework 呢,价格非常非常的便宜,我相信未来,甚至就是今年,每个人都会配备一个能帮你干活的 ai 助理,而 codework 就是 一个非常好的选择,强烈推荐你去试试,大家点点关注哈,跟着阿亮学 ai!

不会选龙虾,阿里的 coop 拍 clock、 could work 有 什么区别?今天一次性给你讲清楚。 could work 为闭源桌面办公 agent, 主打 pc 端全流程办公自动化,无法完全离线运行,面向普通职场人,开箱即用,本土化与合规性突出。 coop 是 开源个人智能体,支持本地部署与轻量化自动化,适合个体从业者与自媒体用户。 highclock 为开源团队协助系统聚焦复杂项目,多 agent 协调流程,可适配开发者与团队场景。 此外,我们提供 opencloud 企业级一站式服务,也可做深度技术支持,有需要欢迎留言。

你是不是也遇到过想用 ai 自动化财务工作流程,但是用 deepsit 或者是 chpt, 他 们往往只能给我们一段拍上代码,然后让我们自己去跑。 但是我们很多财务人其实并没有编程的基础。这两天我测试了一个新的 ai 工具 all the work, 它是阿里研发的新的桌面 ai 工具,不需要我们跑代码就可以帮我们处理了很多繁琐的工作,真的像一个人一样。这 期视频我会用三个案例来给大家演示一下都可以做哪些事。首先先介绍一下这边的界面,当我们打开之后呢,会看到左边这栏有两个,第一个就是我们熟悉的这种对话框的形式。 第二个 skills, 大家可能会有一点点陌生,大家可以简单地把 skills 理解成一个领域内的 best practices, 比如说 file organizer 是 如何去更好地整理我们的文件,直接在这边点击安装我们就可以用了。接下来我来演示一下在 fpa 或者是其他财务工作中,我们可能会碰到的一些非常繁琐的工作。我们看第一个案例, 在这里有从 sap 里面拉出来的每个月的费用报告,有 costant 的 信息,还有费用大类的信息。呃,我们每个月都要根据这样的明细去做我们的费用报告,看一下 code word 能不能帮我们实现自动完成报告,或者可以先给我们一个草稿。呃,我们点击一下新任务,把指令复制给它。 那目标是可以基于两个月的费用明细生成一个出版的报告,一个是 excel 文件。然后还有一个就是我们在月节汇报的时候,一个讲稿的大纲, 那具体的要求分成五步,第一个就是先读取名系,然后在如今的统一和数据的清洗,比如这个月份,有时候表格拉出来可能会有一些不同的格式,那第二个是汇总的维度,一个是从组织维度,比如说部门,呃或者是产品线。第二个是从费用的维度来,根据费用的类型做统计,最后就是生成一个 month, over month, 也就是阅读的对比报告,一个是总费用的变化,一个是组织维度的变化,还有一个是 top drivers, 比如说哪个部门,哪个费用科目是花销最大的,还需要输出一些 exceptions, 比如说大额的单笔支出, 还有一些异常的文本。第四个是告诉他最终的输出文件要放到哪个文件夹里面,包括 excel 表格, excel 大 纲是一个 word 文档,最后可以要求一下这个输出的风格,比如说不要编造原因,所有的结论都是可以追溯的。最后要求他可以先直接输出一下一个汇总的数据,选择一下工作目录, 这边也会出来一个任务监控的栏目,可以非常清晰地看到目前在座的以及代办的事项,还有他产出的那些文件的,目前为止已经全部执行完毕了,可以看一下这边的任务监控,他一共做了这些代办,也是用了代码去执行我们的任务,用到了专门处理 excel 文档和 word 文档的 skills。 在 输出的部分,他这边也给我们一个总结性的报告,一共有多少费用,变化是怎么样的?前三个最大的费用类别是什么?以及需要关注的三个异常?我们先来看一下这边的 excel 表格, 这边一共给我们输出了七个 sheet, 第一个就是 summary, 是 比较简略的总费用以及它们的 variance, 然后看一下这边的 department, 每个部门的费用和差异,这边是 by category 以及这边的 主要的差异。下面一个 exception tab 是 告诉我们可能有一些异常的费用。最后一张是我们的 data cleaning 数据清洗的一个制记录,就是我们拉出来的 raw data 里面。在这些字段下面有哪些是呃缺失率比较高的,那我们可能就要去系统里面或者是报告里面看一下这些缺失率会不会影响我们做报告或者是汇报。 那总体来说报告是比较全面的,但是呢,它出来的产物是比较简单的,其实我们也没有给到它特别多的关于公司的信息和产出的报告的格式,大家也可以测试一下,如果你可以给到它公司比较常用的一些报告的模板,看看它是否可以产出同样的格式,那我们再看一下它给到的汇报的大纲, 第一部分是结论,第二部分是 top drivers, 第三个是异常和风险,第四个是 q n a 预案,就是其他同事在会议中可能会提到的一些问题, 我们可以提前准备。最后是一个口径的说明,其实格式和大致的内容都已经非常的完善了,那我们只需要针对我们自己公司的一些要求,再进一步的做一些规范就可以了。 平时员工报销拿的发票,我们可能还需要做一道检查,就是要查虫,在我之前工作过的几家公司的一个比较常规的操作,就是把员工拿来报销的发票都统一录入到有效里面,然后再进行查虫的处理,这样的话就会非常的麻烦, 因为我们每次都要手动录入发票信息,那我们现在试一下它能不能帮我们做这项任务。我们在技能这边有一个 invoice organizer, 我 们可以使用一下它,看看它的整理发票的功能怎么样 好。选择好这个技能之后,把我的指令发送给他,首先我给他设定了这个路径,但是我们还需要在下面这个选择工具目录中去设置一下文件的路径, 然后再告诉他目标是要识别重复票据和异常票据。具体的要求,第一个是要便利所有的发票文件,然后再提取下面的这些字段。第二步是 提取字段之后,把这些信息生成一个 excel 文件,包括完整的发票台账、重复票据的清单,异常票据的清单 啊。查虫的逻辑是一个是强匹配,也就是如果发票相同的话,那就肯定是判断为重复,弱匹配的话,如果这些信息都相同的话,就判定为一次重复。第四个对于异常规则就写尽着 exceptions 叫文件,也就是那些我们可能因为图片质量原因没有办法识别到具体的信息,这样的话还是需要人工去处理一下。最后就是要求它展示的结果要友好,可以设置输出的表首行冻结之类的格式,最后执行完毕后让它直接输出这些我们想要立刻看到的一些信息。呃,那我们现在就直接发送让它去处理一下这个任务, 我们可以看到它这边每一个步骤,以及到目前为止进行到哪个进程了。 好,我们看到这边已经执行完毕了,所有的代班事项都已经完成,它这边产物是生成了一个 piecing 代码,也就是用 piecing 去执行我们刚才的任务。那我们来看一下它的输出结果。强重复组是有三组,也就是那些发票号码是完全一样的,还有弱匹配组是零组。 呃,异常的票数是十四张,可能是因为图片拍的不清楚,所以看不到那些关键的信息。好的,我们先来看一下这个文件夹里。首先是 invoice ledger, 也是所有的发票的信息都已经统计在这里了,包括发票号码、开票日期、金额等等各种信息都已经统计在这张表格里面了。 我们再来看一下这个查重,这两张是发票号码一样,但是金额和销售方是不一样的, 可以找到这两张看一下。那确实是这两张的 invoice number 是 一样的,但是扣的又不太一样,我们就要去调查一下到底是怎么回事。还有第三个文件是 exceptions, 也就是那些异常说明可能是缺少一些信息,或者是 ocr 不 太确定,没法提取到。然后还有一些是照片的质量问题,就是这边的这几张,比如这张是 pdf, 它写的异常是 ocr uncertain。 好, 还有这个具体是哪个信息不太确定,那我们可以去人工审核一下 它这边写的异常情况是 invoice number 包含了 o 而不是零。我们看一下啊,这个也是我故意设计的,它居然真的可以识别出来。还有一个是它说 invoice code 包含了空格, 那也确实是这个也识别出来了。当然如果你的某一串数字里面它确实是含有空格的,你也可以在输入指令的时候就跟它说这一串代码本身就是含有空格的,那 那么在输出这个 exceptions 的 文件的时候,他就不会把这个当成是异常的情况了。然后这一项任务执行的非常的完美。那在这个 case 里面,我们所有的发票其实都已经是整理过的,它的命名非常的整齐,一眼就能看得非常的清楚,而且也已经归类到相应的年份和月份的文件夹里面了。 但是呢,在月结的时候,我们可能会突然收到很多业务给的发票,可能是这种比较正常的电子发票,有可能是一些他们随便发的 supporting 的 文。 在外省的话,可能还会有一些类似于这样格式的去国外出差收到的发票,然后他的密名也是乱七八糟的。如果我们要手工具一点点整理,然后把所有信息再转移到 excel 里面的话,可能要花非常多的时间。那我们可以利用一下我们刚才安装的这个 file organizer, 把我们的需求贴进去。我是先给他这个目标,就是要整理下我们的文件夹,然后具体要求。第一步是要先保存原文件类型,然后进行分类,也告诉他这个目标的结构应该由哪一些文件夹组成。 在对发票文件进行重命名,我这边要求的格式是这样子的,最后再输出清单和日制,那给到具体的指令之后,我们还要选一下这个具体的文件夹,设置好之后我们就可以让它去完成我们的任务了,它在执行任务之前都会确认一些新的权限,也是确保数据的安全性。这边我们可以看到它每一步的步骤, 到这个阶段我们可以看到它说所有的文件已经读和生成文件夹了。 好,可以看到它已经执行完成了,给了我们文件夹的整体的结构,以及我们之前要求它生成的一些文件。我们看一下,首先它是没有动我们原文件里面的文件,而是生成了一个 output 文件夹,就和我们给他的指定是一样的, 它里面有三个,一个就是我们刚才所有的 raw data, 第二个就是我们要求它整理的文件分成 invoices、 supporting documents 和其他 invoices 也是根据我们给他的格式重新命名了,随便检查一个,比如说这个是滴滴的日期是三月二号,明 名称是滴滴,金额是九十七元,发票号码也没有问题,然后也是电子补票,这些信息抓取都没有问题,有一些无法识别的,嗯,它是写了 onno, 比如说我们这一张是没有办法识别它的日期,确实这个 invoice 里面是没有的,那我们可能就要继续去调查原因了,这张发票是有问题的。好的,这个 invoice 是 没有问题, 我们再看一下 supporting documents 里面,它也是帮我们把所有的说明文件都放到了这个文件夹里面。然后 others 是 无法分类的,跟我们这个 invoice 完全没有关系的一个文件,那如果确实是呃放错了,可以把这个从我们这个文件夹里面删掉。 接下来第二个文件是我刚才让他做的记录,也就是执行完毕后要输出所有的未归类的原因。他帮我们找出了这三张有问题的英文,也告诉我们是哪些原因。这三张都是因为缺少了日期的信息,还有这个 rename log 是 原文件的名称和新文件的名称, 以及最后 scope notes, 就是 告诉我们这次都做了哪一些动作,非常的清晰,对于我们后续追溯有用,它甚至还做了统计招标,真的非常的智能。这个 notes 它也根据我刚才的要求输出,甚至更加详细了。那除此之外,它还有其他的 skills, 也是在不断的更新中,比如说这边有很多的企业里面的 role, 比如说 developers, marketers, 还有我们的 finance 可能会经常用到的一些 skills, 比如说要处理文档,要处理 pdf, 甚至还有 pricing strategy, 除了 fnes 之外,还有 hr, lego 之类的角色。这次测试下来感觉还是比较流畅的,只要我的指令给的够详细,够全面,它完全可以按照我的想法完成任务。如果你的工作中也有类似的,需要很多手工操作的脏活,可以交给他试试看。

以卡拉布特火爆全网之后,阿里也正式推出了自家的桌面端智能助手可的沃克。当前这款产品仍处于官方测试阶段,我也在第一时间获取到了内测资格,今天就为大家带来全网超详细的深度体验测评。从基础上手到核心功能全解析本期内容是被人群十分广泛,不仅面向开发者群体, 哪怕是没有任何编程基础的职场办公桌内容创作者以及学生和科研人员都能从中挖掘实用价值。废话不多说,我们直接进入正题。 首先介绍 codework 的 安装与简介,我们进入 codework 官网,根据自身电脑设备型号,选择设备版本,完成下载与安装。然后使用报名内测后补名单时绑定的邮箱登录, 登录后的界面简洁直观,整体做到开箱即用,即便新手也能快速上手操作。 codework 的 核心功能主要覆盖三大场景,文件整理、内容创作、文档处理。 我们直接在聊天窗中输入我们的需求,和 coderwork 对 话就可以直接使用了。我们点击设置,在设置里面我们可以看到 coderwork 设置了很多的 secure, 我 们和 coderwork 对 话的时候,如果触发对应类型任务,系统会自动匹配并调用相关 secure。 同时, coderworkwork 还集成了多款 mpc 服务, 包含 excel 数据联动、图标工具、 pdf 解析、浏览器连接等实用能力。接下来我们针对 codework 的 核心功能展开实操和演示。第一个文档整理, codework 的 文档整理功能可以一键解决文件杂乱、查找困难、重复劳动等办公痛点。 我们只需要在聊天窗口中输入我们的需求,比如把我桌面的文件进行规整整理, call to work 就 会理解自然语言自动化的执行任务,遇到关键节点还会主动询问你的下一步操作,全程流程清晰可控,完全遵从你的命令。同时, call to work 还会生成一份 to do list 的 标注,出来,调用了哪些 skill, 整个执行过程一目了然。任务完成后, codework 还会输出一份整理报告,最后桌面文件就全部归档完成了。我们除了让 codework 按照文件类型进行归档,我们还能让它清理重复文件,批量重命名, 比如读取相册目录下照片的 excel 信息、获取拍摄地点和日期,统一命名为日期、地点序号的格式,它都能完美执行。更实用的是,你还能把这套整理流程保存成 sku, 后期一键调用,省心又高效。第二个,内容创作。 codewalk 的 内容创作功能能够帮我们全流程生成演示文稿、文档和多媒体内容。比如我们直接在聊天框输入生成一个演示光的照射的文档和动画视频, codewalk 就 会精准理解你的自然语言指令, 自动调用相关 skill, 一 步步帮你完成任务。和之前一样,在这个过程中同样遇到关键几点, codewalk 以可选的方式让我们决定下一步如何执行。最终, codewalk 帮我们把 ppt 和演示动画视频都生成了, ppt 的 生成效果还不错,有需要微调的地方,我们手动修改就行。演示动画的效果也很出色,画面清晰,通俗易懂,完全能满足我们的需求。 第三个,文档处理。 codework 的 文档处理能力真的做到了,一句话搞定复杂的文档数据处理任务。比如,我想把一个 pdf 文档的每个章节的主要内容提取出来,并且汇总到一个 word 文档里,我们直接输入指令, codework 就 会找到这个 pdf 并执行任务。 在这个过程中,他会调用 pdf 和 doc 四 q, 这两个四 q 是 docworks 内置的。最后, docworks 就 帮我们把 pdf 的 核心内容完整提取并汇总到了 word 文档里,整个过程高效又省心。 除此之外, docworks 还能帮我们进行多文档对比,找出多个版本之间的差异,生成修改报告,速度比人工对比快十倍以上。会议记录处理,快速地提取决策点、行动向负责人、截止日期、合同审查、识别关键条款、风险点、金额、有效期, 大大提高准确率,减少遗漏隐患。最后,我们总结一下 computerwork 的 优缺点。优点一,零门槛上手,开箱即用,不用写代码,不用学复杂操作,只要会说中文,会打字就能用,新手也能快速上手。优点二,本地化执行隐私性强。 每个用户在个人终端上都能拥有一个实打实办事的 ai 助理,他的任务执行环境全在你的电脑本地,不用把敏感文件核心数据上传到云端。优点三, skill 生态丰富,执行过程安全可控, 内置非常多的 sku, 可自主安装 sku, 扩展最佳实践执行过程显示授权可控性较强。缺点一,复杂任务处理能力有待提升,处理较多较大文件的项目时效率下降。 缺点二,积分消耗较大,新用户会赠送三百积分,大家需要关注一下积分消耗。缺点三, a 进的执行稳定性还有待打磨,偶尔会出现操作失败现象。总之,当前版本的酷狗 work 更偏向一款轻量化的办公, a 进的助手权限管理更谨慎、更安全,一切都是可控的,更贴合国内用户使用习惯。

本地模型养龙虾,为啥又龙又虾呢?一天一个开源国产龙虾千吻合使用分享第二期大模型本身就不具备联网搜索,联网搜索本质上只有两种方法,一种是调用搜索引擎 api, 正规快速稳定, 但是需付费调用。另一种则是通过爬升解析网页 h t m l 正的受限,不玩低效纳尼,所以我一般使用 sircng, 它是一个开源搜索引擎项目,目前已有二十八点四 k s 三步就能上手使用。第一步,在 linux 部说直接在服务器中执行这三条命令就可以了,执行三个命令后就可以拉起服务。 第二步,修改配置,修改塞进配置文件,在返回参数 format 中加上 json 格式,然后重启容器,接着进入 crayson j 前端页面,设置中直接开启所有的搜索引擎并保存。第三步,千问破对接,进入千问破技能页 面,选择从 skill hub 导入,将 crayson j logo search 这个技能导入,然后进入对话页面,输入,使用 crayson j 技能对接本地 crayson j 服务地址,信息式的内容,就可以自动完成对接了。

最近爆火的智能体 motbot, 名字还没被大家记熟,又又又更名为 openclock。 与其追逐快速的版本迭代,不如来看看这份更亲民成熟的桌面智能体平替方案。 阿里发布首个桌面智能体工具 quadwork, 它的目标简单直接,输入一句话就能指挥它调用电脑软件干活。网友调侃这是打工人之光,测评博主直呼太香了,夸他深沉。 ppt 逻辑清晰,处理 excel 又快又准,还能把图文一键转成视频脚本。 最关键的是,它让 ai 从云端落到本地,直接操作本地文件,兼顾了速度与隐私安全。阿里此时出手,正踩在 ai 智能体的全球风口上。国外的 open ai、 antropic 都在发力,特别是 cloud coork, 但每月不菲的会员费依然劝退了不少人。 阿里的 codework 此时亮相,无疑为国内用户提供了一个更接地气的选择。这得益于阿里在 ai 编程上的积累,其编程工具曾将开发效率提升百分之六十五,如今,这能力正从开发者延伸至所有普通用户。 从行业趋势来看, ai 正从聊天时代大步迈入行动时代。竞争的关键不再是聊天能力,而是理解人类意图并安全执行任务的本事。本地化隐私、安全、开箱即用, 将成为桌面智能体的核心胜负手。阿里 codework 的 发布,标志国产 ai 应用向真办式提效率的深水区挺进。未来的电脑里,或许真会多一位得力的数字同事,这场桌面效率革命才刚刚开始。那么问题来了,这样一个能替你干活的 ai 助理,月付多少钱?你愿意买单?

好用的 ai 龙虾都要经历退壳吗?国外这只龙虾从 clobot 变成 moot, 最后变成 open claw, 经历了两次退壳。现在国内的龙虾拷炮也完成了一次退壳,正式从拷炮更名为千问炮。这次拷炮改名本质是想千问开原生态靠拢,强化整体的能力。 从最近更新也能看出这点,为一点零点零做了多 a 制的系统和扣炮本地模型,增强 a 一 点零点一支持质保 ai 模型和增加视频分析能力 a 一 点零点二新增数据及插件系统和对接归机流动。实际体验下来,他在开源生态里的能力和完整性都在持续变化。好了,今天就分享到这里了,希望国产龙虾越来越好!

当所有 ai 厂商都在告诉你,把数据交给云端吧。阿里做了一件相反的事,把 ai 塞进你的电脑里。 coderwork 桌面端本地优先智能体 macos 和 windows 双平台,支持一句话,驱动自动完成复杂办公任务,所有文件操作在本地沙盒完成。敏感数据不上云,支持离线处理。 你以为这只是隐私保护?不,这是对云端霸权的一次叛逃。当 ai 开始真正进入你的工作流,处理的是合同、财务代码、客户名单。云端再安全,也不如你自己的硬盘安全。 阿里算明白了一件事, ai 的 未来不是让所有人把数据搬到云端,而是让 ai 搬到你家里来。所以, codework 的 真正意义不是又一个智能助手,是他递给你一把钥匙,让 ai 为你工作,但不需要你知道任何秘密。答案写在本地那个沙河里,你的数据永远不需要走出这扇门。

现在 ai 能做的事情已经远远超出我们的想象了,这是我的电脑,帮我把这个链接所有的照片都下载到本地,你看全部搞定,还需要去找什么下载器吗?再让它把乱糟糟的桌面文件进行整理,转眼就整洁了,连文件夹都帮你建好。 ai 已经不是简单的对话软件了,而是真正意向会动手的员工。接下来我就向你展示五个或许你还没试用过的 ai 疯狂功能,用 ai 智能体 codework 来做演示,全是职场刚需,方便你直接偷走使用。 ai 员工一,报销整理助手每月整理报销发票真的太磨人,直接跟 codework 说,把这些发票按以下信息整理好,生成 excel 表,你看 它又开始自动识别信息,转眼一份规整的 excel 表就生成好了。更方便的是,它还能和飞书互联,收到一堆电子票据,不用传到电脑,直接从飞书发给 codework, 它照样识别整理生成的表格,还能一键发回飞书,可以直接转发给财务, 分钟就能搞定一个月的报销。 ai 员工二, excel 数据民工现在不需要你手动操作 excel 了,交给 ai, 直接让 codework 处理数据并画图,它就自己读取文件拆解步骤,关键步骤还会跟你主动确认,全程不用你敲一个函数,直接给你生成格式化图标。而且它所有的操作都在本地运行,所有的文件数据不离开本机, 完全不用担心公司敏感资料泄露。 ai 员工三,演示汇报大事老板让你做行业调研,自己找资料做 ppt 至少要两天。现在跟扣肉发送指令,让他生成演示文稿,你看他自动进行全网搜索,整合一份美观清晰的展示就做好了。也可以直接把项目报告扔给他,让他根据报告做 p 准备,汇报的时间直接省百分之八十。 ai 员工四,总结小能手老板动不动甩来几十页的报告,硬着头皮读至少大半天,还容易遗漏关键信息。直接让 callumwork 提炼重点,发送这个指令,它就自动快速读取文档进行总结,几分钟就能掌握全部要点。而且它配置的 i m 集成功能,除了飞书,还可以 连接钉钉和微信,不用回家加班,手机上就能拿到结果,在外也能高效响应。 ai 员工五,周报美化大师明明一周忙到飞起,可写的周报干巴巴记流水账。直接把这个工作内容和这段指令一起发给 codework, 他 就能把零散的工作梳理成条理清晰、重点突出 的周报。不管是整理文件、处理数据,还是写总结、做汇报,只要你说得出需求, ai 就 能自己动手全干好上面的每个操作,都可以让 ai 把流程沉淀成固定的 skill, 下次直接调用,不用再重复调教,让你真正拥有自己的 ai 团队。你最需要哪个功能?欢迎在评论区告诉我们,下期再见!

谷歌的 jam 四开源了,跑分碾压千问啊,全网都在吹,这是当前最强的开源模型了。但是呢,我实测了七个本地开源模型之后啊,我的结论是,限阶段,我不推荐你用 jam 四。 我知道你最近肯定在纠结,因为 jam 四出来之后,到处都在讨论该不该换呀, reddit 上一半人说要换 jam, 一 半人说要留千问你看了一圈帖子,越来越晕, 今天呢,我帮你终结这个问题,七个模型,四比特和巴比特两种量化,所有的数据我全部都测过了。看完这期视频啊,你不用再纠结,你也不用到处找信息了。先说结论, 本地跑 ai 模型呢,无非就三个场景,我一个一个说,每个场景直接给你最优解。第一个场景呢,也就是最多人关心的跑智能体, 不管你是跑小龙虾, openclaw, 还是其他的智能体,答案只有一个,千万的困。三点六。 三点六呢,跟三点五的架构几乎是一模一样的,都是三百五十亿参数的 mo e 专家模型,每次推理呢,只激活三十亿参数,所以它跑得快,省内存。但三点六呢,在性能上又有提升能力更强了。 如果你的 mac 内存呢,是三十二 g 的, 那用四比特量化的版本,如果呢,是六十四 g 或者更大呢?直接上八比特量化版本,它的精度会更高。那为什么选它呢?因为它是多模态的模型,能识别图片呢。你跑 opencloud 的 时候,用户给你发一张截图过来,它能看懂。 而且呢,工具调用啊,它兼容性非常好,跟欧拉玛呀, lm studio 啊这些主流的推理框架配合没有任何问题。 第二个场景,跑编程智能体,用 ai 来写代码,答案呢是困三 cold next, 一个八百亿参数的 mo e 专家模型啊,专门为了编程任务优化过的,它每次推理呢,也只激活三十亿的参数,用四比特量化版本就可以了,内存占用大概是四十三 g, 需要六十四 g 内存的机器, 芭比的版本呢,我就不推荐了,因为内存直接吃到了八十 g 啊,实在太夸张了。那你可能会问,为什么不直接用困三点六来写代码呢?当然也是可以的,但是呢, code nex 呢,在编程任务上做过专门的优化, 如果你主要就是拿来跑编程任务的话,它会是一个更好的选择。不过呢,它有一个限制啊,就是它不支持图像识别,只能处理文本,所以跑文考这种需要看图的智能体呢,它不太合适。那么第三个场景呢,比较小众,就是纯问答, 就是本地拿来当拆字 gpt 用的。如果你对准确度要求特别高的话呢,不在意速度慢,只想让它帮你解决一些复杂的难搞的问题。那你可以试一试 gemalford 三十一 b 的 单次模型, 单次模型啊,就是完整的模型,所有的参数都在参与运算,所以它会更聪明。但代价是什么呢?慢, 在我的 max studio 上,每秒只能生成十三个头啃啊,首次响应要等五秒以上,所以这个速度拿来跑智能体或者编程呢,体验是不可接受的。 但如果你只是偶尔问他几个难题,忍一忍还是没问题的。好了,三个场景都讲完了,你现在应该已经知道自己该装哪一个了吧, 但是你心里还有一个挥之不去的问题, java4 不是 跑分更高吗?为什么跑智能体不选它呢? 说实话,如果只看跑分, java4 确实是更强的那个模型,它的编程能力啊,领先千万将近十个百分点啊。后面我会给你看具体的地方啊, java4 实在太新了,它的生态还没有经过充分的验证啊。 那么你知道智能体是怎么干活的吗?它需要调用外部的工具,比如打开浏览器啊,读文件呀,执行代码呀。在这个过程当中呢,它靠的是工具调用能力,模型会按照特定的格式发出指令,然后推理框架,再去解析和执行。 jeff 刚开源的时候呢,它的工具调用格式啊,和欧拉玛呀, lm studio, o m l x 啊,这些主流的推理框架呢,全部都不兼容,它会直接的报错。 后来呢,各家框架呢,陆续的更新,兼容性呢?修上来了,基本能跑了,但能跑和稳定那是两回事啊。 我实测的时候就遇到过啊,一些边界情况,比如文本路径带有特殊的字体,那 java 处理起来就会出错。当然,公平的说啊,千万也不是完全没有这类问题啊,但千万在社区跑了更久,踩过的坑更多,框架的适配也更成熟。 所以你看啊,跑分强不等于生态成熟啊,选 ai 工具啊,永远是场景优先,不是看谁跑分高,而是看谁在你的场景里呢,跑得更稳。 你选了一个跑分第一,但生态还在磨合期的模型啊,你踩坑的概率啊,可比成熟方案要高很多呀。 所以这个场景优先的选型思路是我反复验证过的,完整的选型框架呢,在范凯说点 ai, 感兴趣的呢,可以去看。那 jemfort 是 不是就不值得关注了呢?恰恰相反,因为它的基础能力摆在那儿,兼容性也在快速的改善。 但改善归改善,稳不稳定还需要更多的时间来验证呢。但现在你问我跑智能题选什么呢?我的建议很明确,千问模型就是当下最稳的选择了。 好的结论我已经给你了,理由也说了,那接下来呢,我把评测数据摊给你看,你看这次评测呢,我是在 max studio m 四 max 工作站上用 o m l x 推理框架来跑的。我测了整整七个模型啊,分成两个维度,推理速度模型的智力。 有一点要说明啊,就是这一次评测跑的是千万三点五,而三点六刚出来,比三点五又有提升,也就是说,千万的优势只会更大,前面的结论呢,只会更确定。 先来看速度这张表,最关键的是 m o e 专家模型和但是完整模型之间啊,速度差了整整一个数量级啊。 m o e 模型每秒能生成七十到一百二十五个头啃,而但是模型呢,只有十三到十七个,差了五倍到九倍啊。 首次响应时间是更夸张的, m o e 模型不到一秒就开始回复了,而单子模型呢,要等五到六秒,如果上下文的窗口再开大一些呢,单子模型会直接飙到十几秒,二十几秒基本就没法用了。 所以结论很明确,就是在 mac 工作站上,单子模型只能拿来做问答聊天。你要想跑智能体啊,想跑编程啊,那 m o e 是 唯一的一条路。 再看这里,知识能力两者几乎打平,没有差距。但是呢,编程能力拉开了 jimmy for, 领先千万七到十个百分点啊,越难的编程测试差距越大,尤其是 jimmy for 三十 e b, 但是这个版本啊,它的复杂编程测试拿了百分之七十六的分数,遥遥领先所有的模型。 所以基础能力上呢, java 确实要更强,尤其是编程能力,这点毫无争议。但就是这样一个编程能力碾压的模型,现在跑智能体连工具都吊不稳,这就是选模型最反直觉的地方了。 最后说一下量化模型怎么选?所谓量化呢,就是压缩模型,让它占更少的内存,代价就是精度略降。 四比特的呢,比巴比特速度快将近百分之四十啊,内存直接腰斩,智力损失呢,只有百分之二到三个百分点,日常使用你几乎感觉不出差异。所以很简单,三十二 g 内存你就用四比特,六十四 g 内存你就用巴比特。量化版本不用纠结 完整的评测数据呢,我放在视频描述区了,想自己对着看呢,直接往下翻。最后我要公平地说一句啊,在我测的七个模型当中啊,基础智力最强的还是 jumbo for 三十一 b 单词, 它的编程能力甩开第二名十几个百分点啊,这个模型的上限那是实打实的高。但现在你问我本地跑模型选什么呢?我的回答依然是确定的,跑编程千万三 code next 纯问答,追求极致的准确度,用 gemofor 三十 e b 单词。我今天讲的是具体选哪个模型,但说实话呢,比评测数据更重要的是,你怎么判断一个模型适不适用你的场景呢?我们下期再见。

阿里突然宣布 coco 正式改名宽炮,这不是简单的改名,而是阿里 ai 生态的大收网。四月十二号,阿里云发布一点一点零版本,同时宣布品牌重塑,所有产品必须姓 kim。 为什么现在改名?因为阿里旗下 ai 产品太乱了,通一千问通一万,向 coco 用户根本分不清。 openai 有 叉 gpt 生态, metata 有 luma 生态,阿里必须打造 quinn 生态,不然就被边缘化。更关键的是, coco 对 标的是 open call, 改名 quinpo 就是 告诉市场这是官方出品。 阿里开源策略也在变,从广撒网转向集中化,全部纳入 quan 统一管理,方便商业变现。说白了, coco 改名就是阿里在下一盘大棋,用 quan 品牌统一所有 ai 产品,形成闭环以后,可能还有更多产品要改姓 quan, 这是阿里 ai 生态从分散走向集中的标志。

每周 geekhub 都在上演开元奇迹,过去一个月, ai 驱动的开发工具彻底炸裂了趋势榜。今天我们从排名前五十的热门项目中,挑出四个最有话题性的项目,带你一口气看完 排名第一的 kim。 五万四千星项目介绍只有一句话,为什么要用很多 token, 当几个 token 就 能搞定! 这个项目是 cloud code 的 一个技能,能把你的提示词自动翻译成原始人说话风格,砍掉所有语法惯词,废话直接蹦关键词,实测下来能省掉百分之六十五的 token 消耗。 有人说这是行为艺术,但五万四千个 star 证明省钱才是硬道理,在 api 按 token 更管用。 第三个项目 open design, 两万六千星,这是一个本地优先的开源的设计生成工具。直接对标 andropic 的 cloud design, 内置了十九个技能,七十一个品牌级设计系统,能直接生成网页、移动端、桌面端原型,还能导出 html、 pdf、 pptx 甚至 mp 四视频, 支持 cloud code、 codex、 cursor、 gemini 等几乎所有主流 ai 编程工具。开源社区用一个月时间造出了一个商业产品的完整替代品,这就是开源的力量。 第四个项目叫 nova skill, 也就是女娲技能一万七千星口号非常嚣张,你想争流的下一个员工,何必是同事? 这个项目能蒸馏任何人的思维方式、心智模型、决策、启发式表达, dna 全部可以提取并转化为 ai 技能。简单说,你可以把行业大佬的思维模式变成一个可附用的 ai 技能包, 它甚至生成了张雪峰的认知操作系统。如果说 kim 是 让 ai 说人话,那 nova 就是 让 ai 学会像人一样思考。 最后压轴的张雪峰技能六千八百星,由女娲技能自动生成,把张雪峰关于高考、志愿、考研和职业规划的实战思维框架完整蒸馏成了一个 ai 技能包。 这意味着张雪峰的认知操作系统现在可以跑在任何一台电脑上。名人 ip 加 ai 技能的化学反应才刚刚开始。 从原始人说话到蒸馏思维,从开元设计工具到名人 ai 技能,开元社区正在用代码重新定义 ai 的 边界。这就是本周的 geekhub 趋势素览,我们下周见。

今天继续给大家推荐 q 的 walk 这个工具非常的好用。那这一讲呢,我们给大家分享一下它具体能干哪些工作。我认为把它梳理下来有三大类工作。第一类工作呢,就是整理你的电脑,我相信呢,很多人电脑里面的各种各样的文件是非常的混乱的,自己整理真的是非常辛苦, 但是不整理,你有的时候找一个文件找半天也找不到,那现在呢,有这个工具,它可以快速的把你所有的文件夹进行重新整理,重新分类。那这样呢,你再想找一个你想找的文件的时候呢,就非常快捷,也非常便捷,也可以让你的桌面呢变得非常干净,非常整洁。 第二个呢,它非常适合处理一些大的文档,一些复杂的一些文档。我举一个简单的例子,当然你写三十万字的机会可能不多,但是如果说你公司有二十个业务员,每个业务员 都给你发一个日报,你就可以让 qdworks 同时处理这二十份周报,然后找出中间的问题,给出不同的回复,这个是他非常擅长的。 你也可以在处理一个文档的时候,你突然发现另外一个文件夹里面有一篇文件,有几个表格是需要夹到这个文档中间来的, 你这个时候呢,就可以调用酷的 work, 让它自动添加,不需要你手动添加,这个呢也省去了我们大量的时间,大量的工作,所以说在处理文档上,我认为它是非常强大的。第三个呢就是写 ppt, 我 之前也介绍过很多写 ppt 的 工具, 很多人讲说这些 ppt 的 模板不好看呐,这些 ppt 没有办法做动画啦,这些 ppt 感觉没有那么专业啦!今天你有酷的 work, 它就可以帮你做到更多的工作。当然,现在它还是一个非常初级的版本, 但是呢,它已经可以做很复杂的表格,它可以做动态的一些演示图,它可以把你做的图的视例一集一集的展示出来, 显示出非常的这个专业。而且我认为像 cutwork 这样的一些工具,如果它想得到更大的发展,它一定会不断升级自己。那在 ppt 这一块呢,我认为它会做得越来越好,越来越专业。 那我已经连续三讲给大家分享了,如果你连续观看的话,至少可以帮助你省五百块钱以上的 talk 的 费用。所以说,我希望我的视频对你有价值。如果你觉得还不错,欢迎点赞,欢迎关注,谢谢大家!