粉丝4.8万获赞69.3万

最近一段时间,我相信很多朋友都关注到一个名叫大龙虾,英文叫 opencloud 的 ai 产品。 opencloud 本质上是一个 ai agent, 也就是智能体,它跟某宝、某包这样的聊天机器人最大的区别是不仅能聊天,还能干活, 正是这种实用性,让他刷屏了。龙虾的大火,代表了 ai 已经从聊天机器人时代进入了智能体时代。龙虾只是一种智能体,未来会有越来越多针对不同场景的智能体出现。但是我自己,包括我身边所有用过龙虾或者其他类型智能体的朋友们,都会抱怨一个事,太费钱了, 每次龙虾干活的时候都会消耗大量的 token, 如果模型的 token 费用还比较高,龙虾就成了碎钞机。你可能想问,为什么不换个便宜点的模型呢?因为便宜的模型性能又差点意思。那有没有性能足够强,价格也足够低的模型呢?之前没有,但现在有了。 二月十六日除夕当天,阿里正式开源全新一代大模型千问三点五 plus, 性能媲美 gemini 三 pro gbt 五点二等顶级闭源模型,登顶全球最强开源模型。 同时每百万头肯输入价格低至零点八元,是 g p t 五点二的十五分之一, g m n i 三 pro 的 十八分之一。价格这么实惠,性能真的能打吗? 我第一时间就对千万三点五 plus 做了测试,这次我们测试的重点是这个模型的 ag, 也就是智能体能力。 为了让大家好理解,我先介绍一下智能体的工作原理。智能体主要包含两部分,一个是 ai 可用的工具,当智能体接收到一个任务的时候,大模型需要先拆解任务, 形成工作计划,在调用工具一步一步的完成工作计划。所以所谓的测试大模型的智能体能力,就是测试它拆解任务推理并且正确调用工具的能力。可以说智能体能力的测试相当于是大模型的铁人三项,是个综合能力的测试。但是想要深度测试一个模型的智能体能力 并不容易,你需要有足够多的 ai 可以 用的工具才行。正好我们自己做的 reportify 是 商业研究智能体里面已经有一堆商业研究会用到的 ai 应用的工具。为了这次测试,我专门把大模型换成了这次最新发布的千文三点五 plus, 做了一个基于千文模型的商业研究智能体。 那接下来我们就用这个智能体做测试。第一个任务,对比一下未来理想小鹏二零二四年全年和二零二五年前三季度的利润,做成表格和柱状图。 我们看这里千万模型。首先拆解任务生成了代办事项,这个代办事项生成的是比较合理的,然后就开始调用工具干活了,比如要调用财务数据查询工具来查这三家的利润。 其次还要做一些计算,因为我的要求是对比二零二五年前三季度的利润,所以模型需要把查到的二零二五年前三季度的利润做个加总。最后还要调用图标生成工具来生成柱状图,结果不错,数据和图都是正确的,速度也挺快。 第二个任务,请列出美光、三星电子、 s k、 海力士三家存储龙头公司的核心产品,以及过去半年的涨价幅度,最近不是存储行业大火吗?我相信很多关注 ai 的 人都对这个问题感兴趣,还是同样千万三点五 plus 先是把这个任务拆解成了代办事项, 然后调用各种搜索工具搜索相关信息,一项一项完成代办事项,结果也不错,数据正确,内容详实,也给出了所有数据的出处。 第三个任务,请帮我下载过去三个月纳斯达克指数的价格数据,保存到 excel。 经常做商业研究的朋友们应该对这个任务不陌生。过去你需要在某德这种数据软件里各种点,选标地、选指标、选日期,操作难度不低,而且很麻烦。有了 ai, 你 就直接说你要啥数据就行了。你看 千万三点五 plus 模型,理解了你的需求之后,会选择正确的工具,填写正确的参数,最后还会写程序,把所有数据写到 excel 里。之前 reportify 装的大脑是那种性能很好但很贵的模型, 这次换上千万三点五 plus 这个大脑之后,成本大幅下降,同时它的干活能力并没有打折。那为什么千万三点五 plus 能做到性价比这么高呢?这里面的核心技术是阿里千万团队的门控技术, 这个技术前不久刚刚获得了 neo 一 ps 二零二五的最佳论文奖。这可不是一个普通的奖项, neo 一 ps 是 全世界最顶尖的 ai 学术会议之 一,基本相当于 ai 研究的奥运会。二零二五年,这个会议一共收到了两万多篇有效投稿,最终只接收了五千多篇,接收率不到四分之一。也就是说,论文能被接收就已经算赢家了。在这么多论文里,只有四篇论文含金量有多高? 获奖论文的主题就是门控技术。那什么是门控技术呢?简单来说,门控技术就是通过在注意力层的输出端加一个智能开关,把信息像水龙头那样进行智能调控,这样既防止了有效信息被淹没,也防止无效信息被过度放大。 这带来的结果是,模型更少被噪音带偏,训练更稳,长文本更不容易出现注意力被无关信息吸走的问题。 更关键的是,这个改动,四两拨千金,改动不大,但效果又好又稳定。在美国的 ai 同行都在砸钱拼算力的时候,以阿里千万为代表的中国团队却在算法效率上做极致优化。这就是为什么千万三点五 plus 能做到 token 价格只有 g p d 五点二的十五分之一, jimi nike 三 pro 的 十八分之一。 千万是真正通过技术创新把 ai 模型的价格打下来的。这个思路很可能在智能体时代会大放异彩。 为什么这么说呢?我之前说过,智能体的作用已经被龙虾给验证了,唯一的痛点就是费钱。所以性能足够强、价格足够低的模型,一定是智能体时代的刚需。其次,我们再看远一点,如果想要让智能体越来越有用, 你就需要把自己更多的信息、更多的权限给到智能体。这时候隐私就会成为一个不可回避的问题。怎么保护隐私呢?最好的办法就是让智能体在自己的设备上运行。 想要做到这一点,肯定不能靠堆算力,只能靠算法优化,靠开源模型。未来大概率会出现一个现象,全世界每个电脑里都会有 ai 大 模型,而这些大模型大部分都是中国的开源模型。

我发现龙虾机器人一个非常实用的使用场景啊,就帮你整理笔记,从此解放你的双手。是这样的,就是我平时是有那个记笔记的习惯,然后你看这个有道笔记里边,我之前已经记了十几年,差不多有七千多篇, 所以就是什么事情我都喜欢记一下。那在安装这个龙虾机器人的过程中,根据它这个官网,然后这个地方有个教程,这里 啊看起来就是执行这样一条啊命令吗?然后但是你安装的过程中难免会遇到一点小小的问题,所以我会把它记录下来, 然后这次我把它记录到那个 abc 笔记里边,然后的话因为安装的步骤还是挺多的,所以记的时候也比较随意,然后截图链接啊,就往上贴啊这样,但是安装完了之后,就是我突然想到,就是能不能让他帮我整理一下,对吧?所以 啊,我就把把我的需求发给他,就是说让他帮我把那个那篇笔记整理一下,然后标题缩进链接啊,都整理成一个清晰的 markdown 格式,然后因为这个 ipad 这个笔记的话,就是它完全就是在管理一个 markdown, 所以 那我们稍等一下,然后差不多十几秒就整理完毕, 哎,你看就是整理完了之后,就是非常清晰的标准格式,然后这个地方你就可以 贴到 get up 啊,或者贴到你的一些扑克里边,就是可以完全解放你的双手,给你节省了大量时间。

今天用一条视频讲清楚 modelpad 龙虾机器人安装的过程,以及配置飞出插件的流程。首先把 modelpad 的 官网的安装命令复制到命令行中啊,并执行, 等待命令执行,这个过程可能比较长,开始安装第一个提示选择 yes, 第二个提示选择 quickly star, 第三个选择模型的话,我们选择千问,因为千问比较好授权,打开千问的这个授权界面,登录我们的千问账号 啊,登录完成之后,点击确认,可以看到认证成功的一个界面,返回到命令行这里我们选择默认模型, 然后聊天通道我们先选择跳过啊 secure 这里我们选择跳过,然后户客我们把后面三种全部勾选,下面开始安装网关服务,这个是自动化的流程,网关服务安装完成之后,下一步我们选择用 t u i 的 方式来启动 啊。 mod pod 啊的 ui 界面,可以看到一个聊天的这个窗口,这个地方我们输入你好,此时可以看到 mod pod 给我们输出了一段响应,证明 mod pod 安装成功。 下面我们再随书创建企业自建应用。应用名称这里我们输一个名称 啊。应用描述这里我们输入一段应用描述啊。应用图标的话可以选择默认的,不用上传,点击创建。应用创建完成这里我们为应用添加机器人能力, 添加完成之后,在机器人配置这里设置机器人的用户显示名称,这个名称后续会用到。下面一步,我们为飞书应用配置权限复制权限列表到飞书应用里面,开始为 飞书应用开通权限,下面一步,通过搜索把必要权限都给添加上,点击确认可以看到我们为飞书应用配置的好的权限。下面一步,我们开始安装飞书插件,把命令复制到命令行里面,开始执行。 这一步我们会遇到各种奇奇怪怪的错误啊。第一个我们把镜像员切换到淘宝镜像员,把切换镜像员的命令输到命令行里面开始执行, 下面把 npm 的 缓存清理一下,然后再次执行飞出插件的安装。开始执行安装时,我们会看到又输出了啊一些错误,把这段错误丢给豆包,我们按照提示先删除旧的插件,然后再 安装相应的依赖,再次执行飞书插件的安装,此时可以看到飞书插件安装完成。下面一步,我们为飞书插件配置 app id 和 app secret, 找到飞书开放平台,找到配置,以基础信息制短,把 app id 和 app secret 啊,按照上面的命令,我们启动飞书插件,使用完成之后 啊重启网关,下面我们输入命令,查看飞书插件配置是否成功,此时可以看到飞书插件是 load 的 状态,证明安装成功。下面一步,我们为飞书应用配置事件已回调 啊,先使用长连接配置,然后添加事件,我们找到需要添加的事件,在飞书应用中搜索并逐个添加完成,我们点击确认开通权限,确认之后可以看到已经添加的事件。此时我们为应用创建版本,输入应用版本号 啊,一点零点零,然后输入版本的更新说明,这个更新说明可以随意填写,完成之后我们点击保存,然后确认发布,确认发布之后应用已经生效,此时我们打开飞书客户端,在搜索里面找到我们创建的这 机器人,然后开始与他进行绘画,可以在输入框内输入,你好 啊,此时 mod pod 开始给我们输出一段响应,证明飞书插件配置成功。下面看一下 mod pod 是 怎么为我们干活的。在聊天对话框中输入整理一下我的桌面,此时可以看到我的桌面 啊文件相当乱,发送命令给 mod pod 之后,此时此时可以看到 mod pod 的 整个工作过程啊,给我们输出对应的回显,并且桌面文件在以肉眼可见的速度在逐渐的归入到对应的文件夹中, 这就是 model pod 为我们整理桌面文件的一个啊。演示流程,整理完成之后,整个桌面会变得清爽的很多。左侧的机器人对话中可以看到啊最终的输出结果。


今天准备了一盆龙虾,我们来看一下到底几斤龙虾才能做出一斤虾尾。马上开始 你听过最美的旋律, 现在这边正好是一斤虾尾,然后我们把头放进去啊, 看一下啊,三点七五,三斤七两的虾做成一斤虾尾。


真情实在累。 小龙虾呢?是他妈拿回家吃饭了吗?怎么一点下回都没有? 口咸,我有糖。反思一下。龙在上海葱油拌面。 刚才我告诉你啊,你要在上海买这个面,你看上海人打不打死你。这个东西叫葱油拌粉,不叫拌面,而 一点烟味没有。你让我自己调味吗?我也 姐,我买一箱椰树椰汁不行吗?我就想问问啊,你们那个肠啊敷衍是不是做塑料的?为什么这个烟呢?一股塑料味。无人猪肉酥 也没有,猪肉也没有素,那剩什么?无人那还能吃吗?又是被小垃圾们气死的一天。