粉丝1.3万获赞3.4万

什么? ai 可以 完全接管电脑了?没错,就在前几天, cloud 悄悄放出了一个重磅更新, computer user, 这个功能让 ai 走出了对话框,真正拥有了动手干活的能力。它用纯视觉方案可以像人一样看屏幕、点鼠标,操作电脑,执行任务。 也就是说, cloud 可以 真正的接管电脑。以往我们用的 ai 助手大多是靠底层代码驱动,跳过了前端界面,遇到浏览器或 office 这类可以调用接口的还好说,可是一旦碰上这些没有开放接口的软件,它就无能为力了。 cloud 这次带来的 computer user 功能,相当于给 ai 装上了眼睛, 不需要调用接口,而是能像真人一样识别屏幕,点击鼠标,而且它也可以通过手机跟电脑进行交互。看到这里,有的朋友可能会问了, open cloud 也可以用视觉方案呢?没错,但是它需要非常复杂的设置。 cloud 的 优势是能做到开箱即用,省去了复杂的配置流程, 再配合前几天更新的 dispatch 远程操控功能,只要你的电脑开着手机发个指令,它就能跨越空间帮你完成任务。这种视觉操控的闭环,让 ai 从一个对话框变成了真正能干活的数字员工。那 openclaw 是 不是该感觉到压力山大了呢?那你觉得这种长了眼睛的 ai 会是你提升办公效率的一个方法吗?

兄弟们,我终于找到了 codex 接触国产大模型最简单的方法了,还能解决用原声插件的各种痛点。只需要两个工具,一个是插件打开工具 codex 加加,另一个是切换大模型工 具。一口 board 使用的时候呢,你只需要先打开 codex 加加,然后就可以使用一口 board 随意切换大模型了,就连克拉的扣子都不在话下,这丝滑感简直将 cd switch 按在地上摩擦,学会就赶紧去试试吧!

workbody 如何调用 nano banana 二?我们直接看结果,我们只要引用 nano banana 二 skill, 然后输入你想要生成的内容。这里我们生成了一张红烧肉的图片,只需稍等片刻,图片就会生成。 那么我们如何获取这个 skill 呢?首先我们登录 console, 点 woopeng, 然后进入左侧的安装 o o c o i 菜单,复制提示词粘贴到 workbody 中,很快 o o skill 就 会安装好。 o o skill 是 接下来各种 skill 的 一个入口。 然后我们引用 o o skill 告诉 workbody, 我 们需要安装一个图片生成 skill, 可以 看到它给了我们几个选择,我们选择 not not 二, 很快 skill 就 安装完成。然后就像开头一样,你就可以使用 nasa banana 二来生成图片或者编辑图片了。是不是很简单,赶紧来试试吧。

好,我们来分享一个自动批量批改应用的升级版本啊,原来我们只能自己使用,对不对?这里呢我们需要需要什么?以前我们在工作流里面是写入到我们的 非书的 i id 跟我们的密钥,对不对?这里呢我们进行一个升级,首先第一步呢我们就来先要把我们的非书应用的 id 参数呢,先写入到数据库中,然后从数据库里面去进行调用。这里呢就可以让我们 我们如果我们整个学校每个学每个老师都可以来使用这个应用,对不对?但是他就需要自己去创建好这样的一个非书应用的 id 密钥。首先呢好,我们首先看一下 这里,首先第一步呢手势进入了你就要干嘛呢?首先要添加我们的非书的应用 id 和密钥,就是我们开发者给他放放置,看到这里呢我们就该写好了,需要什么去创建,需要开通哪些权限好,然后首先创建好之后也是一样的, 各位创建好我们就把这个呢写入到数据库中,把这个飞书的应用 id 跟飞书的应用密钥给它写入到我们的数据库中。 第二步呢我们我这就不演示了,我已经写进去了,看到各位在我数据库里面,我就进入到了 a b b id, a b stocking, 对 不对?第一步就完成了,接下来我们每首次使用就要先去添加一个飞书应用。 第二步呢跟我们前面是一样的,这里呢我们就来增加了一个老师的姓名,根据老师姓名来查找对不对?我们就这里呢就针对了,不同的老师都可以来使用好,这里就判断老师不同的老师跟作业编号来生成。 第二步作业,老作业模板写入也是一样的,我们把作业模板写入跟前面一样,图片模板呢还是文档模板? 第三个批改作业也是一样的,我们就是作业编号,这里就添加了一个老师的姓名,我们通过老师姓名跟作业编号来查找, 这里呢就可以让我们不同的不同的老师老师都可以来使用这个应用。好,看到我们原来的版本是怎么样呢?就是我们先要把我们的 开飞书应用 id 呢先给它写进去,但是这里呢我们升级版本呢就可以通过数据库的形式去调用我们的飞书应用 id 跟密钥, 这里呢就是所有的老师他们都可以来使用这相相关的内容,这就是我们今天讲的一个自动批量批改应用的升级版本的修改问题。

今天教大家怎么调用大模型 api, 学会了你也能自己做一个 ai 助手。想要调用大模型,首先得知道一件事,这些模型参数动不动就几百上千亿,咱们普通电脑根本跑不动。 所以现在主流的做法是让模型厂商把模型部署在他们服务器上,我们通过网络请求去调用,按使用量付。且 这里有两个核心概念, api 是 接口 api key 就是 你的身份证,拿着它,厂商才知道是谁在调用,该扣谁的钱。 目前提供大模型 api 的 服务商很多,基本流程都一样,注册账号,创建 key, 充值调用。区别主要在模型能力和价格上。我这教程统一用 deep seek, 原因很简单,能力够用,创建 key 方便,价格还便宜。 而且你放心,学完这套教程,所有例子加起来可能就花几块钱。接下来演示怎么创建 key。 首先打开 deep 开发者平台,在左侧菜单找到 api keys, 点击创建, 随便起个名字,点确认,就会得到一串 s k 开头的字母串,这就是你的 api key。 注意,这个 key 就 等于你的账号密码,别人拿到就能花你的钱,一定要保管好,不要提交到 github。 好 t 有 了。现在说接口格式,目前主流就两种, openai 的 chat completion 格式和 andropic 的 messages 格式。 先看 open a i 格式,发一个 curl 请求 base 下划线 url 是 api 点, deep seek 点 com 斜杠 v 斜杠叉,斜杠 completion 认证用 bear token 的 方式 返回的 jsl 里,模型回答在 choice 下面的 message content 里,这里就是他回复的你。好,很高兴见到你。 再看 anthropic 格式,注意这里 base 下划线 url 多了 anthropic 认证,改用 xip ikey 请求头还需要指定版本号返回格式不一样了,回答在 content 下面的 text 里不是 trace 了,字断名也不太一样。 虽然格式看起来不一样,但本质都是发消息收回复。现在模型厂商都会同时支持两种格式,你换一家只需要改变下划线 url 和 key 业务代码一行不用动。

codex 刚上线了一款神级插件 codex chrome, 让 ai 像人一样操作浏览器,先看效果。我给他安排的任务是帮我在某音和小某书上搜索关于 openclaw 的 作品,各平台各找五个点赞高的,每个作品收集五条热门评论,然后通过这些评论整理出大家对这个话题关心什么。他会先分析任务, 然后呢,开始调用 chrome, 这时候 chrome 就 会出现一个独立的标签页组,然后他就在这个标签页组里自己运行,我可以自己继续干别的事情,相互不打扰。他先打开某音,搜索关键词,然后找到相关视频, 并且按点赞进行排序,点进去之后看内容和评论,然后一个接一个。 之后呢,他再切换到小某书,用同样的方式找到相关的笔记和评论。最后他把不同平台的信息整合到一起, 然后给我整理出一份结果,这样就为我省去了大量的搜索提取。然后整理的这个时间用了几天。我认为 codex chrome 最适合的事情是,你本来可以人工完成,但是非常重复,非常耗时间的网页查询、整理对比和初步分析。 或者如果你们公司有一些内部系统,比如 o a 啊 e r p 财务软件,你平时要经常去填一些表单,日报报销什么的,你就可以让他去帮你去批量的填写。我看网上有人说安装不成功,这里有两点需要注意, 第一,你的 codex 和 chrome 的 版本要更新到最新。第二, chrome 的 商店里需要有 codex, 有 些区域不支持,比如欧洲,你换一个支持的区域就可以了。关注我,我是持续分享 ai 提效工具和方法的小伟。

opencode 如何调用 code 工作流实现高效工作? code 是 云端的工作流, opencode 是 本地的 agent 助手,如果两者结合起来,工作效率一定蹭蹭涨。 opencode 调用 code 需要三步,第一步是安装 skill, 第二步是 code 拿授权, 第三步是设置 skill 参数,然后测试。 opencode 调用 code 的 skill 叫做 code workflow, 它需要从 code 获取授权和工作流的演 安装命令为 m, p, x, call 与 bug 等 style code work for 安装成功后就完成了第一步。第二步是打开 code 编程页面,然后登录,点击左下方的 a, p, i, s, d, k, 这里点授权, 这里应用类型选普通客户端类型选服务类,名称是类似身份证,全网唯一,你们自己试 创建 t 会自动下载一个文件,不用管它。权限选全选,然后确定弹框的话选授权。 创建好应用后,点旁边的服务身份及凭证,点击添加按钮,时间选昌期,权限选全选工作空间看实际情况选,点击确定。这个令台要保存好,待会要用。回到扣子编程页面,点击你的工作流,工作流要以发布的状态。 点开工作流后,输入最后的数字是工作流眼保存下来,最后在 c, m, d 设置下 open call 就 能用了。

每天使用各种 ai, 想过如何把 ai 集成到自己的项目里吗?作为一位程序员,最近在想一件事,如何让 ai 简化我的运维工作呢?面对项目中的众多业务接口,众多数据库表 和各种文档,每次需要查询文档,调用接口时都要打开对应的软件或者找文件路径。有时候电脑不在身边就束手无策了, 有什么办法可以让 ai 自动帮我做这件事呢?于是我发现了 spring ai 阿里巴巴这个框架。通过创建 tool 方法定义好每个 tool 的 描述, ai 会通过定义的描述自动判断是否调用。 通过使用 natural language to sql, 将自然语言转 sql 语句,并直接执行 sql。 我 在自己服务器安装了 qdrent, 用于向量搜索,包括数据库表结构解锁。 来,我们看看效果。我接入了查询企业抬头的接口,看他表现怎样。然后我们让他查一下数据库表信息,他会给我输出他自己生成的 sql 语句,并展示查询结果。 最后看看他去查知识库的效果,这个内容肯不是原文,他会将查询到的结果整理之后发出来。当然不止这些功能,还可以扩展成企业 ai, 客户 数据分析、日记分析、知识问答都可以实现。如果需要原码分享,可以在评论区留言,在我这个基础上做你想要的扩展。最后,你们猜这个视频的动画是用什么完成的呢?

为什么我推荐您使用扣子智能体大模型都是搭建好的,我们只需要指令就可以了,所以扣子小到帮你去写一个 word 文档,帮你去做个这种表格,大到帮你去做这种酷炫的视频,帮你去做一个网站,这些功能都是可以去实现的。 接下来我给大家列举几个例子,像我们现在这个视频就是搭建的招聘的一个工作流,它可以直接在各个招聘软件上给您去发送一些招聘的信息, 然后开始帮您收集简历,之后,你就可以看到这些简历都在他的邮箱里,然后你就可以直接去调用他邮箱里面的这个简历。然后呢还会有到一个发票系统,就是可以直接去解析你的发票是什么样的类型,直接帮你录入系统,然后可以直接打包把你的发票 让扣子帮你发给谁,所以对于发票来讲也是比较方便的。第三个功能就是做视频的功能了,像我头顶上方这个视频,就是我们直接去用 cds 二点零给大家做出来的一个完全可以直接商用的视频, 正常手搓这一个视频我觉得没有几百一千他肯定是下不来的。这一个视频生成出来就是两万五左右的一个积分,那这个积分算下来的成本也就十几块钱,我觉得这个成本就已经算非常非常低了,因为如果您是需要用这个视频去进行商用的话,那他能帮你赚到的钱一定是比这个成本要低的多的。


mos, 把我电脑桌面上最新文件夹里面的所有视频,用最新给你的技能剪成一个完整的抖音视频放到剪映里。 好的, wyson, 我 会用我们刚研究出来的最新的 g n n 和技能剪辑视频,具体需要十至十五分钟,请耐心等候。等一等啊! later wyson, 久等了,剪辑好的视频已放入剪映里,请打开查询。 好,完整了,有字幕有开头。