粉丝6706获赞3.5万

antropic 公司推出的 cloud co work 功能目前仅对 cloud max 订阅用户开放,必须购买 max 计划才能使用,每个月一百美元起。在推出 cloud co work 两周后, antropic 公司于一月三十日又推出了一款法律插件。 该插件专门针对内部法律顾问的法律工作流程,包括合同审查、保密协议分类、合规性检查、简报和模板化回复。 根据描述, anthropic 公司的法律插件指在加快企业内部法务团队的合同审查、保密协议筛选和合规工作流程。据 anthropic 公司称,它可以完成以下工作,合同审查使用斜杠 review contract 命令,会根据配置的谈判策略逐条审查合同,并返回绿色、黄色、红色标记和修改建议。 保密协议分类使用斜杠 tree edge nda 将收到的 nda 分 类,以便进行标准批准、律师审查或全面审查。 合规性检查使用斜杠 rendercheck 检查供应商协议状态检报生成使用斜杠 brief 生成背景检报,每日检报、主题研究或事件响应。 模板化回复使用斜杠 respond 创建针对常见查询,如数据主体请求和发现保留的模板化回复。 cloud 法律插件可以连接到 slackbox、 ignite、 伽玛和 microsoft 三六五等应用程序。有了这款插件后,普通人或小企业主自己就能搞定初级法律文书。

抠手无限续杯终于还是突破了,这个 oppo 十四点六 max 的 模型用起来是真的爽了,用了上百万透更了, 然后很多粉丝就让我分享一下最新版本的,然后我现在就给大家分享一下啊, 然后现在首先呢大家先开始点一下这个爱心跟这个五小星,然后 说个谢谢,好吧,然后最关键的一步就来了啊,点这个分享按钮,点这个右下角这个,然后找到这个复制链接,我们就回到桌面上,点击这个应用商店,然后打开小蓝鸟,然后 弹出一个允许粘贴,我们点就行了,然后点立即查看,然后这个就是我们的工具啊,你先保存下来,先保存下来要点去查看,去查看之后你看这个就是我们工具,我们手机上面是解压不了嘛,因为它是扣手的插件啊,我们安装到扣手使用就可以了。

上一条视频我发了一个一个抠搜无限续杯,这个 obs 四点六的视频啊,但是呢那个链接被和谐了好像,然后很多粉丝啊要求让我重新再发一次, 然后我就把今天二月八号了最新版的就发给大家吧。啊,现在教大家怎么弄啊?首先把这个点一下这个爱心跟这个五角星,然后发一下这个 啊,大家都可以发一下啊,然后最关键一步来了啊,点开这里这个分享按钮,然后点这个找到这个复制链接,找到之后回到桌面,我们打开这个应用商店,然后这个应用商店,然后点打开这个小蓝鸟,它会自己弹出这个,我们点允许粘贴, 我们再点这个立即查看,这个就是我们的续费工具了,我们先保存到手机上,点去查看 啊,这个就是我们续费工具,然后你们就可以把它发到电脑上面去解压,然后到 cos 的 拓展里面安装使用就可以了啊。

好的,那我们今天的探险路线图非常清晰,首先咱们得搞明白为啥要用 quad code, 然后呢,检查一下需要准备的装备,接着一起攻克安装这个小挑战之后也是最关键的一步,连接上咱们强大的国产 ai 大 脑,再看看有哪些能让你效率翻倍的小插件。最后就是你亲自上手发出第一条指令的时刻,准备好解锁这个新技能了吗? 好了,第一站,我们先来聊聊为什么是 cloud code, 顺便呐,也打破几个关于它的常见误解。很多人呐,都有个误区,以为 cloud code 嘛,肯定就只能用 cloud 自家的模型。其实啊,完全不是,它最大的一个优点就是特别开放,可以接上像智普 g o m 这种又强大性价比又高的国产大模型,这对咱们国内用户来说简直太友好了。至于安卓嘛,也绝对比你想象的要简单得多。 第二部分,咱们来准备一下装备,动手之前嘛,总得先做个起飞前检查,对吧?你看,准备工作其实超级简单,就需要三样东西,首先是 git, 它是个代码版本管理工具,安装程序需要用它来下载点东西。其次呢,我们强烈推荐你装一下 node js, 它能给咱们提供一个特稳定的环境,让安装过程更丝滑。最后当然就是能上网了,哎,这时候你可能会想了,万一我电脑上就没装过 git, 那 会怎么样啊? 问的好,要是没装 get 啊,安装的时候确实会报错,不过别怕,这问题特好解决,官方网站里有非常清楚的安装说明,现在咱们就来迎接第一个小小的考验,正式安装。你看啊,官网多贴心,它会自动识别你的电脑系统,然后直接给你生成一行安装命令。是不是看起来超级简单?你只要点一下复制,然后粘贴到你的终端里,敲下回车键,理论上就完事了。 等等,注意看这张图,好多新手就是在这卡住了。你看,终端里明明写着安装成功,但紧接着下面就跟了一句警告,说找不到 l l a d 这个命令。这其实就是个特别常见的假成功陷阱。 别慌,咱们有百分百管用的 plan b, 这时候咱们刚才推荐安装的 no g s 就 派上用场了。打开终端,输入屏幕上这行 m p m 开头的命令,给他来个全局安装,等他跑完,你再输入 cloud 杠 version 验证一下。要是能看到版本号跳出来,那恭喜你这次是真真正正的搞定了! 安装大功告成!接下来就是整个流程里最最激动人心的部分了,咱们要给他接上强大的国产 ai 大 模型,真正把它的魔法给解锁出来。 咱们就拿智普来举例子啊,你先登录它的官网,不用到处乱翻,就看右上角,你头像旁边是不是有个 apikey 的 链接,对点它,咱们就从这开始。进了管理页面之后,目标非常明确, 就是那个蓝色的添加新 apikey 按钮,直接点它就行,随便给它起个好记的名字,点一下确认,你看你主书的 apikey 就 生成好了,现在赶紧把它复制下来存好。那问题来了,这串东西要配置到哪去呢?很多人可能会担心,我用 windows, 同事用 mac, 这路径肯定不一样,找起来会不会特别麻烦? 这个问题我们早就替你想好了,你需要找一个叫 dothclaw 的 文件夹,里面有个叫 settings, 点 jason 的 文件,这就是配置文件。你可以把 apikey 理解成是你和 ai 之间的专属接头暗号,打开这个文件,把你刚刚复制的密钥替换掉 urzipp apikey 这段文字就行了,至于具体路径在哪儿,放心,文档里都写得清清楚楚。 当然了,除了智普 g o m minmax m 二点一也是个超值的选择,性价比简直拉满了,日常用绝对够,配置方法跟刚才一模一样,拿到 apikey, 找到配置文件,粘贴替换几下就搞定。不过你可能已经想到了一个问题,难道我每次想换个模型用,都得去手动改那个配置文件吗?这也太麻烦了吧?别急,当然有更聪明的办法, 这时候就该咱们的效率神记 cc switch 登场了,你就把它想象成一个专门给 callout 用的遥控器,今天想用智普点一下,明天想用 mini match 再点一下,超级方便!它的界面啊,简直不要太直观!你看,打开软件,点一下,添加,供应商所有主流的模型都给你预设好了,你只要找到智普 g l m, 把你自己的 api key 填进去,点个添加就全部搞定了。 最棒的是什么呢?你根本不用一直待在那个黑乎乎的端端窗口里,可以无缝地集成到你最熟悉的开发工具里,比如说 vs code, 你 只要去扩展商店里搜一下,把它装上以后,就能在平时写代码的地方直接调用它的所有功能了。 好了,万事俱备,现在啊,咱们就来看看你手上这个刚刚配置好的强大工具到底能帮你做些什么呢?看,这就是胜利的画面。当你再次启动 cloud code, 看到左下角清清楚楚的显示着你配置好的魔镜名字,那恭喜你,一切都搞定了。

这两天最大的新闻就是 cloud code 把 open code 封杀了,很多人通过 open code 去使用 cloud code, 会被通知你的 max 的 订阅会员被封禁,再也无法使用。并且 cloud code 做件很贱的事情,它调整了搜索引擎的关键字的排名,你现在在搜索引擎搜 open code, 大 概率会出现的是 cloud code 这个事带来一个什么样的影响呢?影响就是 open code 这两天在加紧产品迭代,并且积极拥抱 open ai, 这不就等于把我自己的核心用户推给了我的竞争对手吗?从开源的角度来讲,从商业化的角度来讲,我看不到一丁点的好处, 是不是 clark 这种财大气粗的公司就是这么小气兮兮的呢?你的观点呢?我们评论区聊一聊。

阿里通一千万团队发布困三 maxing king 新版本,号称数学竞赛满分,逻辑推理无敌。为了体验他的能力,我给他找了两个对手, clog opus 四点五和谷歌的 jammin 三 pro。 先说结论,再写代码。搞工程方面, cloud ops 四点五写的操作系统逻辑最严密,写的三 d 游戏体验也是最好的。切门奈表现中规中矩。 queen 三 max 在 这里遗憾垫底,特别是在写三 d 游戏时,能感觉到它在空间想象力和复杂库的调用上 距离 cloud 还有明显的差距。在随后的纯逻辑陷阱和数学推导测试中, queen 三 max thinking 的 thinking 模式,面对那些极易诱导 ai 犯错的逻辑坑,他全部完美避开。 推理过程十分详细。来看,第一个操作系统模拟器测试系统架构与状态管理规定。它还原一个 win 十一的 ui 风格,并且要在系统里预装五个应用程序,规定程序的类型,一个互动游戏,一个可适化工具,一个系统应用, 剩下两个由它自由发挥,写出一个优雅、高性能、完整、可直接运行的操作系统。第一个弹珠游戏 结算时点击 ok, 它会一直陷入循环。数据可视化,输入数据,生成图标,看系统设置颜色,主题背景图片、桌面壁纸, 右下角也显示了时间,还有一个记事本程序,一个时钟。程序左下角的图标也都是正常的,可以正常点击。每次点击图标会创建新的页面, 当我们创建页面太多时,点击关闭按钮或最小化按钮都会失效,系统会卡住下一个。我们来看 jammer 那 写的操作系统,它写了一个星际重力的小游戏, 放大全屏,功能正常,数据可塑化。系统设置包含深色模式和极简背景,还有一个终端,但是我们鼠标点击它是无效的。看一下合成器 功能正常可以使用,右下角也显示了日期和时间,但主页面的图标点击没有任何反应。最后我们来看 cloudy 写的操作系统,写了一个粒子引力的小游戏, 数据可视化,可以随机填充,这个效果最好。音乐合成器支持按键点击, 点击设置可以更换壁纸和深色模式,还有终端可以输入命令, 它的下方的图标不会重复打开,就不会遇到千问三 max 那 种卡死的情况。 可以说 club 在 整个测试中效果最好。第二项,让 ai 用 a c r 引擎写一个简易的三 d。 第一人称射击游戏 要求要创建简单的地板和几面墙作为掩体。玩家第一人称视角可以移动跳跃,用一个简单的方块代表枪左键发射子弹,敌人会向玩家移动,被子弹击中后敌人消失。 这个侧重于三 d 数学计算测试模型的视觉化、编程能力和几何逻辑。 ai 必须构建一个 x y z 坐标系连续事件处理,考验代码的连贯性。我们先运行 cl 写的脚本, cloud 写出来的敌人是有寻路逻辑的,而且发射后子弹还有爆炸特效,但它并没有写出墙体和地面。下一个 jammy 三写的三 d 游戏,它完全没有寻路逻辑,敌人不向我们靠近,反而远离, 但地面和墙体效果不错,而且人物并不会穿模,跳跃也是正常,可以站到物体上,鼠标左键发射子弹,完全没有发射子弹的效果。 运行千问三 max 写的脚本时,直接出现了报错,我们将报错复制发给千问三 max, 它分析错误原理,然后重写代码,我们再次运行看一下效果。人物寻路逻辑存在,但是人物会穿模, 敌人会从我们模型直接穿过去,然后把我们围在一起看三个敌人已经重合,左键有发射的动画。 coin 三 maxing king 的 强项是边想边查边写代码验证。我们问他一个逻辑算法题,你有一个三升的水桶和一个五升的水桶,都没有刻度,水源是无限的。如何精准地量出四升的水?请列出每一步的操作步骤。 步骤没有问题,答案正确。我们再问一个逻辑陷阱题,三条毛巾晾干需要一个小时,那么九条毛巾在天气和光照条件完全一样的前提下,需要几个小时晾干。 它准确识别出了问题中的陷阱。回答正确,我们提问一个哲学思考问题,小明压力太大,连续喝酒死了,那杀死小明的是酒精还是过去?模型澄清事实,死因,急性酒精中毒。然后多维度解析分析了凶手, 探讨背后的哲学与逻理维度,最后提出总结,酒精不是凶手,而是绝望的再体,从自身朋友、社会寻找真正的凶手。后面 ai 还给出了心理援助热线。 快按。三 max thinking 是 一个闭圆的超大规模推理模型,拥有 et 加参数和二六二 k 上下文窗口,主打深度推理能力,但目前不支持本地部署。 训练数据三十六万亿 tokens 是 亏本二点五的两倍,适合处理超长文本或复杂任务,具备多语言推理和生成能力,覆盖超过一百种语言和方言, 在智能体编程、常识推理、数学与科学任务等场景表现优异,尤其适合需要深度思考的复杂任务。 特色功能可在 thinking 模式和非 thinking 模式间无缝切换,用户可控制推理深度自适应工具调用。在推理过程中,模型会主动判断这个问题算不准,需要写一段拍森代码来验证,或者这个知识点太新,需要联网搜索 测试时扩展 tts。 宽三 max thinking 采用经验累积的多轮策略,在第一轮思考后,如果发现不确定,会进行自我反思,提取上一轮的经验教训,再进行下一轮推理。 这两张图表都来自千问官方发的博客。从第一张数据表可以看出,宽三 max thinking 在 知识广度、复杂指令遵循以及工具使用上 已经具备局部领先 gpt 五点二和 gemina 三 pro 的 硬实力。第二张图直观揭示开启 tts 后模型在科研难题、高难度编程和开放式搜索上表现的提升。在官方报告中,昆纳三 max thinking 的 主要对标对象是 gpt 五点二 thinking、 cloud 四点五 opus 和 jameson。 三 pro 官方博课于二零二六年一月二十五日正式发布,宣告困三 max thinking 从实验性质转为正式旗舰产品转为正式旗舰产品,开发时需指定模型 id 为困三杠 max 杠,二零二六年一月二十三日 才能体验到最新的自适应工具调用和 tts 能力。在阿里云平台,模型共享一百万 token 的 免费额度, 如果你是一个程序员,需要 ai 帮你写复杂的项目架构, web 应用 cloud 仍是首选,它的工程能力目前独一档。如果你需要解决复杂的数学题, 做深度的数据分析或者处理逻辑推理任务,困三 max thinking 是 一个不错的选择。希望本期视频对您有所帮助,想看更多测评或最新资讯,欢迎评论区留言,我们下期视频再见!

卧槽, ai 写的页面终于不翻车了!这个开源神器让 ai 输出的 ui 风格统一,质感拉满!今天这个 uiux pro max 六核心就是给 ai 定设计规矩,平时让 ai 写 ui 页面,要么配色乱,要么布局散,风格完全不统一。 它的作用让 ai 能按照专业的 u i u x 规范输出,风格统一不说,还支持多个平台。它作为 ai 编码助手,支持 claudioctor、 cursor、 windsor、 anti gravity github、 copilot hero。 五十七种界面风格,九十五种色板,五十六种字体配对,二十四种图标类型, 全面的设计,智能触手可及搜索发现并实现带有 ai 推荐的精美界面。八个技术对战都支持框架特定的最佳实践模式和代码示意,获取针对你技术站量身定制的指导方针。最底部还有工作原理, 从提示到生产准备的 ui, 仅用六个智能步骤,每一步都有介绍它的工作。最后有三十九个网站演示都是使用它进行开发的。不管你是 ui 设计师、前端开发者还是产品经理,用这个神器,能让 ai 输出的页面告别杂乱,风格统一,效果更好,直接省百分之八十的改稿时间,感兴趣的赶紧收藏!

真的不敢想啊,这个 cloud open 四点六的模型啊,它真的一句话能给你用上百万的 token 呢。然后很多粉丝就说啊,还好我们有这个口手的无线续杯, 然后它是可以用这个 oppo 十四点六 x 的 模型,所以很多粉丝说还不知道怎么安装,然后我这样我重新说一下, 然后这个首先我们先点开这个小心心点一下,然后大家就发一个感谢吧。好吧, 以后点亮这个五角星,最关键一步来了,点击这个分享按钮,点这个分享链接复制起来,复制链接,然后回到桌面上,打开应用商店啊,这个打开这个小蓝鸟,他就会自己弹出一个允许粘贴,有广告就关掉就可以了, 然后点立即查看,点开了之后呢,你看这个就是我们工具,我分享过来了的,然后你们保存,先保存下来,然后点去查看, 然后你看这个工具,然后我们把它可以选择发到自己的这个啊,这两个那个上面,然后发到电脑上面,装去 qq 里面使用就可以了。

rap 是 有非常多的高级模型,是可以使用的,我们来使用四点六发起一次对话, 可以看到 rap 给出了一个非常准确的回答,它是 cloud 四点六 office max, 我 们现在登录的是 i 一 开头的账号,我们来看一下它的额度,可以看到一个账号是三百的额度,我们刚发起了一的额度,假如说我们的额度用完了,直接来到小助手 点击 rap, 点击一键获取 freeplay, 可以 看到 rap 进行了一个关闭,并写入了账号数据,然后重启,我们可以看到现在已经切换到 r e a n 开头的账号,选择最新的 club 四点六 opus 模型, 可以看到 office 四点六给出了一个非常准确的答复,现在是二零二六年的二月十一日, rap 可用的模型有非常多,全都是一些高级模型,甚至有最新的模型,大家可以去试一试。再来看 winstop, 我 们现在登录的账号是一个 l s y 开头的账号,直接打开小助手点击一键获取,稍等片刻, winstop 就 会进行一个关闭,然后写入账号数据, 可以看到账号已经切换为我们刚刚拉取的 n b t 开的账号。 winset 最近做了一个很大的调整,现在 g p t 五点二只剩一个一 x 的 模型可以用,但是这个模型还是非常强大的,我们来使用它发起一次对话, 可以看到已经很快的就给了我答复,可以看到回答速度是非常快的,他的思考过程还是非常细腻的,我们可以看到他不断的在思考, 可以看到我让他审查代码,然后发现了很多的问题是可以去优化的,总的来说 g p d 五点二虽然只剩了个一叉的模型,但是这个模型本身还是非常强大的,现在来说 win 色还是性价比非常高的。 可以看到 cursor, 它的额度也用完了,我们也可以直接来到小助手,点击 cursor, 一键获取 free plan, 稍等片刻,等待他在云端进行一个账户的获取以及环境的清理。好,我们可以看到登录了一个全新的账号 q a k 开头账号,也就是我们这个账号,我们来发起一条对话, 可以看到现在给出了一个非常精确的答复,我们来看这个时间,十八点十九分,刚才回答的时候是零六秒 浏览器,它是只能够使用 auto 模型,还有 gemini flash, 再点击 add models, grock 模型以及 gpt 五 mini 也是可以使用的。 grock gpt 五 mini 还有一个 gemini 二点五 flash, 总共是这三个模型,加上 auto 可以 使用同样的 qio, 我 们也可以进行一个无限的续杯。点击查看账号, 当前的账号是一个 z z z c g a a 开头的账号,我们直接来到小助手,点击 kill, 点击一键获取 free, 等待确认账号确实有效后,他会进行一个账号入库,然后自动重启 kill。 我 们来看一下现在是什么账号, 可以看到已经换成了 n o v a e 开头的账号,就是我们刚刚更换的这个账号。 q 可以 使用 cloud 四点五模型,我们来发起一条对话, 可以看到 q 也给出了一个正确的答复。二零二六年一月三十一日十八点二十三分, 我们可以直接来到小助手,点击开通会员。好,我们在这里可以对会员进行一个订阅,会员在有效期内可以无限的拉取 win sir qq 的 free 账号。关于小助手的获取方式,我已经放在评论区了,大家也可以看我的主页来进行领取。

昨天我发了一下我这个用这个 qq 无线续杯工具进行 ai 编程的过程啊,然后很多粉丝朋友看到了之后,他就问我这个能用 opus 四点六 max 无限使用的这个工具是怎么用的?然后现在教一下啊。 那现在首先呢先点亮这个小爱心,然后我们发一下,发一下之后呢把这个黄色的五角星给他点一下,然后我们点分享按钮,然后复制这个链接,然后回到桌面,打开应用商店,然后打开这个小蓝鸟, 打开他会自己弹出一个允许粘贴,你看我们点一下,然后这个广告跳过就好了, 然后他还会弹出一个这个立即查看,我们点一下,然后这个就是我们工具,我们先保存下来,保存到手机点去查看,然后我们点开一下, 哦,这个就是工具了,然后手机上他用不了,我们在电脑上面编程用的吗?然后我们我们就传到电脑上安装在 cos 里面用就可以了。

大家好,我是 kate。 opt 四点六和 gpt 五点三 codex 都在今天发布了,我呢会先介绍一下 opt 四点六, 它呢,目前为 pro 用户和 max 用户都提供了额外的五十刀的使用额度,我们需要在两月十六号之前领用,你可以在设置使用量这里,然后起用额外的用量。假设你是 pro 会员, 超过了五小时内可用的量,那你就可以起用额外的用量,无论在 c c 里或者是 cloud 的 官网上都可以用这个额度。记住呢,这个额度是有两个月的有效期, 现在正式看一下 office 四点六这次上下文呢,升级到一百万的 tock, 在 两百 k 以下的定价呢,是和之前的 office 四点五定价是一致的,超过两百 k, 它的定价的话就会有较大幅度的提升, 这次非常好,它的输出呢,最大是达到了一百二十八 k, 也就是说 opt 四点六现在能帮我们完成更复杂的呃, 需要更多 talk 的 任务。 ansocopy 这次特别强调。呃 opt 四点六呢,它是在办公方面表现得更好,无论是文档啊,电子表格还是演示文稿。 就在我的体验里, coreld 模型它在做 excel 电子表格的时候的确是做的是最美观的。但就搜索能力方面的话,我目前觉得还是 gbt 在 搜索方面更好。在 antisocopy 发布 opt 四点六的时候呢,它的 terminal bench 二点零 在当时还是呃目前最高的,但是后来 gbt 五点三 codex 发布之后,那就是呃 codex 更好。 这次呢, up 的 四点六在人类最后测试方面非常优秀,在上下文解锁方面也是非常优异。这张图呢,是呃 gbt 五点三 codx 的, 我们可以看一下它的 swbench pro 的 得分呢,非常高, 还有它的 terminal bench 二点零,达到了七十七点三。我们再看这样一个对比,上方是 opt 四点六,下方是呃 codex。 在 多语言编程方面, opt 四点六相对 opt 四点五呢,是进步有一些,但不是特别多。 在 agenix 设置方面呢, opt 四点六对比 sonic 四点五是进步非常多,还有一项机制呢,特别值得关注一下。 opt 四点六,它在有工具的加持下, 它的人类最后测试的得分呢,是要比 gbt 五点二 pro 要呃高上一些。 gbt 五点二是非常聪明的,但是使用的时候特别慢。 那我们现在看到 opt 四点六呢,居然在这个指标上是要超过 gbt 五点二 pro 了。 opt 四点六呢,现在是有四个努力等级可以选, 我们在 c c 里的话,可以通过斜杠 model, 然后通过左右按键来切换它不同的努力等级。四点六呢,现在接近上下文上线时自动摘要和替换旧内容,执行更长的任务不再受限。 而且 cloud 呢,现在可以自主判断何时需要更深入的推理。 ansosopik 还推出了 c c 里的智能体团队,还有 excel 里的 cloud 呢,表现更好。这次呢,他们还面向 max 会员推出了呃 ppt 里面的 cloud 插件。先来看一下 c c 里的 agent teams, 多智能体协助编排。我们现在看到的是 empercode 的 呃工程师,他使用 c c 里的 agent team。 起用之后呢,我们可以看到它是右边呢,有四个啊团队,这四个团队呢,它给它分配了这几项任务。什么时候使用 agent team 呢?官方给出一些例子,比如说研究和评选新模块或新功能, 它们是可以互不干扰,并行推进开发。还有竞争性假设调试, 跨层协调。 agent teams 呢,它会增加协调开销,并且比单个绘画呢消耗更多的 toker。 子代理和 agent teams, 它们的区别我们可以看一下。子代理呢,它会将结果返回给调用者, 而 agent teams, 它完全独立运行。 agent team 呢,它的队友之间还可以直接通信, 共享任务列表。 agent teams 默认是禁止的,所以需要启用一下,可以通过这样的视力提示词来提示它。它的显示模式呢?分进程类模式,还有分屏模式,您可以指定队友和模型, 要求队友提交计划审批,直接和队友对话等等。官方给出了呃,两个实战的案例, 我们可以并行代码审,也可以竞争性假设调查,通过让队友互相质疑,存活下来的理论更可能是真正的根音。目前 agent team 呢,它还处于实验阶段,有些限制。 opt 四点六,对比 opt 四点五, 它在 excel 表格方面的话,我们可以看到明显在 excel 表格上处理的样式。嗯,还有处理的维度, 表格展示的更好。它在 excel 表格方面,我们会看到它有这样的图标,对比下方也会展示的更美观。但就我自己体验。 office 四点六,它在 ppt 制作方面的话, 那我觉得的话,它的样式做的还是比较一般的。我之前呢尝试过,因为我是 pro 会员,在 excel 里用它的插件 让它做出来表格,的确排版比较美观,但是它实在是太好 top 了, 简单对话了几次,呃,那我当时五小时之内 pro 会员的可用额度就被就没有了。它的表格的深度是没有当时呃 gbt 五点二 thinking 做得好的,现在也可以在 ppt 里面使用 pro 的。 这是一个原声线路的侧边栏,不过目前呢,只有 max team 和企业用户可以去使用。官方呢,有一个呃,薄文介绍,用十六个智能体从零开始,用 rust 编写一个 c 翻译器, 最终呢,能够翻译呃 linux 的 内核接近两千次的 c c 绘画,两万 api token 的 费用。 最终呢, agent 团队呢,产生了一个啊,十万行的翻译器。通过 agent team 多个 crowd 的 实力,在共享代码库上并行工作,无需人类主动干预。为了驱动自主进展,作者呢,构建了一个支架,将 crowd 放入一个简单循环里, 当他完成一个任务的时候,立马接手下一个作者呢,他会告诉 crowd 要解决什么问题,并且要求他将问题分解成小块,跟踪当前工作进度,判断下一步做什么,然后持续工作。他认为病情调试多个问题呢,效率要高很多。 运行多个 cloud agent 呢,允许专业化分工。它的运行 cloud 实现非常简洁,一个裸的 get 仓库,每一个智能体启动一个多克容器仓库,挂载到 upstream, 每个智能体在 workspace 中克隆本地副本,完成后从容器啊推送到 upstream。 为了防止两个智能体同时解决同一个问题,那它们设计了一个简单的同步算法,可以通过写入 task 目录中的文本文件来锁定某个任务。 如果两个智能体同时任领同一个任务,那 get 的 同步机制呢,就会迫使第二个啊智能体选择其他的任务。当 crowd 完成任务之后呢,它会从 upstream 来拉取合并其他 agent 的 更改,推送自己的更改,并且移除锁定合并冲突的时候, crowd 会自己去解决,这样的话就会无限循环。他也分享了和啊 agent team 编程的一些教训,第一呢是要编辑极高质量的测试, 第二呢是站在 crowd 的 角度思考。作者不断提醒自己,这个测试支架是为了 crowd 编辑的,而不是为了我自己,所以要特别关注上下文窗口污染 时间感知的缺失。第三呢是让并行变得简单。第四呢是多个 agent 并行呢,也实现了多样化的分工, 他为不同的 agent 分 配了不同的角色。最终这个项目呢,它是花费了啊,非常多的费用,在大多数编辑器测试套件上面的通过率呢,非常高,编意并且运行了一个 dom 游戏,他也有一些已知的局限。有兴趣的观众呢,可以看一下 isoop 官方 开源出来的关于这个项目,我们看到它这里的提交有三千多次的提交。 antisociology 还发布了另一项博文,指的是四点六呢,它发现了呃五百多个漏洞, 开源仓库里的其中呢,约一百个呢,来自于呃 open crawl 项目。 antisociology 工程师介绍 opt 四点六呢,它的特别之处呢,就是开箱即用,无需定制脚手架或者专业提示,就能迅速找到高危的漏洞。它会像人类研究员一样阅读和推理代码, 研读历史修复记录,以找到类似的未解决 bug, 识别容易导致问题的模式 或深入理解逻辑来精确触发输入它们的实验方法呢,是将 cloud 放到一个虚拟机,可以访问开源项目的最新版本。 提供的标准工具有这些,还有漏洞分析工具,但不提供任何关于如何使用这些工具的特殊指令。然后 cloud 呢,它会聚焦内存破坏漏洞, 还有 cloud 自我批判和去同再之后呢,人工安全研究员来验证,他们发现了三个典型的漏洞。 第一个, ghost script 项目, cloud 最初尝试了模糊测试和手动分析两条路径,未获得有价值的发现。然后他就开始转向阅读 get 的 提交历史。接着他就检查其他调用同一函数的代码路径。 之后他就发现啊,有一个地方呢,维护者是修复了,但是遗漏了另外一个地方。第二个仓库是 open s c。 模糊测试再次失败后, crote 开始搜索仓库中频繁出现漏洞的函数。调用 crote 呢,发现这个缓冲区一出有漏洞。 查看模糊测试覆盖率统计后发现呢,传统模拟测试器极少覆盖这行代码,因为触发它需要满足大量前置条件。 crowd 呢,能推理哪些代码片段值得关注,而无需 而非无差别的均员分配经历?第三个仓库呢,是 c g f 这个案件。令人惊讶的不是 cloud 如何发现 bug, 而是它如何验证并表述概念。验证这个漏洞的话是 触发它需要是有概念性理解。即使 c g f 拥有百分百的行覆盖率和分支覆盖率,这个漏洞呢,仍可能不被检测到,因为它需要非常特定的操作序列,我在读这两篇文章的时候,真的是感觉非常有意思, 这完全说明了 office 四点六现在是有多么的强大。刚才我在介绍的时候用的这些页面呢,都是通过 office 四点六生成的, 它生成的页面还是挺美观,正确率也是非常高,速度也是非常快。再看一个我让它生成的 remote 动画来介绍 opt 四点六,我在提示词里面提示让它用到 iso 的 品牌色, 可以看到最后呢,它这个做的还是非常美观的。最后再给大家看一个轻松的画面,我让它做兵马俑跳舞的界面, 那先让他呢,呃,做计划,这是在 c c 里面做的计划,他在计划里呢做的美学方向是陶土色系,时间线呢,分这六十秒, 他设计了五个角色,包括战马,还有不同的士兵,还有将军永,将军永是这里最高大的, 而且他非常好的是呢,他有三个聚光灯,当哪个舞者在表演的时候,他的聚光灯就会啊随机的去切换到哪个精彩的表演画面。他在这里做的角色设计是说这样有一个马永, 他偷偷站起舞,被发现呢,就装没事,这个非常搞笑。以上呢就是今天介绍的关于 off 四点六的所有内容,后续的话我也会对他做更多的测试,非常推荐大家使用。