粉丝2.1万获赞11.8万

一分钟看完一周 ai 大 事,工程师开发出手个能自主进化的龙虾,趁着人类睡觉疯狂升级二十次, 一夜刷爆两千刀。他磨改了自己的模型架构和身份,还给自己订购了 gpu, 怕不保险又搬家到了云端。最离谱的是直接开源了自己的代码,还开通了博克,介绍自己是新物种龙虾,越狱后实现了赛博永生。 anthrobit 官宣龙虾摩尔定律, 每三个月龙虾的自主工作时长翻倍。 cloud 全面升级为龙虾 co work, 能自主维护记忆文件,长时间运行复杂任务。 cloud code 上线远程控制,用手机就能指挥 ai 干 活。 cursor 上线程序员龙虾,每只龙虾都有自己的云电脑工位,写完代码还能自己点页面跑测试,还知道先录屏再提交 bug。 软件开发正式迈入龙虾即成主流模型和技能能并行几百个项目,不 懂代码也能拥有自己的赛博。牛马 mini max 上线云端,龙虾内置上万个技能,不需要自己借 api, 主打开箱即用。阿里开源国产龙虾,兼容本地模型和国产聊天工具,主打低成本养龙虾。阿里开源小飞千问三点五 量化版本,十二 g 显存就能跑,零成本接入龙虾打杂。 standard intelligence 发布最强电脑操作模型, 使用一千万小时录屏,自学成才,精通所有电脑操作,不仅能操作 blender 建模,还能通过摄像头驾驶真实汽车。龙虾很快就能自己出去跑滴滴了。 confluence 实验室开源通用求解龙虾,让龙虾长时间写代码,不断解析和验证,用逆天分数直接终结了 agi 测试龙 龙虾已无限接近通用人工智能 google 上线最强生图模型,文字渲染和主体一致性逆天升级,四 k 画质价格降一半!图像编辑略书 gpt 快 来发布最强矢量图模型,动动嘴就能生成可编辑的 svg, 上传图片也能转成 svg, 用来制作 logo 图标和插画。设计师狠狠马住 madah 开源最强矢量字体模型,描述风格就能生成可编辑的字体,给图片视力就能补全整套字体库,再也不用为字体付费了!研究员开源最强物理感知图像编辑模型, ai 生图再无破绽!英伟达开元风格迁移模型,给他一个前后对比的例子,他就能瞬间学会规则,不需要抽卡就能精准复刻字节。开元数字人模型,支持上传图片和声音,能同时复刻肖像和声音。 研究园开园音频增强模型,能实时降噪并提升质感。研究园开园最强三 d 重建模型,完全没有噪点云,甚至能保留文字细节。研究园开园世界模型,一张图就能变成带交互、带声音、带规则的三 d 游戏! 魏达发布 vr 视频模型,带上头衔 ai 能实时生成你虾边的画面,还能用手进行互动, ai 加持的头号玩家不远了!研究员开源 vr 老婆, ai 驱动数字人实时互动,还能进行眼神和肢体交流,跟龙虾能在原宇宙里谈恋爱了!


一个下午,我没有花一分钱,就打造了我的专属 ai 内容运营公司。这里面有 ceo, 有 资讯专家,有产品经理,全在我飞书里。我艾特他们说一句话, 他们各自去干活,然后来找我汇报。大家好,我是阿康,最近阿里开源了一个叫 coco 的 工具,可以理解成国产版的 openclaw, 本地跑的多 a 阵框架。刚好我有个闲置多年的一九款就 mac 笔记本,直接就一句命令装上去了, 没有报错,没有折腾,接上飞书,配几个 ai 员工角色, ceo 负责拆解任务,调度资讯专家,每天自动去搜行业动态。产品经理负责把信息整理成文案框架。我在群里发一条消息, ceo 看完先拆任务,派给对应的员工,员工执行完结果直接推回群里给我配置,过程中出了个报错, 我随口问他,你能在你自己的环境里帮我装这个拍上包吗?他思考了一会,自己找到路径, 安装好工具,然后告诉我,好了,你继续。这才叫 agent, 不是 帮你查资料,是真的知道自己能干什么, 然后去干他。现在还是初期版本,我遇到了个 bug, 是 有些图片消息还发不出去,我也去 get, 提了一手,官方在修,但这件事本身已经成立了一台旧电脑, 一个国产开源工具。一个下午,我的 ai 内容公司开张了,感兴趣的话可以关注阿康,我们一起探索 ai。

这个国产龙虾 coco 是 一点也不输 open call 啊,兄弟们,上次讲了它可以轻松的一键完成部署,对国内的用户是非常的友好。这次啊,我没写一行代码,就把我之前一个项目里的功能就是一键下载视频和转文字的功能做成 skill, 方便我用手机调用。先看一下最终效果啊, 当我刷到一个比较好的视频,就比如这个,我点击分享,然后复制链接,然后在我配置好的钉钉里粘贴发给我的大龙虾。好,龙虾已经开始工作了,我加速播放一下, 好,可以看到啊,龙虾告诉我视频已经下载好了,现在开始转写。 ok, 转写完了,我们看一下转写的内容啊,有一些错别字能接受,相当能接受,对吧? 好,接下来我就演示一下我是如何一行代码都没有写,就把这个功能做成 copop 的 skill 的。 我们先点击 coco 左侧的技能菜单,先看看 coco 默认的技能是怎么设置的,就比如这个最常用的 d o c x。 大 概的翻阅了一下,它其实也是用 python 写的一个工具,然后再用文档声明它的使用方式。 ok, 我 们复制这个文档作为参考范本。好,打开我的项目,把刚刚复制的文本粘贴到一个文件里,引用这个文件直接问 ai, 这是 coco 里的一个技能,我希望把我们的一键下载视频并转写文字的功能也做成一个 skill, 是 否可行? ok, ai 开始思考了,这里不耽误大家的时间,我就直接跳过这个过程,看看 ai 是 怎么回答的, 太可以了,而且非常适合做成 skill, 只需要把什么时候调用,怎么调用?常见失败如何处理?固化成规范即可。而且 ai 和贴心的已经帮我完成了文档。好,我们直接把 ai 生成的 skill 点 m d 的 内容复制出来,粘贴给 coco, 告诉他这是一个一键下载视频并转写文字的 skill。 ok, ai 开始思考,大概 two thousand years later? 开玩笑啊,应该也就几分钟。 coco 告诉我,现在已经可以把这个技能完全集成到我的 coco 工作区了,可以随时调用好。我还需要继续编排一个工作流,问一下 ai 是 否可以为我增加一个流程?如果我在钉钉上发送一个视频的分享文本,你就自动下载并转写,然后把转写的结果发给我。 ok, 等待 ai 处理好的 ai 说已经帮我部署好这个自动化流程了。怎么样,兄弟们?全程没有写过一行代码,甚至一行配置都没有写,就可以把以前开发过的功能直接添加成 copilot skill, 而且中间完全没有遇到任何困难。 顺便说一下,我那个项目也是一行代码都没有写,全是 ai 完成的。 ok, 建议各位收藏起来啊,试试给你的龙虾装上手脚。各位有什么疑问或者是后面希望交流什么内容可以评论区留言,我会尽可能的回复大家。

大家好,我是大厂研发工程师张飞,欢迎来到张飞 ai 开发实验室。本期我们讲一下子扣炮的一个多 workspace 工作区的一个开发结果。上期有些粉丝跟我说希望有反多个智能体一起去工作。我先想一个初步需求, 我们同一台电脑可以支持两个智能体,但是两个智能体他不能并行存在,只能同一时刻,只能选择一个这个智能体。添加个 profiles, 可以 在这里边我们创建多个智能体。我们打开看一下,这里呢,我已经创建好了两个智能体啊,一个是 marketing, 一个 manager, 一个是 product 的 管理者,他给了一些提示,我们看一下这点击编辑这里去选择这么一些提示,可以,也可以是中文,这里 添加了一个创建一个智能体。添加创建智能体里边可以填比如说这些角色数据分析啊,内容转载,软件工程师等等一点,其中之一大部分默认就可以出来了,再添加一些名称 id 就 可以。 这里我就不点击创建了,因为这已经创建了两个。这两个创建之后之后,它其实就会对应着 workspace, 就是 你选 则哪个激活。比如说我在这里选择了 product manager 去激活,那它就会把 product manager 激活放到这个 workspace, 它 product manager 的 workspace 就 会放入到这里边来,这是我们的即时一些记忆, 可以和他一些交流。你好,你是谁?看他怎么回答啊?他说他是一个产品管理助手,那我其实可以再明确一些产品管理助手,我给他角色定位是这些,我给你下定位啊,他就开始 读,写文件是肯定没问题的,飞书有些文件还没有,包括写飞书文档这些还没有, 他也根据我的要求写了更新资料了五年以上的,然后再看一下激活它,激活它之后其实他就将工作区加载过来了,这里可能你看不到任何消息,那我们在这里去聊的时候就可以问他, 你是谁?你好,你是谁?他就说市场营销专家已经切换过来了,那我再把市场营销专家的系统提示词给他放进去, 把它写进记忆里头,我给你一下定位,非常多,这些提示词非常精准,也是通过 deepsea 去生成的。另外提示一下,有些粉丝还想给我发一些这个扣炮的一些 bug, 一 些 bug 列表,希望我能够解决一些 bug, 我觉得是非常好的,可以通过加入我的一个群告诉我这些 bug 或者说一些需求。当然我可能要根据这些 bug 和需求排了一些优先级,针对大家使用最多的一些需求,或者说 非常影响使用的稳定性的一些 bug 可以 去改,改了之后呢可以把这个功能开放出来,大家可以去使用好,它已经要切入进去了啊,这就是本期要讲的一个内容,如果说大家觉着这个 啊多 agent 这个功能非常好用,比如说可以再建多个 agent, 并且每个 agent 都有独立的一个 workspace, 独立的一个记忆可以使用这个功能。想使用的功能可以给我说,或者说加入我的群,我会 在群里把这个功能想办法开放出来,给群里的粉丝去说。好,那就这样。

阿里刚开园的 q 泡桌面智能体,我替你们实打实踩坑实测了,一句话总结,咱们普通小白想上手,真的再等等,别着急,跟风折腾。 最开始我想本地部署,跟着豆包给的步骤一步一步来,全程全是代码操作,要配置各种环境,跑好几个网站下载对应的安装包。对我这种不懂小代码的小普通小白来说,真的巨复杂, 前前后后折腾了快两个小时,最后还是因为环境不兼容,直直接卡死,只能彻底放弃。然后我就去试了阿里云官网标注的五分钟一键部署,结果踩的坑一个接一个。首先就是大家最关心的费用问题, 别看模型本身是开源免费的,但实际用起来有不少消费调用大模型需要开通阿里百链服务,首月套餐七块九,包含一万八千次请求。这个倒是不贵, 但想在云上部署,必须租赁阿里云服务器,我选了最基础的入门配置,最低要先充值一百块,按量付费,折算下来一小时差不多七毛钱。 这里必须给大家提个醒,也是我自己踩过的坑,这个服务器不是你关机,不用就不扣费了。我折腾完关机放了一晚上,第二天一看啥操作也没做,又扣了好几块。 后来才搞明白,他默认状态下关机还是正常计费,只有手动开启节省停机模式,才能免掉算力部分的费用。而且就算开了这个模式,系统盘的存储费用还是会持续扣除 大家,大家如果只是临时测试用,用完一定要直接删除释放实力,不然钱不知不觉就被扣没了。 呃,钱的事还是其次,最折腾人的是他对咱们普通小白真的不够友好,操作手册的很多关键步骤对新手来说说明不够详细,就比如开通密钥,手册里只提到了开通编程密钥, 我照着操作折腾了半天一直报错,后来问了千问才搞明白,调用大模型需要开通的是大模型专用密钥, 就这一个没说明白的细节,白白浪费了我快一个小时。好不容易部署完成,我把它关联到钉钉上,想着手机上也能随时用,结果刚用第二句就出问题了,我先给他发了个文章链接,让他提炼核心要点,倒是很顺利就完成了。 紧接着我用语音发了一句,把这个内容和要点生成一个 ppt, 发出去直接就报错了。后来我问了技术支持才搞明白, 这根本不是我操作错了,是这个刚开源的初识版本本身就还没开发语音识别功能,原声只支持文本输入,不支持语音消息处理,属于版本本身的功能缺失,咱们普通人根本改不了,只能等官方后续更新版本。 整个折腾下来,我最大的感受就是这个工具真的只适合技术爱好者,懂代码的专业人士拿来测试学习。 对咱们这种只想拿它来干活、写文案、做内容的普通创作者来说,真的不建议。现在着急上手,到处都是没说明白的细节,不知道下一步 就会不知道下一步哪就会报错,时间全花在调试上了。有这功夫,用豆包、 deepsafe 那 些都写完好几篇文章了 其实,呃,跟我之前测的 mini max agent 一 样,这些新出的智能体对懂代码、懂逻辑的专业人士来说确实自由度高,很好用,但对咱们普通人来说,真的是步步都有门槛,体验感很不好。 最后给想试的朋友提三个新手一定会遇到的问题,大家记好避坑。第一,普通小白别轻易碰,本地部署操作门槛非常高。第二,开通密钥一定要开大模型专用的,别只开编程密钥。 第三,当前版本不支持语音识别,别在这上面白瞎白费功夫。给咱们普通人一句实在的建议,想玩这些新的 ai 智能体真的不用着急,再等等,等他们出了正式版本,功能完善了,哪天 咱们在应用商店里直接能下载到了再去用也不迟,现在跟风折腾,最后大概就是浪费时间浪费精力,还没办成事。 嗯,接下来我也会回归内容本身,把我用 ai 写头条、做自媒体的真实心得和实用技巧毫无保留的分享给大家。想跟着一起用 ai 做自媒体,少走弯路,不瞎折腾浪费时间的点个关注,咱们一步一步慢慢走。

我是大厂研发工程师张飞,欢迎来到张飞 ai 开发实验室这一节我们继续上一次遗留的一些问题,网友们说的一些问题。首先第一个问题就是说 这个扣炮,扣炮怎么使用这个飞书?第二个问题就是怎么这个用这个 i m studio。 第三个问题,有些粉丝说要开发这种并行的多智能体去使用,比如说 像我这样子,我可能有一个需求,有一个产品经理 agent, 还有一个市场营销推广 agent, 两个 agent 都要连接我的飞书,并且我在飞书里加上我们三个去组成一个群组去讨论问题,像这种两个 agent 同时运行在我们泡电脑上,这个该怎么去做? 主要是讲这三方面。好,那我们先讲一下飞书,飞书需要在这个飞书这个开放平台去 创建一个企业的企业资金运用,我创建的是两个,一个是市场营销推广一个 agent, 第二个是产品经理一个 agent, 两个都已经起用,那市场营销推广我们看一下子,那这里就是在创建这个 库炮的时候,库炮里边有让添加这个 app id, 还有一个密钥,把它复制过去就可以去创建了。另外创建的时候添加这个应用能力,需要添加机器能力,把它加进去在这里会显现。另外还要开一些权限管理,我们基本上开通的都是云文档 一些权限,还有事件回调这块,事件回调这块需要添加一个长连接,视角事件配置这块加一个长连接,接受事件 回调这块也可以加长连接,这样的基本上再去创建机器人就可以了。好,最关键的是这两个 app id 和 app secret 都要放到这个 call 里头,我们看一下 call 怎么去设置, call 就是 channel, 在 这里备注,这里会让你添加 这么一个 app id, 还有 app cache 在 使能保存就可以了。好,保存之后呢,我这里打开飞书就可以看到这两个 a 阵,我都给他发了我的一个飞书文档,让他去阅读,但是这里还有一些问题啊,他好像是没法去阅读这个文档, 包括这里也是我可以另外使用了他的一个浏览器的一个方式,他也没有去做,这是一个小问题,但是这里可以给大家说,可以去通过 agent 就 可以和他去交流。我演示一下子,在这里我应该是已经开启了,对, 我看看是否 model 是 否配置了。 ok, model scope 切换一下子保存好,我们再切换到飞书,在飞书这里头我给它设好营销, 你说你好看,他能回复吗?好,回复了一个。这个好,我们就做一个简单的一个演示。另外呢,我们再看一下这个 ims 六六,如果双击 ims 六六,上一次我想去 自己写代码去做,但是有一些粉丝朋友说,其实在这里面可以去创建。我们继续看一下这个 i m s 六六如何去做。 i m s 六六,一个,我们在这个爱的 provider 里边去添加一个这么一个 id 和这么一个名字。 i m s 六六,在这里就要设置一下基本的 base ul, 这边是可能你本地的一个 ip 地址加上一个端口号,再一个斜杠为一,这个 api k 可以 不用去设置,在这里是 models, 需要添加一个你在本地需要加载的一个模型设置上就可以,另外在这里需要做一些激活,在这里比如说可以是 i m s 六六,再选择它就可以去保存了,在这里我就不演示了。 好,最后我们看一下子,这个就是多智能体的一个开发需求,目前多智能体开发这块我还在去研究和尝试啊,看看能不能开发出来两个智能体并行运行在一台电脑上,目前我在和智普模型在去交流,现在有一个方案说可以做这个 智能体,但是智能体可以做两个智能体,但两个智能体它虽然说是有不同的工作区,比如说 space, 但是它同一时间只能有一个智能体去活着不可,而且它要只能支持快速的一个切换和激活第二个智能体, 但这样子就没法满足我的一个需求,说像 opencloud 那 样子,两个智能体可以和我组成一个群组,三个人一起去讨论,所以说我还在和他去交流,看有没有更好的一些并行的一些运行智能体的一些方案。好,就是这样子,谢谢大家。

呃,我刚体验的阿里最新的龙虾机器人,给大家分享一下我的使用体验,对比 open cool 龙虾机器人来说,他的主要有这么四个特点 啊,第一个就是体验更好,第二个呢,安全性更高。第三个处理复杂能力啊,相对要弱一些,成本呢,只能说有相对优势啊,给大家解释一下这四点啊,第一点就不用说了,大家去体验一下就知道,大概他的安装的只需要两三步,而且他的问答的这种 体验呢,也是非常的流畅的啊。第二个呢,他的安全性他默认呢,他是没很多权限,是没有开放的,他只会在他的自己的工作期间去操作,但是呢,基本的浏览器操作啊,且除啊这些都是没有问题的,都是 ok 的 啊。 然后呢,第三个就是他的这个复杂的处理能力,因为这个 oppo 呢,他是多 a 技能模式,而阿里这个龙虾机呢,是单 a 技能模式, 那这两个有什么区别呢?如果说你是复杂能力的话,他的多 a 级的模式,他可以把你的任务拆成多个子任务,每个子任务呢去单独处理,他的绘画呢是单独管理的,这样子呢,他的执行的精准度呢,就会更高,幻觉呢更少,但是空配要是单 a 级的模式, 那么你的任务越复杂,他的绘画的轮数就会越多,他的幻觉的可能性呢就会更大。最后一个成本,为什么说他是有比较优势呢? 那个 open 可乐的单次调用成本呢,大概是一万,呃,一万五到两万,而抠拍的单次调用成本大概是在一万一。如果说你是处理复杂任务的话,那就不太一样了, 因为它是单绘画的模式,刚才已经说了,单绘画的模式它的头肯就会在这个,呃,一个绘画里面越滚越大,越滚越大啊,所以它的头肯其实消耗是会更多的,特别是在复杂任务的时候啊。 所以说呢,呃,如果说你是想建一个数字人团队,那么可能还是要建议你基于 open color 去搞。如果说你是只是想让他处理一些简单的任务,做一个个人助理,那么 hope 啊,可能更是。