过去三周,我深度测试了 open art 里的每个功能,生成了数百张图片和视频,只为摸清哪些真正管用。 而此刻,你很可能正犯着一些错误,导致每次生成都在白白消耗积分。一旦你弄懂 open art 真正是如何运作的,你就再也不会为失败的产出浪费一分钱。 这就是为什么我要向您展示如何精准操作该平台,针对不同项目该选用哪些模型,以及如何在不耗尽积分的情况下创建一致的角色。 如果你想跟着一起操作,我会展示给你看。使用描述中的链接进行注册。首次登录时,您将看到五个快捷方式,为您提供所需一切功能的快速访问入口。 故事功能会带你回到旧版界面,所以我们不会用它。我们将从创建一张图片开始,因为它是其他一切的基础。点击创建图片页面顶部有一个标有模型的按钮。选对很重要,因为每个模型都擅长不同的方面。 如果您想要看起来像专业相机拍摄的高超逼真图像,请使用 nano banana。 二、如果您想要更具艺术感或风格化的效果, c dream 四点五是您的最佳选择。如果您希望生成的图像保持一致性,并专注于叙式, clingo one 在 这方面表现出色。 为你想创作的内容选错模型是人们浪费积分的最大原因之一。所以在开始之前先决定你需要什么样的图片。这个选择决定了你该用哪个模型。 现在,我们来谈谈提示词,因为这是我看到人们因模糊描述而白白浪费积分的地方。这些描述给出的结果与他们想要的相去甚远。别写什么森林里的女人,这种笼统的描述,你得具体点。我每次都用这个公式。 主体加动作加环境加光照加镜头角度。所以一个更好的提示词是,一位留着棕色长发的年轻女子,身穿飘逸的白色连衣裙,小心翼翼的穿过有高大松树的树林。柔和的晨光穿透树冠,透下戏剧性的阴影。 镜头从后方跟随他向前推进。你越具体,生成的效果就越好。让我向您展示它具体是如何运作的。我要选 nano banana 二当模型,因为我想要那种超写实的效果。对于宽高比,我会选择十六比九,并将分辨率设置为四 k。 我要生成两个变体,这样我可以挑选最好的一个,然后点击生成。光线正是我所想要的。裙子的细节也很棒,这就是你对提示词越具体时发生的情况。还有一个名为自动润色的功能,它会帮你自动优化提示词,使其更加强劲。 如果您想要更多的控制权,还有一个增强提示按钮,它能把您的基本想法扩展成完整的电影级描述。还有一个从图片生成提示词的功能。如果您上传图片, open art 会分析它,并根据所见编写提示词。现在,请点击你生成的其中一张图片,将其打开。 您将看到选项,可以重绘该图像,放大它,将其动画化为视频或对其进行编辑。你也可以将其用作参考图,甚至基于它创建变体。 如果你想放大图片使其更清晰,请点击放大,并选择精确模式。皮肤增强选项专为提升面部细节而设计。如果您正在处理肖像或角色,这将非常完美。让我点一下生成差别,说实话,令人难以置信。 看看现在的细节有多清晰。生成单张图像很棒,但你可以更进一步,获得更强的控制力。与其只输入提示词,你还可以上传参考图片来引导人工智能,这让您对最终结果拥有更多掌控力。 点击提示框,你会看到上传图片的选项。一旦你上传它,这张图片就会被标记为图一。如果你再上传一张,它就变成图片二了。 在这种情况下,图一是我们刚刚生成的图像,而图二是服装。参考。现在写提示词,我会描述一位女性摆出与图一相同的姿势,穿着来自图二的服装。角色完全一致,服装也与参考图吻合。 但如果您想创建一个能在数十张不同图像和场景中保持一致的角色呢?角色一致性一直是人工智能的难题,但 open art 为此内置了专属功能。 回到主页面,点击角色,在这里你会看到不同的选项,比如物体或背景。你也可以创建这些方面保持一致的图片,但这里的核心功能是角色,所以点那个,你会看到从文本描述或图片创建角色的选项。 让我们用文字提示创建一个角色。我会粘贴提示词,然后选择我的模型。我正在用 nano banana pro 来获得逼真效果。你还可以选择风格,无论是照片集写实、数字艺术还是动漫, 我还是选照片集真实感吧。点击生成, open arts 将根据您的描述创建预览图片。我特别喜欢这张自信表情的光线完美,夹克上的细节也很逼真,所以我选这个, 确保角色周围有边框高亮显示。点击创建。您的角色现在已保存在库中,现在让我们看看其他功能的连贯性。再次点击创建角色,但这次选择物体 在这里,你只需上传任意物品的图片,即可立即将其添加到你的素材库中。我已经生成了我想用的这个指南针图片,我会把它上传并命名为 stella 的 指南针。对背景也做同样的操作。 我之前生成了这个悬崖场景,想要附用,所以把它保存为背景。现在你去创建一张新图片,就会看到你保存的所有素材。 我将选择 stella 作为我的角色。添加指南针道具并选用悬崖背景。现在我要粘贴提示词并生成 stella。 看起来和我创建时一模一样。 指南针在他手中,悬崖背景也与我保存的一致。一切保持一致。不仅仅是角色,这在人工智能平台中确实难得。 既然你已经有了角色和图片,让我们用视频让他们火起来。在主页面点击视频,你会看到两个选项,一个是纹身视频,另一个是起始针加结束针。这本质上就是图声视频。 纹身视频根据提示词从头创建视频。图生视频将静态图片转化为动态影像。对于大多数用力图像转视频更好,因为你完全掌控七十帧。 你完全清楚角色的样貌、环境、细节以及光影效果是如何运作的。然后你只需告诉人工智能如何让它动起来。让我们用图生视频吧, 我要上传刚才生成的悬崖上 stella 的 图片。此外,你还可以添加另一张图片作为结束帧,以获得更多控制,但这并非必须。此外,请确保已选择了正确的视频模型。这次我用 clean 三,然后把提示词粘贴进去。 我将时长设为五秒,分辨率设为一零八零 p。 点击创建视频就会开始生成。 这正是我想要的动作流畅,光照保持一致,看起来像是用真实摄像机拍摄的。 这正是让图声视频如此强大的原因。不过,若想快速生成视频且无需图片,请使用纹身视频。但这次写一个详细描述一切内容的提示词。点击创建,人工智能将从零开始生成整个场景。 关键在于知道何时使用哪一个。若需一致性与掌控力,请选择图声视频。 如果您只是在测试想法或需要快速完成纹身视频就能搞定。我大约百分之九十的时间都用图声视频,因为我想在让角色动起来之前完全掌控它们的外观。 我们缺少的最后一项是音频生成功能,而大多数人甚至没意识到 open art 能做到这一点。回到主页面,点击音频并选择创建旁白。你会看到提示框和模型选择器。 open art 使用 eleven labs 的 声音模型,所以音质非常出色。我会粘贴提示词并选择一个声音。 open 二为您提供针对口音、性别、年龄甚至用力的筛选器。我要选一个女性叙述风格的配音,因为这是用于讲故事。如果您希望它更慢或更快,还可以调整速度。让我们点击生成并听听看。斯黛拉站在悬崖边缘,看着太阳沉入山后, 风斜着冒险的低语。他明白自己的旅程才刚刚开始。听起来很自然,节奏把控得当,语调也契合我想要营造的氛围。你可以下载它并直接添加到视频中。 现在我们来测试一下语音克隆功能。在这里,你上传一个音频文件,并编写一段希望用该声音说出的脚本。我会用自己的录音,然后写下我的台词。这样的城市给我的生活带来了无尽的欢乐与思绪。 日落是一天的亮点。这听起来和我非常相似,大多数人分辨不出来。 最后,我们来测试一下变声器。我将上传同一个音频文件。这次从 open art 库中选择一种声音。这样的城市给生活带来无数喜悦与思绪。日落是一天的亮点。 虽然台词未变,但声音已完全置换。音频声成为作品增添最后的专业质感。掌握这四项核心功能,您将不再浪费积分,同时获得更优质的成果。若今天就想开始创作逼真的优质人工智能内容, 请点击下方描述中的链接注册 open art, 感谢观看,我们下期再见!
粉丝3.5万获赞21.0万

上期视频,我们用 openclaw 完成了策略代码的迁移和上线,但今天我们介绍一个更实用的应用,搭建一个完善的交易系统。 我们都知道市场行情在趋势和震荡之间来回切换,我们很难准确判断当前是什么状态。趋势策略放在震荡式里会反复止损,来回打脸,网格策略碰上单边行情又会深度套牢,这个痛点相信做量化的朋友都深有体会。 所以今天我们来做一件更有意思的事,搭建一个能自动判断行情切换策略的智能系统。 在这套系统里, openclo 扮演的是决策大脑的角色,他要完成一个完整的闭环,首先是感知, 通过 m c p 协议读取发明者平台的实盘状态,通过文件系统读取鱼情新闻。然后是思考,根据我们定义的规则分析市场情绪,判断当前是恐慌还是贪婪,是该追趋势还是做网格。最后是行动,调用 api 启停对应的趋势或者网格策略,把分析报告推送给我们。 这样一来源本需要我们盯盘分析,手动操作的事情就变成了 ai 自动化,我们只需要定好规则,剩下的交给它。 明确了思路,我们来看需要准备哪些东西,主要是三块,第一是 m c p 配置,让 openclaw 能连接发明者平台,这个待会详细说。第二是消息渠道,我用飞书,如果你不熟悉飞书,机器人怎么配?没关系,直接问 openclaw, 它会一步步引导你完成配置。 第三是发明者平台上对应的实盘策略,鱼情采集工作流和两个交易策略,一个趋势,一个网格 先搞定 m c p m c p 是 一种让 ai 调用外部工具的标准协议,通过它 open core 就 能获取和控制。发明者平台的试盘配置流程是这样的,首先在发明者平台的账户设置里申请 api 密钥,然后获取平台提供的 m c p 协议地址。 拿到这两样东西后,打开 openclaw 的 配置文件,把服务器地址和认证信息填进去。配置完成,我们来测试一下,让 openclaw 执行获取实盘列表的命令,可以看到,返回了账号下所有实盘的信息, id、 名称、运行状态、累计收益都有了。 这说明 openclaw 和发明者平台已经打通了 make c p 通了。接下来在发明者平台准备策略和数据源。先说策略,我在自营策略库里挑了两个,一个是多品种超级趋势策略,用 atr 指标判断趋势方向,趋势来了就顺势开仓,适合单边趋势行情。 另一个是专业网格交易策略,在设定的价格区间内低买高卖,适合横盘震荡。这 两个策略的试用场景正好互补。但注意,我们不是同时开两个石盘,而是让 openclaw 根据市场情绪判断当前适合哪个,只启动相应策略。所以先分别创建好石盘,放着备用 再说。余情数据员,我在平台上部署了一个余情采集工作流,他从九个 r s s 数据员定时抓取加密货币相关的新闻快讯,保存成 jason 文件,每条新闻包含标题、时间和摘要。后续 openclaw 会分析这些新闻的关键词进行情绪判断。 渠道和策略都准备好了,现在要给 openclaw 布置具体的任务了,在这份指导语中定义了 ai 每次执行时应该做什么, 我们来看具体关键点。首先是决策定义,实盘配置,然后是核心执行流程以及余情分析规则,接着是最核心的决策矩阵, 根据余情信号以及策略收益进行不同策略切换的抉择。最后还有日制格式报告模板、定时任务和飞书通知配置这些,搭建了一个完善的任务执行流程。 指导语写好了,上线之前,我们先手动跑一遍验证效果。出发执行后,可以看到 openclock 依次完成了这些动作,读取实盘状态、余情分析、决策执行,最后生成一份完整的分析报告并发送到飞书, 整个流程完全自动。我们看一下报告,情绪指数、重大事件、策略收益、本次决策和原因都清清楚楚, 手动测试没问题,现在让它自动跑起来。在 openclaw 里创建一个定时任务,执行频率设为每小时整点,设置完成后,每小时整点, openclaw 就 会自动醒来,进行设置好的操作,从此策略管理变成全自动。我们再也不用纠结当前到底是什么行情,该跑哪个策略了。 系统跑起来之后,我们不可能一直坐在电脑前盯着,这时候移动端的价值就体现出来了。每次定时任务执行完, openclock 会把分析报告推送到飞书,打开手机就能看到,相当于有个 ai 分 析师每小时给你汇报一次市场情绪和策略表现。 在地铁上,在吃饭时随时能掌握系统运行情况。当然,有时候我们等不及下一次定时报告,想立刻知道情况怎么办?直接发消息问就行。比如我发一条查看一下实盘收益。 open call 收到后,立刻调用发明者接口,返回两个策略的最新状态,包括是否在运行,运行了多久,累计收益多少,今日收益多少。这种双向交互让整个系统非常灵活,不只是被动接收报告,而是随时可以主动了解情况。 还有更实用的玩法,比如我发现趋势策略跑了一段时间一直没开仓,我就发消息问策略,长时间不开仓有什么优化思路? openclaw 分 析了一下,给出建议,不开仓通常是因为 atr 通道太宽,价格没有突破趋势线触发信号。 建议把 atr 周期从十调到十五,让指标更平滑。把 atr 乘数从三调到二,让通道变窄,更容易触发。 我觉得有道理,就回复暂停实盘,按这个调整一下参数。 openclock 收到指令后,先调用 api 暂停策略,然后自动打开浏览器,进入发明者管理后台,找到参数设置面板,调整 atr 周期和陈述的滑块,点击保存。 整个过程我只是问了一个问题,确认了一下建议,剩下的全是 ai 自己完成的,这才是真正的智能助手。 好,我们回顾一下今天做的这套系统,核心是用 open call 解决趋势和震荡行情难以辨别的痛点。 通过 m c p 连接发明者平台获取实盘数据,通过余情工作流感知市场情绪。用指导与理的决策矩阵自动判断该跑趋势还是网格策略,用定时任务实现自动执行,用消息渠道随时接收报告和发送指令。 当然,这不是一个完美的框架,可以优化的地方还有很多,但今天的重点是给大家展示各种工具的组合应用方式,希望能帮助大家理解这些工具怎么配合使用,在此基础上做出更多更好的创造。我们下期再见。

就在上个月,我也和你一样面临着同样的抉择困境,纠结于 hicksfield 那 无与伦比的镜头运动到底值不值得入手,还是 open notch 的 灵活性和丰富的模型库更胜一筹。因为选错了工具,你损失的远不止那点月费,你还会浪费好几周时间去学习一个最终只会拖你后腿的系统。 因此,我花了整整一个月的时间对这两个平台进行了深度测试,就是想看看他们在真实工作流中的实际表现。 我的关注点完全放在最终效果上,比如角色的一致性、复杂的动态效果,以及你的钱到底花的值不值。在这期视频里,我就来给大家详细拆解我的所有发现,帮你今天就能做出不后悔的正确选择。在对比具体功能之前,我们得先搞清楚每个平台的定位到底是什么,因为大多数人正是在这一步犯了迷糊。 huxfield 是 一个专研于 ai 视频生成的工具,它全心全意只做一件事,打造具有电影感的短视频内容。没错,它确实内置了强大的图像生成模型。但请别误会,它的整个设计都围绕着一个核心理念展开, 那就是让创作者也能轻松实现专业级的镜头控制,而无需昂贵的设备或复杂的剪辑技巧。这个平台以移动端为先,其核心就是它专为移动创作的创作者设计,主要面向 tiktok、 instagram、 rios 和 youtube shorts。 而 open art 则是一个全能型平台,它集图像生成、视频创作和编辑工具于一身,它的目标就是成为你的一站式创意工作台。在这里,你可以调用超过一百种不同的 ai 模型来生成图像, 利用多个顶尖的生成器来制作视频,打造风格统一的角色,并且无需切换平台即可完成所有编辑。现在咱们就来实际体验一下。我们先从视频生成侧起,毕竟这是两家平台的看家本领。 进入 hixue 的 主页后,我把鼠标移到左上角的视频选项上,这时会弹出一个下拉菜单,里面有几个选项,比如编辑视频、视频超分和创建视频。 我点击创建视频,进入视频界面后,你就能看到一些基本功能,比如文本提示框、模型选择器和图片上传区。不过真正的重头戏在右上角,这里你会看到一个不起眼的小按钮,上面写着更改,点一下它就能打开电影级预设库,里面提供了超过七十种特定的摄像机运镜效果。 接下来我将切换到 hixue 的 平台,在这里可以浏览各种镜头选项,比如 fpv 无人机视角极速推进子弹时间、三百六十度环绕升降镜头。还有很多其他酷炫的运镜方式。 比方说我想制作一个产品展示视频,我会搜索推轨推进镜头,然后点击选中它。接着我就在这里上传产品的图片,然后输入提示词。大理石桌面上的一块奢华手表,搭配戏剧性的灯光效果。在模型选择器里,你能看到它们提供了像 sora 和 vivo 这样的顶尖 ai 模型。 不过这次我先用 hixfield 的 标准模型,然后点击生成,生成结果出来了,效果相当不错。它的相机运动可不是后期硬加上去的特效, 而是深度融入了 ai 的 生成过程里。这意味着运动看起来非常自然,像是专业导演指导的一样。手表的反光会随着相机移动而真实的变化,而且大理石的纹理在整个视频片段里都保持了一致性。 现在我再给大家展示一下 open art 的 操作方式。打开 open art, 界面会提供这些主要的选项供你选择,分别是故事、视频、图像、角色和音频。每个功能面板都是为处理特定任务而设计的。 我把鼠标悬停在视频选项上,然后点击里面的图声视频功能,这样我就进入了视频生成的界面。 左上角最显眼的就是模型选择器,这正是 open 二与众不同的核心所在。追求真实感,我可以选 google view 三、想要电影赶镜头,就选科林二、 six, 要是玩创意趣事,那就选 sora 二、这里的可选范围非常广,这次测试我就选 google v e o 三了,因为我想要那种以假乱真的画质。 在这里,我可以随心所欲地设置视频的生成参数。我把版本调到三点一,打开音频,分辨率选一零八零 p, 画质更清晰,宽高比选十六比九,横屏观看更舒服。视频模式选普通优先,保证画质。 速度慢点没关系,时长就设八秒吧。我还会上传一张图片,作为视频的起始画面,就是这块豪华手表,瞧!接着,在提示词框里,我会输入镜头,缓慢推进主体,搭配戏剧性灯光,然后点击生成。 生成结果来了,运动流畅,电影感十足,完全符合我的描述。镜头拉近时,光线会自动调节拍摄主体,全程都能保持清晰对焦。所以核心区别在于,希格斯场提供了预设方案,能确保特定的运镜效果。如果你需要批量产出内容,又不想费心琢磨,那这个功能就再合适不过了。 而 open 二则让你能调用多个顶尖模型,灵活性更高,但你需要通过提示词来引导它。而正是在这一点上,这两个平台走上了截然不同的道路。视频部分讲完了,接下来我们看看它们在图像生成方面的表现。 那么我切回希格斯场的界面,把鼠标移到左上角这个图像文字上,这里会弹出一个下拉菜单,里面有局部重绘、高清放大、生成图像等选项。我点击生成图像,这样就进入了图像生成界面。 在这里我可以选择要使用的模型。希格斯厂提供的选择还真不少,比如 nano、 banana pro、 c dream 四 five, 当然还有它们自家的旗舰模型,名叫 saw, 这次测试我就选 saw 了。 saw 与其他图像模型有何不同之处?区别在于,我可以在右侧点击更改选项,点击后会长开超过五十种视觉预设风格。 我可以浏览各种选项,比如 iphone 东京街头风格、 y 二 k 中世纪鱼眼等等,风格多样。现在我来选择 iphone 风格。接下来我输入提示词,一位女性肖像,自然光、户外咖啡馆环境参数设置保持默认,直接点击生成。 生成结果出来了,骚的设计初衷就是要消除那种常见的塑料感十足的 ai 味,让生成的图像看起来就像是用手机实拍的一样,拥有自然的光照和真实的质感,你能看到照片里细腻的颗粒感,还有微风拂过它发丝的灵动瞬间。接下来我再试试它们的 raf 模型,这个模型专为概念艺术设计。 我再次将鼠标悬停在图像上,这次我从下拉菜单里选择 raf。 我 输入提示词,动漫角色、未来都市景观、霓虹灯、雨夜街道。然后点击生成, 来看看我生成的效果。这个效果和臧生成的截然不同, rif 模型在风格化创作和多参考图融合方面表现突出,霓虹灯的光效充满活力,熠熠生辉。街道上的雨水恰到好处地倒映着都市的灯火,动漫风格干净利落,细节丰富。接下来我们转到 open art, 看看它有什么能耐。 在主页这里,我把鼠标移到图像按钮上,然后点击创建图像。现在我进入了 open art 的 图片生成界面。首先映入眼帘的就是模型选择器,它提供了超过一百种模型可选, 这正是 open art 和 hicfield 的 核心差异所在。我选择 nano banana pro 模型,因为它确实是当下市面上最强的图像模型。无论是在照片及真实感还是角色一致性方面, 分辨率最高可以支持到一 k、 二 k 甚至四 k。 我 选择四 k, 追求极致画质宽高比我设为十六比九。我输入同样的提示词,自然光下的女性肖像、户外咖啡馆环境,然后点击生成, 这就是生成的结果。图像质量超高,细节极其丰富,皮肤质感出色,光影效果逼真,并且是四 k 高清分辨率。 open nars 的 亮点在于,如果我不喜欢某张图像,可以立刻切换到其他模型重新生成,而且每个模型都有一套不同的参数和配置选项。 这意味着你拥有极大的自定义自由度和丰富的开放选项,让你能够精确地按照自己的设想来生成图像, 两者的区别一目了然。 opnars 让你能使用超过一百个模型,每个模型都各有优势,且支持自定义设置。 国外还有局部重绘这类高级编辑工具、背景移除以及终极高清放大等功能。相比之下, hixfield 只提供少数几个专用模型,这些模型效果可靠,生成速度也快,但它并非为处理大量或复杂的图像任务而设计。如果你的工作流以视频制作为主,只是顺带生成一些图像,那么 hixfield 是 可行的。 但如果你需要多样的模型选择、专业级的控制力以及使用高级工具对图像进行迭代优化的能力,那么 openart 更适合你。 open nars 的 实力明显更胜一筹。目前在 ai 内容创作领域最大的难题之一是如何在多张图片和视频中保持角色形象一致。接下来我们就来看看各个平台是如何应对这个挑战的。首先,我们打开 hixfil, 把鼠标移到左上角的角色按钮上,然后点击搜 id 角色, 接着点击创建角色按钮。 hixfil 的 会提示哪些图片效果最佳,哪些不太适合。然后我再上传我的图片,我还可以在这里直接给角色起名,我打算叫它托马斯。 hicksfield 还会评估上传图片的数量是否合适,并给出整体质量的反馈,这让我能判断是否需要提供更好的参考照片, 图片上传完成后,点击生成按钮即可。训练需要一些时间,完成后我的角色就创建好了。现在我可以返回图像标签页,点击 hicksfield so, 在 提示词按钮旁边点击这个角色按钮,然后选择托马斯, 接着输入提示词,咖啡馆笑像、休闲装、晨光,然后点击生成。这就是生成的结果。说真的,它完美还原了我的角色特征,面部结构和整体感觉都拿捏的恰到好处,而且灯光与皮肤的质感交相辉映,呈现出浑然天成的效果。 接下来我们看看 openner 在 保持角色一致性方面的表现。在 openner 的 主页,我来点击这个创建角色按钮,这就打开了角色创建的专属工作区。 在这里,我可以创建一个形象统一的角色,确保他在多张不同的图片里样貌始终如一。这里我有两种选择,要么用文字描述来创建,要么上传一张图片作为起点。为了这次演示,我就选择上传一张图片。大家可以看到这里支持上传一张图片,不过其实最多可以上传四张图片。 在大多数情况下,上传四张或更多参考图效果是最精准的。但就像我前面提到的,为了这个视频,我还是只用一张图。接着我就点击构建我的角色。 open art 会花上几分钟利用这张参考图来训练角色。模型 处理完成后,如果哪个角度的仕图看起来不对劲,我还可以重新生成,然后给角色起个名字,我就叫它布拉德吧。选好布拉德之后,现在我就能把它放到任何场景里,同时确保它的面部特征保持一致。再提示词框里, 我输入布拉德站在海滩上,手持冲浪板,晴空万里。这里就是控制生成参数的地方。首先我把生成模式调到高,这样能获得更精细的细节和更稳定的生成效果。接着我把输出模式切换成宽屏,这样就能完美适配现代视频平台的格式要求。 之后我把画质设为四 k, 这能让画面更锐利,同时保持图像极其清晰。最后选择你想要使用 nano banana pro 模型, 然后点击创建。大家看第一张生成图,布拉德的面部特征、发型和整体样貌都和参考图一模一样,但周围环境却完全变了样。不过在第二张图里, ai 尝试把人物融入到环境当中,这其实也说得通,所以下一张我们索性连人物的样貌也改一下, 让大家看看他有多灵活。这次我换一个完全不同的场景。这次用的提示词是布拉德正在探索一条森林小径,他脚蹬登山靴,柔和的阳光从林间洒落。现在我再次点击生成来看看这个效果。面部特征始终如一,毫无破绽, 换了行头,场景和打光也天差地别,但布拉德这个人设却稳如泰山,这功能简直太给力了。无论你是要打造品牌,还是构思故事,或是制作需要同一角色反复出镜的内容,你完全可以打造一个 ai 虚拟偶像,让他他穿梭于几十个视频和图片之中,再也不用担心每次出场都像换了个人似的。

我们最近看到 hermes agent 在 与 open cloud 的 竞争中逐渐占据上风,主要原因在于 hermes 被定位为一个能够自我提升的智能体,能够随着你的使用不断成长,让自主执行与学习循环相结合。 但现在有一个新的智能体框架试图抢走 hermes 的 风口,它叫做 open human。 open human 是 一款部分开源、以人为本的桌面智能体,采用 gpl 第三版许可证。 它的设计目标是成为你在各种工具中所做一切的记忆和入口。它是用 rast 和 terry 构建的,指在弥河 ai 模型在技术上能够做到的事情与他们实际能够了解你的信息之间的差距。这里的理念其实很简单, 如果你想要一个私密的原声桌面端的解决方案,易于设置,并且能够快速理解你的生活、工作流程以及各种工具,而无需太多阻碍,那么你就可以选择 open human。 openhuman 的 独特之处在于,它不仅仅是一个 ai 代理的外壳,它实际上采用了本地优先的记忆术结构,能够持续地从不同的工具中提取数据。无论是 gmail, slack、 git up, 还是你日常使用的其他任何工具,这些数据都会被导入到一个结构化的、寄予 markdown 的 本地记忆系统中,并存储在 sqlite 数据库里,而不是依赖于黑盒的向量记忆。其中一个非常有趣的部分是类似 obsidian 的 维基系统, 你实际上可以自己阅读和编辑 ai 的 记忆系统。它还内置了一百一十八种以上的集成, 你可以享受到每二十分钟自动后台同步模型、路由,以及用于降低成上下文使用成本的 token 压缩功能,还能实现浏览器和电脑的控制。甚至还有一个 google meet 代理 可以实际加入会议,并将会议内容转录到记忆中。如果你要把 openhuman 和其他以终端为主的智能体,比如 hermes 和 opencloud 进行比较的话, openhuman 会显得更加面向普通消费者,因为它集成了许多你日常会用到的功能,这些功能也能让你的大语言模型从中学习。 它是原声桌面应用,设计理念是能够以最少的设置快速理解你的生活和工作流程。现在我立刻想到的一点是,如果你在使用专用模型,他们确实可以利用你的数据进行训练。所以你在 openhuman 中连接任何内容时一定要格外小心。 最好的解决方案是使用本地模型,这样可以让你的专有数据保留在本地,而不是被发送到模型进行训练。 现在开始使用其实非常简单,你可以通过原声安装包轻松安装。这也是推荐的方式。无论你用的是哪种操作系统, micros, linux 还是 windows 都可以安装,这一点非常棒。但如果你想要一个简单的方法,比如你是编程初学者,你只需要访问 tiny human ai 的 官网。 在 open human 中,你可以点击下载并为你的操作系统安装。本质上,这就是一个安装程序,会把 tiny human 安装到你的电脑上。 安装好 open human 并打开后,你会进入引导流程。在这里,你可以首先选择你的运行环境。我个人是在本地运行的,但你也可以选择在云端运行。不过还是强烈建议你在本地运行, 然后你可以点击,继续就会出示化 openhuman。 接下来你可以选择用 google 账号, twitter 或 github 登录。我个人用的是一个临时的指秒账号,登录后就可以点击开始使用了。 现在我个人选择的是自定义设置方式。我没有使用任何积分系统,我也不需要用到内置的简单安全功能或其他这些东西。 所以我们接下来要做的就是继续选择自定义。然后在这里我们可以为文本语音以及 o o o s 配置我们的语言模型。这意味着你可以选择不同的服务提供商和集成方式。 现在我要做的是保持默认设置,但你也可以自行配置引入你自己的 api 提供商。接下来我们要做的是选择我们想要的语音系统,我们会将其设置为默认语音。这个默认语音自带托管的语音识别 s t t 和语音合成 t t s 功能。现在这个功能可以直接通过 open human 使用,你也可以配置它,让你能够使用 eleven labs 甚至是 open ai whisper。 然后我们还可以选择我们的 off 连接,比如 gmail, slack 以及 notion。 我们也会把这个保持为默认设置。就这样你会被带到 open human 的 主控制面板。现在我要说的一点是, 我不喜欢他们试图过度变现这个应用的方式。我当然理解他们想从中获利,但这些弹窗和类似的东西真的需要去掉。不管怎样,这里就是 open human 的 主控制面板。 你基本上可以让你的助手做任何事情,而且随着你不断使用,他会从你所有的对话中获取并保留记忆。每当你与 open human 代理交流时,这些内容也会被纳入知识库。 现在你还可以管理你所有的连接。你也可以像使用 openclaw 一 样直接通过这些不同的渠道使用 openhuman。 你 有多种不同的集成,可以帮助你进行聊天,提升生产力,使用工具和自动化以及社交和平台相关的操作。 基本上,你可以通过像 open human 这样统一的桌面原声应用直接设置所有自动化流程。你有你的智能页面,这是你的记忆页面。在这里你可以管理你的树状结构以及上下文。 你可以重置你的记忆。虽然我不会这么做,但在你导入所有知识后,你基本上可以获得一个摘要素。你甚至可以通过导入文件夹或文件来添加知识,这对于你在进行编码项目时非常重要。而你的潜意识页面基本上可以让你添加一个活动任务。你还可以编辑和操作你的记忆 任务列表本质上是不同类型的任务,会根据你给出的提示,由不同的子弹里运行不同类型的任务,然后在这里显示出来。 cos 和 streams 是 它们之后将要发布的两个新功能。我绝对不会去尝试奖励机制,我甚至不知道它们为什么要加这个功能。 但不管怎样,这就是 open human 的 基本结构。为了演示你如何设置本地模型或其他提供商,因为现在它会消耗你聊天和 human 标签页中的免费额度或免费积分。你可以进入设置,然后点击高级。进入高级后再点击 ai 配置。 在大语言模型和语音部分,你可以配置本地模型以及你的服务提供商。那我们现在就来实际测试一下。接下来我们要给他一个市场调研任务,主要是分析 open human 与 hermes agent, open cloud cloud code 以及其他各种框架的对比。 现在我们要让它专注于几个不同的主题,比如记忆系统,自主性、集成能力以及其他一些领域。在它识别出这些优势和不同需求之后,我们可以让它在本地生成一个 pdf, 然后发送出去。现在我已经把它连接到 gmail, 所以 它也会把 pdf 发送到 gmail。 这是我创建的一个简单自动化流程, 但你甚至可以在本地创建定时任务,以及通过不同的集成实现各种自动化。现在他看起来正在请求一些信息。我想这是因为我在用免费版, 所以我现在要切换到我自己的服务提供商。看起来他已经完成了报告内容的生成这一步。他实际上用了多个工具来获取内容, 现在正在生成报告。顺便说一下,当你连接这些服务提供商时,为了安全起见,因为你实际上是在把这些服务商的数据同步到 open human。 所以如果你对通过 open human 使用的任何内容感到不放心,就不要同步。他们确实声明不会用这些数据进行训练,但对于个人信息,你还是需要采取一些防护措施。你现在可以看到,这就是我正在导入的记忆来源之一,也就是我的 gmail 内容。 你甚至可以构建一个摘钥数,然后他会直接显示在这里的这个区域。总体来说,这是一种很好的方式来管理你所有的记忆来源。看起来任务已经完成了。这是关于所有这些不同安全带的公开市场调研报告。真的很棒,因为你看他完成的多么精准。 我现在在 openhuman 里用的是 gpt 五点五进行调研,你可以看到它确实完成了任务,并且在底部还附上了精简过的来源列表,所以它能够这样完成任务,而且完成的这么快, 真的很酷。现在我们实际去看看 gmail, 看看它是否已经发送出去了。就像这样,我们在已发送邮件类别中收到了这封邮件,里面附有调研报告。 虽然不是学术论文,但它确实用多个来源对比了所有不同的安全带。我知道这只是一个非常简单的提示词,但无论如何,它确实完成了任务。 我特别喜欢 open human 的 一点就是它采用了类似 obsidian 的 可读记忆系统,并且能够自动从多个来源,比如 gmail 进行信息采集。这样随着你不断使用,它会不断完善并获取所需的实时上下文。 当你需要了解这些不同连接器中的任何信息时,他都能为你提供你想要的答案,并且会根据你所连接的大型语言模型,从你提供的所有不同来源中给出最新最准确的解答。 这也是它与其他类似 hermes 或 open cloud 之类的工具不同的地方,因为它更像是一个统一的用户界面,让你可以通过这个简单的界面来管理一切。通过这种方式,你甚至可以像刚才演示的那样部署自动化流程,还能用这个应用程序做各种各样的事情, 这是一个你今天就可以轻松上手的工具。就我个人而言,我还是更喜欢用 hermes, 而不是 open human。 但对于那些想要一个更简单的部署系统 以及更容易上手的工具的人来说, open human 可能是一个很容易入门的替代选择。好了,说到这里,希望大家喜欢今天的视频,并且有所收获。

兄弟们,看,人圈又出猛货了!这个叫 open hardware 项目,上线才四天, get up 上直接冲到到一万二的新标了,火速出圈。他专门对标 cloud code, 但人家走的是极简路线,纯 python 写的代码就一万多行, 体积直接瘦了四十多倍,核心功能却保留了九乘八,一点没缩水。最香的不是配置啊,是一条命令,启动 g o i, 界面直接给你整的明明白白的本地模型 g p t 各种大模型,想接哪个接哪个。四十三个工具,五十四条指令,读文件,搜索写作画图全能搞定。还有安全审批机制兜底放心用,轻量好扩展个人团队都合适。这玩意出来,真正的 ai 训练师才算有了趁手的家伙,效率直接起飞。

很多使用 openclaw 的 朋友都会有一个疑惑,明明工具功能很强,用起来却很笨拙,效率不高?其实并不是软件本身不行,而是没有安装适配的优质技能。 只要选对核心 skill, 就 能让 openclaw 从普通聊天工具变身全能打工人。今天给大家整理五个口碑拉满、实测好用的高分技能,附带完整安装命令,新手也能一键部署。先说怎么装,一分钟搞定。 我们打开永冻虾七二四 claw, 打开后点击右上角的兑换码输入二二二,输入后即可免费使用。接着我们点击左边的技能,就可以看到所有的 skill 了。 再说 skill, 第一个, tivoli web search, 这是必装的联网搜索神器,完美解决大模型知识滞后的短板,专为 open claw 智能体优化,自动过滤广告和无效垃圾内容,精准抓取全网最新资讯、行业数据、热点素材输出结构化内容不用手动整理, 不管是查资料、做调研、找文案素材,都能秒出精准结果,是所有用户的基础刚需技能。 安装命令, clawhub install tablie search 第二个 skill better 堪称 opencloud 的 安全守护底座,评分极高,且实用性极强。 clawhub 第三方技能鱼龙混杂,容易遇到全线越界、恶意代码、隐私泄露等隐患。这款技能可以在安装前自动扫描风险检测全线边界与代码安全,精准拦截高危技能,保护本地数据和密钥安全,避免系统崩溃。本地部署用户一定要优先安装。安装命令, clawhub install skill vendor 第三个, summarize 安装命令, clawhub install summarize 专业长内容处理效率神器,适配免 key 大 模型, 支持 pdf 网页、长文、会议纪要、语音转写文案等多种格式,一键提炼核心要点,生成精简摘要,梳理逻辑框架,面对长篇文档、论文资料,无需逐字阅读,几秒就能提取关键信息,极大节省整理和阅读时间。 第四个, fashion doc 安装命令 clohub install fashion doc 国内用户专属办公联动神器,无需复杂 a p i 配置免 key, 就 能直接读写非书文档表格和多维表格, 支持自动创建更新汇总办公资料,还能自动生成日报、周报。适配多 agent 协同办公,分工整理文档,不用手动切换软件,职场人和团队协助必备。第五个, self improving agent 安装命令 cleop install self improving agent 能让 ai 持续自我进化的核心技能,自动记录任务执行失败案例复盘工作逻辑,优化执行策略,越用越贴合个人使用习惯,还能优化多 agent 分 工搭配,长期使用适配度越来越高,打造专属个性化 ai 助手。 这五个技能覆盖搜索、安全、文档长文处理、 ai 净化全场景,安装简单,兼容性强,复制命令即可在可乐 app 一 键安装,轻松玩转 openklo 全部潜力学习办公创作全场景,效率直接拉满。

给大家分享一下,最近很多人装上 openclaw 后,但真不知道拿它来干嘛。今天就跟大家聊聊我最近这段时间我的 ai 眼镜 rokerglass 接入 openclaw 的 经验,聊聊我的一步六小虾是如何协助工作的。 目前前三只已基本调教完毕,后三只虽还在训练中,但雏形已现。这六只小龙虾就是我的全能分身。从整合行程并推送眼镜的管家、报销及材料、整理每日热点 ai 资讯、整理短视频文案创作、帮手销售运营,再到直接输出解决方案与 ppt 的 全速工程师,个个都能独当一面。 老规矩,觉得有用记得点个赞,加个关注,咱们废话不多说,直接开始。先说第一只,我叫他日程管家虾。开年后,每天客户很多,忙的飞起,以前手动排气真的太头疼了, 市面上大部分的代办清单、日程管理的产品我都用过,而且还买了不少会员。但是啊,有了龙虾以后,我把那些产品全部都卸掉了。 我平时经常约见客户,线上线下的都有,以前我得一个个核对时间,生怕撞车。现在我把所有约见需求直接发给管家虾,它会自动统计这些多方日程,帮我做好排气规划。更省心的是,它能结合我的航班出行计划,自动提醒行程冲突。 比如要从澳门去深圳、蛇口,还要密集好友客户,他会帮我分析行程衔接,优化排布,直接告诉我能约还是不能约。不用我自己算来算去,它还能跟我的智能眼镜深度打通推送提醒事项, 每天早上八点准时推动当日行程和天气。硬件联动这块做的特别棒,能打通日历和提醒事项。这种无感的提醒方式,替代了我以前手动列清单的习惯,既高效又不会漏事。第二,只叫情报虾。目前我也在做自媒体,每天得盯着行业动静, 以前 manu 刷几十个网站,效率太低。现在每天早晨给我推一份整理好的早报,但这还不够,国外大厂经常半夜发新品。为了不错过热点,我给他加了个功能,每三小时监控一次谷歌 openai 的 官号,直接推送到微信上。 功能不光适合自媒体,炒媒股、炒币的朋友也能用。另外,他还是我的外脑,看到好文章、好视频链接丢给他,他自动提取重点,打标签存 库。以前我们得硬着头皮把知识记脑子里,现在不用,只要链接给了他,这知识就算是我的资产了,写稿子的时候随时能调出来用。第三支是用来帮我做内容的,我每天带着录音卡片,跟客户聊啥见啥都录下来。 晚上把这些素材统一喂给他,他会根据我平时说话的风格,把这些零碎的对话整理成短视频文案。这样一来,我不用苦思冥想,选题素材都在那摆着,他负责整理,我负责审核。长期下来,他越来越懂我的风格,相当于养了个随时待命的文案助理。第四,销售运营虾。这套流程特别顺畅,白天我跟客户沟通的录音、微信聊天电话素材全部喂给他。 他首先是个超级分析师,会自动把客户分类,谁意向高,谁在招投标阶段谁是关键决策人,全部梳理清楚,填进非书的多维表格里,还会提醒我明天该跟进谁。紧接着,依照今天微信接入的能力,他又变成了执行者。我 把他拉进客户群,当客户问基础技术问题,或者要行业资料 ppt 时,他会直接调用刚才分析出的客户背景,用我的语气精准回复,还能自动发送文件。 以前是分析归分析,回复归回复,现在他既能看懂局势,又能下场干活。我不在群里的时候,他也能基于对客户需求的理解进行接待,完全不会冷场,基本的销售闭环他都能扛下来。 第五只我用来干脏活累活就叫他打工瞎吧。最典型的就是报销,我经常出差,每个月那一堆发票,简直是噩梦。以前我要手动去邮箱下载文件名,全是乱码,还得一个个改名字归类。现在我把邮箱接给他, 发票一来,他自动下载读取内容,按日期改好物名,放进对应文件。月底我要报销,喊一声,他直接吐出一张整理好的 excel 表。但这事中间我踩过一个大坑。这个任务链路很长,监控下载、读图、改名归类。我一开始用国内某大厂的模型,任务跑到一半就断,怎么调指令都没用。后来换了个高智商模型,立马就通了。最后一只也是最让我惊喜的,我叫他解决方案助理。 以前接个项目,从客户需求到出样案,我得好几个通宵。现在流程变了,白天我用录音卡片记下客户的需求,晚上丢给这只虾。他会先梳理出一个通用的技术框架,然后结合我后台存的标准方案库,自动进行定制化改造。最酷的是昨天的一次测试,我把一份产品规划文档加上两份技术参考文档丢给他, 让他搞定一个 ar 加 ai 项目的全套落地方案。结果你猜怎么着?哪怕我上传的原始文档有点损坏,他居然能基于通用场景和技术特性,自己把需求补全了。 最后,他直接输出了三份完整的工程设计文档,从微服务架构、前端应用到系统对接、代码级实现,甚至连设计合理性审查报告都写的明明白白。 第二天早上,他不仅给了我方案,还附带了一份详细的工作清单和自动生成的 ppt, 直接就能拿去推进项目。说实话,这事最震撼我的点是,现在靠烧 top, 居然能让 ai 直接承接一整套从产品到工程的落地任务。虽然我还得人工复合一下,但他已经把最耗时的那部分工作干完了。 以上就是我这几个月用下来的六个真实场景,从商务排程到工作杂事,再到核心的业务交付,实实在在的用工具解决麻烦。如果你也在玩小龙虾,欢迎在评论区聊聊你的用法,咱们互相启发。我是一步二零二六,一起来看一百个真实的 ai 落地场景。

现在这只小龙虾真的是太火了,很多人都觉得他很厉害。今天我们用一个视频讲清楚 o p q 的 工作原理,为什么他不仅能聊天,还能替你处理任务,甚至在你没动手的时候主动帮你完成工作? 其实,你可以从八个核心能力来理解它的工作机制,分别是 gateway、 agent、 skills、 channels、 notes、 memory、 heartbeat 和 crown。 听起来有点技术,但如果逐个拆解,你会发现这个系统真的像一位贴身助理。首先是 gateway, 它是所有请求进入 open call 的 第一道关口,就像你家门口的智能门禁。不管你是通过网页、手机 app 还是聊天工具发指令,所有请求都得先经过它。它的核心作用是做身份验证、绘画管理、用户隔离和请求路由。 技术上说,它就是一个 api 网关加绘画管理系统,用来确认是谁在说话,并把请求准确送到系统内部。对应模块 没有 gateway, 系统就分不清用户,也扛不住多端并发症,再多指令也进不来。 第二个关键模块是 agent, 他 负责理解你的意图,拆解任务并制定执行计划。比如你说整理上周的会议纪要并发给团队。 agent 会先搞清楚目标,再把任务拆成几步,找文件、提取内容、写摘要、 发邮件。技术上,他通常基于大语言模型运行一个持续推理、循环观察、思考、规划、执行、反思。 他先看当前环境,再想逻辑路径定步骤,做完后还会检查结果,发现不对就调整重来。 所以, a 卷不只是执行者,还有规划和自纠能力,这是处理复杂任务的核心。但光有大脑不够,还得能干活,这就靠 skills 模块。 你可以把它当成助理的工具箱,里面装着各种可调用的功能,发邮件、操作浏览器、写代码、处理文档、 调外部接口、生成报告等等。每个 skill 都是独立模块,遵循统一接口,随时被 agent 调用。 简单说, agent 的 决定做什么, skills 负责怎么做。没有 skills, agent 再聪明也只是空想。接下来是 channels 解决的是你在哪说话的问题。现实中,你可能用微信、飞书、 telegram 或网页跟 ai 交流。 chat 的 作用就是把这些不同来源的消息统一转成系统能懂的标准格式,再交给 a 键处理。这样无论你换哪个平台,背后的助理始终如一,理解力不打折。 但如果系统只在云端,很多事还是干不了。比如操作你电脑里的文件,打开本地软件,这时候就需要 no 字。 no 只是装在你电脑、手机或服务器上的清亮客户端,相当于 ai 的 手脚,他们通过网络连着 agent, 负责在本地执行具体操作。比如 agent 要你打开 excel 表格改数据 指令,就会通过 nose 在 你设备上真实执行。技术上, nose 支持自动重连和心跳检测,确保连接稳定。可以说, a 箭是大脑, nose 就是 伸向现实世界的手和眼。再来看 heartbeat, 大多数 ai 是 你问一句,他答一句,但 openclaw 不 止被动响应。 heartbeat 是 个后台守护机制,会定期检查邮箱、任务列表、系统通知或数据变动,一旦发现新情况,比如客户发了紧急邮件,他会主动提醒你。技术上, 这是由定时运行的守护进程实现的。也就是说,即使你没说话,系统也在默默巡检,真正具备主动服务能力。最后一个模块是 plm, 也就是任务调度器 上卧底稳定。生活中很多事是按时间发生的,每天早上报日程,每周五出周报,每月出缴账单,定期备份资料,这些都由 plm 管理。 他根据标准时间表达式安排任务,支持一次性、周期性或延迟触发时间一到,任务自动跑起来,不用你每次都手动喊一声。当这八大模块协调运转, open clock 才真正开始自动干活。 你通过 channels 下指令 get away 验身份,并路由 agent 拆解任务,调用 skills 执行。通过 note 在 设备上落地,同时从 memory 读取你的习惯和历史。 即便你没新指令, heartbeat 仍在后台盯梢, chrome 则在时间轴上准时推进各项事物。 整个系统就像一张持续运转的智能工作网,让 ai 不 仅听懂你,更能替你做事、盯消息、守时间、跨设备行动。 所以 open call 根本不是普通聊天机器人,而是一套会思考、有记忆、能执行、会提醒、可跨端的数字助理系统。某种程度上,他更像一位永远在线、越来越懂你,还从不抱怨的私人助理。

你不知道赛博喵办的新功能?第三个很多人已经开始偷偷用了!扫码即可绑定 能接入 open club 的 智能硬件,全屋智能场景一键触发 回家模式。有什么事尽管说呀喵,我也跟着晃一晃。

五月八日, openai 在 a p i 中加入了三款新一代语音模型,主打语音推理与对话的 gpt real time two, 突出实时多语言翻译的 real time translate 和聚焦语音转文本的 real time whisper。 我们来看 real time two, 这是 open ai 第一次把 gpt 五的推理能力直接塞进语音模型里,上下文从三十二 k 拉到一百二十八 tokens, 这是什么概念?就是你能跟他对话将近两个小时,甚至他还能边听边想边干活。相比之下,他有人味了, 以前他在后台拉数据就卡着不动,现在他会自然地说,嗯,等等,我查一下。就是这句废话,让你觉得对面真的有一个活的助理在帮你跑腿。 另外两个模型也很强大, gpt realtime translate 七十多种语言输入,实时翻译成十三种语言。 gpt realtime whisper 边说边实时出字幕。 当然,好用的代价就是钱。 realtime two 每百万音频输入 token 三十二美元,输出六十四美元,不算便宜, 不过更长的上下文并行工具调用流水线执行。这三个东西叠在一起,意味着 voice agent 第一次能真正干活了,诱惑力还是蛮强的。 open ai 这一波确实又在算法工程上领先了一个身位,但是 ai 还有另外一条路叫落地。 就在五月七号的时候,千万面向所有人免费推出了 pc 端的 ai 语音输入功能。跟 o p ai 不 一样的是,千万把它封装成了一个零门槛打开就能用的桌面工具。它不是那种你说一句它转一句的读写器,而是按住 u alt 键, 就像跟朋友吐槽一样,说出你的需求,所有用语的语气词会全部被自动过滤,直接输出几条逻辑清晰的代办文字。 最最重要的是,完全免费。 open ai 在 秀肌肉,它告诉你语音 agent 的 上限在哪,千万则在铺路,告诉你这些能力,今天你就能免费用得到。会听、会想、会干活的语音 ai 正在从两个方向同时赶来,而我们未来或许只需要开口就够了。你想用哪个?

hello, 大家好,是不是辛辛苦苦跟着教程装好的 open curl, 满心欢喜的以为自己能够拥有一个无所不能的超级助理,结果发现他好像什么也干不了,甚至还有点笨。 你让他去查看文件,他会说没有权限,你让他搜索一下天气吧,他又说没有联网。先别着急着怀疑人生, 接下来我会手把手教你给 open curl 装上这六个 skill, 让它真正的从一个聊天助手进化成一个赛博牛马。正式开始之前呢,咱们先来熟悉三个最常用的命令, windows 的 用户请你打开 power show, mac 用户呢,请你打开终端。 open clone 呢,有一个官方的技能市场叫做 cohab, 上面足足有两万多个大佬们已经写好的 skill, 咱们全部都可以直接拿来用。 接下来我要给大家重点推荐的六个超强的 still 呢,也全部都在这个里面。不过先别着急,在正式的把它们装进我们电脑之前呢,我们需要花一分钟的时间搞定几个关键的前置操作。第一步, 我们需要先给它装一个应用商店,也就是 apple store。 windows 用户打开 power show, mac 用户呢,进入终端输入这行命令。后面呢,装其他的技能也就是一句话的事,装完这个呢,先别着急着跑,这里有一个新手极其容易踩的超级大坑, 从二零二六点三点二版本开始呢, open club 默认对本地文件的读写做了严格的限制,如果你不想你的 ai 连个本地的文档都打不开,那需要把你的权限 全部解开,操作呢,非常简单,打开 power show 或者终端输入这行命令。那么 现在呢,我们我们就把工具的权限切换成了完整版,注意,运行完之后呢,我们一定要重启一下网关, 让我们的配置生效。搞定这一步呢,你就可以让 open call 自由的去读写和修改你电脑中的各种文件。底层的权限和应用商店呢,都已经准备好了,接下来我们就是见证奇迹的时刻, 我将会把最必要的六个核心的技能教给你,咱们挨个装。 第一个 skill, 突破次元币的一个联网神器 telesearch。 你 肯定好奇为什么你的 ai 总是两眼一抹黑, 原因很简单,因为呢,他还没连上网。所以呢,咱们第一个必装的技能就是 table search, 这里呢,有一个坑,大家注意避雷啊!这个插件呢,最近在 cohab 的 应用商店下架了,不过别慌,咱们可以去 w 三 c school 的 备份站那下载,安装的方式非常非常省事,我们只要把安装包下载好之后呢,直接告诉 open call 你 的包在哪,比如说 帮我安装这个目录下的这个技能。但是注意,装完还不算完,我们还需要去 telly search 的 官网去注册新建一个密钥,它每个月都会有免费的额度,而且完全不需要绑定 visa 卡。 拿到密钥之后呢,直接发给 open klo, 让他帮我们配置好。搞定这一步之后呢,你的 ai 就 正式的拥有了一个看世界的眼睛。第二个 skill, 授人以渔的技能,雷达 find skill。 如果你每次都需要手动的去给 ai 找技能,那真的是太累了,那么我们不如格局打开,直接教给他,让他自己去找。 那么这个 skill 呢,可以帮你去搜索你所需要的一个 skill, 装上这个神器之后,比如 你想找自媒体运营相关的技能,你直接问他,他会非常精准的给你一个推荐。那么操作步骤,我们打开终端,输入这行命令。那么第三个 skill, 打工人觉醒的主动型牛马 pro active agent, 一个让 open clone 变成一个卷王之王的 skill, 有 了它呢,你的 ai 就 有了主动权。比如你丢给他一个大的任务,他会根据自己来去拆解步骤,然后自己呢去找工具去执行, 遇到问题呢,他还会自己去想办法去绕过去,再也不用你去一步一步盯着他干活,这呢才是一个合格的赛博牛马。 那么方法呢,和上面一样,我们输入这行命令,然后进行安装。第四个 skill, 一个究极进化的自我反思的 skill self improving 拍拍手,讲重点了啊,这个技能绝对绝对是王炸, 普通的 ai 做错事只会原地的死机,或者给你胡说八道。但是这个 skill, 他 就有了一个反思的能力,就像我们平时做 ui 设计 d 稿 b 了,没关系,复盘一下,哪里不对,我们改完呢,又是一条好汉。 他也一样,任务执行失败了呢,他会根据自己总结经验,然后调整策略,再重新试一遍,简直真的是越用越聪明。同样的 操作方式呢,也是在终端呢,我们输入这行命令就安装可成功了。第五个 skill, 眼观六路的多元搜索 multi search internet。 这个 skill 呢,可以让我们的 open curl 同时调用多个搜索引擎, 然后去交叉对比信息,然后彻底告别我们单一的个信息源,然后导致我们的误导,给你最最最安全,最最准确的答案。 有时候呢,只用一个搜索引擎,搜出来的东西可能不是那么全面,那么我们就给他多配几个第六个 skill, 替你去上网冲浪的赛博双手 agent browser。 最后这个 skill 呢,不仅能让他联网,还能让他像真人一样去浏览和操作网页。这里安装是稍微特殊一点点, 需要分为两步,一步呢是先去给电脑的局安装浏览器依赖, 第二步呢,再把它安装到我们的框架里面。搞定这个之后呢,他就能够帮你去各个网站去爬取关键的数据,阅读一些长篇的文章,真正能够成为你互联网的手气。好了,以上呢,就是让你的 openclo 脱胎换骨的六大核心技能,赶快去试一试,保证让你的工作效率原地起飞。下一期呢,我会给大家更新更干的内容,记得点赞收藏加关注,我们下期见!

你好,我是尹徽生啊,如果你的 office 啊,只是一个光秃秃的大脑,那它只能陪你去聊天了,哎,我们上一讲啊,其实也讲到了,那其实可以增加 skill, 那 在这里呢,有哪些办公类的 skill 我 们能直接提出来给大家去用呢?那今天呢,我们就从浩瀚如烟的这个技能市场当中精选出 top ten 的 办公必备技能,帮你啊来去武装你的 agent, 那 咱呢,让它从入职信迅速啊成长为我们的办公的全能武干。 呃,为什么 top ten 呢?其实在可罗哈巴当中啊,我们之前提到过有一万三千多个技能,那编码技能其实占大多数的,而很多人在去搜索的时候发现说,哎,我通过关键字去搜呢,可能找不到我想要的这些办公类的技能, 那如果我们不加选择去安装呢,不仅浪费资源,还可能引入安全的这个隐患。所以啊,我们就想了,那能不能我们直接为大家去提供 top ten 的 这个办公的技能,既是高频使用的,又是通用的,又是安全的。 所以呢,其实我们就想,那这些技能在社区当中,我们啊应该是最常用的,那就从大家最常用的这个工具开始,那我在这里面的话,提供给大家的十个技能,依次给大家列在这,然后呢,我给大家去简单介绍一下, 那我们知道日常办公的时候,其实离不开我们的这个邮件,特别啊,大家去做这个海外电商的相关的工作的时候,那这个 google 和 gmail 自然是用的最多的,所以呢,我把它放在了第一位。 那除了这个 google 之外的话呢,我们知道,那咱们通过这个龙虾呀,经常会去通过浏览器来去获取相应的这个网页的信息,所以呢第二个我在里放的是 agent browser, 那 当然呢,大家也可以去使用我上一讲所用的这个 agent rich, 那 第三个啊,就是我们最常用的,咱们会有更多的信息进来,那必须得总结啊,那所以我们使用的是啊 summary 这样的一个总结视频网页和邮件的工具。 那第四个的话呢,可能对于我们的平常办公的同学呢,可能比较少见,是吧,那其实它呢叫做版本管理的工具哎,比如说我们的这个龙虾写的对应的文件,然后这个文件呢,我们说了,那第一版我觉得不好,那再让它改成第二版好,那改了第三第四第五版之后呢,最后我们说了,还是第一版最好,你再回到第一版的时候呢,你就要一个版本管理工具,而 get 呢就是一个非常好用的版本管理工具。 其中啊有一个在线托管网站叫做 github, 那 它呢就可以去给我们进行仓库的管理,适合于大部分的技术用户,但是呢也适合于我们在办公来进行我们的网站的管理。然后呢还有啊呢再往下呢,叫做 cloud code 的 m c p, 它呢主要是通过 m c p 这个协议可以很方便的去连接你的 cloud code 这个相关的工具啊,那比如说对我们的面试行的操作呀,对文件的读写编辑等等,那这样的话呢,就可以让你的 cloud 有 一个嗯专业的这种编程的一个能力, 到那边很多人说了说,哎,我在国内啊,其实没有这个卡扣的这样的这个工具啊,也没关系啊,那在国内其实会有像它的这个开源替代品叫做 open code, 以及啊像这个自己出产的这个叫做 tree solo 这样的这个工具,这些都是可以进行替代的。 好,在右侧的话呢,其实是我们的一些更常用的办公工具,比如说网页的搜索,文件的管理,日历,以及啊我们的翻译,最后呢是我们的图片生成。我觉得啊,平常在我自己的这个办公当中,那它呢是最高频的,并且呢也是最通用的啊。 好,那这边的话呢,这些十个啊是我自己最擅长使用的,那你可以把它们都装上,但是呢也可以什么像我上一讲说,你可以按需进行安装,基于你的实际工作场景来组合这些 skills 啊。那提到组合啊,可能大家就是还是不太熟,所以呢,我这边还是给大家来两个例子啊,咱来看看 啊。第一个例子是这样的,比如说我们想打造我自己的这个信息的吞四兽,哎,啥意思呢?咱就可以能从搜索到摘药,让它变成一全自动的环境。 那这怎么做呢?假设啊,我们自己的角色是一个市场分析师,每天早上我们得快速了解行业动态,那如果靠人工去搜,打开网页阅读总结可能一上午就过去了。我最好的办法就是组合我们的两个工具,一个呢就是刚才提到的 web search, 一个啊就是我们的这个总结,是吧我们的 summarize 把这两个呃这个技能给它组合进来之后,那这样的话呢,它就可以既解锁又总总结了,那这个整个场景呢,你可以把它想象说,我们想要找一下二零二六年 ai agent 市场当中的一个最新的进展。好,那整个过程呢,我们就变成了利用第一工具进行搜索, 好,搜索完之后我们去智能筛选,剔除广告,然后呢,接下来进行我们的长文的摘样,最后啊产出像下面这样的一个 ai 市场晨报,那最终呢,我们就可以得到不同的这些晨报效果,是吧?包括这个关键的观点啊,观点的摘样,还有原文的这个链接。你看这一整套组合下来,我们就把原本需要两小时的阅读工作,咱给它压缩到了十分钟, 而且更重要什么呢?就这个 agent browser, 那 可以让你遇到一些需要登录才能查看的这个网站的什么呢?能够像人一样,咱可以去操作,乱七八糟去获取信息。哎,我觉得这个是我特别喜欢的一个功能 啊,你看这是一个简单的这个整合,是吧?那还有的时候呢,我们平常打交道啊,处理最多的啊,是什么呢?是我们电脑里边的文件,那比如说我自己是一个内容创作者,那我的电脑啊,真的是堆满了各种素材、草稿和参考资料,文件管理是我最大的一个痛点啊,那这时候呢,我其实就给我的龙虾装了一个 file manager 这样的一个插件。 好,这个插件啊,那这边它可以用来做什么呢?比如说我的这个下载文件夹里边就是有大概五十个文件吧。好,那在里面包括 pdf 的 报告啊,图片素材啊, tst 的 文件, excel 的 这个表格乱作一团是吧?那这时候啊,我就其实可以跟我的 agent 说了,我说你把下载文件夹里边的文件按照这个文件类型整理到不同的子文件夹里边,然后文件名呢统一加上今天的日期。 好,那你这时候 a 阵会做点什么呢?还是四个步骤是吧?第一个就是扫描分类是吧?他就看一下我们要处理的这个目录好。然后第二个呢叫做拽软,这个意思就是什么叫做预览操作,就是我实际给你去移动的时候,那你没有回退的空间了是吧?那我这边来去模拟一下整个的移动,让你看一下移动的结果, 没问题之后,我们再去进行这种批量的操作,来避免你误操作是吧?最后第四步,我们来去生成相应的我们的报告,那它的这个效果呢?其实就感觉是这样的,是吧?杂乱五张文件变成了我们的四个文件夹,那就变成这样的一种实现的形式。 嗯,那在这里的话呢,还要去注意啊,我们操作之前,大家一定要记得先对这些文件做好备份,因为有的时候咱们的 agent 很 容易出现幻觉,出现幻觉的时候就有点类似于说啊,容易误删我们的关键的系统文件了。所以在这边的话,一个是控制他访问的目录,这很重要。另一个是什么呢?你在操作之前一定要对文件进行相应的备份。 好,那在接下来的话呢,我们说那这里面你看每一个它都有它自己的用处,那这边我们说要不要一次性把它全都装上呢?其实我给大家的建议啊,不要一次去安装太多,还是像我们上一讲说的是吧?装的太多,那就背了很多的工具箱跑不动了是吧?变慢了,所以起步啊,我给大家的建议,你先装这俩, 一个叫 file manager, 一个叫 web search, 那, 那这边它解决最基本的动手和联网的能力,那等你用习惯了,我们再去组装说发邮件的能力啊,总结的这个能力啊,版本的能力啊等等, 然后再最后啊,我们再去组装这些高级的这些技能,是吧?好,那这样的话,你的整个的这个工具箱那就完整了是吧?那这样的话,每一个工具其实你也可以用的非常非常熟,那我觉得这个工具箱你完整了,几乎就已经超过百分之九十的这个聊天的机器人了。 好,最后来呢,这边我来去总结一下吧,像这个办公 skill 的 这个本质啊,就仍然是把我们的数字能力外包给 ai, 那 外包的时候就包括像我们的搜索信息到我们的文件管理能力,从我们的这个邮件的处理到编辑代码能力,那其实每一个 skill 呢,都是 age 的 能力,边界的一个拓展。我们这一边以后啊,其实大家要多收集这些 skill, 然后呢,把这个 skill 进行精准的选品 和组合,然后呢再和我们的 open coll 结合在一起,就可以打造成我们的办公的特征标,这个其实就是我不断去收集 skill 的 一些基本方式。 好,那在最后的话呢,想给大家依然是有一个可以讨论的话题,是吧,那在这个 top ten 的 技能当中,你最想给你的 open club 装哪一个? 或者啊,你有其他的一些独门的这些技能组合的这些心得啊,也欢迎你呢,在评论区分享你的装备清单,让我们一起来去打造最强的龙虾。

各位朋友大家好,今天我们要聊一个重磅消息。 openai 的 codex 在 短短六周内,从一个关在笼子里的代码工具,摇身一变成了能操控你 mac 的 桌面助手。 还记得去年五月的 codex 吗?最初它只是个沙盒工具,只能在云端运行,碰不到你的电脑。但现在,这个边界彻底消失了。 四月十六日, open n i 推出了几乎全能版 codex, 它能用鼠标和键盘操作你的任何应用,访问本地文件,还能用浏览器上网。你还能装九十多种插件,比如管理接额任务、自动部署手机应用。 最酷的是, codex 能同时干好几件事,还不打扰你。比如你写代码时,它能在后台帮你测试界面、查资料、装插件一气呵成。 你还可以自己教 codex 新技能,比如抓取 youtube 字幕、画流程图,甚至设置每天或每周自动跑一遍。这感觉就像给电脑装了个会说人话的闹钟, 好戏还在后头。四月二十日, openai 推出了 chronicle, 一个会定时截图并记住你工作内容的功能。 你再也不用说,接着上次他自己就懂他是怎么工作的呢。简单来说, codex 会每隔一段时间拍一张你屏幕的照片,认出来上面的文字,然后把关键内容存在一个 markdown 文件里,这个文件就留在你的电脑上。 但别忘了隐私问题。 open n i 自己都承认这个功能有风险,截图会发给 open n i 的 服务器处理,虽然他们说不保存,但本地文件是没加密的。更糟的是,如果网页里有隐藏指令, codex 可能会上当。 这让人想起微软的瑞扣功能,那个曾经因为安全问题被全网批评扣代词的 qualac 也有类似问题,所以目前只给 pro 用户用,而且欧盟、英国、瑞士都用不了。 所有这些更新都离不开一个新的大脑 gpt 五点五,他在上个月发布,是扣代词默认使用的模型,在编程基本测试上创下了新记录, 六周时间抠代码,从一个沙盒工具变成了桌面代理,甚至还能跟着你上手机。对于四百多万开发者来说, ai 助手不再只是工具,而是一个真正的伙伴。未来会怎样,我们拭目以待。

别睡了, open ai 的 大招来了。前两天,他们悄无声息地扔出了 g p t 五点四,我一看,这不完了吗?这不是小升级,这是直接把 ai 从会聊天进化到会干活的形态了。马斯克曾经暗示过,有些东西一旦开口,世界就回不去了。现在他来了,只不过他不来自于 group, 而是来自于 open ai。 打这一刻开始,他不再是那个只会在对话框里陪你聊天的复读机了,而是真正接管了你的电脑。 这次 open ai 的 定位非常明确,他把推理、编程还有工作流完全融合成了一体。之前 ai agent 需要各种外挂工具、模拟器才能够假装操作电脑。而 g p t。 五点四直接具备了帮你做的能力, 就是它可以像人一样看屏幕,理解坐标,通过鼠标还有键盘来发送指令,在不同的软件还有网站中,可以像真人一样随意操作,任意切换。这意味着,你以前写一个行业报告,或者是 excel 表,查资料,做 ppt, 折腾一整天的事。 现在你只需要一句话,剩下的事你就不用管了,它自己会点开文件夹,自己调 a p i, 自己来生成图片。值得一提的是,它还更聪明了,它还成功回答了我该走路还是开车去五十米外的洗车店这个问题。 他的回答是,开车,因为需要车。以前他可不是这么回答的,可见他的推理强度又有了显著提升。那五点四特别高效的用法就是,在之前我们用 g p t, 他 写完代码,至于能不能跑通,不知道,体验顺不顺,需要我们亲自测。但这次的五点四,你看,他自己写了一个主题公园模拟游戏,包含了访客反应、建筑放置等复杂的机制,他这次可以自己先玩一遍,哪的逻辑不对,他可以自己改 代码,如果报错了,他可以自己去修。那这种感觉就太真实了。就像你招了一个实习生,以前你得手把手的教,现在你直接招了一个职业经理人,他不但把活给你干了,还顺便把 bug 给你修了。最后端着长柄来问你,老板,你看这行吗?那 ai 何时能够完整的代替打工人?这条界限越来越模糊了,我现在有时候也分不清到底是我来操作 ai 来帮我进行替校,还是我再辅助 ai 去干那些零七八碎的细活了。

别再傻努力了,现在早已进入全民 ai 时代了,拼的根本不是马,你有多难熬多勤快,是谁会用 ai 提升效率,谁就能够跑赢别人。可现实呢?市面上 ai 会员月月扣费,没完没了, 自己搭建环境呢,门槛又高,普通人直接被卡在了门外。想用呢,咱们又用不上这款 openkit 小 龙虾 ai 盘,就直接给普通人准备了整套的一个 ai 环境, 提前帮你装的好好的,插上电脑直接用本地独立运行,一次入手终身不需要充值续费。想知道当下普通人如何能够轻轻松松没有套路,使用咱们的一个 ai 进入直播间,好吧,咱们直接进入直播间,实话实说,不玩套路不画饼,怎么使用怎么来!

看到喜欢的建筑外观或室内场景,想把它搬到自己原有的建筑或空间结构上,无需重新建模或手动拼贴, ai 就 能帮你一键融合。 今天我们来学习全能溶图。首先,打开暗刻 ai a 阵主页,新建一个项目,在左侧工具栏找到技能库,通过关键词搜索找到这个技能。操作非常简单, 第一步,上传你的溶图目标,也就是现有的建筑或室内场景图。第二步,上传溶图参考,导入你收藏的灵感图、意向风格图。 第三步,选择设计领域,有建筑和室内两种场景可选。最后点击生成即可一起看一下生成效果。 ai 会智能提取参考图中的核心设计要素,包括材质、光影、造型等,与原图的结构精准融合。 无论是建筑外观的新风格尝试,还是室内空间的整体氛围调整,这个技能都能帮你快速出图,让抽象灵感秒变专业效果图。快打开按壳 ai a 进解锁更多玩法吧!欢迎点赞收藏加关注,一起学习更多 ai 提效技巧!