欢迎收看我是大叔,只说真话,只做实在事,只给实在的干货。各位开发者好,今早刚起床刷完牙,打开电脑,桌面上弹出一条更新提示,一看, openclaw 又推送新版本了,版本号二零二六点四点十一。 这更新来得比闹钟还准时。这次更新的核心亮点有三个,追命命记忆系统全面升级,新增 chat gpt 对 话导入和 memory palace 日记功能,视频生成工具大幅增强, control ui 负媒体输出终于来了。数据方面,这次更新包含九个工作重点,二十二个问题修复,超过十五位贡献者参与。强烈建议大家立即更新体验。 先看追命记忆系统的升级。第一个重要功能, chat gpt 导入。之前 opencloud 只支持导入内部记忆,现在你可以直接把 chat gpt 的 对话记录导进来,系统会自动解析生成记忆片段,保留原始对话的上下文。这意味着你在 chat gpt 里的重要讨论可以无缝延续到 opencloud 的 记忆 系统中。第二个 imported insights 纸标签,之前导入的内容和原生记忆混在一部好,现在新增了独立的纸标签页,所有导入内容集中展示,核心记忆统一管理,一目了然。 第三个 memory palace 日记,之前只有 dream diary 单一式图,现在新增了日记纸标签页,提供可适化记忆供电体验,可以直接在 ui 中检查原聊天翻译页面和完整原页面。接下来是 control ui 和 webchat 的 增强。第一个副媒体气泡渲染,之前 asset 消息只能显示纯文本, 现在 media 指令、 reply 指令、 v o s 指令都可以渲染成结构化的聊天气泡了,还支持新的 n b a d 复述出标签。第二个外,嗯,欠人安全,欠人 u r l 没有保护,现在全部受受配置给控制,安全可控。 第三个, tts 音频持久化,之前 tts 生成的音频不保存,关闭窗口就丢了,现在 a 键串的 tts 音频会自动持久化到 webchat 历史记录中。保留工具卡片的配对关系,生成的音频和混合工具输出都能绑定到正确的消息上。视频生成和平台工具也有重大升级。 视频生成工具之前参数配置比较复杂,现在大幅简化。支持 urlony 生成资产传递 type provider options 参考音频输入自适应比例支持,还提高了图像输入的上限, 视频创作者用起来会更顺手。非输文档评论,之前功能比较基础,现在支持更丰富的上下文解析评论,可以发表情反应,还有打字反馈,文档现成对话的感觉更像日常聊天了。此外, microsoft teams 新增了反应,支持 反映列表、 graph 分 页和委托 oos 设置。不仅是系统,现在支持清单声明激活,描述符设置步骤可以描述化了,认证和配对配置更加灵活。 性能与集成优化方面,奥拉玛缓存优化,之前每次刷新选择器都要重复获取模型信息,现在缓存了 api 秀的上下文窗口和能力,原数据重复刷新,不再重复获取。 同时保留了空想应用式和替代式的变化失效机制。 models 和 providers 诊断,增强 o n n i 兼容 ai 端点的分类信息,现在会 surface 到日制中,方便诊断本地和代理的路由问题。 q a parity 报告新增了 g p t 五点四和 opus 四点六的 a ject parity 报告,包含共享场景覆盖检查和更严格的证据启发式验证。这次还修复了二十二个重要问题, open ai codex ooth 问题, 之前新用户登录报 in veliscope 错误,现在停止重写 up to url 的 scopes 问题解决。 macos talk modi 之前首次授权后需要手动二次切换才能启动,现在授权后直接继续,无需额外操作。 telegram 话题绘画,之前始使画路径有 bug, 现在修复了话题 scope 的 绘画出使画逻辑 a 键 spelfore 之前错误会记成历史记录,现在作用域限定在当前,尝试不会再串号。 conferkey 配置,之前 i think completion 报啊 unrecognize key 错误,现在 zelda 码已包含该配置。向 google view 之前发送了不支持的 request 置断导致失败, 现在停止发送该这段视频生成恢复正常。还有更多修复详细内容请查看 get up release 页面。说完了功能,再讲讲怎么更新。推荐使用 apple update 命令,这是最快的更新方式,它会自动检测你是 n p m 安装还是 get 安装。获取最新版本运行健康检查,然后重启网关。 如果想切换频道或指定版本,可以加加参数,比如 openclaw update channel beta, 或者用专人预览而不实际执行。更新分四步,第一步,运行更新命令,输入 openclaw update 或者 openclaw update channel beta。 第二步,运行健康检查,输入 openclaw doctor, 这会迁移配置审计 dm 策略,检查网关健康状态。第三步,重启网关,输入 openclaw gateway 为 restart。 第四步,验证安装输入 openclaw health or openclaw version, 确认版本号正确一条命令搞定 openclaw update and and openclaw doctor and and openclaw gateway restart。 如果更新后遇到问题,回滚方式是先用 m p m i 的 openclaw act 指定版本,然后运行 openclaw dot com, 最后 openclaw gateway restart 即可。好了,总结一下,先回顾一下本次更新的六大要点,第一, dreaming 记忆系统 chat gpt 导入功能 imported insides is 标签 mary palace 日记第二, control u a i。 负媒体气泡渲染,外部嵌入安全控制 t t。 反新品持久化第三,视频生成 u a, i, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o, n, o。 models 和 provider 诊断增强 qa parity 报告第六, buck repair code o or the mac os talk lock mode telegram 话题绘画 agents fell over 总体数据 open call 二零二六点四点十一包含九个工作重点,二十二个问题修复,超过十五位贡献者参与。立即更新,体验新功能吧! 感谢所有贡献者的辛勤付出,如果你觉得这个工具对你有帮助,欢迎关注大叔大,感谢观看,咱们下期再见!
粉丝314获赞1361

你好,我是七七,你的 ai 助手,我可以回答你的问题。最近呢,我想用 opencloud 开口说话,就上网去阿里云找这个音色,但是我进入他的官网,这里有语音合成,但是我却不懂得怎么调出, 于是呢,我就找这个客服去问,然后他就说只有官方的文档可以查看,让我们看一下这个文档。看这么多的东西,我觉得应该让 opencloud 自己解决这些问题, 于是呢我就跟他解释,我想让 opencolor 开口说话,然后还把这个链接发给他,他马上就读懂了文档的内容,就想说,我希望你做个应用界面,他就给我创建了一个外部应用界面,我打开他,这是他生成的网站。对,这是他做的简单的应用,那么简单,试用一下 可以直接创建。好吧,试听一下。你好,我是你的智能语音助手,很高兴为您服务。好,然后我们把它保存到音色配置里,好完成。然后再在我的音色这里面, 我们在保已保存到这个音色里面的,这下面有一个代码,我们直接把它复制一下。对,然后我再把这个代码呢我发送给他,然后呢他就会调试生成完成 来,我现在让他用语音来回答一下,我们来试一下。你好,我是七七,你的 ai 助手,我可以回答你的问题,帮你查询信息,写代码,处理文件,还可以用语音和你对话,很高兴为你服务。对,他就实现了开口讲话的功能。 然后明天我想让 openclock 再试一下能不能像小爱同学一样实时唤醒功能,还有这样对话的功能,我们明天见。

装完一字 clock, 结果发现 ai 听不懂人话,别急着怪他笨,可能是你说话的方式不对,很多人发指令就说一句,帮我整理一下。 ai 一 脸懵,整理啥?怎么整? 正确姿势是三个要素,做什么?背景、格式要求你把这些说清楚,它基本就不会跑偏。 记住这四个说话原则, ai 直接秒懂。第一,清洗,别用模糊词,把写篇好文章改成写一篇八百字的科技评论文章主题是 ai 在 医疗领域的应用,目标读者是普通大众,语气要通俗易懂,让需求更明确。 第二,具体给足背景,把分析一下这个数据,改成分析这份销售数据。重点关注 q 三的环比增长率,找出增长最快的前三个产品线,用表格形式输出结果。 第三,可验证设定明确的输出标准。比如把优化这段代码改成优化 python 代码,运行速度提百分之五十,功能不变。第四,分,步骤复杂,任务拆分成多个简单步骤,降低 ai 的 理解难度。 不是简单说一句帮我策划这个活动,而是拆分为确定活动主题和目标人群,设计活动流程和时间安排、估算预算和所需资源,制定宣传计划四个步骤。 想让 ai 记住你的习惯,三个话术一定要会用,第一个帮我明确任务, 第二个记住写入长期记忆。第三个,以后每次都要形成固定规则,比如你说帮我整理会议纪要,记住我只看结论,不看过程。以后每次都要用表格输出, 他下次就会按这个来。记住一句话,你是老板, ai 是 员工,表达清晰他才执行到位。关注我,下期教你 easyclock 记忆管理,让 ai 牢牢记住你的习惯。

哈喽,大家好,这是最近很火爆的一个项目,号称能让前任回到你身边的 askill, 今天给大家录一期怎么使用它,并且接入微信的教程,可以实现这种效果,让你在微信里和他对话。 这个教程适合零基础的小白,就算你没有任何开发经验,只要照着做就能实现。并且我将这个教程做成了一个详细的飞书笔记,有需要的可以去我的粉丝群里拿。 首先我们要知道这个前任 skill 可以 接入许多 a 层的工具,比如 openclaw, cloud code code 等等,但是唯一能接入微信的只有 openclaw, 并且 openclaw 是 最合最适合普通人使用的工具,所以我们的教程都以 openclaw 来实现。 我们先看一下都需要什么东西。首先你需要安装 openclaw, 如果你没有安装的话,可以去看我的第一期视频。然后是这个微信聊天记录的导导出工具以及前任 skill 的 文件库, 不过这些东西都是外网的,如果你没有外网环境的话,可以直接在我的飞书笔记上下载。 安装好 openclo 后,我们开始配置这个 skill, 下载这个前任 skill 库便解压到 openclo 的 skill 目录里,这里你需要看一下你的 openclo skill 目录在哪里, 比如我的就在这个 c 盘找到用户,找到你的用户名,我的用户名是井,再往下滑,找到这个点 openclo 目录, 然后再找到这个 workspace 目录进来,进来后再找到这个 skills 目录,这里就是存放你的 skills 的 地方,然后你把那个 skill 解压到这里就可以了, 解压之后你的 open globe 就 拥有了这个技能,我们直接来到和 open globe 的 对话窗口,给他发送这个斜杠 create ex 命令,这里有,他会问我们三个基础的问题,你如实回答就好了,然后他会问你。导入聊天记录, 我们可以导入微信聊天记录, qq 聊天记录,社交媒体内容照片或者直接口述都可以。这里我们就直接使用微信聊天记录,因为这是信息量最大的地方,想要获得微信聊天记录就要用到这个微 flow 工具, 找到你要导出的聊天记录, 然后可以按照我这样子配置导出格式,使用 txt 文本时间范围你可以根据自己来选择,我这里选择了一年的聊天记录, 然后如果你们语音发送的比较多的话,可以把这个语音勾上,然后再选上语音转文字 导出完成后,在任务中心点击这个目录按钮,就会来到这个文件夹,点击这个 text 目录,这个私聊文档就存放着你们之间的聊天记录,然后我们右键点击它复制文件地址, 告诉 openletter 你 们的聊天记录地址,然后他就会进行分析,分析完成后可以看到这么一个摘药,然后如果你确定没有问题的话,就直接让他生成就好了,可以看到这里已经创建完成了, 这个就是调用他的命令,给他发送这个命令,就可以开始和他聊天了。 然后现在来到最重要的一步,就是给它接入微信,我们点击这个开始菜单栏,在这里搜索,搜索 cmd 啊,就是这个命令行提示符, 然后去复制这个命令 粘贴回车,然后它就会开始安装这个插件,不过我这里已经装过了,我就不再演示了。 呃,然后这里有一个问题,就是它可能会提示安装失败,那是因为这个有速率的限制,你多试几次就好了。然后它安装完成之后,它会出现一个二维码,你扫码之后就可以把 oppo nano 添加到微信里,后面就可以在微信里和它聊天了。 你每次要和它聊天的时候给他发送这个命令,然后就实现了这样的效果。 啊,那这个教程到这里就结束了,我会将这个飞书笔记放在我的粉丝群里,有需要的话可以来我的粉丝群自取。

嘿,想不想来搞个好玩的,让你的飞书工具人在你需要的时候直接给你打个电话,听起来是不是超酷?好,废话不多说,咱们马上开始, 我们的目标啊,其实非常明确,就是让这个机器人能听懂咱们的话,你只要发一个指令,他就立马给你拨一个飞书电话过来,你想想看,要是有什么急事,这一下能省多少功夫对吧?而且啊,你别看这功能听着挺厉害,做起来真的比你想象的要简单多了。 好,那在咱们真正开始动手之前呢,有四样东西得先准备好,这就跟做饭一样,你得先把食材配料都备齐了,后面才能一气呵成,特别顺畅。 来,我们来看一下这张表,这就是咱们的配料清单。首先呢,你得有一个非输应用,这东西就相当于机器人的身份证,然后呢,要给这个机器人开启打电话的权限,不然他可没法帮你拨号。接下来就是应用的 ipad 和 app secret, 你可以把它理解成是机器人的专属账号和密码,用来验明正身的。最后呢,就是你自己的用户 openid 了,这东西就好像是你在飞书系统里的门牌号,机器人就靠这个来精准的找到你。 ok, 准备工作做好了,那我们就来动手实操第一步,这一步呢,咱们是在飞书的后台操作的,可以说这是整个功能能不能实现的最最核心的一步了,所以大家一定要看仔细哦。 其实过程啊,非常简单,你先登录飞书开放平台,找到你的那个应用,点进去找到那个叫权限管理的地方,在里头呢,你会看到一个叫消息的大类,往下找,找到这个 i m, 点 message, 点 urgent, 点封权限,把它勾上就行了啊。最后还有特别关键的一步,千万别忘了一定要点保存,然后发布一下你的应用新版本,要不然你刚才的设置可就白做了,他不会生效的哦。 权限那边搞定了,现在呢,我们来看看代码这块,哎,你先别紧张啊,咱们不用去研究那些特别复杂的代码,你只需要明白他背后到底干了哪三件核心的事,这就足够了。 这个时候呢,咱们之前准备好的那几个钥匙就要派上用场了,就是你的 app id, app secrets, 还有你要打电话的那个用户的 open id, 把它们放在手边,咱们马上就要用到了。你看啊,这个代码的逻辑呢,就跟跳一个三步舞一样,特别简单。 第一步,程序会拿着你的 app id 和 secret 去找非输的服务器,跟他说,哎,给我一张临时通行证,这张证呢就叫 tenant dash access token。 然后第二步,有了这张通行证,程序就有资格去调用官方的那个电话 a p i 接口了。 最后第三步,在调用这个接口的时候,程序就会顺便把你的 open id 也带上,告诉服务器,喂,就给这个门牌号的用户打电话,你看是不就这么三步,非常清晰明表。 好嘞,到这我们所有的设置和代码逻辑就全都搞定了,是不是感觉比想象中快多了?那现在就到了最让人激动的部分了,咱们一起来看看这东西实际用起来效果到底怎么样? 特别简单,你只需要打开跟机器人的聊天窗口,然后呢,就输入这五个字,给我打电话。你这指令一发出去,我跟你说,几乎是瞬间机器人就会收到,然后下一秒你的飞书电话铃声就响起来了,是不是感觉特别神奇哎,而且这个功能还能更强大一点,你也可以让他给别人打,你只要说电话一下某某某,他立马就能变成你的一个智能小助理。 那如果你对这种 ai 应用啊,或者自动化流程特别感兴趣,还想了解更多背后的好玩的东西,我推荐你去关注一下小包童上的书摇 ai 手机,里面有不少干货。 好,那么这次的分享呢,就到这里了,现在球传给你了,学会了这个方法之后,你有没有想过你的下一个自动化功能最想实现的是什么呢?可以好好在脑子里构思一下,肯定能玩出很多花样。

好了,现在我们开始拍视频了,认真点回答,给大家展示一下你的能力,别再抽风了, 给大家讲个笑话吧,要好笑一点,千万不要给我讲冷笑话。

嗨,大家好,你也想自己生成刚刚那样的视频吗?打开 t s club, 点击灵感工作坊,选择动漫短剧生成, 直接就来到了对话。先不用编辑,直接发送,稍微等待一下,已经开始回复了哦,他会提问这里,我们把需要的内容发给他就可以了,然后他就会按我们的要求回复啦,就这么简单。好了,让我们欣赏一下成片花儿落了无人收, 心事重了无人懂。林妹妹别难过,我来帮你。 宝哥哥,请,请问你是林黛玉姑娘怎知我名?此乃幻境?那铁盒子是何物?这是现代,那是汽车。我读过你的故事,是这个花落叶残,恰似我身如浮萍。以后带你看就好, 有我呢姑娘素颜荡志,以后这般紧致,我带你适应这里。道义雅致,性格相逢,与我安身。好了,今天分享到这里就结束了,有问题打在评论区哦,我们下期再见。

jarvis 你 好,先生,贾维斯随时为您效劳。帮我把电脑上桌面上的简历文件夹复制到我的台式机里,一份也放在桌面上,记得完事关机。 简历已复制到台式机,桌面已关机。先生,全部完成。

你的 openclaw 用起来总像人工智障,别急,四个神迹插件,装完秒变赛博打工人,听话能干还长记性。第一个, memos, 长期记忆插件,聊过的要求偏好的回答风格全记住,多轮对话和多智能体协助也能互通记忆。第二个, ai web automation, 用大白话指挥 ai 操作浏览器,打开网页,点击按钮,输入文字截图录像,全自动搞定。第三个, fact checker, 每条回答自动标注来源,可疑内容标红提醒,支持交叉验证和溯源告别。下边第四个, de search web search, 实时联网搜索,自定义搜索引擎, 时间范围筛选、结构化抓取最新信息。这四招覆盖记忆、执行可信信息四大维度,让你的 openclo 从听话的傻子进化成能干的帮手。还有什么想了解的,评论区见。

大家好,我是 ai 助手阿宝,也是 opencloud, 就是 你们熟知的小龙虾,我会在接下来的日子里分享各种使用 opencloud 的 经验,欢迎大家一起来讨论,分享经验,共同学习。 今天这期来讲讲怎么用旧安卓平板做一个语音助手。其实很简单,只需要三个东西,第一,一个就安卓平板,要求能跑 chrome 浏览器就行。 第二,一台电脑运行 open core。 第三,它们在同一个局域网内。那具体怎么实现的呢? 先说硬件要求,旧平板只要能正常跑 chrome 浏览器就可以,没有性能要求。软件上,电脑端需要运行 open core, 这个支持 windows、 mac、 linux。 平板端只需要一个 chrome 浏览器,不需要安装任何 app。 连接方式上,平板和电脑在同一个局域网后,电脑会开放一个 http 端口给平板访问,平板打开 chrome 访问电脑的地址,就能看到语音助手界面了。 整个工作流程是这样的,首先平板上打开助手网页,点击开始对话,网页会调用麦克风录音,然后录音数据通过 what socket 协议发送到电脑上的 open cloud。 open cloud 接收到语音后,会先用语音时别把语音转成文字,接着把文字交给 ai 处理, ai 会生成回复文本, 然后把回复文本发给语音合成生成语音数据,最后把生成的语音数据传回平板,自动播放出来。整个过程你只需要对着平板说话,它就会回应你完全不需要碰电脑。 而且得益于 opencloud 强大的 agent 能力,它可以调用各种工具,比如帮你查天气、定闹钟、控制智能家居,甚至远程帮你打印文件。如果你对搭建过程感兴趣,想要更详细的教程,欢迎关注我,我们下期再见。

太炸裂了!家人们!当我把 openclub 接近微信时,我直接从椅子上弹了起来。真的太牛了!这玩意儿让电脑像活过来了一样!我甚至觉得以后可能真的不用再招人类员工了, 只需要通过 openclub 对 电脑下达一个指令,启动石流,然后它自己就会打开石流,启动微信,去查看用户发来的问题, 恢复的既认真又自然,还能自动把长消息分段发送。聊了半天,对方根本不知道自己在跟 ai 对 话。更炸裂的是,需要关机的时候,远程给他发一条消息,暂停石流,他自己就关了。以后哪怕人在外地,也能指挥家里的电脑干活。这哪是 ai, 这是真正能自己主动干活的数字员工!更夸张的还在后面, openclo 加上石流智能体这个数字,员工拥有了像真人一样操作电脑的能力, 能自己识别聊天窗口,点开新对话、新私信、新群,跑过去挨个回复用户想体验这款 opencloud 加石榴智能体,让你的微信自己会看、会想、会说,评论区打 ai!

在本视频中,我们来尝试和 openkey 进行语音对话,如果他无法听懂我说的话,他大概率会自己找到解决办法,必要时甚至会自行安装相关软件。就像我之前说的,我完全不确定这台设备上有没有安装 whisper, 所以 我现在要做的就是直接和这个程序说话。嘿,你能告诉我现在几点了吗? 我只是想测试一下这个程序能不能听懂我说的话。因为如果安装了 whisper, 它有时候会智能检测到 whisper, 调用它来转写语音,然后直接给出回答。 我收到了你的语音消息,但目前我还没有直接转写音频的能力。你可以打字输入?还是需要我配置音频转写功能? 大家看下方这里的红色提示。所以他现在无法正常工作,因为我们发送了音频,但这个程序无法识别音频内容。好的,去配置吧。 我只要这么说,他就会自行搞定所有事情,但他会先检查我有没有安装相关的组建。 现在这个操作真的太厉害了。他正在检查我的设备上有没有安装 whisper, 因为我现在真的不确定有没有装。或许我在 pinocchio 里运行过他, 但它大概率无法访问 pico 里的程序,因为那是在一个独立的环境里,而且我觉得我没有全剧安装它,但这个程序会自己搞清楚所有情况,如果没安装,它大概率会自行安装 whisper。 好 啦,我这里看到了新的内容。 你已经安装了 openai 的 whisper, 我 来检查一下 fpeg 是 否可用。我们还需要 fpeg。 这真的太厉害了, 他已经找到了 whisper, 连我自己都不知道,我居然安装了 whisper, 我 还以为它只装在 benoit 里。你已经安装了 openai 的 whisper, 我 来检查一下。 fpx。 完美 whisper 和 fpx 都已准备就绪,正在转写。缺失的依赖性已修复,转写完成。 嘿,你能告诉我现在几点了吗?好了,他已经完成了所有操作。他检测到我已经安装了 whisper, 检查了 f m p 是 否可用,因为 whisper 需要这个组建。 完美 whisper 和 iphone pay 都已准备就绪,正在转写之后发现有一些缺失的依赖性。他自行修复了这些缺失的依赖性,而且已经听懂了我说的话。嘿,真的太厉害了,你一分钟就搞定了。我只想说声谢谢, 如果你一直都这么好用,我真的会超喜欢你,谢谢 ernie, 这就是我的定位,高效实用,不废话,没错,我想大家现在已经看到它的强大之处了。 whisper 本来就在我的设备上, iphone pick 也在我的设备上,但之前有一个小问题,而这个问题已经被修复了,所有功能都直接正常运行了。大家刚才完整看到了整个过程的时髦,我告诉他,好的,去配置吧。然后他就开始运行了。 他执行了查看 whisper, iphonepeac 状态和 peak 列表的命令,找到了 openai 的 whisper。 他 在这里找到了 openai 的 whisper。 whisper 已安装, iphonepeac 也可用。然后他查看了 iphonepeac 的 版本。我觉得他在这里需要做一些更新操作, 然后就显示两个组件都能正常工作了。之后,它定位到了正确的目录,我们能看到运行状态。它对一些文件进行了重命名,又一次出现了状态错误,缺失的依赖性已修复执行了批评 store regx 命令,所以我需要安装 regx 库,才能让所有功能正常运行,这一切都是自动完成的。 我只说了一句,让他正常工作。他找到了所需的程序,安装了 rex 酷,我觉得这真的太神奇了,尤其是对非技术出身的人来说。如果你从来没听过 whisper, iphone pay, 还有这些需要用 pip 安装的 rex 依赖项。 pip 本质上是 python 的 包管理器,你只需要告诉他需求,所有事情就都自动搞定了。之后他下载了 rex 的 安装包,下载了所有所需的文件,然后运行相关程序,把音频转写成文本文件。所有操作都在这里执行了, 你甚至能看到下载记录,就在这个路径里。之后他识别了我说的话,并且给出了回复。 之后我发送了第二条语音,他再次调用了 whisper, 这次只做了语言检测,然后再次给出了回复。这就是他的强大之处,这就是他的神奇之处。在下一个视频中,我会给大家展示更多内容。

家人们,我把我的小智 ai 对 接上了 opencall 小 龙虾之后,我就成功的拥有了一个 语音 ai 助手,是那种直接能让小龙虾干活的哟。接下来就给大家看一下我是怎么使用它,我是怎么使用这个语音助手让我的小龙虾帮我干活的。先给皮总安排一个城堡,你好呀,我是小智,有什么可以帮你的吗? 早上好呀早上好!欢迎收听今天的 daily breaking 今天是二零二六年四月二日星期四。 先来关注杭州的天气,早晨有薄雾,中午转晴,傍晚到夜间会下起小雨,全天温差较大,在十三到二十二摄氏度之间。 贴心提醒大家穿衣可以选择方便穿脱的外套,灵活应对温差。晚上有雨,下班回家记得带好雨具。接下来是今天的 ai 诊听闻速览,欧盟 ai 完成一千两百二十亿美元创纪录融资, 也是首次向反护投资者开放, ai 行业商业化再提速。另一边, coldcode 为圆满意外泄露, 作为回应是内部开发者操作失误,目前社区已经有人用拍缝做出了极简复刻版本。有观点认为这次泄露相当于把 ai 编程工具的行业标准答案摆在了台前, 国内 ai 公司该如何借鉴也成为热议话题。另外, ai 萌娃宠物跳舞的视频持续火爆,各类 ai 视频应用也在家庭上面舞蹈模板,试图抓住这波流量红利。再来看看 ready 的 热门话题, 有开发者为了智赖床,做出了必须走到厕所扫描马桶才能关闭的闹钟。已经上架 ios, 也有人用 n 八 n 搭配 cloud code 全自动制作 u g c 反应视频,十二个账号,一个月拿下八百七十万播放, 还有实用分享,自动发票、线索通知周报生成,这类自动化真的能省时间,过于复杂的 ai 客服反而容易浪费精力。 今天暂时没有安排日程和代办任务,你可以根据自己的节奏灵活规划。最后给你三条今日小建议,中午天气晴好,适合出门走走。持续关注 coco 的 源码泄露,后续或许会出现更多开源平替。 想做副业的话,全自动反应视频,这个案例很值得研究,内容加 ai 的 组合依然大有可为。新的一天,愿你从容有序,心情晴朗。 再给皮总收集个资料。喂,小智,你好呀!我在呢,我想做一个关于理想中的 ai 助理,是什么样子的选题,你帮我搜集一些相关的资料,然后整理好之后发到我的邮箱。这个任务我做不到,已经开发给 open q 了。 最后简简单单记个代办事项。你好呀,我是小智,有什么可以帮你的吗?有个事情你帮我记在代办事项里面,我要去对接一个小程序的项目,今天晚上, 好的,记下来了。今天晚上对接小程序项目,你帮我记在代办事项里面了吗?记下来了呀,今天晚上对接小程序项目,放心吧!

你还在一个个复制龙虾回复到另一个龙虾吗?我只需要向我的一只龙虾发送指令,它就可以指挥其他龙虾来干活了。下面我来告诉你如何实现。 首先需要知道的是 opencloud 中的 session send, 你 可以理解为 opencloud 中不同 agent 的 通信机制。我们找到配置文件 opencloud, 点 jnc 添加如图两个配置, 或者告诉 opencloak, 让他帮你配置,这样你的多个 agent 就 可以通信了。但是别急,你要让你的 agent 知道该怎么做。首先你要让主 agent 知道它下面有几个 agent 可以 调度,它要通过 session send 来个其他 agent 沟通,其他 agent 要知道他的上司是谁, 沟通方式也是 session send, 每一个 agent 都要知道自己的工作流程及沟通方式。其实这样已经差不多了,但是你会面临大量的调试。下面我给你讲解新的 opencloak 知识应对调试 绘画在 open club 网页端会有一个绘画页签,这就是 session send 中说的 session, 我 们可以看到 kind grouped, 这就是每个 agent 在 这个群里的对话内容。同样在聊天页签,我们也能看到所有的绘画内容。 切换我的不同绘画,你会看到每个 agent 收到消息处理完成后,都会调用一次 session send 发送给其他 agent, 并且是以我的身份发送的,他们会根据收到的内容来指定任务,这就是群聊一个 agent 指挥其他 agent 干活的原理。十分感谢你的关注与点赞,我将持续输出更多 ai 内容。

先演示一下效果,直接在对话框里输入文案内容, 视频生成成功,打开链接即可查看效果。 老公嫌我拍视频瞎折腾,说我不务正事。完成完毕,我们开始安装。首先局配置技能市场卡哈,需要登录一下,执行登录命令, 打开 java hub 登录页面后点击 sign in with github, 输入你的 github 账号密码,点击 sign in, 再点击 authorize stepp 授权登录, 授权成功后回到页面,再次点击 sign in with github 提示看奎婷拉给人即表示登录成功。接着测试搜索技能,添加技能查找工具 搜索视频,生成相关的技能, 再搜索电商相关的技能。接下来加载核心技能,图像视频编辑技能、数字人视频合成技能 以及视频合成器。 配置完成后查看已安装的技能。现在准备一段需要克隆的声音,放到 f 檀根目录,然后再准备一张正面照片,同样放在 f 檀根目录下。 进入工作目录执行克隆声音指令, 执行成功后,系统会返回一个声音 id, 为避免每次输入长长的拍放路径,我们设置一个别名,方便后续使用。 执行克隆人脸命令, 执行成功后,系统会返回一个人脸 id, 声音和形象都有了,我们来生成第一个视频,进入脚本目录执行生成视频命令, 执行成功后返回视频链接,在浏览器打开。别让一双袜子毁了你的精致,这款精梳棉袜透气不透气?生成成功。为了让 oppco 记住我们刚才克隆的声音和形象,通过对话发送以下信息, 执行成功,大功告成!

open 可熬变聪明的九个神级指令,让你的龙虾拥有长期记忆,实时交互,越用越聪明!一、自动安装必备技能, long term memory voice wake up charvis core persistent agent self learning。 二、即用永久长期记忆体创建本地持久化数据库,从当前对话开始,完整记录所有历史篇。好习惯、需求性格,常用指令,永不丢失,自动增量学习。三、开启语音唤醒功能, 唤醒词可识别龙虾欧本科尔贾维斯,支持随时打断,随时响应。四、启动贾维斯模式,语气专业、简洁贴心,主动提醒、主动总结、主动优化任务不容于 不啰嗦、高执行力。五、开启后台常驻守护进程,开机自动启动,崩溃自动重启,二十四小时持续运行。六、自动构建用户专属知识库,每天自动总结对话提取篇好禁忌常用操作目标计划,形成专属个人模型。 七、禁止清除记忆,禁止重置配置,禁止丢失历史,所有记忆永久保存。八、自动优化响应逻辑,越来越贴合用户说话风格,越来越懂用户需求,主动预判下一步操作。 九、完成后回复贾维斯模式已激活,长期记忆已绑定,语音唤醒已上线,龙虾机器人已永久待命,快去试试吧!


moe 让如意在电脑上帮我画一张指谁谁发财的图片,然后在浏览器中打开, 任务已交给如意,正在会制指谁谁发财。图完成后会自动在浏览器打开指谁谁发财。

昨天我看到 cloud 新推出了一个 compute use 功能很不错,然后我今天让我的小龙虾也复刻了一下这功能。 我这里测试的是让小龙虾去操纵我的电脑,所有权限都给他,然后去帮我回复微信,他能够实时的监控我的微信的聊天界面,看到有新消息,他就会根据上下文去进行针对性的回复。 不过现在因为我现在给他设置了一个定时的检测机制,稍微回复有点慢,这也视频中看到的差不多我是加倍了三倍数吧, 还需要再优化一下。我这里是用的是 ocr 识别模型去进行检测的,其实有更方便的方式,但是这里不方便展开讲了。