十二月十一日,据智普公众号消息,智普正式上线并开源 g l m t t s 工业及语音合成系统,只需三秒,语音样本 g l m t t s 即可学习说话人的音色和说话习惯, 在通用朗读、情感配音、教育评测、电子书、有声客服等场景中,实现自然、流畅、贴近真人的语音。
粉丝3.6万获赞39.1万

只需要三秒就能克隆我的声音吗?对啊,我们人工智能就是要讲效率吗?没错,后面这句就是 ai 用三秒钟录音克隆的我。这正是制服今天刚刚开源的 gmtts。 克隆我这样的普通话只是他的基本操作。他的克隆能力到底有多强呢?就是不管多有地方特色的方言,同样只需要三秒就能给你精准的复刻出来。我用几段方言素材试了一下,你听听这个效果。有人问哪里的黑暗之神,呜呼啦呼黑魔变身, 你让我怎么跟上面交代呀?马上给我出去!其实东北话我也略知一二了,而真正让他拉开差距,是他的情感表现力。我们来听听同一段充满愤怒的小说台词,他和市面上其他几个模型的效果对比。你怎么就那么不会说人话呢?你怎么就那么不会说人话呢? 你怎么就那么不会说人话呢?高下立判,尤其是在悲伤、愤怒这种情绪上,他的真实感直接达到了开源模型的顶尖水平。 最关键的是,它还彻底开源,模型权重代码全部开放,用的还是阿帕奇二点零协议,开发者可以直接拿去做商业项目,这格局没得说。所以无论是需要高质量配音的创作者,还是想集成语音能力的开发者,质朴,这个 glm t t s 绝对是目前开源领域的版本答案。

只需要三秒他就能克隆我的声音吗?对啊,我们人工智能就是要讲效率吗?啊?我需要录什么? 随便说两句就可以啊,英语四川话湖南话都能说,其实东北话我也略知一二了。我不信 a a 能看懂故事,能演好人的感情,哼,谁信啊? 当然是真的,只需要输入文本,我就能自动把开心的情绪、悲伤的情绪、愤怒的情绪都演绎出来。我想给这个人物加点设计,比如来句口头禅。 可以呀,你可以自定义指定发音。比如,把你好啊读成雷猴啊,把我不信读成我信你个鬼。 长官信号强度爆表了。他们回应了。哎,人类的未来还会存在吗? 博士,还没破译出来吗?正在,正在解析。这是一种极其高等的语言逻辑,包含了十一个维度。天呐,太美妙了!正在同步全球广播,全世界都在听。他们对地球说的第一句话是什么?是宣战还是和平? 破译出来了,博士,你快放啊,他们到底说了什么?这,这不可能,快放啊。 你好,我是银河保险的业务员,最近我们推出了聚会的星际旅行保险,请问你有需要吗?

来了来了,全网都在找的豆包手机同款 ai 工具,智谱开源 autobot 膜给你们找到了,操作简单而且免费,小白也会试用,同时支持安卓、苹果、鸿蒙。 下面我速分享给大家。首先点视频右下角分享键分享复制链接,然后打开这个工具包, 没有的去下载一个就会弹出资源包,没有弹出的去首页输入鱼饼大全,然后打开这个文件包,右下角去保存就可以了。

免费了,不要三四九九,也不要九块九,不包手机的平替智普的开源项目 open auto gm, 配合它的开源模型 auto g o m 九 d, 咱们也能实现手机 agent 的 自由。我用手上这台安卓手机和 mac 电脑搭好的环境,让他来帮我购物, 这是执行效果,提示词是在淘宝上找到帮宝适黑金刚 l 码最低价的商品,加入购物车,然后发微信告诉我商品选好了。我来看看。这套开源方案和豆包手机最大的区别有三点,第一, 一,运行级别不同。开源方案只能在前台运行,豆包手机可以在后台自己默默的运行。第二,手机的便携性不同。开源方案手机和电脑必须用数据线连接,或者是在同一个 wifi 下,豆包手机可以只拿着手机到处走。三、智能程度不同。 开源方案接的是九 b 参数的小模型,能完成大部分的基础场景,但是极限智能比不上豆包手机。推荐两种适合的使用场景。 场景一,操作电脑忙不开的时候,比如快下班时提前叫车,当同事还在等车的时候,你已经上车回家了。场景二,需要在手机上多个 app 之间切换,收集数据,分析并且最终操作手机的场景。比如说在双十二购物选择最低价格商品时,我的微信收到消息了,任务完成。 牛逼!那么这么牛逼的手机, a 镜的方案会不会很难配置呢?完全没问题,我摸索了一套极简方案,只需要一行命令和一句话就能配置好。 首先看我这期视频,一行命令把 cloud code 安装好,然后打开 cloud code, 告诉他这句话,一路点同意就能安装完成整个配置过程,需要用数据线把安卓手机 在电脑上这么简单都能就能搞定,快去配置一套试试吧!你还有什么场景想用手机 app 来解决的?详细的安装过程和常见问题我会总结成文档,方便大家查看。关注我,玩转 ai 编程。

极简版,把你的手机变成豆包手机第一步,搜索 open article 开源代码仓第二步,安装 python 和 git 第三步,把终端切换到目标文件夹第四步,执行 git clone 下载项目第五步,终端输入 cd open article, 进入项目目录 第六步,安装依赖第七步,用 vs code 打开 examples 文件夹中的视力脚本,点击运行或终端执行。第八步,安装并修改手机输入法,然后就可以在电脑上操控手机,自动完成这些 app 中的操作了。 怎么样,你学会了吗?不会也没关系,仓库中有详细的步骤教程,现在支持超过五十种国民 app 覆盖衣食住行,快去试试吧!

今天给大家分享一个豆包手机同款的开源项目,也就是最近特别火的智普,他们开源的 open oto g l m 是 专门用于控制这种托管手机的智能体。这个是一个框架,也是一个项目,但是这个总体来讲它的亮点大于实践, 主要有两个比较大的创新。第二个就是他们这个框架是可以进行这种手机的 连接,其实它跟按键精灵是差不多的,甚至它比按键精灵要小或者简单很多,实现了电脑和手机的远程操作,可以直接连 usb 或者直接在一个 wifi 里面就可以进行对接和联通。 我也详细梳理了一下这个项目,它开源的话其实并没有开源特别多的东西,像一些 memory 记忆体啊,这些记忆模块都没有开源,而且它只有一个智能体模块,它更像一个 simon, 而不是实际的一个项目。因为他在去年的时候其实是呃发了一个 app 的, 也是 otoglm, 但是在后面就没有特别多的推广了,而且效果也一般。 但是由于这一次豆包手机大火了之后,他借着这个风也做了开源,让大家也看到了这个项目。 我们详细来梳理一下这个项目。首先它的主要的架构就是你可以支持用它自己的本地模型,当然它都是使用的这种 best url 的 方式,你可以用本地的,也可以直接用现成的,但是那个模型必须要支持能元素定位, 现在币源的模型几乎都可以多模态的,最近的微软也开源了一个三 b 的 模型,应该性能也是蛮不错的,做元素定位,而且思考的模型 应该性能也是蛮不错的,但是他没有跟这个模型做一下对比,不知道他们九 b 的 这模型跟这个微软开源的三 b 的 模型比起来怎么样,应该大差不差,因为微软这个模型稍微小一点点,但是测试起来效果还是蛮不错的,而且小了之后才能在我们这种本地的这种显卡上面跑。九 b 还是挺大的,不算小了, 但是他有量化的,不过肯定是需要二十四 g 才能跑的,三 b 的 话做一些量化操作的话,也是可以让他实现在十二 g 内存上面跑的。 我重点比较疑惑的就是它到底有哪些工具和它这个智能体,它是什么样的一个智能体?它智能体只有一个智能体,然后我也没有 memory, 也没有记忆的规则,然后主要就是典型的 react 智能体, 整个流程就是典型的感知、思考、行动的这样的一个循环。然后每一次它做任务的时候或者下发任务的时候,它就会把整个 手机的系统去构建一个上下文,他的系统有什么应用这些,还有他的截图,就构建这样整体的一个上下文,加上你的一个任务规划, 然后他通过思考思考了之后去规划出来一个计划,然后去做执行,每一次执行了之后,他再进行一次思考,然后再进行执行,直到完成任务为止。当然他还有一些敏感操作,比如说验证码,比如说 要进行付款呀,这个是要人工介入的,它会主动的提示你们,我重点是想要知道它有哪些工具,或者可以执行哪些操作,是怎么样执行的?然后我就让它梳理了下,我是用的这个 deepweek 来做的,梳理它的工具也 跟按键精灵是差不多的,甚至比按键精灵要简单很多。首先就是启停指定的应用,然后手机上面关键的那几个按钮,还有就是滑动输入文本,返回上一页,还有点击,这些都都是可以的, 主要用的就是滑动文本和点击这几个,然后启启停应用,切换应用,这都是标准的按键精灵里面的东西。然后就是操作他的其实是一个相当于方寸扣领,点击某一个按钮去调用这某一个工具,然后有一些比较标准的规则, 应该执行前要检查应用,然后最多呢连续的等待三次,验证这个操作是否可以 进行操作。然后就是完成之后检查一下它的准确度,其实整体看起来它是一个 demo 的 形式,它并不是一个特别完整的项目,只是一个 非常简单的 demo, 稍微复杂一点的可能就是它搭起来了这样的一个框架,你自己可以去加一些 memory, 或者说加一些什么东西,然后我去可以放在你的手机里面,可以进行继续的二次开发。 总体来讲这个项目还是不能直接拿来做实际的运行的,可以做二开,这个是可以的。然后我都还专门让它梳理了一下它的记忆模块有没有,它是没有记忆模块的,它只有它模型上下文 token 的 这样一个上下文,然后这些提示词它都是用的中文呢?然后必须遵循的一些规则, 这些提示词其实还可以拿来做一些借鉴这些智能体的提示词借鉴还是蛮不错的。还有像这些执行动作某一个 app, 然后这就是它们方选透的一些东西了,当然做成 mcp 其实也是可以的。

智谱开源 ai 使用体验,它相当于在 ai 软件中植入一部云手机,里面所有的软件都跟原手机上的没有关联,需要在原手机上的软件重新登录, 它可以调用原手机的相机,一句话让他发小红书等软件与手机调用原相机启动比较卡 启动购物软件对比价格, 三家软件都启动了, 最后还是去小红书搜索, 这个功能个人觉得比较鸡肋。这个结果启动购物软件的意义是什么呢? 与手机内置没有的软件直接切菜也下载不了, 其他跟手机自带语音助手一样,一句话帮你搜索歌曲播放。现在开元了,等大佬瞧瞧吧!

没有想到都跑手机的朋友们,恭喜你省了三千五,因为就在昨天的时候,支付把它的 autgrm 开圆了,它可以直接机关你的手机屏幕,替你思考点击输入场景,覆盖了五十多个高频的中文 app, 比如说微信、淘宝、抖音、美团这些核心的场景,它都是可以跑的。 我拿它做了两个小测试,有亮点,当然也有吐槽点。首先第一个点外卖,它是真的可以跑通,比如说你想在美团上去下单,然后到加购,下单路径是很顺畅,你会产生一种错觉, 好像手机里面住了一个非常懂你小助手一样。第二,他的一个跨平台笔架是很实用的,我可以让他对比淘宝和京东同款拖鞋,他能够自己搜,自己去对比,最终给出你的一个结论,这就不是什么聊天机器人了,这相当于一个端侧 a 阵的他真真正正的上桌了。更关键的是什么?他居然很克制, 比如说他碰到了支付或者验证码之类的敏感操作呢?它会自动停止让你接管,很聪明,不会约借。但有一点很值得吐槽,就是现在的形态对普通人是不够友好的,你要用电脑通过 a、 d、 b 去控制手机体验,实际上更像是你在电脑面前远程控制着你自己的手机,就很奇怪。大家如果想要试试,可以找我拿下开源地址 和它的一个部署教程。智普啊, autolm 开源,我想说的是,它的价值不是在完美的体验,而是说它释放了三个信号。第一, ai 手机的异件可能要被打下来了, 以后的 ai 体验不一定要靠很贵的硬件,说不定就是靠的一个开源框架加它的一个端侧的能。第二就是大厂的 for a 阵固城河开始变浅了,开发者和极客们可以直接拆改做出来自己的版 本。第三呢,无障碍和轻量自动化领域绝对是要爆了。对于一些操作是很方便的人群来说,语音加 ai 操作就等于手机自由。欢迎大家评论区留下你的想法。

是谁还没有用上这个智普 auto game? 别急,猴哥今天给大家带来了本地部署的和职装的版本,保证让你一看就会使用。 首先点击我视频右下角箭头,复制后分享链接,然后返回到手机桌面,找到这个蓝色小鸟软件,没有的去应用市场逮一只,打开会跳出文件,如果没有弹出就在主页搜索栏输入,小心在这 也可以跳转到资源包。然后我们找到使用工具合集保存安装就行了,超级简单,你们学会了没有?

一天一个实用软件,今天带来的是全网爆火的 ai 软件,智普开源 auto golem, 支持安卓苹果,操作简单而且免费,小白也能轻松下载。第一步,点击本视频右下角分享箭头,点击分享链接显示复制成功。第二步,打开这个软件,没有的去应用商店下载一个。第三步, 下载后打开软件会自动弹出一个文件夹,没有的话在搜索框输入白羊宝库,接下来点击立即查看,点击宝藏应用,找到这个文件,点开保存下载安装就可以了。

来了来了,全网都在找的豆包手机同款 ai 工具,智谱开源 auto g l m 给你们找到了,操作简单,而且免费,小白也会使用,同时支持安卓、苹果、鸿蒙。下面火速分享给大家。首先点本条作品右下角的箭头, 找到分享链接,复制一下,打开这个蓝色的小鸟,没有的,下一个,打开等待两秒会弹出资源包,没有弹出搜远远分享进去,找到保存下载就可以用了。

兄弟们,最近智普突然把他们的手机 agent, 也就是 auto gm 开源了,在豆包手机助手被全面封禁之际,这个手机 agent 的 鼻祖选择用开源的方式为这个技术世界再添一把新的柴火。该项目开源两天就迅速获得了七点七 k stars, 这个开源的智能体参数只有九币,却能够帮你操作手机上的五十多款 app。 用户只需用自然语言描述需求,封 agent 即可自动解析意图,利用视觉模型理解当前界面,规划下一步动作并完成整个流程。你只需要说句话,手机就可以自己执行启动应用、 输入文本、滑动屏幕、长按双击等操作,哪怕是遇到敏感操作时, ai 也可以自动转人工接管。也就是说,你现在可以使用 ai agent 来自动回消息、购物、点外卖、抢机票、定酒店、刷视频等等。我们来用这个开源的手机 agent 定高铁票看看效果。 agent 的 准确率非常高,顺利完成任务,并且将隐私的乘车人信息填写和支付交由人工处理。 最绝的是模型完全开源,支持本地服务器部署,极大地解决了人们对于保护个人信息隐私的忧虑。 如今,开源的 auto g m 就 像一根极具爆发力的导火索,瞬间点燃了许多人的热情。去拥有一个只在你本地设备上运行的,只为你服务的真正的 agent agent, 不 再是大厂能随随便便封禁的豆包,而是整个时代全民共创的狂欢。感兴趣的朋友们快去部署到自己手机上试试吧!

每天教会大家白嫖一个实用软件,今天教会大家获取的是全网爆火的智普开源 auto glam, 一 款超级好用的 ai 软件, 简直就是今年王炸,内有生活助手、工作助手两个板块,而且完全开源,人人都可以拥有豆包手机。接下来我手把手教会大家如何下载,同时支持手机、平板、电脑三端,操作简单便捷,小白也可以轻松学会。第一步,点我视频分享复制链接, 找到这个软件,打开没有的,下载一个,允许黏贴,它会弹出个资源包,如果没有弹出的话,我们在这里搜索金子工具,找到软件合集,看到这个保存安装就可以使用了。

大的来了,兄弟们,豆包手机同款 ai 工具,质谱开源奥特科冷工具,它终于来了,操作简单,一键部署,同时支持安卓、苹果、鸿蒙,还有没拿到的宝子们抓紧了, 因为不知道什么时候会被和谐。首先点右下角分享键分享复制链接,复制成功后我们打开这个蓝色小鸟,没有的话就去安装一个,打开后会弹出一个资源包,如果没有弹出,就在这里搜索鱼饼大全,然后打开这个文件,找到我们的工具,保存安装就可以了。