智普于十二月十一日发布了 g i m t t s, 它彻底革新了语音合成技术。 g i m t t s。 仅基于十万小时的数据训练便实现了三秒音色复刻,拥有超强的文本情感理解力。 这得益于其独特的多奖励强化学习框架,该框架融合了字幕错误率、情感相似度等多种奖励,将语音的拟人化表现力推向开元缩塔水平。 此外,它还针对高精度场景设计了 phone mini 发音控制,通过音素和文本的混合输入,完美解决了多音字和生僻字发音不准的难题。同时,优化的 lo 二定制技术让精品音色的定制成本大幅降低,创作者现可通过 helen face 或智步清音 app 进行体验。
粉丝94获赞1189

就在昨天,全世界所有的安卓手机都可以用上真 ai 了,中国的智谱正式宣布啊,他们把全世界第一个为手机而生的通用 agent auto gm 给开源了,是的,完全免费开源了。也就是说,从今天开始,世界上任何一台安卓手机啊,都可以用 ai 来完全操控了。 ai 会自己看屏幕,理解界面,然后自己规划思考, 最后模拟出你手部的点击,滑动输入,帮你完成各种各样的操作,而你全程都不需要碰屏幕,完全交给 ai 就 可以了。现在我跟 ai 说帮我点三杯冰美式, 看,他就可以自己思考自己操作了,一步一步点击,完全不用我管,我们再试一个,如果让他对比一下这个显示器在哪个平台更便宜,帮我决定一个,自己下单。然后你看啊,他是真的开始了多步骤操作,现在淘宝搜了一下,然后把价格记下来,然后再去京东搜了一下,把价格记下来,结果还去拼多多看了一圈,然后真的帮我选了一款真的很便宜很便宜的款,这个羊毛真的给它薅到了, 操作的过程就跟真人人手一模一样。最后我们再试一个超级无敌难的版本,我下周六要去长春玩,帮我总结一下这个页面上推荐景点,然后在高德地图上收藏一下这个景点,看一下门票的价格,然后再去一二三六订一张上午实验从北京去长春的高铁票,然后再把香味信息整理好给我,他就开始自己干活,自己搜索,一个一个搞, 打开一二三零六开始帮我看动车票了,而我自己只需要最后付款那一步看一下,确认一下就可以了,你看这个过程是不是真的超级夸张,这个已经不是简单的那种自动化脚本了,而是真的完全用 ai 来去驱动,也就是一个住在你手机里的数字生命。我觉得这个才是我心里面的 siri 该有的样子。 这次可以做到这么猛的效果,也是因为 autim 他 们用上一套视觉语言模型,他可像人一样自己去看懂屏幕上内容,知道哪里是按钮,哪里是输入框,然后再模拟人的点击、滑动、输入这些操作。所以理论上它是可以操控任何一个 app 的, 根本就不需要其他厂家的配合,而是直接变成了一个人类的用户。 我看一下开源社区他们的界面啊,现在已经支持了五十多款主流的 app, 大家关心的微信、淘宝、抖音、 b 站、携程这些全部都可以用。而自古这次把它开源了,我觉得这个意义真的非常重大,因为它解决了一个大家都很关心的问题,隐私问题。如 如果要操作我的手机,那我的聊天记录、支付密码怎么办?而现在因为代码是开源的,所以你可以完全把它部署在你自己的手机跟电脑上,我们就是一台五零九零显卡去跑的, 所有的数据都在你的本地,根本就不会上传到云端。而且有了开发的社区,大家一起去完善这个项目,速度只会越来越快,可以做的事情也越来越多。而从今年开始,像 google、 苹果,还有其他那些巨头大厂,大家都在试着让 ai 真正学会操作手机这件事情, 没想到智普直接在年底就开园了,现在每个人都可以下载来直接用了,所以我觉得二零二六年的手机市场跟 ai 市场啊,应该又会迎来一波腥风血雨了。

豆包手机作为一个真正意义上的 ai 手机,上线就被封杀。豆包手机能够封杀?我把质朴清颜开元的 auto g l m 部署到我的手机, 你说你也能查到并且封我的号,那现在我把 open auto g l m 接入到我的机械臂,跟手机没有任何关联,豆包手机能被远程吊销 i m e i 锁死系统,甚至从基带层面拉黑, 是因为他还是他们的终端?当代码离开云端汉进铜线对抗就从数字世界降维成物理世界平台的所有杀账号魔法在这一刻都黯然失色。那你该如何应对?

