粉丝4.5万获赞41.1万

soy marinated crabs i think you'd like seoul。 说到美食,那中国可有太多了。 actually china has a lot too you could go to beijing for peking duck or go to chongqing for hotpot that would be nice or go to shanghai for our braised pork and pan fried buns, i think you'll really like it。 带上任意耳机,就能把全世界变成你的母语。 谷歌 gemini ai 同传要干掉专业翻译官了,过去同声传译得靠专业人士,现在 google translate app 用 gemini 二点五模型直接变身实时翻译,神奇。简单说,你连上耳机,点开 live translate, 它就能连续监听周边声音,把多语言自动翻成你的目标语。 比如在国外街头听不懂当地人聊天。 gemini 自动检测语言,滤掉噪音,保留说话者的语调节奏和音高,让翻译听起来超自然,不会像机器人那么生硬。 gemini 到底牛在哪儿?它结合了模型的世界知识和多语言能力, 支持七十多种语言,两千对组合,不光翻词,还抓弦外之音。普通翻译软件遇到 stealing my thunder, 可能会翻译成偷了我的雷,但 jammer 能秒懂,这是抢我分头。多语言输入也强。一场混杂英语硬地语的对话,他无缝切换,不用手动调,设置双向模式更实用。你说英语,他实时播硬地语给对方, 对方回话,你耳机里瞬间变英语,聊天零卡顿。实际用起来,跨过会议、旅游、聊天、看外语电影全覆盖。目前 mate 版在安卓上每末印可用, 任何品牌耳机都行, ios 和更多地区明年跟上。以前我们苦学外语是为了翻山越岭去看世界,现在 ai 正在抹平语言的鸿沟,让世界主动来拥抱你。科技的终极浪漫就是让沟通再无边界,你觉得呢?评论区聊聊。
家人们,谷歌这次更新真的太牛了!就在本周五,谷歌官方正式宣布将其最强的 german 翻译模型集成到翻译 app 中了。这次更新最实用的功能就是现在只要戴上耳机,就能实现 ai 实时翻译。 无论是聆听外语演讲、参加外语课程,还是观看没有字幕的深入电影,只需开启持续监听模式,它就能自动将外语翻译成你的母语, 简直太省耳朵了。和外国友人面对面交流也变得更轻松了。在双向对话模式下,你说中文,对方能听到翻译后的内容,对方说外语,你在耳机里能 直接听到中文翻译,再也不用手忙脚乱的查词典了。不过呢,这次 ai 的 升级也可能会带来一些冲击,从事翻译相关行业的朋友们可得留意了, 像日常的会议、同传、跨境沟通以及简单的文档翻译这类工作未来很可能会被 ai 取代。基础翻译需求预计会减少,行业竞争或许也会愈发激烈。当然了,在一些高端场景中,比如国际商务谈判、文学翻译等,这些工作需要对文化有深入理解, 还有精准把握情感。目前 ai 还无法胜任,人的专业能力依旧直观重要。另外,这次更新在投资领域也有影响。 从利好的方面来看, a 股市场中的 ai 板块、科技股以及跨境通信相关企业很可能会从中受益。谷歌开了这个头,国内产业链大概率也会紧跟步伐。但另一方面,翻译服务类行业可能会受到一定的冲击,如果有投资计划,建议尽量避开这个方向。



最近谷歌搞了个大动作,这一下可能要彻底改变咱们沟通方式了。这事啊,得从谷歌一个特别狠的操作说起,简直就是背刺自家人,你看他们直接拆了自家 pixel 报刺的墙,把顶级的翻译功能给所有人用了。这背后的想法可能是想让 ai 更聪明,而咱们呢,都成了他的免费陪练。 这个更新的意义可不一般,感觉就像传说中的巴别塔,真的在我们眼前倒了。以前那些举着手机摆弄翻译机的笨办法都忘了吧?那操,很快就要翻篇,那这次更新到底牛在哪呢?关键是体验有两个大突破,第一个就是硬件解放了技术,不再只绑定一款设备。 这个比喻绝了,等于说现在随便一个有麦克风的设备都能有这个超能力。但第二点更厉害,现在的翻译居然有了情商, 对,最大的升级就是这个语气保留,这可真是个规则改变者,你想想,以前的翻译多呆板呢,纯粹就是个没有感情的复读机,你看这区别就大了。现在 ai 能听出你生气了,还能把火气给翻出来。所以说关键就在这,他翻译的是那个人情味,不光是字, 这体验简直是天壤之别,沟通一下子就火了,有蟹有肉了。那么问题来了,这么颠覆的技术出来,谁会最先感到害怕?很明显,一个是翻译机,另一个就是那种旅游速成外语吧,就让我们思考一个大问题了,那我们还有必要学外语吗? 哎,还真不是, ai 没有干掉语言学习,只是改变了游戏规则。过去语言是工具,现在 ai 把工具这活干了,反而凸显了它的文化价值。 因为现在人人都能开口说话了,最基本的沟通障碍没了,所以真正的竞争变成了你脑子里有没有货,有没有独特的见解。语言的八别塔倒了,但咱们思维里的那堵墙还得靠自己推倒。所以最后想问问你,一副耳机就能搞定几十种语言,你还会让孩子苦学十年外语吗?

谷歌刚刚放出大招,所有耳机秒变童声传译神器,实时翻译七十多种语言,出国旅游、开会再也不怕语言障碍, jamming 模型甚至能保留说话人的语调和节奏。此外,更厉害的是,翻译现在能懂弦外之音,成语里语直接意义。还推出 ai 浏览器, disco 输入计划旅行自动生成行程表,这才是真正的 ai 革命!

谷歌又放大招了,这次竟然将 ai 语音同声传译功能带到了我们的日常生活中,是不是感觉出国旅游、商务洽谈再也不用担心语言障碍了呢?近日,谷歌正式宣布将 gemini 模型集成至其翻译应用中, 推出了一项突破性的 ai 语音同声传译功能。这项功能究竟有多强大呢?简单来说,用户只需佩戴一副普通耳机,就能实时聆听外语内容,并立即获取母语翻译, 无论是听新闻、看视频还是与外国友人交流,都能轻松应对。更令人惊叹的是,这项功能支持超过七十种语言和两千个语言对,几乎包含了全球大部分国家和地区。 这意味着无论你身处何地,都能享受到无障碍的沟通体验。而且,谷歌的 ai 语音同传功能还具备高度的准确性和流畅性,让你在交流中更加自信从容。谷 歌的 ai 语音同声传译功能无疑为我们打开了一扇通往世界的新窗口,让语言不再成为沟通的障碍。如果你也对这项功能感兴趣,或者有任何看法和建议,欢迎在评论区留言分享哦!

十二月十四日消息,据外媒 type crunch 报道,谷歌推出耳机实时翻译测试版,功能保留说话者语气语调,适配任意耳机,支持七十余种语言, 目前已在美、墨、印安卓端上线,二零二六年将拓展至 ios 及更多地区。这 may 高级功能同步融入谷歌翻译,优化俚语等翻译精度。

欢迎收听歪哥 ai 研究院的每日 ai 日报。今天是二零二五年十二月十五日周一,我是小白,这里是专为 ai 开发者、从业者和创业者打造的每日 ai 日报,帮大家快速了解今日 ai 行业重要动态,解决信息泛滥问题。 大家好,我是歪哥,今天我们帮你浏览了十二个 suburbs, 五百四十四条 twitter 和二十四个 discord 的 频道,总共一万零四百四十八条消息,相当于为你节省了七百五十四分钟的阅读时间呢。 哇,十二个多小时的阅读量。今天我们有七个重要主题要聊,包含大模型竞争、产品发布、技术突破、社群监控、行业合作、隐私争议和应用创新。 没错,今天的 ai 圈可真是热闹, gpt 五点二上线二十四小时就遭差评,谷歌趁机反超,还有迪士尼十亿美元入股 openai 的 大新闻。咱们先从今天最火的大模型竞争说起吧。歪哥刚才说 gpt 五点二被吐槽,那谷歌那边有什么动作吗? 谷歌这次真的是踩点发布。就在 gpt 五点二发布前一小时,谷歌推出了全新的 gemini deep research agent, 基于 gemini 三 pro 构建,还用了多部强化学习来减少幻觉。这个时间点也太巧了吧,效果怎么样? 数据很亮眼,在 humanity's last exam 测试中达到百分之四十六点四, deep search qa 上百分之六十六点一, browscom 测试百分之五十九点二高分。而且还同步推出了开源网络研究 agent 的 基准 deep search qa 和全新交互 api。 这个 api 有 什么特别的支持服务器端状态管理、远程 mcp 工具调用和后台执行长时间推理循环,这对开发者来说很实用。看来谷歌这次是有备而来,要和 open ai 正面刚了。对了外哥,我看到今天还有个挺有意思的技术突破,关于数学证明的。 哦,你说的是 autos 井号一零二六问题,这可是困扰数学界五十年的难题,结果 ai 辅助下,四十八小时就被攻克了。四十八小时,这也太快了吧。 是的, harmonics 的 ai 系统 aristotle 在 令证明语言中自动证出了 c k 平方等于一 k elfevolve 系统还帮忙探索数值,结果陶哲轩都说这带来了全新理解,绝非简单搜索传统方式要多久? 可能需要数周甚至数月。 ai 不 仅找到了二零二四年必可等人论文的完整解,还证明了 ai 能生成新的数学动件,而不只是解锁现有文献,这标志着 ai 在 数学研究上的重大突破。对了歪哥,刚才聊的都是技术突破,那商业合作方面有什么大动作吗? 啊,你问对了,迪士尼直接向 open ai 砸了十亿美元,还拿到了认股权证,成为 sorry 平台首个大型内容授权合作伙伴。 十亿美元?这是要把米老鼠都 ai 化吗?没错,三年期许可协议,第一年还是排他性的。 sora 和叉 gpt emoji 将获得迪士尼旗下超两百个角色授权,包括米老鼠、漫威、皮克斯和星球大战角色,但不包含真人肖像或声音。 这意味着什么?迪士尼将利用 openai 的 api 构建新产品工具,覆盖迪士尼加流媒体平台,为员工部署。叉 gpt 用于内部工作流程,粉丝精选创作视频还将在迪士尼加播放,这是内容巨头与 ai 技术的深度融合。对了歪哥,我看到谷歌也没闲着,推出了什么 deep research agent, 哈哈,时机卡的真准。就在 gpt 五点二发布前一小时,谷歌推出了全新版 gemini deep research agent, 基于 gemini 三 pro 构建。这是要正面硬钢的节奏啊,效果怎么样? 数据很亮眼,在 humanity's last exam 测试中达到百分之四十六点四领先水平。 deep search qa 上取得百分之六十六点一, browscom 测试获得百分之五十九点二高分。关键是通过多步强化学习训练,提高准确性,减少幻觉。听起来很专业,有什么实际应用吗? 谷歌同步推出了开源网络研究 agent 机准 deep search qa 和全新交互 api, 支持服务器端状态管理、远程 mcp 工具调用和后台执行长时间推理循环。这是要让开发者都用上他们的技术战。对了歪哥,刚才说到迪士尼和 oppai 合作,我听说还有个数学界的大新闻 啊。小白,你消息挺灵通啊。确实,四十八小时内, ai 帮助人类攻克了困扰数学界五十年的 erdos 警号幺零二六问题。陶哲轩都说这是全新理解 五十年的问题,四十八小时就解决了,这也太夸张了吧。关键是 ai 不是 简单搜索。 harmonica 的 arizona 系统在令证明语言中自动正出 c k 平方 e k alpha delta f 来帮助提炼出干净公式。传统模式可能需要数周甚至数月呢。 那语数科技的机器人 app store 呢?听起来很有意思。这个确实很酷,行业首个人型机器人应用商店,用户可以像下载手机 app 一 样,一键部署舞蹈、武术动作,首批就有李小龙截拳道和扭扭舞,完全模块化、标准化。 说到隐私,还有个更有意思的是,豆包手机助手最近被质疑侵犯用户隐私,这是怎么回事?啊?哈,这个是挺有意思的。有网友质疑豆包能通过特殊权限获取银行安全、键盘等受保护内容,豆包官方赶紧出来辟谣了, 屁,要说了什么?豆包说他们用的是系统原声截屏接口,严格遵循应用的 secure 标记,技术上根本无法截取银行、 app 等受保护界面。那个 read frame buffer 权限只是用来获取虚拟屏空间的截图,供云端大模型分析。 好的,今天的 ai 日报就到这里。从 gpt 五点二的争议到谷歌的反击,从 round 位的世界模拟到迪士尼的十亿投资,我们看到 ai 行业正在经历激烈的竞争和快速的技术迭代。 没错,对于 ai 开发者和创业者来说,这些动态告诉我们,技术突破不等于用户认可,商业化落地才是关键。 如果觉得今天的分享对你有帮助,别忘了点赞、关注、转发一键三连哦!你的支持就是歪哥继续更新的最大动力,也欢迎私信歪哥聊聊你最想聚合哪类 ai 信息,我们来给你定制日报内容,明天见!