一川AI6天前
今日AI新闻2025.12.11 1. 阿里通义千问发布 Qwen3-TTS 语音合成模型 ——49 种音色自由切换,支持 10 种语言及方言,可零成本商用。该模型在播客、有声书等场景中能精准还原不同角色声线,词错误率保持行业领先。 2. 阿里同步推出 Qwen3-Omni-Flash 全模态模型 —— 支持 119 种语言实时流式交互,开放系统提示词自定义权限,特别适配直播弹幕即时翻译等场景。基准测试显示其响应速度较上代提升 300%。 3. Google 推出 Gemini TTS 2.5 语音系统 —— 实现情绪级语音调控,从欢快到阴郁 24 种语态自由切换,支持 24 种语言跨角色对话。新系统可根据上下文自动调整语速,预计 2026 年第一季度正式商用。 4. Adobe 与 ChatGPT 达成深度合作 —— 用户现可通过对话直接编辑 Photoshop 图片和 PDF 文档。输入 "把背景调亮并添加水印" 等自然指令,即可自动完成专业级设计,无需手动切换软件。 5. 商汤科技发布 Seko 2.0 动画神器 —— 输入一句话自动生成 100 集连贯动画剧集,采用多剧集记忆架构确保角色不崩坏。官方宣称单集制作成本已降至 15 元以下,较传统方式节省 99% 费用。 6. 腾讯元宝 AI 上线 QQ 群智能总结 —— 自动提炼未读消息核心内容,支持热聊话题归类、重要信息标红。该功能已覆盖 PC 端、移动端及浏览器插件,有效解决 "爬楼" 焦虑。#今日AI新闻#tts#qwen #gemini#腾讯元宝
00:00 / 01:46
连播
清屏
智能
倍速
点赞20
00:00 / 00:42
连播
清屏
智能
倍速
点赞1
00:00 / 02:01
连播
清屏
智能
倍速
点赞9016
00:00 / 00:45
连播
清屏
智能
倍速
点赞1
00:00 / 00:46
连播
清屏
智能
倍速
点赞1
00:00 / 00:36
连播
清屏
智能
倍速
点赞5
00:00 / 00:24
连播
清屏
智能
倍速
点赞0
00:00 / 01:00
连播
清屏
智能
倍速
点赞0
00:00 / 00:26
连播
清屏
智能
倍速
点赞2