00:00 / 05:01
连播
清屏
智能
倍速
点赞436
00:00 / 04:37
连播
清屏
智能
倍速
点赞1228
一川AI3天前
今日AI新闻2025.12.11 1. 阿里通义千问发布 Qwen3-TTS 语音合成模型 ——49 种音色自由切换,支持 10 种语言及方言,可零成本商用。该模型在播客、有声书等场景中能精准还原不同角色声线,词错误率保持行业领先。 2. 阿里同步推出 Qwen3-Omni-Flash 全模态模型 —— 支持 119 种语言实时流式交互,开放系统提示词自定义权限,特别适配直播弹幕即时翻译等场景。基准测试显示其响应速度较上代提升 300%。 3. Google 推出 Gemini TTS 2.5 语音系统 —— 实现情绪级语音调控,从欢快到阴郁 24 种语态自由切换,支持 24 种语言跨角色对话。新系统可根据上下文自动调整语速,预计 2026 年第一季度正式商用。 4. Adobe 与 ChatGPT 达成深度合作 —— 用户现可通过对话直接编辑 Photoshop 图片和 PDF 文档。输入 "把背景调亮并添加水印" 等自然指令,即可自动完成专业级设计,无需手动切换软件。 5. 商汤科技发布 Seko 2.0 动画神器 —— 输入一句话自动生成 100 集连贯动画剧集,采用多剧集记忆架构确保角色不崩坏。官方宣称单集制作成本已降至 15 元以下,较传统方式节省 99% 费用。 6. 腾讯元宝 AI 上线 QQ 群智能总结 —— 自动提炼未读消息核心内容,支持热聊话题归类、重要信息标红。该功能已覆盖 PC 端、移动端及浏览器插件,有效解决 "爬楼" 焦虑。#今日AI新闻#tts#qwen #gemini#腾讯元宝
00:00 / 01:46
连播
清屏
智能
倍速
点赞19
AI资讯每日报2025年6月28号 阿里云今日发布Qwen VLo多模态大模型,实现图像理解与生成的跨越式升级,用户可通过Qwen Chat平台直接体验视觉内容再创作功能。 浙江大学团队推出国内首个海洋开源大模型OceanGPT(沧渊),具备专业海洋知识问答和多模态数据解读能力,采用慢思考机制降低错误率。 Hengbot公司发布AI机器狗Sirius,集成OpenAI语言模型和14个运动轴,支持跳舞、踢球和语音对话等室内交互场景。 AI音乐公司Suno宣布收购WavTool强化音乐编辑功能,但面临多起版权诉讼,具体财务条款未披露。 腾讯开源混元-A13B模型,800亿参数采用MoE架构,数学推理和工具调用表现突出,单张中低端GPU即可部署。 可灵AI上线视频音效生成功能,基于Kling-Foley模型实现音画帧级同步,支持上传视频或直接生成带音效内容。 深度求索公司透露DeepSeek-R2大模型因长文本推理稳定性问题延迟发布,承诺将带来颠覆性多模态能力。 科大讯飞突破语音合成技术,实现1分钟克隆人声及方言实时转换,已应用于客服和有声书领域。 谷歌推出AI虚拟试衣系统,上传照片即可生成动态试穿效果,支持服装搭配推荐并覆盖ZARA等品牌合作。 腾讯开源13B混合推理模型,工具调用准确率提升40%,GitHub首日Star量破千。 谷歌基因组模型登上《Nature》封面,1秒解析DNA变异并预测数千种疾病风险,获医学界广泛关注。 蚂蚁集团开源模型在SWE-Bench编程测试夺冠,首次实现直接解析代码结构图完成错误修复。 清华团队研发的具身智能厨房机器人获数千万投资,成为全国首个持食品经营许可证的AI厨师。 阿里云检索Agent在GAIA基准测试超越GPT-4o,支持多轮自主网络搜索并全面开源。 关注Jianlong Talk,每日更新AI全球资讯。 #人工智能 #AI新手村 #ai #ai资讯 #ai热点
00:00 / 02:24
连播
清屏
智能
倍速
点赞7
00:00 / 01:12
连播
清屏
智能
倍速
点赞117
一川AI1月前
今日AI新闻2025.11.14 1. 李飞飞 World Labs 发布 Marble 3D 世界模型公测版 —— 输入文本 / 图片即可生成可交互虚拟宇宙,支持实时编辑与多格式导出。该工具采用 Chisel 实验性 3D 编辑器,实现结构与风格分离设计,可输出 Gaussian splats、三角网格等专业格式。 2. OpenAI 在韩国与新西兰试点 ChatGPT 群聊功能,首次支持多人协作与 GPT-5.1 模型互动。新功能优化了速率限制机制,允许通过表情符号回复等自然交互方式。 3. 百度推出多模态 AI 助手 "超能小度",数千万现有设备可免费升级。该助手整合语音、视觉及空间环境信息,能完成拍照记录停车位等实用操作,家庭场景中还可协助家长关注儿童活动轨迹。 4. LinkedIn 推出 AI 人脉搜索神器 ——13 亿用户可通过自然语言查询精准匹配领域专家。技术团队通过优化模型参数提升处理速度,并将基础设施升级为 GPU 架构以应对高并发需求。 5. 编程工具 Cursor 完成 23 亿美元融资,估值达 293 亿美元。资金将用于开发自研模型 Composer,减少对外部算力依赖,同时加速企业版市场拓展。 6. Character AI 与耶鲁大学联合发布 Ovi 技术,采用双骨干交叉模态架构实现音画完美同步。该开源项目通过高质量数据集训练,已解决传统视频生成的音画延迟问题。 7. Google NotebookLM 新增 Deep Research 功能 —— 支持自动完成在线调研,现可兼容 Google Sheets、PDF 等十余种文件格式,用户通过 URL 即可导入数据生成统计摘要。 8. 苹果公司同日更新 App Store 审核指南,明确要求第三方 AI 调用须公示数据接收方并获得用户授权。新规首次将 AI 模型纳入监管范围,违规应用将面临下架风险。#今日AI新闻#李飞飞#linkedin #cursor#characterai
00:00 / 02:11
连播
清屏
智能
倍速
点赞8