AI资讯每日报2025年6月28号 阿里云今日发布Qwen VLo多模态大模型,实现图像理解与生成的跨越式升级,用户可通过Qwen Chat平台直接体验视觉内容再创作功能。 浙江大学团队推出国内首个海洋开源大模型OceanGPT(沧渊),具备专业海洋知识问答和多模态数据解读能力,采用慢思考机制降低错误率。 Hengbot公司发布AI机器狗Sirius,集成OpenAI语言模型和14个运动轴,支持跳舞、踢球和语音对话等室内交互场景。 AI音乐公司Suno宣布收购WavTool强化音乐编辑功能,但面临多起版权诉讼,具体财务条款未披露。 腾讯开源混元-A13B模型,800亿参数采用MoE架构,数学推理和工具调用表现突出,单张中低端GPU即可部署。 可灵AI上线视频音效生成功能,基于Kling-Foley模型实现音画帧级同步,支持上传视频或直接生成带音效内容。 深度求索公司透露DeepSeek-R2大模型因长文本推理稳定性问题延迟发布,承诺将带来颠覆性多模态能力。 科大讯飞突破语音合成技术,实现1分钟克隆人声及方言实时转换,已应用于客服和有声书领域。 谷歌推出AI虚拟试衣系统,上传照片即可生成动态试穿效果,支持服装搭配推荐并覆盖ZARA等品牌合作。 腾讯开源13B混合推理模型,工具调用准确率提升40%,GitHub首日Star量破千。 谷歌基因组模型登上《Nature》封面,1秒解析DNA变异并预测数千种疾病风险,获医学界广泛关注。 蚂蚁集团开源模型在SWE-Bench编程测试夺冠,首次实现直接解析代码结构图完成错误修复。 清华团队研发的具身智能厨房机器人获数千万投资,成为全国首个持食品经营许可证的AI厨师。 阿里云检索Agent在GAIA基准测试超越GPT-4o,支持多轮自主网络搜索并全面开源。 关注Jianlong Talk,每日更新AI全球资讯。 #人工智能 #AI新手村 #ai #ai资讯 #ai热点
00:00 / 02:24
连播
清屏
智能
倍速
点赞7
00:00 / 00:48
连播
清屏
智能
倍速
点赞42
Qwen开启成人礼还是阿里味道之殇? —技术负责人林俊旸离 阿里千问技术负责人突然离职,这事儿奇怪吗?说实话,我看到这张93年的面孔第一眼,就有种直觉——他太像腾讯的人了。不是贬义,是那种气质和范儿,跟阿里传统的“阿里味儿”确实不太一样。所以新闻出来的时候,我没那么意外。 但真正让我警觉的是另一个信号:今年春晚,字节的豆包几乎霸屏了。在这个节骨眼上,阿里核心大模型的技术负责人离开,这绝不是一个孤立的人事变动,而是巨头在释放调整信号——0到1的阶段过去了,该换打法了。 阿里腾旭字节三家的大模型负责人,到底有什么不一样? 这个问题特别有意思,我把三个人的背景摊开给你看,你会发现三家巨头的战略全写在履历里了: 腾讯的姚顺宇,97年,从OpenAI回国。 腾讯押的是未来,是那个从世界顶级AI圣殿回来的少年天才。 字节豆包底层的负责人吴永辉,77年,快50岁了。 他的履历很重——谷歌、DeepMind、Gemini核心参与。字节要的是厚重,是大规模作战的经验,是能扛住亿级用户的技术骨架。 而刚离开阿里的林俊阳,93年,北大硕士毕业就进了达摩院,阿里土生土长。 他是阿里自己养大的孩子,带着千问从0走到1。现在他要走了,某种意义上也意味着,阿里那个“内部培养、从0起步”的阶段,画上了一个句号。 为什么林俊阳的“语言学硕士”身份,可能是理解他的关键?这是我查他资料时最触动的一点:林俊阳的本科是北大计算机,硕士却是——语言学。 这是个非常罕见的跨学科组合。在AI圈,搞计算机的人太多了,但懂语言本质的人太少。ChatGPT最核心的能力是什么?是对人类语言的理解和生成。一个既懂代码逻辑、又懂语言结构的人,简直是做大模型的“天选之人”。 所以你看,他能在2022年作为负责人做出阿里千问,不是偶然。现在他离开了,无论下一站去哪,这种“计算机+语言学”的底色,都会是他最值钱的底牌。期待他下一程,走得更远。#林俊旸
00:00 / 01:38
连播
清屏
智能
倍速
点赞53
00:00 / 02:09
连播
清屏
智能
倍速
点赞1
00:00 / 03:53
连播
清屏
智能
倍速
点赞44
00:00 / 03:53
连播
清屏
智能
倍速
点赞292
00:00 / 01:47
连播
清屏
智能
倍速
点赞10