《阿里千问3.5震撼发布!性能超GPT-5,价格仅1/18》 #阿里云 #通义千问 #大模型 #AI黑科技 #多模态大模型 一、千问3.5模型概述 1. 发布背景:阿里云通义千问团队最新发布的千问3.5系列,是继千问3之后的新一代多模态大模型。 2. 核心技术:将线性注意力机制与稀疏混合专家(MoE)结合,总参数达3970亿,但激活参数仅150亿,大幅降低部署成本,推理吞吐量提升19倍。 3. 多模态能力:支持视觉、语言,通过早期文本视觉融合、多模态旋转位置编码等技术,统一处理文本、图像、视频,语言支持从119种扩展到201种。 4. 性能与性价比:权威评测分数领先,API定价仅0.8元/百万token,为Gemini 3 Pro的1/18,性价比极高。 二、技术架构创新 1. 线性注意力机制:将传统注意力计算复杂度从O(n²)降至线性,引入门控网络,自适应决定信息处理路径,平衡效率与精度。 2. 混合注意力机制:以3:1比例混合门控网络(70%)和softmax注意力(20%),提升长距离效率,增强上下文学习能力。 3. MoE设计:128个专家池,每个token动态选择8个专家,复杂问题激活更多(如12+),简单问题激活更少(4-6),按需分配降低显存开销。 4. 混合推理:在千问3基础上优化,动态切换思考与非思考模式,通过思考预算参数(如token限制)控制推理深度,适应不同复杂度任务。 三、训练与性能表现 1. 数据处理:训练数据来自百度百科、代码仓库、学术论文等多渠道,结合千问2.5生成百万级合成数据,进行多阶段清洗(规则过滤、去重、质量评分)。 2. 多模态能力:支持高清图像理解与生成、语音输入翻译与情感识别、视频剧情理解、代码生成与解释。 3. 基准测试: MMU Pro(多学科选择题):87.8分,超越GPT-5.2的85.6分。 HumanEval(代码生成):超越GPT-4和Claude 4.5。 数学能力:同样领先。 4. 应用场景:智能客服、代码辅助、医疗辅助、金融风控与报告生成等。 四、部署与展望 1. 部署方式:支持Hugging Face下载、本地运行或VM部署,全参数模型需8个A100(约800GB显存),成本较高,但提供蒸馏模型降低门槛。 2. 未来方向:持续优化架构,提升性能与性价比,推动大模型在中小企业的应用。
00:00 / 01:27
连播
清屏
智能
倍速
点赞27
00:00 / 01:07
连播
清屏
智能
倍速
点赞380
00:00 / 21:54
连播
清屏
智能
倍速
点赞92
AI资讯每日报2025年6月28号 阿里云今日发布Qwen VLo多模态大模型,实现图像理解与生成的跨越式升级,用户可通过Qwen Chat平台直接体验视觉内容再创作功能。 浙江大学团队推出国内首个海洋开源大模型OceanGPT(沧渊),具备专业海洋知识问答和多模态数据解读能力,采用慢思考机制降低错误率。 Hengbot公司发布AI机器狗Sirius,集成OpenAI语言模型和14个运动轴,支持跳舞、踢球和语音对话等室内交互场景。 AI音乐公司Suno宣布收购WavTool强化音乐编辑功能,但面临多起版权诉讼,具体财务条款未披露。 腾讯开源混元-A13B模型,800亿参数采用MoE架构,数学推理和工具调用表现突出,单张中低端GPU即可部署。 可灵AI上线视频音效生成功能,基于Kling-Foley模型实现音画帧级同步,支持上传视频或直接生成带音效内容。 深度求索公司透露DeepSeek-R2大模型因长文本推理稳定性问题延迟发布,承诺将带来颠覆性多模态能力。 科大讯飞突破语音合成技术,实现1分钟克隆人声及方言实时转换,已应用于客服和有声书领域。 谷歌推出AI虚拟试衣系统,上传照片即可生成动态试穿效果,支持服装搭配推荐并覆盖ZARA等品牌合作。 腾讯开源13B混合推理模型,工具调用准确率提升40%,GitHub首日Star量破千。 谷歌基因组模型登上《Nature》封面,1秒解析DNA变异并预测数千种疾病风险,获医学界广泛关注。 蚂蚁集团开源模型在SWE-Bench编程测试夺冠,首次实现直接解析代码结构图完成错误修复。 清华团队研发的具身智能厨房机器人获数千万投资,成为全国首个持食品经营许可证的AI厨师。 阿里云检索Agent在GAIA基准测试超越GPT-4o,支持多轮自主网络搜索并全面开源。 关注Jianlong Talk,每日更新AI全球资讯。 #人工智能 #AI新手村 #ai #ai资讯 #ai热点
00:00 / 02:24
连播
清屏
智能
倍速
点赞7
阿里云创始人王坚对AI的最新观点 中国工程院院士,阿里云创始人王坚最近一句话戳破我们的AI真相:咱们的模型能力甚至比美国 GPT-4o 还强,但真正卡脖子的,居然是我们自己! 核心观点 有4个,第一,AI 的本质是思维革命。 你以为 AI 只是更聪明的工具?错了!王坚说,这东西正在彻底改写我们的思考方式。 就像从自行车到火箭的跨越 —— 以前的 AI 解决的是 “玩具问题”,比如算个数学题、识别个图片;现在的 AI,要啃的是现实里的硬骨头,比如工厂优化、城市治理。 算力翻一百万倍的时候,你就不会再纠结 “怎么从香港骑车到上海”,而是直接想 “火箭该怎么对接空间站”。这才是 AI 最可怕的地方:它不是帮你做事,是让你连做事的逻辑都换了一套。 第二,别纠结 AGI还是ASI。 总有人争吵 “通用人工智能什么时候来”,王坚说:这就像纠结 “小学生和博士生哪个阶段算‘真正的人’”。 AI 就是个不断长大的孩子,幼儿园会数数,博士会解方程,但本质都是在变强。现在的关键不是划界限,而是盯着它每天多会了点啥 —— 就像你不会问 “孩子到几岁才算有出息”,只会看他每天有没有进步。 第三,中国市场不是 “卖场”,是 “炼金炉”。 很多人觉得中国市场就是卖货的?大错特错! 王坚用阿里云的亲身经历说:这里是技术的 “炼狱场”—— 成百上千的 AI 产品会死掉,但活下来的一定是真金。比如你搞个 AI 客服,放市场里一测,用户骂两句就知道哪里不行;改完再上,几次下来就比实验室里闭门造车强 10 倍。这就是中国的优势:能让技术在实战里快速成熟。 第四个,创新是马拉松,不是百米冲刺。 最近有人闲得慌,说:“某某公司怎么好久没出新模型了” 王坚说:你见过谁能 30 天不睡觉跑马拉松?短期快慢根本不重要。就像 DeepSeek、阿里千问、Kimi 这些玩家,你快的时候我歇歇,我冲的时候你喘喘,互相推着跑,这才健康。真正的高手,从来不是一直领先,而是别人超了之后,还能追上去。 总结一下:最大的坑,其实是 “创造力匮乏”那么问题来了:你觉得 AI 最该解决的 “中国特色难题” 是什么?是帮农民看天气,还是帮家长辅导作业?评论区聊聊,说不定你的脑洞就是下一个风口!#ai #ai最新资讯
00:00 / 02:26
连播
清屏
智能
倍速
点赞2008
00:00 / 00:48
连播
清屏
智能
倍速
点赞34
00:00 / 01:30
连播
清屏
智能
倍速
点赞1390
00:00 / 01:37
连播
清屏
智能
倍速
点赞5291
00:00 / 01:06
连播
清屏
智能
倍速
点赞15
00:00 / 04:25
连播
清屏
智能
倍速
点赞959
财报炸裂,股价崩盘,英伟达一夜蒸发1.77万亿 家人们,全球AI“总龙头”英伟达上演了魔幻一幕:它刚刚交出了史上最强财报,股价却应声崩盘。 财报有多强?第四季度营收681亿美元,暴涨73%;净利润近430亿美元,几乎翻倍。然而,市场用脚投票,股价当天暴跌5.46%,市值一夜蒸发超2700亿美元(约1.77万亿人民币),创下近11个月最大单日跌幅。 这巨大的“预期违背”背后,是资本市场在交易“预期差”。对于英伟达这样的“尖子生”,市场期待已高到离谱,“超预期”成了常态,这次财报只是“达标”而非“惊艳”,导致大量获利盘“卖事实”离场。 更深层的担忧在于三点:第一,客户太集中且“手头紧”。超一半收入来自微软、亚马逊等少数云巨头,它们正为AI基建疯狂“烧钱”,其自由现金流已出现下滑或停滞,未来持续购买力存疑。第二,AI“回报”不明,泡沫担忧升温。巨额投入尚未看到明确商业化回报,市场开始质疑热潮的可持续性。第三,自身增长显露疲态,毛利率出现下滑。 这堂生动的市场课告诉我们:要分清“叙事投资”与“价值投资”;警惕“人尽皆知的好消息”,股价可能已提前透支;长期看,AI产业趋势未变,但参与时需拒绝追高、关注上游“卖水人”(如光模块、先进封装)、用定投平滑风险。#英伟达市值一夜蒸发超17万亿元 #英伟达股价暴跌 #AI投资 #财报
00:00 / 03:16
连播
清屏
智能
倍速
点赞61
00:00 / 01:19
连播
清屏
智能
倍速
点赞1
00:00 / 01:28
连播
清屏
智能
倍速
点赞1
00:00 / 04:07
连播
清屏
智能
倍速
点赞1499
00:00 / 01:45
连播
清屏
智能
倍速
点赞5