决定中国 ai 手机与电脑成败的,是这八种看不见的核心硬件。大科技的终极主线就是端侧 ai 爆发。端侧硬件的底层重构是接下来国产替代最核心的赛道,背后蕴藏着千亿级的市场爆发空间。 下面这些公司正迎来端侧 ai 换机潮带来的长期发展机遇。以下内容仅为行业分析,不构成投资建议。 第一种,端测 s o c n p u 核心芯片,脱离云端的本地大脑,无论是电脑本地部署还是手机端跑大模型,都极度依赖这颗算力中书。高端端测芯片是摆脱算力焦虑实现离线运行的绝对命脉。核心企业,锐鑫微、全智科技、精诚股份。第二种, 超薄 vc 军热板与相变材料,压住蒜粒怪兽的冷冻液,本地蒜粒全开必然带来恐怖发热。在下一代轻薄手机和 aipc 机身里,极限散热材料是防止降频烧毁的最后防线。核心企业,中石科技、飞荣达斯全新材。 第三种,高速低功耗内存,本地大模型的极速缓存,几十亿参数的模型,没有海量高宽带内存,根本跑不动。端侧 ai 的 爆发,直接倒逼智能终端内存规格全面跨代升级。 核心企业,江波龙、百维存储、德明利。第四种,高阶 h d i 与内在版高速信号的微缩立交桥, 主板空间被大电池和新模组疯狂挤压,核心线宽必须极限微缩技术迭代刚性极强,是高端消费电子硬件升级的核心在体。核心企业,蓬顶控股、盛虹科技、东山精密。第五种,高频微型温补金震 ai 系统的精密节拍器,算力越高,对时钟信号的稳定性和抗干扰要求越变态,能够匹配高阶算力的小尺寸高频经震,市场缺口极大。核心企业,钛金科技、汇伦晶体第六种,高阶射频前端模组终端通信的信号灯塔。 ai 手机时刻需要高速低延迟的无缝网络连接,这种高级程度的射频核心长期被海外寡头垄断,国产替代及其迫切。核心企业,卓胜微为杰创新第七种,钛合金微缩结构件,旗舰终端的轻量化铠甲。 为了平衡疯狂增加的内部原系件重量与机身强度,下一代高端手机全面切入钛合金。其三, d 打印与精密加工性能供不应求。 核心企业,长银精密、统联精密、银帮股份第八种,高性能硅基 o、 l、 e、 d 材料端侧视觉的终极窗口。高刷、极低功耗的顶级屏幕显示技术 不仅是旗舰手机的核心卖点,更是下一代空间计算和穿戴设备的生死线。核心企业,奥莱德莱特光电、青悦科技你觉得这八大核心命门里,哪一类最有可能率先吃透这波 ai 终端换机潮的红利?欢迎在评论区留下你的看法,一起聊聊硬核科技的未来。
粉丝1.4万获赞4.7万


各位观众朋友大家好,在万物互联的时代,我们身边越来越多的设备需要联网与智能化,从智能汽车到工业机器人,从边缘计算终端到各类智能硬件,而为这些设备提供连接能力的正是无线通信模组企业。 今天我们就来聊聊一家在这一领域深耕细分赛道的企业。美格智能传统意义上的通信模组更像是设备里的翻译官,负责数据的转换与传输,实现设备与网络的对话。但美格智能正在做的是给这个翻译官装上大脑, 他们以通信加计算加 ai 推理一体化智能模组为核心,让模组不再只是传递信息的通道,而是具备本地计算和智能决策能力的边缘计算节点。 如果把传统模组比作一条高速公路,只负责让数据快速通行,那么每个智能的高算力 ai 模组 就像是高速公路上的智能服务区,不仅能通车,还能在本地完成图像识别、语音处理、实时决策等复杂任务。 这意味着很多原本需要上传到云端处理的 ai 任务,现在可以在设备端直接完成,大大降低了延迟,也更好地保护了数据隐私。 近年来,美格智能已经从传统的通信模组业务稳固向端侧 ai 算力平台拓展。在智能网联汽车、机器人、工业视觉、智慧零售等场景中,这种会思考的模组正在成为核心组建 企业。在这一高算力 ai 模组的细分布局中,已经形成了深厚的技术积累和产品矩阵。从连接万物到赋能万物,通信模组行业正在经历一场智能化的深刻改革, 每个智能的实践也让我们看到未来的智能设备不仅需要联网,更需要一颗强大的本地大脑。以上就是今天的科普内容,我们下期再见。

大家好,我是李老张啊,想了解鸿蒙七到底长什么样。不用改 hdc 了啊,看看这个 qx max 就 行了啊。这款手机上就是这个 qx max 啊。这款手机上少发了一个东西,叫伴随式 ai。 什么概念?小易不再是你喊一句他回一句的工具了,就常驻在屏幕的右侧,不说话不打扰,但一直在那双击导航条,他就能帮你归拢信息。微信里的通知奶茶取单号是吧?机票的行程他不用手动的复制版粘贴,他主动帮你整理好,到点就自动提醒通勤。现在帮你查好路况,告诉你几点出门,不堵车,一键打车, 连地址都给你填好,甚至出差的时候连机票都帮你定啊。这是一个 ai 交互的一个质变,从用户发起 ai 响应变成了持续在场实时服务,翻译成人话从随到随叫变成了无数。不在这个底层能力呢,来自于小易的 a 卷的自我演化的框架, 他不是简单的对话模型升级,是小易有了自己的智慧大脑,能记忆,能反思,能进化。你记住的不是你的偏好,而是你下一步想要干什么 啊,不是等你,是自己说话才主动。更关键的一个信号呢?小易 colo 已经登陆电脑端了对吧? mate 部十四上已经开启了 beta, 一个华为账号手机、平板电脑全能用对不对?手机跟小易上建立的默契,换到电脑上,它还是同一个 ai。 跨端 ai 行动这事以前没有真正做过, 为他的尝试,把这几个点穿起来,就能看到鸿蒙七端侧的相关的一些完整路线图了。 p r x max 的 伴随 ai, 本质上是鸿蒙端侧 ai 的 雏形和前哨战, pc 上发布鸿蒙七,大概率把这个能力系统化、平台化, npu 调度原生开放给第三方的开发者。小于的 a 阵架构会 下沉到鸿蒙系统底层,成为基础设施。跨设备的 ai 系统要做成标准能力,这为什么说跨时代呢?因为过去十年所有的 ai 应用的能力都在云端,你在数据上传到服务器,算完再传回来,慢费电。还有隐私问题,端算 ai 把计算全部压在本地 npu 上,毫秒你响应断网也能用数据不出手机,这不是简单的体验升级,是整个计算架构的范式切换。云端 ai 是 你随身带的一个伙伴,对吧? 苹果也在做端测 ai, 但苹果的路线是封闭的,模型和应用全在自己手里。华为走了一条不一样的路,模型进系统, ai 能力开放给所有应用,跨设备协调做成标准接口,小于壳老还能跨端漫游。封闭和开放水跑得快,两年后肯定就能见风向。 产业链的影响其实也非常不小,端测 n、 p、 o 的 需求会暴增,手机 soc 的 竞争维度从 cpu 跑分全面转向 ai 的 能力啊,这是对芯片设计公司、风测场都是一个结构性的增量,对整个半导体产业来说是新的增长体现。 如果你对端测 ai 的 机会感兴趣的话,如果你想知道哪些公司真正受益,哪些只是蹭概念的啊。欢迎看我们的这个季度会员课补课,我们准备在六月份啊, 在那个 hdc 的 期间,我们单独要做两期的会员内容,去深度拆解鸿蒙期和他带来的一系列的这个变化,以及相关的机会,需要的话赶紧加入咱们的记录会员科普课啊,这个九天四十五个视频,八场专门的直播。然后呢?因为内容好,所以平台给了大量的补贴,尤其叠加六二八, 本身咱们的月卡已经两百多将近三百块钱了,所以机卡应该是八百块钱才合适,但现在只要六百出头就能拿到,甚至某些平台补贴特别大,不到六百你就能拿到, 非常的超值。需要的赶紧看一下,链接就在底下点击即可。好,今天就到这啊,一定记得接住掉老师电话,不然你不知道该怎么看课啊。我是瑞老张,关注我,咱们投资的视角,看科技背后的精彩,我们下一见,拜拜!

有家电从业者不给你们看点好东西,那就这些手指那么大的一块板子,知道这些东西是什么吧。家电行业真正要迎来 ai 的 春天了啊,真正的拐点就在这么几片,呃,小设备上面, 记得以前的所谓的智能家居呢?呃,就像个智障一样对吧?基本上都是靠预设程序,然后靠你自己去触发,他说智,智能题就是智障,你的所谓的隐私只能靠堵, 但现在只有末梢的 ai 的 板子完全就不一样了,从以前的被动的执行变成主动去理解你的意图,这真的是好东西,这是真正能跑大模型的设备, 而且对国产的专利不算高,只有一梯两梯三梯这样子。但这个东西给家电行业带来的冲击是真正的从被动到主动的个转变,所以我更加愿意称这些东西的出现是家电行业的拐点的原因之一。 所以顺德那边还在生死关熬的从业者们,看看这个这些东西吧,看懂了估计你就改命了呵。

别再瞎猜了,纯写鸿蒙七点零的底层进度彻底曝光!又在前天 open harmony 七点零备胎一现身, get called a p i 版本飙升到二十六!与此同时,华为官方开启了 harmony os a p r 二十六体验官招募开源底座和商业系统完美对齐,直接坐实信号, 鸿蒙七点零已经完成底层接口定型!为什么要盯着 a p 二十六? a p i 级别就是系统能力的总闸,五点零打通,纯血六点零全面商用。而 a p i 二十六的跃升,意味着分布式协同和内核级延迟被写入了更硬核的规范。结合六月 h d c。 两千零二十六大会预告的鸿蒙 ai 核心能力,搞开发的都懂, 普通 ai 只是调云端接口,而 a p 二十六释放的密码很可能是端侧大模型对硬件算力的直接接管, ai 将直接涨在系统骨架里。目前官方极客马拉松决赛已明确要求用七点零逼塔进行封闭开发,大厂早已闭门适配,别等正式发布才去翻文档,关注我 h d c。 大 会带你第一视角拆解鸿蒙七点零硬干货!

专测 ai 部署是以后建设发展的一个主要方向,因为你现在如果再去写那些简单的外设驱动啊,根据这个协议文档去做开发啊,以后的路呢会越走越窄,因为以后 ai 呢,它编码阅读文档的能力呢,会越来越强,以后 ai 就 很容易代替你。但是呢,把这个 ai 模型部署到我们的这种专测设备上啊, 就比如说我身后的这个机器人,它这个上面呢就有一个 r d k 的 开发板啊,我们需要把机器人走路的这个模型部署到这个端侧的这个设备上,那整个过程呢,你就要去学习 啊,我怎么去完成这种模型格式的转发啊?我拿到这个模型之后,我在这个端侧上去推理,怎么保证我推理的这个效率?四个看的总线啊,两个胳膊两条腿,我怎么保证它的同步啊?这些呢?就是啊,就是开发以后高薪的一些方向。

hello, 大家好,我是司马。二零二六年, ai 可能不再只是住在云端,而是要搬进你的手机、耳机、眼镜、汽车和机器人里面。谁能给这些设备装上本地 ai 大 脑, 谁就可能吃到下一波的芯片红利。前天,极微咨询发布了一份很重磅的报告,叫二零二六年中国半导体端测 ai 芯片上市公司研究报告。听起来很专业对吧? 那我来帮大家把它翻译成人话端测 ai 芯片啊,就是让 ai 不 只是住在云端服务器,而是直接住在你的手机、耳机、汽车、机器人、 ai 眼镜里面。以前的 ai 像远程外脑啊,你问一句呢,他还要跑到云端去找答案 单侧的 ai 呢,把一个小型的 ai 助理啊,直接塞到这个设备本地。这份报告一次性拆了十六家中国半导体相关的一个上市企业。那么问题来了呢,谁最有机会吃到这波红利啊,谁的技术又更值得被关注呢? 今天我就用最简单的话来帮你拆解这份报告里面有十六家公司啊,包括了金城股份、北京军政、瑞新威、地平线机器人、恒旋科技、金城科技、全智科技、杰里科技、乐星科技、 中科蓝讯、国科威、富瀚威、泰林威、巨星科技、黑芝麻智能、安凯威。别怕啊,名字很多啊,不用背,你只要记住一个核心逻辑啊,端侧 ai 芯片呢,比拼的不是说谁嗓门大, 而是谁能在最小的设备里面用更低功耗跑出更强的 ai 能力。这就像什么不是让你家的冰箱里面塞一台超级电脑,而是让冰箱里的小芯片也能看得懂、听得懂、反应快。 所以报告看的不只是营收和利润啊,还包括技术路线、应用场景、市场趋势以及未来的一些风险。最核心的判断是,二零二六年呢,端测 ai 会从概念热走向产品落地, 手机 aipc、 耳机、摄像头、机器人、智能汽车都会需要这种低功耗、高效率、本地运行的 ai 芯片。哪些公司值得关注呢? 第一个我觉得可以重点看巨星科技。报告里对巨星科技关注的重点也很明确啊,它在端测 ai 音频芯片上率先把内存计算呢,也就是 cim 技术呢,推向了商业化。 这个词听起来很硬核啊,我给你打个比方,普通芯片算 ai 啊,有点像你做饭时,食材在冰箱啊,锅呢在厨房,你得来回跑。而这个存类计算的思路是尽量让存数据和做计算呢,离得更近, 甚至在存储附近啊,直接就算了。好处是什么?少搬数据,少浪费电,反应快。巨星科技的端侧 ai 芯片 ats 三二三 x, 采用 cpu 加 dsp 加 mpu 三核异构设计, mpu 单核算力达到一百, gps 能效比高达六点四, tops 每瓦艾特硬特八。这句话再翻译一下啊,就是 它不单是靠一个大脑来运算,而是让不同类型的小脑分工合作啊。 cpu 管控制, dsp 呢?管音频信号, mpu 呢,专门跑 ai。 所以 它是用什么?比如 ai 耳机啊,无线麦克风、会议设备、 智能音频交互的这些场景。第二个呢,就是地平线机器人,它更偏向自动驾驶机器人和高性能的边缘计算。 如果说巨星更像是把 ai 塞进耳机和小型设备上,那地平线呢,就是给车和机器人撞上大脑,它下面还有一个叫地挂机器人。第三类呢,是恒玄科技、 北京军政啊,瑞星威这些公司,他们在智能音频、智能穿戴、视觉处理、工业控制、 a i o t 这些领域呢,已经有比较深的一个积累。所以你会发现,二零二六年端测 ai 芯片不是单纯一个我算力高 啊,真正重要的是赚的快,工号低,体积小,成本可控,还能真正的装进产品里面去卖,这才是核心的竞争力。那这件事情意味着什么呢?尤其是我们普通人要关注的。简单的来说呢,未来 ai 不 一定是每次都要联网, 不一定是每次都要等云端去回复。比如你的 ai 耳机,你可以本地识别语音指令,你的 ai 眼镜可以现场去理解你看到的东西,你的机器人可以在本地判断障碍物和行动路线,你的手机呢,也能在本地处理很多的 ai 任务。 这会带来三个重要的变化,第一个呢,是响应速度更快,不是每次都要把数据传到云端啊,设备呢,自己就能够处理了。 第二个呢是隐私更好啊,很多数据呢,就不需要离开本地的设备。第三个呢就是体验更快更稳定,网络不好的时候啊, ai 的 能力呢,也不会说直接断片,所以干脆 ai 不是 一个单独的芯片故事, 它背后其实是整个终端设备的一个升级,手机要更聪明,耳机要更懂你,机器人要更能够自主,汽车呢,要更安全。好了,我们来总结一下 极微咨询这份二零二六年端测 ai 芯片报告啊,其实释放了一个非常强的一个信号, 端测的 ai 不 再只是 ppt 里面的概念,它正在进入真正的产品落地的一个阶段。在这波机会里啊,巨星科技的看点是端测 ai 音频和内存计算的商业化地平线,机器人更倾向于汽车和机器人的一个计算平台。 恒玄科技啊,北京军政呀,瑞星微等公司呢,则在智能穿戴呀,视觉处理啊,工业控制等场景呢,持续在布局。一句话概括,未来谁能把 ai 芯片做的又聪明又省电又便宜,还能够量产, 谁就更有机会站在端测 ai 的 风口上。那么问题来了,这波端测 ai 芯片机会,你会更看好哪家公司呢? 你觉得端侧 ai 的 芯片会先在哪一个产品上爆发呢?是 ai 手机还是 ai 耳机,还是 ai 眼镜?还是说机器人?欢迎你在评论区聊聊你的想法。 好了,今天呢,就先到这里了,拜拜!对了,本次报告不做任何投资建议,只是科普啊。

朋友们,重磅消息!下个月苹果全球开发者大会 w wdc 要来了!这次不太一样,苹果将在 w wdc 上重点展示端测 ai 能力,把谷歌的 gemini 模型轻量化,精简到能在 iphone 上本地运行。新版 siri 用谷歌 gemini 重构 部分查询,在谷歌云上处理,用的是英伟达的 ai 芯片和隐私技术。注意三个关键词,谷歌的模型、英伟达的芯片、苹果的自研芯片。全球市值前三的公司,在这个节点上形成了一次史无前例的生态藕合。如果你还以为 ai 只是几家大模型公司在打架, 那今天这条视频你一定要好好听完。咱们先把事说清楚。苹果今年的 ai 策略非常清晰,端侧加云端混合架构,端侧靠自研 a 系列和 m 系列芯片,在 iphone 和 mac 上本地跑 ai 云端。苹果没自己建大模型算力池,而是选了谷歌云, 用谷歌 gemini 模型来跑 siri 的 复杂查询。而且为了隐私保护,苹果还用了英伟达的隐私计算技术。这个组合很有意思。苹果跟 openai 的 合作其实更糟,但后来苹果决定用谷歌 gemini 来升级底层 ai 模型, openai 因此非常不爽,甚至威胁要起诉苹果。 为什么苹果选谷歌?因为 gemini 在 端侧轻量化上做得更好,而且谷歌云有现成的全球基础设施。那问题来了,这个布局意味着什么? 拆三层来看。第一层,端侧 ai 进入爆发期,全球端侧 ai 市场规模预计二零三三年突破七百五十五亿美元,复合增长接近百分之二十八。苹果把 gemini 轻量化到 iphone 本地运行,等于端侧 ai 从噱头变成了落地, 以后,你的 iphone 不 需要联网就能跑大模型推理,这对隐私和响应速度是质的飞跃。第二层,云端的算率需求不减反增, 苹果端测能跑的任务有限,复杂查询还是要上云。谷歌云加英伟达芯片的组合说明一件事,混合 ai 架构是产业共识,不是二选一。 端侧解决隐私和响应,云端解决复杂推理,两边都需要算力。第三层,英伟达仍然是最大赢家。不管苹果用谁的模型、谁的云,只要需要 ai 芯片,就绕不开英伟达。 苹果这次明确用英伟达隐私技术在谷歌云上跑 siri, 就是 又一个证据。从产业赛道看,苹果的 w wdc ai 战略其实是整个 ai 产业发展的一个缩影。大模型军备竞赛的上半场已经结束了,现在进入下半场落地。 端测 ai 是 落地最快的方向,因为终端设备保有量巨大,二零二六年全球边缘 ai 推理市场规模预计超过一千五百亿美元。艾维电子、雷神科技等 a 股公司也在布局端测 ai, 这个方向的产业链机会正在加速释放。当然要注意,端测 ai 还面临工耗、散热、模型压缩等挑战,苹果的端测体验究竟如何,还要看 w、 w d c 上实际展示的效果。 以上仅为个人观点和行业逻辑拆解,不构成任何投资建议。苹果 w、 w、 d c 的 ai 组合权,真正值得留意的是三个巨头的协同,而不是单打独斗。你们觉得端测 ai 会是今年最大的科技主线吗?评论区聊聊,下期见。

黄仁勋直接说漏嘴了,咱们先来看视频, plan right now, tell me very very soon, we like to tell you, there's there's a。 老黄全程反复提一个词, very very soon, 态度十分急切。而更关键的是,他在采访中不断重复的一个词,端测 ai。 黄仁勋说,他刚进入 it 行业时,正好赶上大型机时代结束,个人电脑爆发,现在他直接点破 云端, ai 只是开胃菜。 ai 的 下半场在你的手机和电脑里。什么意思?意思是未来你的电脑、手机都会内置本地 ai 模型, 因为真正聪明的 ai 必须长期理解你的习惯,而这些东西只能存在你的设备。很多人看完后怀疑老黄是不是画笔, 其实并不是,因为资本市场的动作已经能说明很多东西了。戴尔正在开发预装本地模型的 ai 电脑,苹果六月开发者大会有内部消息表示,接下来的 siri 会彻底进化成 ai 助手。那按照这个发展,接下来的风口 你们知道是谁吗?我的第一反应是沟通,以前市场只把沟通当安卓周期过,但如果 ai 手机爆发,他可能直接从手机芯片公司升级成 ai 终端平台公司。 关注过黄仁勋的应该都知道,他过去两年提过的东西,后来几乎全应验了二四年。他说存储短缺,二五年存储直接起飞。今年他说光模块不够,结果光通信板块又暴涨。 资本的市场从来不会说谎。所以在这个时代,最可怕的不是别人吹牛,而是他吹过的牛全成了财富机会。

黄仁勋最近透露了一个重要信号, ai 行业的游戏规则正在改变,这件事情跟每个企业家都有关系。过去几年啊, ai 的 主战场呢,在云端,各个企业呢,都在拼大模型,拼算力,拼参数。但是呢,黄仁勋说下一个战场呢,不在云端,而是在个人设备上。这个判断呢,是来自英伟达内部的消息。他透露出的信息呢,有这么几个重点, 第一就是 aipc 即将爆发,个人电脑呢,将很快的内置强大的 ai 能力,不需要联网就能完成复杂的任务。第二呢,是 ai 手机市场更大, ai 手机呢,比 ai 电脑呢普及更快,因为它更随身,更私密。第三呢,是沟通,正在从手机公司变为 ai 公司,它的定位变了,意味着整个手机行业都在为 ai 重构。 第四呢,是存储和 cpu 依然短缺, ai 时代,数据存储和处理器呢,还是不够用。第五呢,是物理, ai 是 更大的蓝海,不只是数字世界的 ai, 而是能够操控物理世界的 ai, 工厂里的机械臂、物流系统,无人驾驶,这些才是 ai 的 下一片境况。 所以,企业家的机会在哪里呢?不在云端的打磨型,而是在垂直领域的个人 ai 应用,在能落地的 ai 场景,我是老李,我们今日龙虾海马仕实现了 ai 短视频获客和智能客服。如果你还不知道如何真正用 ai 对 业务提效,可以找我留份资料。

今天聊一个很有意思的问题,目前的大模型基本都使用混合专家架构,并且在云端的部署已经是标配了 deep seek 用它,千问用它,其他闭元的大模型大概率也是用它。 基于混合专家架构的端侧大模型也有人在做。 oppo 在 二零二四年宣布了全球首个端侧混合专家,实现 l n a i 的 欧盟已经上架了苹果应用商店 千万一点五的混合专家版本。也有人在手机上跑通了量化推理。但问题是,这些端侧混合专家模型,要么是把云端模型硬塞进手机,靠权重卸载和缓存调度勉强跑起来。要么是在十亿参数以下的小规模参数量占用空间小, 缺乏系统性的架构设计指导。没有人回答过一个根本问题,在手机的内存和工号约束下,混合专家架构的最优配置到底是什么? 最近有一篇论文叫 mobile mo, 是 第一篇系统研究十亿以下规模混合专家模型在端侧缩放定律的工作。 他发现了一个甜点区,中等稀疏度加细腻度专家加共享专家。在这个配置下,混合专家模型在手机上的 preview 速度比同内存的稠密模型快一点八到三点八倍, dico 的 生成快二点二到三点四倍。同时, mini max m 二展示了另一个极端, 两千两百九十亿,总参数只激活九十八亿,稀疏比高达二十三倍,在云端效果很好。那问题来了,同样是混合专家架构,为什么云端能做到二十三倍?稀疏比端侧只能做六倍? 为什么云端用两百五十六个专家,端测只能用八到十六个,这背后的物理约束到底是什么?今天我把这个问题拆清楚,从底层硬件约束出发,讲清楚混合专家架构在端测面临的每一个核心问题,以及对应的设计策略。先建立一个基本认知,端测和云端的瓶颈完全不同。 云端混合专家模型的核心瓶颈是跨节点通信,专家分布在几十个节点上,每个 token 需要被路由到不同节点的专家通信,甚至可以占到执行时间的一半左右。所以云端的设计核心是怎么让通信模式可预测、可优化、 deep sec v 三的节点限制路由,就是为了解决这个问题。 端测混合专家模型的核心瓶颈完全不同。手机上没有跨节点通信的问题,所有东西都在一块芯片上,但 手机有两个硬约束,内存宽带和工号旗舰手机的内存宽带大约五十到六十 gb 字节每秒。逐次生成阶段,每出一个 token, 需要把所有参与计算的权重从内存读一遍,包括注意力层共享专家、被选中的路由专家。 假设一个混合专家模型的激活参数是十亿四,比特量化下大约零点五 g b 自结,那每个 token 的 生成延迟下限是零点五除以五十等于十毫秒。注意,这只是理论下限,实际还要加上 k v 缓存读写激活值、计算调度开销。真实延迟通常是理论值的两到三倍, 而且如果你想要更强的模型能力,激活值的两到三倍,而且如果你想要更强的模型,会限性增长。关键是这个下限完全由内存带宽决定,跟计算能力无关, 你的神经网络处理器算力翻倍,这个下限一毫秒都不会减少。这就是端侧推理的核心物理事实。逐次生成阶段是内存带宽受限的,不是算力受限的。你的神经网络处理器再快也没用,瓶颈在从内存搬数据的速度 理解了这个物理约束,混合专家架构,在端侧的所有设计决策就有了锚点。第一个核心问题,稀疏度为什么不能太高?直觉上稀疏度越高越好。总参数多意味着模型容量大,激活参数少意味着推理快。 mini max m 二做到了二十三倍稀疏比效果很好。 但在端测,高稀疏度有三个致命问题。第一个问题是专家贪缩。在几亿参数这个规模下,如果你有六十四个专家,但只激活两个,每个专家在训练中看到的数据量极少。 大模型训练几万亿 token, 每个专家即使只分到六十四分之一的流量,也有几百亿 token 的 训练信号。但小模型训练数据本来就少,如果再被六十四个专家瓜分,每个专家可能只看到几亿 token。 训练信号不足,专家学不出有意义的分工,最终大部分专家变成了噪声,只有少数几个被反复激活,这就是专家瘫痪云端。大模型不怕这个问题,因为训练数据量巨大,大批次训练下,每个专家都能获得充足的信号, 但端测模型总参数只有几十亿,训练数据有限,高稀疏度直接导致训练不稳定。模板模板的实验验证了这一点,稀疏比超过十倍后,模型质量开始下降。第二个问题是逐词生成时的内存访问模式。 高稀疏度意味着专家数量多,即使每次只激活两个,但哪两个是动态决定的?这意味着所有专家的权重都必须常驻内存,因为你不知道下一个 token 会激活哪个专家。 在四 g b 字节内存预算下,如果你有六十四个专家,每个专家的参数量就被压缩到很小,表达能力不足。如果你想保持每个专家的大小,总参数量又会超出内存预算。 第三个问题是, batch size 为一,端侧是单用户场景。逐词生成时, batch size 永远等于一,每个 token 只激活两个专家,其他专家完全空闲。 专家数量越多,大部分参数永远在等待被激活的状态。内存利用率越低,云端高,病发场景下大批次可以统计性的均摊负债,端侧没有这个条件。 所以 mobile mode 的 结论是,端侧的最优稀疏比大约在六到八倍,远低于云端的二十多倍。第二个核心问题,专家应该做大还是做小?这是粗力度和细力度的选择。 粗力度是每个专家很大,比如每个专家的前馈网络维度是四千零九十六。好处是单个专家能力强。坏处是内存开销大,而且负债不均衡时浪费严重。 细腻度是每个专家很小,比如每个专家的前馈网络维度只有一千零二十四。好处是灵活,你可以用更多专家来覆盖更多知识领域。同时,每个专家的内存开销小,负债不均衡的影响也小。坏处是单个专家表达能力弱。 摩拜默的发现是在端侧细力度明显优于粗力度。原因有三个,第一,内存效率细力度专家小。你可以在同样的内存预算下放更多专家总餐,数量更大,模型容量更高。第二,组合灵活性。 八个小专家里选两个,有二十八种组合。十六个小专家里选两个,有一百二十种组合。 更多的组合意味着路由器可以为不同类型的输入找到更精确的专家组合。第三,赋载均衡更容易。专家越小,单个专家过载的影响越小。即使某个专家被过度激活,他处理的计算量也不大,不会成为延迟瓶颈。 但细力度有一个问题,单个专家太弱了。如果每个专家只有一千零二十四维的前馈网络,他能学到的知识很有限,怎么补偿? 答案是共享专家。第三个核心问题,为什么共享专家在端侧比云端更重要?共享专家是 deep seek 的 混合专家,架构提出的设计 除了被路由器动态选择的路由专家之外,还有一个或几个共享专家,对所有 token 都激活,不经过路由。在云端, deep seek v 三两百五十六个路由专家里只配了一个共享专家,占比很小, 作用是减少路由专家之间的溶余。但在端侧,共享专家是整个架构的稳定器。第一,它集中承载通用语言知识,让路由专家不用浪费餐。数学语法和常见搭配可以专注于领域特定知识,每个小专家的有效容量因此变大了。 第二,给训练兜底。端测模型规模小,路由器容易学偏。共享专家保证,即使路由器选错了专家模型,仍然有基本的语言能力。有研究发现,浅层模型去掉共享专家后,某些任务的召回率下降百分之七十六,而深层模型只下降百分之四十三。 端侧模型层数少,对共享专家的依赖更强。第三,延迟可预测共享专家的计算量,固定权重可以长注偏上缓存不需要从内存重新加载,加上路由专家的动态部分,总延迟的方差更小,用户体验更稳定。 所以 mobile 某一的推荐配置是一个较大的共享专家加八到十六个较小的路由专家,每次选两个路由, 共享专家的前馈网络维度是路由专家的两倍。第四个核心问题,四比特量化在混合专家场景下有什么特殊挑战?端侧部署几乎必须用四比特量化。四 g b 字节内存预算下,半精度浮点只能放二十亿参数, 四比特能放八十亿参数,差四倍。但混合专家模型的量化比稠密模型更难,原因在路由器。 路由器是一个小型的限行层,输入是 token 的 隐藏状态,输出是每个专家的得分。路由器的输出决定了哪些专家被激活。问题是,路由器的输出经过归一化后,专家之间的得分差距可能很小。如果量化引入的噪声改变了得分的相对排序, 那激活的专家就变了。一个本该被激活的专家没被选中,一个不该被激活的专家被选中了。这不是精度略有下降的问题,是完全走错了路的问题。 稠密模型的量化误差是连续的,渐近的,每一层都有一点误差,最终累积成输出质量的轻微下降。混合专家模型的量化误差是离散的、跳变的,路由决策一旦翻转,整个计算路径就变了。 mobo 的 解决方案是四阶段训练,域训练,中期训练指令微调,最后做量化感知训练。 为什么量化感知训练放在最后?因为前三个阶段需要在全精度下让模型充分收敛,让路由器学出稳定的分工模式。如果一开始就加量化噪声,路由器在噪声干扰下学不出清晰的专家分工训练会不稳定。 量化感知训练放在最后,是在路由器已经稳定之后,让模型适应量化噪声,这时候路由器的决策边界已经形成。量化感知训练的作用是让模型在低精度下仍然能维持正确的路由决策,而不是重新学习路由。 这跟稠密模型的量化感知训练逻辑不同,稠密模型主要是让权重适应低精度表示。混合专家模型的核心目标是保护路由决策的正确性。 第五个核心问题,手机上的易购硬件怎么分配混合专家模型的组建?现代旗舰手机有三种计算单元,中央处理器、图形处理器、神经网络处理器。混合专家模型的组建天然适合易购调度 共享专家放神经网络处理器,因为它对所有 token 都激活,利用率百分之百,权重可以常驻偏上缓存 路由网络放中央处理器,因为计算量极低,但需要快速返回决策结果。路由专家动态调度,高频被激活的专家放神经网络处理器或图形处理器的缓存里,低频专家留在内存,可以用历史激活频率来预测哪些专家是热的。 zippo 这篇工作就是做这个基于缓存亲和性的专家调度,把混合专家推理从读取受限转变为算力受限。 还有一个更激进的方案,有研究提出在中央处理器上做专家预计算,当神经网络处理器在处理当前 token 时,中央处理器根据路由预测,提前计算下一个 token 可能需要的专家把结果缓存起来。 如果预测正确,下一个 token 的 专家计算就是免费的。第六个核心问题,端测混合专家模型的缩放定律跟云端有什么本质不同? 云端的混合专家缩放定律基本遵循亲切拉的框架给定计算预算最优的模型大小和训练数据量有一个确定的比例关系。 混合专家架构在这个框架下的优势是,同样的,计算预算可以用更大的总餐数量,因为每次只激活一部分,从而获得更好的性能。端侧的缩放定律完全不同,约束不是计算预算,而是内存预算和延迟预算。 mobo 提出的端侧缩放定律是这样的,给定内存预算和延迟预算最优配置需要同时满足三个条件,第一,总餐数量乘以每餐数自结数不超过内存上限,这是内存约束。 第二,激活参数量乘以每参数自结束除以内存待宽不超过延迟上限,这是逐次生成阶段的延迟约束。第三,激活参数量除以计算吞吐不超过延迟上限,这是 preview 阶段的延迟约束。 在这三个约束下,最优解不是仅可能多的专家,尽可能高的稀疏度,而是一个平衡点,专家数量够多,让总餐数量填满内存预算,利用所有可用内存,激活参数够少,让逐词生成延迟满足要求不超过内存待宽限制, 但稀疏度不能太高,否则训练不稳定,专家利用率低。这个平衡点就是 mobile 说的填点区, 具体到数字在四 gb 字节四比特量化内存预算五十毫秒逐次生成,延迟预算下,最优配置大约是总参数三十到五十亿,激活参数五到九亿, 八到十六个。细力度路由专家,一个共享专家,每次选两个路由,稀疏比六到八倍,这跟云端的最优配置差了一个数量级,不是因为端侧的算法不行,是因为物理约束完全不同。 最后总结一下,混合专家架构不是一套固定的最佳实践,它是一个设计空间,最优解完全取决于约束条件。 云端的约束是通信宽带和计算预算,端侧的约束是内存宽带和工号预算同一个架构思想在不同的物理约束下推导出来的最优配置,差一个数量级理解约束比记住配置重要的多。

发现没有,以前铺天盖地的手机广告已经很久没看到了。那些以前为了一个摄像头参数都能撕得头破血流的厂商,为什么这么安静?原因只有一个,端测 ai 来了,而他们不但没肉吃,连汤都快没了。 先理理逻辑,随着 ai 阵子的爆发,云端跑大模型的电费和推理成本几何倍数的增加,科技巨头们为了省下这笔天价开支,已经开始把 ai 空投到手机端。中英国际的报告提到, 谷歌最近发布的 jam 四开源大模型,全系都迁移到了免授权费的 pi 七二点零协议下,厂商不需要付高昂的专利费就能直接在手机上用。巨头的意思很明确,让模型在本地跑,用你手机自己的芯片和电量去算,以此来分摊云端的成本。 但这在物理上把手机厂商逼进了死胡同。根据行业研究报告,现在的智能体 ai 在 手机后台自己和自己交互的数据量, 比以前简单的聊天功能暴增了上千倍。而底层的硬物理规律是, ai 在 本地每输出一个词,手机内存就必须把整个 ai 模型的文件从头到尾完整读取一遍。 这种高富在从硬件直接导到了企业报表里。高盛在分析 pc 大 厂最新的财报时明确指出,不断上涨的内存成本正在严重抑制传统个人电脑业务的短期利润增长。大模型太重,高端内存又太贵。如果现在强推 ai 概念,用户买回去发现设备发热 卡顿掉电,直接砸的是自己的招牌,这正是手机厂沉没了的原因。但与此同时,上游正在吃大肉, 手机厂为了不砸招牌,就必须死磕硬件升级,而升级就必须大量采购更高算力的端侧 soc 芯片和核心存储模组。这就形成了一个奇特的共生画面,下游手机厂在咬着牙承受高昂的硬件成本,而卡在中间的芯片供应商已经赚到了真金白银。 来看数据,给各种智能终端提供本地算力芯片的星辰科技一季度营收同比大增百分之四十九,全智科技营收大涨百分之四十七,并在财报里明确透露是价量齐升, 瑞欣威的营收也大涨了百分之三十六。而存储模组大厂江波龙一季报营收同比暴增百分之一百三十三。 现实很残酷,压力在终端大厂身上。上游大口吃肉,可以想到,芯片大厂赚了钱,一回头又得成吨成吨的去买制造芯片的特种设备和先进封装材料, 利润正顺着这套云端降本终端升级的铁律,像漏斗一样固定流向最上游拥有核心技术壁垒的厂商身上。 虽然目前半导体材料企业估值已充斥历史高位 pe 百分位百分之八十到九十九,但设备企业估值仍处于历史中低位 pe 百分位百分之二十八到四十九。随着端测 ai 从概念一步步落实到终端的刚性配套,上游需求爆发的确定性极高。 说白了,端测 ai 爆发的海啸已经能远远看到了。而下一步,用户为了流畅度付出的每一步换代成本,最终都会经过手机大厂的成本账本,最终变成最上游半导体材料和设备商财报里稳稳的利润。 看透了这部棋,聪明的你,猜到为什么手机在降价了吗?评论区聊聊。本内容仅供参考,不构成任何投资建议。

今天我们想聊的呢是端测 ai 这个技术,嗯,它在整个产业链里面是如何落地的,以及它会给各个行业带来什么样的机会。是的是的,这个确实是一个非常前沿的话题啊。那我们就开始吧, 咱们先从端测 ai 的 产业链全景图开始。对,那这个产业链主要包括哪些环节呢?端测 ai 的 产业链啊,它其实主要就是三个大的环节, 最上面的那一层呢,是基础层,基础层就是那些硬件的部分,芯片啊,传感器啊,然后中间这一层呢,就是技术层,就是操作系统啊,开发工具啊。最下面的那一层就是应用层,就是我们手机里面的各种 ai 的 应用。明白了, 那下面咱们就来了解一下端测 ai 的 本质和优势吧。对,这个技术到底是怎么让终端设备变得更聪明的?端测 ai 其实说白了就是把原本依赖云端的 ai 运算能力直接搬到了手机、电脑这些本地设备里面。嗯,让设备可以自己思考,自己回应, 不需要每一次都把你的数据上传到云服务器去处理。这么说的话,那端测 ai 岂不是速度很快?没错没错,因为数据不用再传来传去了,所以它的响应特别快,然后也省流量, 而且你的隐私数据也不会离开你的设备,所以安全性也大大提升了。那为什么最近大家会越来越关注端测 ai 呢?其实这一切都要从二零二二年拆的 gbt 火遍全球开始说起。嗯,大家用 ai 用的越来越多,对数据分析的需求也越来越强, 但是完全依赖云端来处理这些事情,就会出现一些问题,问题主要是出现在哪些方面呢?首先就是速度和延迟的问题,因为网络有时候会慢或者不稳定,对,就会导致体验变差,而且你用的越多,费用也越高,特别是一些需要马上做出判断的场景,云端根本就来不及反应, 所以大家就希望把 ai 运算直接放到本地设备上。嗯,这样又高效又省钱,还解决了数据安全的隐患,所以端测 ai 就 成为了人工智能的一个新的风向标。懂了, 那端测 ai 到底有哪些实际的优势呢?端测 ai 的 话,就是它把 ai 的 模型直接跑在你的手机啊或者电脑这些终端上,所以它根本就不需要网络,也可以很快的给你一个反馈,然后也不会消耗你的流量。嗯,同时呢,你的数据始终都在你自己的设备里面, 所以别人也没有办法去切取,而且他还可以根据你的使用习惯来不断的优化体验,会越来越贴合你个人。好的,那我们现在就进入上游产业链,来聊一聊核心硬件。 嗯,说到云端算力芯片啊,就是全球的这些云服务巨头们,他们最近在算力基础设施上面的投入到底有多夸张? 这个数字真的是让人啧舌。二零二五年的第三季度,海外那四家最大的云服务公司,他们在算力基建上面的投入就高达九百七十九亿美元,比上一个季度增长了百分之十, 而且这个增长势头还在持续。哇,这个增速真的是吓人。那国内的情况跟他们相比有什么不一样?国内的话现在还处于追赶的阶段,但是像字节跳动这些头部的企业,他们的 ai 使用量已经快要赶上谷歌了, 所以国内的算力需求也是猛增的。那现在的投入是远远不够的,所以接下来几年国内在算力基建上面的开支肯定也是会大幅提升的。 那我有个疑问啊,就是这个 gpu 芯片在整个 ai 算力的发展当中,到底扮演了一个什么样的角色?其实在 ai 算力不断扩张的这个过程当中, gpu 芯片就是最核心的那个引擎,它就像一个雪球一样,一旦滚起来,速度就会越来越快。 二零二三年的时候,全球 gpu 的 市场规模是四百三十六亿美元,但是到二零二九年,这个数字会飙升到两千七百四十二亿美元。 天呐,这中间的年复合率是百分之三十三点二,听起来这个市场几乎被 gpu 承包了,那具体到厂商呢?是不是有一家独大的情况?是啊, 英伟达在这个领域里面,就跟 windows 在 pc 系统里面一样,是绝对的主导地位。嗯,二零二四年上半年,中国的 ai 加速卡出货量超过了九十万张, 然后二零二二年的时候,英伟达在全球的 ai 芯片市场份额超过了百分之八十,在 ai 加速芯片领域甚至高达百分之九十五, 其他所有公司加起来都没有他多。看来英伟达的实力确实很强大啊。那最近国产的自研超节点有没有什么亮眼的表现?最近的话就是,国产自研超节点真的是风头狠劲,他就像是一个大力士,专门负责提升算力的载重能力,这个也是我们能够追上海外巨头的一个关键。 所以二零二五年下半年这个领域会有哪些新的变化?二零二五年下半年的话,就是各种国产的超节点方案会集中的亮相。嗯,互联网公司、交换机企业,还有就是做 gpu 自研的这些厂商都会带来他们的新产品,比如说华为和曙光,他们就是坚持全站自研的路线。 同时呢,还有一些第三方的 switch 芯片公司,跟互联网大厂联手推出的一些终端的解决方案也是非常值得关注的。 ok, 那 这些上游的核心硬件对于我们整个 ai 产业链来讲,到底有多重要?可以这么说吧,这些硬件就是 ai 产业的地基。嗯,无论是芯片还是各种设备和电路板,每一环都缺一不可, 只有把这个基础打牢了,上面的应用才能跑得起来。对于想要参与到这个 ai 浪潮里的普通投资者来说,有没有什么比较简单直接的方式,大家可以关注一下科创创业人工智能 etf, 谨慎 代码是一五九一四二。嗯,它是布局了产业链上的各个核心企业的,相当于一键打包了,这些 ai 龙头让你不用头疼怎么去挑选个股投资变得清晰简单。好的, 那这个存储芯片在整个电子设备里面到底是一个什么样的作用?存储芯片其实就是相当于电子设备的仓库, 它的作用就是专门负责存储和读取数据。嗯,是一个非常关键的部件,离开了它,设备就没有办法保存任何信息。哦, 那存储芯片在整个半导体的大家族里面是属于哪一类呢?如果我们把半导体产品分成四大类的话,就是分立器件、光电器件、传感器和集成电路, 那集成电率是其中非常大的一个家族。然后存储芯片就是核逻辑芯片、微处理芯片,并列的都是集成电路里面非常核心的成员。懂了, 那最近这个存储芯片的市场有什么新的变化吗?最近的话,存储芯片是处于一个非常强的上行周期,就有点像大宗商品一样,它的产品是高度标准化的,然后供应又很集中,所以它的价格波动特别明显。这个周期是从什么时候开始啊?价格有什么具体的变化吗? 这一轮周期是从二零二五年的第二季度开始启动的,然后可能会一直持续到二零二六年全年。 二零二五年第二季度开始,价格就开始逐步的上涨。嗯,九月份之前主要是因为滴滴二四的转产带动了涨价,九月份之后,因为 hdd 缺货,加上 ai 推理的需求转向了 ssd, 所以 ssd 的 价格也被带飞了。 然后又因为下游的 ai 客户对于价格上涨并不敏感,所以就导致存储芯片的涨幅超过了预期,形成了所谓的超级周期。 所以二零二五年第三季度和第四季度企业级 ssd 的 市场有什么不一样的表现?二零二五年第三季度的话, 因为 ai 的 需求扩展到了推理端,然后加上北美那边的云服务商大规模的扩建 ai 基建和服务器,所以企业级 ssd 的 全球前五大品牌的营收直接环比增长了百分之二十八,达到了六十五点四亿美元,天呐, 然后到了第四季度就变成了抢货的局面,因为供应商的产能还是比较谨慎,所以就造成了供需的缺口,加上 csp, 也就是云服务提供商们开始囤货,来避免 ai 服务器的交付延误,所以价格就进一步的被推高了,预计涨幅在百分之二十五左右。 在这样的一个市场环境下,本土的存储芯片企业有没有什么机会?当然有了,在政策的支持下,本土的存储企业也是通过技术的进步和本地化的服务在不断的缩小和国际大厂之间的差距,份额也是在逐步的提升。 观测 soc 芯片到底是怎么做到让我们的设备又省电又聪明的?观测 soc 其实就是专门为 ai 打造的一个全能芯片,它里面不光集成了处理器和存储器,还集成了专门的 ai 模块,所以设备可以在本地直接跑 ai 的 运算,不需要经常去麻烦云端。 嗯,然后再加上它的功耗非常的低,芯片面积又小,但是算力又很强,所以它是非常适合智能终端的各种需求的。明白了, 那全球的 soc 市场这几年增长的快不快?哪些东西是最主要的推动力?这个市场的规模是从二零二二年的一千五百四十八亿美元,预计会增长到二零三二年的三千二百七十八亿美元,年均的增速在百分之八左右。嗯, 最大的动力肯定还是来自于手机和边缘计算的落地,让终端的本地智能处理能力变得越来越重要。了解了 那端测的智能传感芯片到底有什么独特的本事?端测的智能传感芯片可以说是设备的眼睛、耳朵和脑袋,它不光可以捕捉光线、声音和动作,还可以在本地直接进行降噪和识别分析。 嗯,比如说摄像头可以直接进行人脸检测,然后工业传感器可以当场判断机器是不是有故障,不需要把数据都送到云端去处理。最近这几年,全球的端测智能传感芯片市场有多大? 增长速度又有多快呢?二零二三年的时候,全球的市场规模是四百六十九亿美元,过去几年的年均增速差不多有百分之十。 嗯,然后预计到二零二五年会增长到七百一十亿美元,整个行业是持续在扩张的。哎,那未来这个端侧智能传感芯片会往哪些方向发展?未来的话,它会变得更小型化,功耗会更低,然后集成度会更高,同时它的精度和可能性也会不断的提升。 嗯,并且它会跟 ai 的 结合会更加紧密,能够在本地完成更复杂的分析和判断。好的, 那我们接下来就来进入中游产业链的部分。对,然后我们要关注的第一个话题就是端测 ai 的 市场规模。嗯,我特别想知道二零二三年端测 ai 在 全球的消费设备当中是一个什么样的分布情况?二零二三年的话,端测 ai 全球的消费设备的出货量是两百二十八一台, 然后主要的就是手机、智能家居和 pc、 pad 这三大类产品撑起了整个市场。嗯,其实最早的时候,端测 ai 主要是用在安防和车载领域,但是从二零二三年开始,手机和 pc 也开始全面地引入 ai 的 功能,这就直接带动了整个行业进入了一个高速增长的新阶段。 那中国的端测 ai 市场这几年增长速度有多快?主要的动力是什么?中国的端测 ai 市场其实现在也是在加速扩张,二零二三年的时候市场规模还不到两千亿元,但是预计到二零二八年是会冲到一点九万亿元的,嗯,年均增速高达百分之五十八。 主要的增长动力就是 ai 手机的普及,然后数据中心的快速发展,以及智能驾驶和 a i o t 这些新的应用场景不断地落地。面对这么多新的机会,对于普通的投资者来说,有没有比较省心的方式可以参与到端测 ai 的 这个赛道当中? 其实现在有一个比较简单的方式,就是可以关注一下科创创业人工智能 e t f 景顺代码是幺五九幺四二, 他其实是提前就布局了端测 ai 的 这个蓝海,同时覆盖了整个 ai 产业链的上中下游。那这个基金的历史表现怎么样? 背后的管理团队实力如何?这个基金他跟踪的是科创创业 ai 指数,然后这个指数从二零一九年年底设立以来,年化涨幅是百分之十七点一一, 嗯,是明显跑赢大盘的。然后他背后的管理公司是景顺长城基金,是国内首家中美合资的基金公司,管理规模超过了七千六百亿,非货规模也在行业前十。然后他的基金经理团队平均从业年限是十四年,是非常资深的。 最近大家都在说新一代的 ai 手机,那它到底在架构上面跟传统的手机有什么不一样?新一代的 ai 手机,它其实是采用了一个三层的新架构。嗯,最底下那一层是混合算力的供给,就是它把本地的算力和云端的算力融合在一起, 然后中间这一层是以大模型为核心,最上面这层是由智能体和原生化的服务组成的全新的应用层, 它是完全颠覆了过去那种以芯片加操作系统为基础的老的模式。在国内的这个 ai 手机的市场里面,本地的数据和政策到底带来了哪些独特的变化?中国庞大的数据资源其实是成为了生成式大模型不断训练和优化的核心燃料。嗯, 所以我们本地的 ai 生态是非常有优势的。然后再加上政策上面的一些规定,海外的手机品牌,比如说苹果、三星,他们要想在中国市场提供生城市 ai 的 服务,就必须要跟我们国内有牌照的大模型厂商合作, 这就导致了他们在海内外的 ai 策略是完全分开的,也给了本土的厂商更多的机会。那二零二四年这个 ai 手机的出货量有什么特别之处?二零二四年是 ai 手机真正爆发的一年,出货量是呈现指数级增长的。嗯,这个背后的原因主要有三个,第一个就是芯片的快速迭代, 第二个是用户的场景越来越丰富,第三个是端测大模型的能力越来越强。这三个因素就像三个助推器一样,让 ai 手机从二零二四年开始进入了一个高速扩张的新阶段。 那接下来的几年,全球和中国的 ai 手机市场会扩张到什么规模?全球的 ai 手机出货量预计会从二零二四年的八点二七一台,基本上每两年就会翻一翻。 嗯,中国的话会从二零二四年的零点四亿台增长到二零二七年的一点五亿台,然后到二零二七年的时候,中国会占据全球百分之五十一点九的市场份额, 那个时候 ai 的 功能就会成为手机的一个标配。明白了,那这个 ai 眼镜跟传统的 ai 眼镜相比, 到底在功能和使用体验上面有哪些不同? ai 智能交互眼镜其实更像是一个可以戴在脸上的全能助理,它把相机、眼镜、墨镜和蓝牙耳机的功能全都集合在了一起,但是它又不像 ar 眼镜那样是主要用来看的。嗯,它是主打音频体验的, 论是运动的时候听歌,还是户外导航,或者是开会的时候做笔记,它都能轻松胜任。然后再加上它是这种潮牌的设计,佩戴起来也跟普通眼镜一样轻巧舒适,所以它是真正把科技和时尚融合到了日常生活当中。听起来很有意思。 那二零二四年全球的 ai 眼镜市场在销量和产品类型上面有什么特点?二零二四年全球的 ai 眼镜总共卖了一百五十二万台,其中 revampena 就 卖了一百四十二万台,占据了百分之九十三的市场份额。嗯,产品类型上面的话,带有拍照功能的占到了百分之九十四, 然后 ar 加上 ai 的是百分之四,纯音频的是百分之二,基本上整个行业都是被拍照这个功能所主导的。 那 ar 加 ai 的 这种智能眼镜,未来会遇到什么技术上的难题? ar 加上 ai 是 大家公认的一个未来的方向,因为它一旦加上了显示的功能之后,就可以解锁很多全新的场景。 嗯,但目前的话,它最大的问题就是在光学和算力这两个方面技术还没有完全的成熟,所以短时间内还没有办法做到消费级的普及, 可能还需要再等一段时间了解了。那国内的 ai 眼镜市场现在是什么情况?未来会怎么发展?二零二四年国内的 ai 眼镜销量只占全球的百分之三, 但是像星际、魅族、 m y v u 和 starv 这些本土的企业也是在不断地进行技术创新,积极地去拓展新的应用场景。 嗯,然后随着供应链的调整,二零二五年会有更多的新品实现量产,核心技术上面也没有被落下。全球的市场在接下来几年会有一个什么样的增长?全球的 ai 眼镜市场啊,预计二零二五年会有三百五十万台的销量,比二零二四年增长一点三倍。 嗯,主要是靠 revmate 的 持续热销,还有一些新机型的发布,以及小米、三星这些大厂的加入,然后到二零三零年的话,销量会达到九千万台,市场规模会高达一千三百五十亿元。好的,那我们接下来要聊的就是下游产业链的应用场景了, 端测 ai 现在都在哪些领域落地了,然后未来哪些行业又最有可能率先被它彻底的改变呢?端测 ai 其实已经渗透到很多行业了,像智能手机、智能家电、智能驾驶,还有智能制造、智能安防等等。嗯,它都已经有很广泛的应用了。 那未来的话,医疗健康、零售、教育这几个行业会很有可能因为端侧 ai 的 发展产生一些颠覆性的变化。 ok 吧,那今天我们算是一起梳理了一下端侧 ai 从上游到下游的整个产业链的情况, 然后也看到了这个技术是如何一步一步的改变我们的生活和工作方式的。好了,那这期节目咱们就到这里了,感谢大家的收听。然后咱们下次再见吧,拜拜。拜拜。

今天我们给大家讲一下专测 ai 的 投资机遇以及未来的确定性。首先大家应该知道什么是专测 ai, 专测 ai 就是 将大模型直接装入终端设备,比方说像手机、眼镜、汽车等实现本地实时响应,它解决了延迟、隐私、网络依赖等 痛点,比方说延迟从过去三到五秒已经降低到一秒以内。那么他这个赛道的核心逻辑是什么呢?还是在市场的一个需求爆发? 从二五年的 ai 的 整体的爆发来说,整个全球的规模已经达到了三千亿元左右,预计到二零二九年达到一万以上,但年复合的增长呢达到百分之四十, ai 眼镜这个赛道未来五年的增量可能超过百分之百。第二个就是政策非常强的一个扶持 国家人工智能家的这个行动里面明确给出一个从资金到技术到人才各方面的一个扶持计划,这个地方呢也最高得出五百万元的一个政府补贴。 第三一个就是从场景来说全面爆发。众所周知, ai 手机、智能座舱、 ar 的 眼镜,还有人形机器人等各个领域的需求爆发出来了。 那么普通投资人如何从投资上去把握这个赛道的投资机遇呢?主要是三个方面,第一个是核心的换锂芯片, ai 的 s o c 方面,比方说像瑞星威、恒选科技等等这些呢,企业在核心的算力方面呢,有比较强的一个技术积累。第二个就是 硬件的终端,比方说 ai 演艺的硬件提供上。第三一个就是系统的解决方案提供上,这些企业呢,把软件硬件一体化,像 新元股份绑定了华为等格格大厂,这样的话有比较强的订单的确定性,这对业绩的贡献来说是非常有利的。 总体来说,官司 ai 从二零二五年的元旦到未来持续的爆发,这个赛道容量大、应用广、确定性强,改善和提高普通老百姓参与 ai 的 设备的科技感和获得感。

端测 ai 芯片变格我们依赖云端 ai, 但常困于延迟成本和隐私风险。有没有一种方式让 ai 的 智慧安全地在本地运行?答案就是端测 ai。 下面我们来解析它。 端测 ai 就是 把 ai 大 脑直接装进设备,它反应快、省流量,数据更安全,不再事事求助云端。但这股浪潮是如何兴起的? 观测 ai 的 爆发源于一场芯片革命,产业链上游由四类核心硬件驱动,它们是这场改革的基石。我们首先来看算力芯片, gpu 是 ai 模型的孵化器,其市场规模预计到二零二九年将飙升至两千七百四十二亿美元,英伟达占据绝对主导。那么设备本地的大脑又是什么? 端侧 so c 是 专为本地 ai 设计的全能芯片,它将多个核心组建集于一身,全球市场规模预计十年内翻番。光有大脑还不够数据存呐! 存储芯片是 ai 的 数据仓库,其需求激增正催生一个超级周期。有了计算和存储,设备还需要感知世界,这就需要传感芯片 智能传感芯片是设备的眼睛和耳朵,能采集并初步分析环境信号,其市场正持续走高。当芯片就位,中游的设备市场将如何变更? 芯片技术成熟,引爆了中游设备市场。中国端测 ai 市场规模预计在二零二八年将冲向一点九万亿元,其中 ai 手机是绝对的主力。 ai 手机正以三层新架构重构生态,全球出货量预计三年内翻近三倍,成为 ai 普及的核心在体。除了手机,下一个爆款会是什么? ai 眼镜是下一个风口,定位随身全能助理全球销量预计到二零三零年将突破九千万台。这些终端设备将应用在哪些场景? 端侧 ai 的 应用正渗透到各行各业,从消费电子到自动驾驶,一个万物智能的 ai 家时代正加速到来。最后,我们来总结一下, 从芯片到终端再到应用端,侧 ai 正将智慧带到每个角落。这场变化的核心是让每个终端都成为独立思考的智能体。