00:00 / 00:12
连播
清屏
智能
倍速
点赞15
00:00 / 09:33
连播
清屏
智能
倍速
点赞4
00:00 / 09:00
连播
清屏
智能
倍速
点赞33
《Gemini 3 技术深度解析:架构、性能与生态应用》 #Gemini3 #人工智能 #谷歌模型 #多模态 #技术创新 本次视频主要对谷歌最新发布的人工智能模型 Gemini 3 进行介绍,涵盖其测评成绩、发展历程、技术架构、多模态输入、性能表现、应用场景、训练设施、产品生态等方面,并与其他顶尖模型进行对比,对其未来发展作出展望: 1、Gemini 3 基准测试成绩:被称为世界上最好的多模态理解模型,在推理能力、多模态理解和智能编码方面取得突破性进展。在各项权威基准测试中霸榜,如在 LM Arena 测试中得 1500 分,远超其他顶尖大模型。在 humanities exam(HLE)博士级推理、GPQA 科学问答、AGI two 人工智能新标准测试中,均表现出色,正确率高,得分远超其他模型,接近人类推理水平。 2、发展历程:从实现文本、语音、图像混合输入,理解动态内容,到探索 AI agent 能力,再到引入深度推理架构 DeepSeek,实现真正的深度推理,并引入思维签名、思维等级等机制,支持 100 万的上下文推理长度。 3、技术架构 编码层优化:采用 5:1 的局部与全局注意力交替配置策略,引入 GQA、RMSNorm、QK-norm 等规范化技术,提高训练稳定性、处理速度和准确性。 上下文处理突破:通过架构优化,实现 100 万的上下文长度和 64 TOKEN 的输出效果,各蒸馏模型表现良好,不同规模模型适用于不同场景。 多塔式架构:支持文本、语音、音频、视频和 PDF 混合输入,各模态在独立塔中专业化处理后在推理层融合,提高多模态理解能力。 4、DeepThink 架构创新 思维签名:API 返回结果包含加密推理过程信息包,确保长链路推理的可追溯性和一致性,对高可信度场景意义重大。 思维等级:开发者可根据任务设置模型思考时间,平衡速度和精度,提高系统效率。开启 DeepThink 后,各项测试成绩提升显著。分层推理、动态推理、缓存中间结果、量化推理输出等机制提升了推理性能。 多模态能力及应用场景:具备文本理解、视觉理解、音频处理、视频理解能力,可应用于文档分析、图像理解、语音助手、视频摘要等多个场景。 5、训练基础设施:采用谷歌自研第六代 Trilion TPU 芯片,在峰值运算、单芯片算力、容量带宽、功耗等方面有重大技术突破。
00:00 / 22:38
连播
清屏
智能
倍速
点赞36
00:00 / 27:18
连播
清屏
智能
倍速
点赞6
00:00 / 05:32
连播
清屏
智能
倍速
点赞6
@ 在昨晚美沙投资论坛上,马斯克与黄仁勋并肩而坐。一位是梦想改变人类生存轨迹的“硅谷钢铁侠”,另一位是手握AI算力命脉的“芯片教主”。 当马斯克大胆预测“货币将变得无关紧要”时,黄仁勋却打趣回应:“钱真没用的时候,记得提前通知我一声!”两位大佬由此展开关于未来的对话。 马斯克预计“未来工作将变成一种选择,就像人们打游戏或体育运动那样。” 与此相对,黄仁勋认为,“几乎所有人的工作形式都会发生变化……但我们不会因为AI而无事可做,反而可能更加忙碌。” 马斯克认为,AI和人形机器人将真正消除贫困:“人们经常谈论要消除贫困之类的宏大目标。问题是,这些话我们已经听了多久了?” 他指出,多年来很多组织试图解决这些问题但成效甚微,而AI和机器人能够实现这一目标。 黄仁勋则通过放射科医生的实际例子说明了AI的“近因效应”:AI并没有取代放射科医生,反而让他们需求增加。 “AI把图像分析这部分做得更快、更准了,于是医生就可以看更多图像、更多种类的影像,有更多时间和病人沟通。” …… 马斯克与黄仁勋的对话揭示了AI未来的双重图景:马斯克畅想工作成为选择的乌托邦,黄仁勋则预见AI将催生更忙碌的时代。这场“争吵”实为理想与现实的互补——一个仰望星空,一个脚踏实地。在算力争夺的喧嚣下,真正的变革或许正在太空AI与能源革命中悄然孕育。 #马斯克对话黄仁勋 #文案自创 #图片来源于网络上无标注图片
00:00 / 00:12
连播
清屏
智能
倍速
点赞3
你们还记得之前被GPT系列霸屏的日子吗?现在不一样了,谷歌刚发布的Gemini 3 Pro直接上演“王者归来”,把GPT 5.1按在了榜单下面,这背后藏着的财经逻辑,关系到整个AI行业的钱袋子! 先给大家扒扒这份硬核成绩单:在LMArena大模型竞技场,Gemini 3 Pro拿下一千五百零一分的高分登顶,是首个突破一千五百分的模型。更夸张的是数学和多模态能力,美国数学邀请赛配合代码执行准确率直接100%,屏幕理解测试得分七十二点七个百分点,而GPT 5.1才三点五个百分点,近乎二十倍的差距!连马斯克和奥特曼都忍不住在推特上夸它强,这可不是随便说说的。 而且不止谷歌,咱们国内巨头也不甘示弱。2025年三季度Hugging Face全球开源模型榜单里,阿里通义一下子有七款模型冲进前十,旗下Qwen2.5-VL在十三项权威视觉评测中夺冠,全面超越GPT-4o与Claude3.5。 为啥巨头能突然逆袭?核心就是“场景在手,天下我有”!AI再厉害,不能落地赚钱就是空谈。先看谷歌的实战答卷:2025年三季度谷歌净利润同比增长近三十三个百分点,AI正是最大功臣。Gemini模型全面植入搜索、YouTube、云服务等核心业务,让搜索广告的AI Max功能帮广告商转化率提升十四个百分点。更m现在Gemini应用月活用户超六点五亿,这种自带的海量场景,创业公司根本比不了。 可另一边,明星AI创业公司却还在“烧钱换流量”。就说很火的编程工具Cursor,虽然年化营收早就超过五亿美元,但其实是负毛利率,靠烧钱维持运营。连行业顶流OpenAI,至今也没摆脱亏损的命运,说白了就是模型能力再强,找不到稳定赚钱的落地场景,终究是空中楼阁。 听到这可能有朋友要问:创业公司难道就没机会了?当然不是,但思路得变了!以前比拼模型参数、刷榜单就能融资的时代过去了,现在拼的是“AI+场景”的硬实力。阿里通义已经深入金融、电力、教育等多个领域,和国家电网、招商银行等展开深度合作;谷歌则通过AI重构广告、搜索、云服务的核心逻辑,让技术直接变成真金白银。这些案例都说明,AI的价值最终要靠行业落地来兑现。 #gemini3 #ai创业公司 #ai应用场景 #ai应用概念股 #阿里巴巴股票
00:00 / 03:50
连播
清屏
智能
倍速
点赞18
00:00 / 08:32
连播
清屏
智能
倍速
点赞10
《震撼!谷歌Gemini 3全面剖析,AI发展迎来新变革?》 #Gemini3 #人工智能 #谷歌模型 #多模态 #技术创新 本次视频主要对谷歌最新发布的人工智能模型 Gemini 3 进行介绍,涵盖其测评成绩、发展历程、技术架构、多模态输入、性能表现、应用场景、训练设施、产品生态等方面,并与其他顶尖模型进行对比,对其未来发展作出展望: 1、Gemini 3 基准测试成绩:被称为世界上最好的多模态理解模型,在推理能力、多模态理解和智能编码方面取得突破性进展。在各项权威基准测试中霸榜,如在 LM Arena 测试中得 1500 分,远超其他顶尖大模型。在 humanities exam(HLE)博士级推理、GPQA 科学问答、AGI two 人工智能新标准测试中,均表现出色,正确率高,得分远超其他模型,接近人类推理水平。 2、发展历程:从实现文本、语音、图像混合输入,理解动态内容,到探索 AI agent 能力,再到引入深度推理架构 DeepSeek,实现真正的深度推理,并引入思维签名、思维等级等机制,支持 100 万的上下文推理长度。 3、技术架构 编码层优化:采用 5:1 的局部与全局注意力交替配置策略,引入 GQA、RMSNorm、QK-norm 等规范化技术,提高训练稳定性、处理速度和准确性。 上下文处理突破:通过架构优化,实现 100 万的上下文长度和 64 TOKEN 的输出效果,各蒸馏模型表现良好,不同规模模型适用于不同场景。 多塔式架构:支持文本、语音、音频、视频和 PDF 混合输入,各模态在独立塔中专业化处理后在推理层融合,提高多模态理解能力。 4、DeepThink 架构创新 思维签名:API 返回结果包含加密推理过程信息包,确保长链路推理的可追溯性和一致性,对高可信度场景意义重大。 思维等级:开发者可根据任务设置模型思考时间,平衡速度和精度,提高系统效率。开启 DeepThink 后,各项测试成绩提升显著。分层推理、动态推理、缓存中间结果、量化推理输出等机制提升了推理性能。 多模态能力及应用场景:具备文本理解、视觉理解、音频处理、视频理解能力,可应用于文档分析、图像理解、语音助手、视频摘要等多个场景。 5、训练基础设施:采用谷歌自研第六代 Trilion TPU 芯片,在峰值运算、单芯片算力、容量带宽、功耗等方面有重大技术突破。
00:00 / 22:38
连播
清屏
智能
倍速
点赞29