960
17
724
83
举报
发布时间:2026-05-28 09:51
查看AI文稿
AI大模型学习
AI大模型学习

粉丝15.1万获赞32.0万

相关视频

  • 昨晚刚录完,DeepSeek V4 预览版今天下午就官宣了! 内容全印证,观点依然有效,看完秒懂训练和推理为什么必须分开~#DeepSeekv4 #华为昇腾 #AI大模型 #国产大模型 #AI未来合伙人
    03:42
    查看AI文稿
  • AI模型的 “训练”和“推理” 是什么意思
    01:29
    查看AI文稿
  • 实测9大国产模型:DeepSeek V4推理能力到底行不行? DeepSeek V4发布后评价两极分化,有人说炸裂,有人说失望。我们选择闭上嘴、上手测。本期视频集合了9款主流国产模型,用一道七年级棋盘的数学推理题进行三轮实测,全程原速录制,不调提示词、不剪辑翻车瞬间。
结果出人意料:DeepSeek Flash和Pro在三轮测试中几乎全对,Flash只翻车一次,两者推理能力并无代差,Flash更快更便宜,完全够日常使用。而价格昂贵的豆包Seed模型,实测单价超139元/百万Token,数倍于对手。Kimi、千问等也暴露出“蒙答案”、输出Token上限导致任务中断等真问题。
耗时的评测、真实的成本、意外的翻车,以及在浮夸环境下DeepSeek那句“不诱于誉,不恐于诽”。所有测试代码与结果已放入粉丝群,关注后自取。你还想看哪个模型的硬核实测?评论区告诉我。
#deepseek #deepseekv4#kimi #minmax #glm
    05:43
    实测9大国产模型:DeepSeek V4推理能力到底行不行? DeepSeek V4发布后评价两极分化,有人说炸裂,有人说失望。我们选择闭上嘴、上手测。本期视频集合了9款主流国产模型,用一道七年级棋盘的数学推理题进行三轮实测,全程原速录制,不调提示词、不剪辑翻车瞬间。
    结果出人意料:DeepSeek Flash和Pro在三轮测试中几乎全对,Flash只翻车一次,两者推理能力并无代差,Flash更快更便宜,完全够日常使用。而价格昂贵的豆包Seed模型,实测单价超139元/百万Token,数倍于对手。Kimi、千问等也暴露出“蒙答案”、输出Token上限导致任务中断等真问题。
    耗时的评测、真实的成本、意外的翻车,以及在浮夸环境下DeepSeek那句“不诱于誉,不恐于诽”。所有测试代码与结果已放入粉丝群,关注后自取。你还想看哪个模型的硬核实测?评论区告诉我。
    #deepseek #deepseekv4#kimi #minmax #glm
    查看AI文稿
  • 10分钟带你解析大模型推理流程! 从流程梳理到训练解析!全程干货~大模型|LLM
#AI #大模型 #大模型应用 #大模型学习 #人工智能
    19:35
    查看AI文稿
  • 模型的推理和训练有什么区别? #ai #人工智能
    00:21
    查看AI文稿
  • 大模型推理服务器 大模型推理服务器,是专门为加载、运行、服务大语言模型(LLM) 并对外提供低延迟、高并发推理服务的专用服务器(硬件 + 软件栈),核心是把训练好的大模型变成可对外响应的 API 服务。一句话总结。大模型推理服务器 = 高性能异构硬件 + LLM 专用推理引擎 + 服务化框架,是让大模型 “能用、好用、稳定用” 的生产级基础设施。
#大模型推理 #服务器 #vLLM
    01:14
    查看AI文稿
  • AMD暴涨背后:AI正在重新需要CPU?苏姿丰看到了什么 AMD过去一年股价大涨,估值也被推到高位。表面看,这是AI热潮下的又一次资本狂欢;但更深层的变化是,AI产业正在从大模型训练走向推理、代理型AI和端侧AI。这个过程中,CPU、GPU协同、小芯片技术、先进封装和全球供应链生态,正在重新决定AI基础设施的竞争格局。本期视频从AMD最新财报、苏姿丰的判断和AI产业变化出发,分析AMD为什么被市场重新定价,以及它能否真正抓住下一阶段的AI机会。
#AMD #人工智能 #AI #CPU #苏姿丰
    18:14
    查看AI文稿
  • 为什么它前面几步都对,后面却突然开始漂? 模型推理最容易翻车的地方,往往不是不会开始,而是没法在很长的链路里一直稳下去。
#科技下一站  #与ai同行  #精准入坑 #大模型课程 #一起学习吧
    06:49
    查看AI文稿
  • **为什么模型“记不住你”?上下文、记忆和参数到底有什么区别 很多人以为模型在长期记住你,其实很多时候,它只是把当前上下文参考得特别像真的记住了你。
#大模型记忆 #模型知识 #大模型课程 #大学生必须知道的信息差 #ai
    06:48
    查看AI文稿
  • 10分钟带你深度解析大模型推理流程!全程干货~大模型|LLM #大模型 #AI #智能体 #人工智能 #干货分享
    09:41
    查看AI文稿
  • 别再硬拼模块了!统一才是最强的 传统机器人模型会看不会想、会想不预判,今天这篇论文,直接把具身智能统一化了。
-
以前模型训练就是感知、推理、世界模型、动作策略分开训练、分开优化,最后靠接口硬连在一起,一复杂就容易出错。
北京人形发布的的Pelican‑Unified具身智能模型把理解、推理、想象、行动整合成一个闭环,一套表征、一起优化。
同一个主干做推理,同一个生成器一边想象未来场景,一边输出机器人动作。
📑 Pelican-Unified 1.0: A Unified Embodied Intelligence Model (UEI) for Understanding, Reasoning, Imagination and Action
#ai新星计划 #搞机的陈序员 #青年创作者扶持计划
    00:47
    查看AI文稿
  • 别再被骗了!算力最大风口,根本不是大模型训练 算力真正的暴利赛道,90%人都搞错了#算力 #大模型 #Ai科技 #商业布局
    02:00
    查看AI文稿
  • 速通具身毕业论文!LeRobot+LingBot-VLA 蚂蚁灵波开源的具身智能基座大模型LingBot-VLA
后训练+真机推理全流程:SO ARM 101机械臂组装、校准。获取端口号、连接摄像头、遥操作、录制示教数据集、选择VLA预训练模型、后训练微调、仿真验证、开环验证、真机推理
#机器人 #具身智能 #VLA #蚂蚁灵波 #lerobot
    08:46
    查看AI文稿
  • AI模型训练和推理的关系
    05:47
    查看AI文稿
  • 训练推理 构建应用
#科普 #训练 #推理 #构建 #应用
    01:09
    查看AI文稿
  • AI概念科普:学习框架vs推理引擎 #学习框架 和#推理引擎  是#AI大模型 训练和推理必不可少的工具。在模型训练时,学习框架调用训练/测试数据以完成模型的训练;模型训练好后,工程师完成模型的分发并通过推理引擎将模型运行起来,用户通过API调用模型并完成特定的任务。常见的学习框架包括#Pytorch #Tensorflow ,推理引擎包括#vLLM#SGLang等。
    01:36
    查看AI文稿
  • OpenAI 负责人称 AI 刚跨过一道坎 这具体意味着什么 OpenAI的AI,刚刚跨过了一道什么坎?就在几天前,OpenAI后训练负责人告诉我们:AI并没有突然变强,只是刚刚跨过一道坎。这句话,究竟意味着什么? #后训练对齐   #推理模型突破   #AI安全门槛
    02:48
    查看AI文稿