7
3
3
分享
举报
发布时间:2026-03-14 11:22
AI大模型杰睿
AI大模型杰睿

粉丝1256获赞1.0万

相关视频

  • 20260312 直播回放-深度学习第一课 @教AI的陶老师🍫 20260312 直播回放-深度学习第一课:
01.03 认识深度学习
13.35 深度学习解决问题的步骤
18.21 #模型的训练 过程
30.53 #损失函数 的作用和类型
35.24 #梯度下降 
40.37 #激活函数 
#深度学习入门
    43:45
    查看AI文稿
  • 1-解释LLaMA的RMSNorm和SwiGLU激活函数改进 #大模型#ai#互联网大厂#大模型面试题#Transformer
    04:54
    查看AI文稿
  • Sigmoid vs SiLU 。 保安大爷 vs 大厂职员 有没有想过:
为什么二分类最后一定要 Sigmoid,Transformer 却偏爱 SiLU/Swish?
今天把激活函数写成“打工人”:门口当保安负责放行(0~1 概率),公司里当职员负责搬运信息(既保幅值又软门控)。#sigmoid #激活函数 #activation #transformer神经网络架构 #人工智能技术
    05:51
    查看AI文稿
  • 原来音频Transformer断定每帧都是周期函数 #手撕AI大模型
    08:58
    查看AI文稿
  • Transformer的FFN 在干嘛?用一颗西瓜算到最后 Transformer 的 FFN 只是“过个 SiLU”?这期我拿一颗西瓜做例子,把 FFN:up → SiLU → down 从输入 x 开始一路算到输出 y,让你亲眼看到模型到底在更新什么。
我们用 5 个“摊位能看到”的粗特征(外皮颜色/敲声/重量/瓜脐/瓜蒂),先升维成 8 个内部判断(甜度、成熟度、水分、沙感、皮厚、裂瓤风险、新鲜度、性价比),再用 SiLU 这个“软阀门”温柔放大/压制,最后回到 5 维看增量:
✅ 重量被强化(+0.166)
❌ 敲声被负向更新(-0.116)
↩️ 瓜蒂被轻微回调(+0.091)
…以及 瓜脐几乎不动(+0.027)#transformer神经网络架构 #前馈神经网络 #激活函数  #前馈机制 #人工智能
    10:44
    Transformer的FFN 在干嘛?用一颗西瓜算到最后 Transformer 的 FFN 只是“过个 SiLU”?这期我拿一颗西瓜做例子,把 FFN:up → SiLU → down 从输入 x 开始一路算到输出 y,让你亲眼看到模型到底在更新什么。
    我们用 5 个“摊位能看到”的粗特征(外皮颜色/敲声/重量/瓜脐/瓜蒂),先升维成 8 个内部判断(甜度、成熟度、水分、沙感、皮厚、裂瓤风险、新鲜度、性价比),再用 SiLU 这个“软阀门”温柔放大/压制,最后回到 5 维看增量:
    ✅ 重量被强化(+0.166)
    ❌ 敲声被负向更新(-0.116)
    ↩️ 瓜蒂被轻微回调(+0.091)
    …以及 瓜脐几乎不动(+0.027)#transformer神经网络架构 #前馈神经网络 #激活函数 #前馈机制 #人工智能
    查看AI文稿
  • 大模型激活函数第二讲 #大模型#人工智能 #跟我一起学习 #面试
    03:24
    查看AI文稿
  • 90%的人都不懂!现代大模型的激活函数,到底强在哪? #大模型技术#计算机#人工智能 #机器人 #编程
    03:48
    查看AI文稿
  • 大模型激活函数第三讲 | 算法岗面试必背,看完直接拿捏 #大模型#人工智能#求职 #面试官 #程序员
    05:51
    查看AI文稿
  • 【第 169 集】别再死磕纯理论创新了!🤯 现在的顶会趋势就是“缝合”——用Transformer去激活HMM(内部缝合),用CV的方法解决NLP的问题(外部缝合)。 #人工智能 #论文写作 #NeurIPS #深度学习 #HMM
    01:21
    查看AI文稿
  • Relu激活函数的铁拳 你以为Relu激活函数就这么简单?结合到深度神经网络中,再加上浓郁的八股味,你就会体验到什么是真正的铁拳了,一起来接受铁拳吧!#深度学习 #ai面试
    06:00
    查看AI文稿
  • SwiGLU 就是“挑西瓜”:重量、声音、瓜蒂,谁更可信? 今天用西瓜讲透 SwiGLU:内容分支负责“我想说什么”,门控分支负责“我信不信、说多大声”。同一套门控矩阵,换一颗瓜策略立刻变:瓜蒂新鲜时声音权重暴涨,瓜蒂干瘪时声音直接被压制。 #SwiGLU #transformer神经网络架构 #attention #激活函数 #门控架构
    08:29
    查看AI文稿
  • 跟着AI闲谈小馆学大模型:激活函数总结与历史,从入门到精通 #大模型 #人工智能 #学习AI #每天进步一点点 #求职
    04:26
    查看AI文稿
  • GPT模型核心代码解读 #GPT模型 #Transformer模型 #ChatGPT #代码 #python
    01:33
    查看AI文稿