Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
AI抖音
探索
直播
放映厅
短剧
搜索
您是不是在找:
公共汽车用俄语怎么说
grab food是什么意思
冬天会下大雪吗英文
英文单词中哪个词是用法语
英语写自己在什么学校该怎么写
李诗婷的英文名怎么写
啃臭英文啥意思
神仙流利说的英语是什么
充电器拿来的英语怎么说
越南语声母表和韵母表挂图
LLM张老师学堂
1年前
谁都能听懂的Transformer #大模型 #transformer神经网络架构 #ai基础教程
00:00 / 03:39
连播
清屏
智能
倍速
点赞
4041
就是Iris
6月前
通俗拆解人工智能领域的革命性架构Transformer #人工智能 #大模型 #机器学习 #知识科普
00:00 / 02:05
连播
清屏
智能
倍速
点赞
473
AI大模型Agent
4月前
30分钟让你全面理解Transformer,建议收藏! 别样感受。在知识的殿堂里,邂逅经典论文《Attentionls Al You Need》 —《Attention is all you need》论文解读及Transformer架构详细介绍 #大模型 #transformer神经网络架构 #人工智能 #AI #深度学习
00:00 / 34:18
连播
清屏
智能
倍速
点赞
119
埋头苦读
6月前
何恺明LeCun暴击Transformer命门! Transformer已经提出很久,但是针对于Transformer结构上的改进一直在进行。 近期何恺明、Yann LeCun联手发表的论文提出Transformer架构可以彻底舍去LN层,仅用9行代码就实现动态双曲正切、无需归一化的Transformer!这点可以看出,直到今天针对于Transformer结构的改进仍然具有创新点可探究。针对Transformer各方面的改进仍是一个不错的研究方向。#transformer神经网络架构 #神经网络 #人工智能 #大模型 #论文
00:00 / 00:36
连播
清屏
智能
倍速
点赞
393
AI工程师阿文(资源简介自取)
1年前
一个简单的例子带你理解什么是transformer#人工智能 #机器学习 #深度学习 #知识前沿派对 #transformer
00:00 / 01:29
连播
清屏
智能
倍速
点赞
441
教AI的陶老师🍫
2年前
#Transformer 的“老母亲”#RNN#循环神经网络 #深度学习 #机器学习#机器学习入门 #人工智能 #人工智能入门
00:00 / 05:44
连播
清屏
智能
倍速
点赞
2571
ReadPaper论文阅读
3年前
Transformer为什么会比CNN好?微软认知服务首席研究经理袁路老师分享对于Transformer和CNN的异同、优劣的看法。#沈向洋带你读论文 #科研 #readpaper #论文
00:00 / 07:33
连播
清屏
智能
倍速
点赞
138
论文搬砖学长
1年前
一觉醒来Transformer和Mamba都被超越了! 超越Transformer和Mamba的新架构,刚刚诞生了。斯坦福UCSD等机构研究者提出的TTT方法,直接替代了注意力机制,语言模型方法从此或将彻底改变。 #transformer #mamba #TTT #马拉ai #马拉火车
00:00 / 01:49
连播
清屏
智能
倍速
点赞
335
LLM张老师学堂
1年前
进入注意力机制前,先跟我一起过概念 #transformer神经网络架构
00:00 / 06:58
连播
清屏
智能
倍速
点赞
832
葡萄-论文指导
2月前
一天一个计算机sci发文风口:Transformer 👉近期何恺明、Yann LeCun联手发表的论文提出Transformer架构可以彻底舍去LN层,仅用9行代码就实现动态双曲正切、无需归一化的Transformer!这点可以看出,直到今天针对于Transformer结构的改进仍然具有创新点可探究。针对Transformer各方面的改进仍是一个不错的研究方向。#Transformer#人工智能#深度学习#大模型#sci
00:00 / 00:25
连播
清屏
智能
倍速
点赞
51
龙哥紫貂智能
7月前
transformer真不用归一化啦? 何凯明、刘壮、杨立坤带队 提出DyT,已入选CVPR2025
00:00 / 00:50
连播
清屏
智能
倍速
点赞
314
xAI
1年前
transformer位置编码 Transformer论文中提出了使用一种叫做 Positional Encoding(位置编码) 的技术。这种技术通过为每个单词添加一个额外的编码来表示它在序列中的位置,这样模型就能够理解单词在序列中的相对位置。#人工智能 #chatgpt应用领域 #transformer #ai#位置编码
00:00 / 00:08
连播
清屏
智能
倍速
点赞
64
liunx
2年前
大语言模型现在之所以有突破性进展,本质上就是Transformer提出后,借助encoder和decoder,能实现文字和数字向量的相互转换,把语言问题变成了数学问题。 #懂得人自然能看懂 #一张图告诉你 #这一刻动漫照进了现实 #用最幼稚的动画片讲出最真实的道理 #滑走你就草率了
00:00 / 00:11
连播
清屏
智能
倍速
点赞
265
深蓝学院学术分享站
1年前
KAN取代transformer中的MLP层 在这项工作中,我们引入了 Kolmogorov-Arnold Transformer (KAT),这是一种新颖的架构,成功地将 Kolmogorov-Arnold 网络 (KAN) 集成到 Transformer 中,解决了与大规模训练场景相关的关键挑战。我们提出的 Group-Rational KAN (GR-KAN) 变体,具有合理的激活函数、基于组的参数共享和方差保留初始化,在计算效率和可扩展性方面表现出显著的改进。#大模型 #人工智能 #Transformer #多层感知器 #激活函数
00:00 / 01:33
连播
清屏
智能
倍速
点赞
136
死磕A论文I女算法
2年前
CNN+Transformer,字节提出下一代视觉Transformer#人工智能 #论文 #人工智能论文 #Transformer #CNN
00:00 / 00:20
连播
清屏
智能
倍速
点赞
1572
龙哥紫貂智能
3月前
谷歌提出MOR 让每个token有不同的 transformer层数 实现按需计算
00:00 / 00:48
连播
清屏
智能
倍速
点赞
127
机器之心
10月前
Tokenization不存在了? 来自 Meta 、芝加哥大学等机构的合著论文《 Byte Latent Transformer: Patches Scale Better Than Tokens 》火了,在 Hacker News 上受到广泛讨论。 该研究提出了一种新的 LLM 思想。#机器之心主编说 #Meta #Tokenizer #Tokenization #论文 #趋势 #AI #人工智能 #科技 #前沿科技
00:00 / 00:50
连播
清屏
智能
倍速
点赞
173
龙哥紫貂智能
3月前
Grok4发布后,大力出奇迹也基本到头 都在寻找token效率更高的算法 能量模型+transformer结合来啦 斯坦福和哈佛联合提出EBT
00:00 / 00:52
连播
清屏
智能
倍速
点赞
137
XAI
3月前
Transformer架构详解:从机器翻译到大模型基石 #人工智能 #数学 #科普 #AI #深度学习
00:00 / 12:12
连播
清屏
智能
倍速
点赞
154
龙哥紫貂智能
4月前
上海AI Lab周伯文团队 提出傅里叶位置编码FoPE 大幅提升Transformer长文本泛化能力
00:00 / 00:44
连播
清屏
智能
倍速
点赞
191
悦龙居
7月前
在AI领域Transformer为什么这么火?#transformer #人工智能 #机器学习 #深度学习 #计算机视觉
00:00 / 01:21
连播
清屏
智能
倍速
点赞
72
小翼 Max
10月前
《66号文件》 要技术有技术,要朋友有朋友,这便是当今“不惹事,也不怕事”的中国。 #国际会议 #国际民航组织 #当代中国青年 #国际化人才 #大国外交风范
00:00 / 01:20
连播
清屏
智能
倍速
点赞
NaN
刘三姨啊
7月前
这个臭不可闻的电影,却拥有世界上最香的名字? #抖音创作季 #人物故事 #电影 #电影解说 #文化
00:00 / 01:24
连播
清屏
智能
倍速
点赞
NaN
欢喜大弟
5月前
当下AI的能力边界 个人倾向于Transformer架构所释放的红利已经接近尾声了,我们即将迎来一个技术上的瓶颈期。对于咱们普通人来说,战线就没必要拉得那么长,我们就先聚焦于一个你熟悉的垂直细分领域,基于一个差异化的小切口去搭建AI智能体。
00:00 / 09:42
连播
清屏
智能
倍速
点赞
41
帧间症候群
2月前
被遗忘的火车合体?最初的新干线!雷电的起源与演变 被遗忘的火车合体?最初的新干线!雷电的起源与演变秘闻 1万1000字【彻底了解雷电(上)】真实与机器人 变形金刚 G1 头领战士 合体金刚 大力神 挖地虎飞车队#变形金刚 #童年动画
00:00 / 35:29
连播
清屏
智能
倍速
点赞
982
唐山大兄(唐万亿)
4月前
究竟该由谁举证,聂圣哲还是唐山大兄 在我发出“唐山大兄20问聂圣哲”之后,聂圣哲始终不敢正面回应,他和他的拥趸提出的“谁质疑谁举证”其实已经让很多人控制不住的笑出声儿来,但是我们并没有急于反驳,而是让这种愚蠢的声音在他们那群人当中形成共鸣广泛传播,再一次回应击溃所有,有理有据有策略地支持@抖音小助手 抖音平台打击“劣迹艺人”不但封杀,还要讲清楚他们为什么错,今天是打脸聂圣哲驳斥其错误言论的第一期#唐山大兄20问聂圣哲 #唐万亿专治聂百亿
00:00 / 11:48
连播
清屏
智能
倍速
点赞
NaN
AI灵魂拷问
4月前
Transformer的前馈神经网络#AI #NLP #人工智能 #AI科普 #大模型
00:00 / 02:20
连播
清屏
智能
倍速
点赞
7
小贝莫愁
3月前
这本是近期我看过的文里面最对我胃口的!我是很喜欢这种设定的,就喜欢看男人们修罗场扯头花,女主人格魅力十足我也喜欢啊,搁谁身上都得迷糊!!#小说 #推文 #女生 #炒鸡好看小说 #文荒推荐
00:00 / 01:13
连播
清屏
智能
倍速
点赞
1410
陈默呀
6月前
雷军说小米汽车最初提出的目标就是媲美保时捷和特斯拉,打造世界第一的汽车,这就是小米和其他传统车厂不一样的地方!#大学生第一视角看雷军 #一口气起底雷军 #雷军给武大学生颁奖学金时发言 #真诚才是雷军的必杀技
00:00 / 03:05
连播
清屏
智能
倍速
点赞
3525
泌外陈博
3月前
被误解的潮吹(二)研究历史!#女性健康 #科普 #医生 #辑哥 #涨知识
00:00 / 01:03
连播
清屏
智能
倍速
点赞
6096
量子位
6月前
AI版《猫和老鼠》看呆网友!1分钟一镜到底无后期无拼接 AI版《猫和老鼠》,以假乱真骗过网友!不仅一次性生成时长能长达1分钟,而且全程无后期无拼接,表情、动作、剧情、一致性全都可圈可点,背后的关键在于引入TTT层(Test-Time Training)。这项来自NVIDIA、斯坦福、UC伯克利等团队的研究,已被CVPR 2025收录。#AI在抖音 #视频生成 #CVPR #AI视频 #猫和老鼠
00:00 / 01:19
连播
清屏
智能
倍速
点赞
467
小玛姐姐sub
2月前
确认关系-我和先生是谁先提出的? #情感 #故事分享 #亲身经历 #小玛姐姐 #玛友会 @小玛姐姐小助理
00:00 / 06:03
连播
清屏
智能
倍速
点赞
1183
泽良的灵树AI之旅
3月前
AI+MCP颠覆传统软件! 泽良先说一个暴论:未来不做MCP的传统软件,都会被边缘化! MCP,即模型上下文协议(Model Context Protocol)是一种由 Anthropic 于 2024 年底提出的开放标准协议,旨在让AI模型能够方便、安全地连接到各种外部数据源和工具。 简单来说,MCP为AI模型提供了一个类似“USB接口”式的通用连接方式,可以让LLM大语言模型调用第三方工具和软件。 人类访问网站需要HTTP协议;而大模型访问外部工具则需要MCP。行业在这一点达成共识的速度非常之快。 首先是OpenAI宣布兼容MCP、Google、微软先后宣布兼容MCP,国内的字节、百度、阿里也都开始拥抱MCP,为什么? MCP是是一种让人工智能读懂软件的方式,比人类去读懂软件更简单。因为人类才需要GUI用户视觉界面,需要看到、点击、反馈,而AI只需要上下文就够了。 只需要一些上下文语境,以及包含在语境当中的“接口”,AI就可以实现上传、下达,不辱使命。 在未来,所有软件、本地的,云端的软件,都要mcp化。都要开放API,去给大模型LLM去调用。 而传统软件,要么消亡,要么MCP化,变成可被大模型所调用的工具,即成为智能体。 第一点原因,软件AI化之后,原本复杂的操作,可以有更简单的交互界面,服务更多的用户; 第二点原因,是可以顺带把客户在这个细分场景下的所有需求,都通过更简单的操作来完成。 互联网的历史上,总是简单软件的替换复杂的;效率高的,替换效率低的产品。因此,任何没有MCP化,耽误AI主动调用你的传统软件,都将被边缘化! #人工智能 #MCP #Agent #OpenAI
00:00 / 02:22
连播
清屏
智能
倍速
点赞
7
菲菲历史
3年前
#历史故事#历史影像
00:00 / 08:44
连播
清屏
智能
倍速
点赞
NaN
林中兽
2月前
斩虎团队再添一位大将#斩虍 #斩虍专属二创 #抽象PK观察员 #抽象PK名场面 @斩虍
00:00 / 00:29
连播
清屏
智能
倍速
点赞
NaN
元宝游戏解说
9月前
超级弱小的变形金刚的超进化#变形金刚 #单机游戏 #steam游戏 #游戏
00:00 / 02:38
连播
清屏
智能
倍速
点赞
670
慕仔影视
1年前
浙江小伙发明灭火爆弹,号称灭火速度碾压一切灭火器#我爱发明 #发明
00:00 / 03:11
连播
清屏
智能
倍速
点赞
NaN
二老鲁
1年前
泼上帝一脸咖啡#泼咖啡
00:00 / 02:24
连播
清屏
智能
倍速
点赞
NaN
Y时筱
1年前
#高甜来袭 满满家属感 大型修罗场#张一山 #张慧雯 #因为一个片段看了整部剧 #谁的综艺dna动了
00:00 / 03:22
连播
清屏
智能
倍速
点赞
3493
熊猫来了
4月前
笑话!边界问题还轮不到你指手画脚吧!#军事#搞笑#祖国万岁
00:00 / 01:47
连播
清屏
智能
倍速
点赞
NaN
云汐影视
7月前
兄弟如手足07:男人买下破产饲料厂谁知成了亿万富翁#老剧回看 #好剧推荐
00:00 / 12:50
连播
清屏
智能
倍速
点赞
1705
小凤短剧
6月前
热播短剧《逆命为光白月光觉醒计划》女人重到十八岁,重生到儿子表白现场,看到恋爱脑儿子,女人决定先拯救恋爱脑儿子,避免他身败名裂#热门短剧推荐
00:00 / 20:00
连播
清屏
智能
倍速
点赞
401
魔术师艾尼瓦尔
4月前
感谢大家的支持 #正能量
00:00 / 01:17
连播
清屏
智能
倍速
点赞
3643
火焰说剧
11月前
黄玲终于反击了,为了不让外甥侄子住在家里,她当着婆婆的面要和丈夫庄超英离婚#小巷人家 #闫妮 #蒋欣 #李光洁
00:00 / 02:42
连播
清屏
智能
倍速
点赞
NaN
篮球记者贾磊
5月前
曾凡博摔伤后完全昏迷山西主场竟然没有急救的医生 曾凡博摔伤后完全昏迷,山西主场竟然没有急救的医生这引起了北京队工作人员的不满,无奈之下曾凡博被送往了医院。#曾凡博 #曾凡博受伤 #北京男篮 #刘传兴 #北京男篮vs山西男篮
00:00 / 00:38
连播
清屏
智能
倍速
点赞
NaN
小猫有点困˶ー`֊´ー˶
3月前
依旧沦陷 有个大妈真的凭一己之力破坏了直播的氛围 #蛋宰 #野悠 #宰熊 #连麦 #蛋宰cp
00:00 / 15:18
连播
清屏
智能
倍速
点赞
1843
ai阿瑟资料院
10月前
Transformer+小波变换热上加热绝对还能发更多顶会 Transformer在顶级学术会议中始终是一个热点研究领域,无论是其自身的优化还是与其他技术的结合。在ECCV 2024上,一篇引人注目的论文提出了一种将Transformer和小波变换结合起来的新架构,这一架构在识别空间频率模式方面效果显著,性能超越了现有的SNN。 这种结合之所以成功,是因为它发挥了小波变换在多尺度分析上的优势,增强了Transformer处理信号和图像数据的能力#跟我学AI #神经网络 #人工智能 #机器学习 #注意力机制
00:00 / 00:07
连播
清屏
智能
倍速
点赞
61
量子位
5月前
21世纪最具影响力论文揭晓!AI独占四席 ResNet登顶 Nature发布21世纪最具影响力论文榜!AI 论文占四席,ResNet 登顶,Transformer、Random Forest、AlexNet纷纷上榜。AI 论文除了具有天然引用优势,更是开源与实用性加持。上榜论文揭示学术新趋势:方法、工具类论文正成引用 “黑马”!#ai在抖音 #nature #论文 #引用 #transformer神经网络架构
00:00 / 02:39
连播
清屏
智能
倍速
点赞
7660
魔吒AI
1年前
大模型最强架构TTT问世,秒杀Transformer? #大模型 #transformer神经网络架构 #aigc #数字人 #人工智能 @魔吒AI数字人实体
00:00 / 00:50
连播
清屏
智能
倍速
点赞
16
Eric_
4月前
第一节 AI系统学习#大规模语言模型 书本📚 《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》 #深度学习算法#人工智能 #AI
00:00 / 13:40
连播
清屏
智能
倍速
点赞
461
人工智能论文搬砖学姐
11月前
揭示Transformer重要缺陷!傅里叶分析成为发文新热点 #傅里叶分析 #transformer
00:00 / 00:35
连播
清屏
智能
倍速
点赞
218
方块哥游戏解说
2月前
我的世界:杰杰麦琪变形金刚超能服装大作战#游戏内容风向标 #我的世界 #我的世界中国版 #我的世界试炼传说#游戏解说
00:00 / 05:30
连播
清屏
智能
倍速
点赞
3430
唐宇迪教你学AI
2年前
Transformer作为热门模块能做那些项目呢?#transformers #人工智能 #计算机技术
00:00 / 01:21
连播
清屏
智能
倍速
点赞
41
秦老司
2年前
Transformer #人工智能 #自然语言处理 #深度学习 #语音识别 #鸡你太美
00:00 / 06:27
连播
清屏
智能
倍速
点赞
1159
Ai算法工程师Power
3月前
CV 圈谁最能打?当然是 Swin Transformer CV 圈顶流 Swin Transformer 的原理有多绝?#Swin#机器学习 #神经网络 #深度学习 #计算机视觉
00:00 / 08:28
连播
清屏
智能
倍速
点赞
983
论文搬砖学长
1年前
时间序列+Transformer! iTransformer是重新审视Transformer结构后提出的时间序列预测基础,采用注意力机制进行多元相关性分析,并采用前馈网络进行序列表示。#人工智能 #transformer #时间序列 #注意力机制 #ai
00:00 / 01:14
连播
清屏
智能
倍速
点赞
91
汽车之家原创
6月前
特斯拉FSD到底行不行? 智驾、泊车、座舱,关于 FSD 以及焕新特斯拉 Model Y 智能水平的一切,《智检报告》一期都讲明白!#fsd #特斯拉 #特斯拉降价 #特斯拉modely #智驾
00:00 / 21:22
连播
清屏
智能
倍速
点赞
702
点➕号关注🉑抢
8月前
DeepSeek在Transformer架构的基础上进行了创新,提出了多头潜在注意力(MLA),显著降低了推理显存的消耗,提升了推理效率。
00:00 / 01:19
连播
清屏
智能
倍速
点赞
13
人工智能论文搬砖学姐
3年前
视觉Transformer背后的关键,清华&Meta提出HoNet:用递归门控卷积进行高阶空间和相互作用(原文和代码)#人工智能论文 #人工智能 #论文 #Transformer
00:00 / 00:25
连播
清屏
智能
倍速
点赞
1050
不读500篇AI论文不罢休的蒂普榭尔
1年前
清华大学提出Transformer新SOTA 更适合应用于时间序列#人工智能 #清华大学 #transformer #时间序列 #深度学习
00:00 / 00:40
连播
清屏
智能
倍速
点赞
172
Ai孙行者
1年前
以transformer为主的大模型技术一旦被颠覆,代价很大 #大模型 #科技 #人工智能
00:00 / 02:09
连播
清屏
智能
倍速
点赞
7
简介:
您在查找“
transformer谁先提出的
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2025-10-18 06:51
最新推荐:
暗黑破坏神不朽武僧无限举高高玩法
平井桃哪个团的
实况足球如何转应用宝
龙龙历险记说见面比什么都来得真实
强化封锁为什么没有大金播报
是那个嘎嘎应当的冰红茶吗
身体好开心比什么都重要
豆包AI怎么让树缓慢移动
电脑上的闪艺怎么在手机上玩
海之芽开业嘉宾都有谁
相关推荐:
拍照好看的评论
你没有好不好也慢慢习惯了
石宇奇联动金铲铲限定玩法
鬼面吞妄指令动图教程
廷gg送车意义
桃黑黑听潮阁怎么了
印度比赛不是说空运了食材吗
男生头发要求
卡尔明年会回lck吗
喜人助演第几季开始
热门推荐:
我不知道她在写什么
正版拼音卡片
错过交作业的时间
问题解决完怎么结尾
马上要上课点名告诉我点谁
kelly干妈英语教学怎么样
安徽高校2026寒假时间
云悠然英语怎么说
26众合精讲课什么时候出来
江苏初中生每天睡几个小时