00:00 / 03:13
连播
清屏
智能
倍速
点赞28
00:00 / 01:30
连播
清屏
智能
倍速
点赞102
00:00 / 05:38
连播
清屏
智能
倍速
点赞3161
一句它昨天走了,里头藏着现在所有AI大模型最核心的秘密。 一句它昨天走了,里头藏着现在所有AI大模型最核心的秘密。 大多数人以为Transformer是什么高深算法,其实它的核心思想,跟你平时听人说话时脑补上下文的过程一模一样。 有人跟你说它昨天走了,你第一反应肯定是,谁走了。但如果他前面刚提过我家那只老狗,你瞬间就懂了。你的大脑看到它的时候,没有孤立地看这一个字,而是自动回头去找最相关的那个词。 Transformer做的就是同一件事。它不是从左到右挨个读,而是一眼扫过去,让每个词都找到自己的重点关注对象。以前的AI读句子跟念经差不多,读完句尾句首的信息已经模糊了。Transformer让所有词同时摆在面前,每个词跟其他词都聊一遍,根据关系远近自动分配注意力。 同样一句话,不同的人关注点不一样。学语法的关注主谓关系,养过宠物的关注情感。Transformer更聪明,它同时戴好几副眼镜来看同一个句子。有的专攻语法,有的关注语义,有的捕捉情感,汇总在一起,得到一个更立体的理解。 但这里有个问题。所有词同时出现,机器分不清先后顺序。狗追人和人追狗,在它眼里是同一堆词。工程师的办法是给每个词发一个座位号,叫位置编码。就像全班站在操场上,每个人胸前挂着学号,你既知道他们是谁,也知道原本坐哪。 所以下次再有人在你面前聊大模型,你可以淡定地回一句,本质上不就是让每个词找对搭档嘛。#一句它昨天走 #AI #transformer #大模型
00:00 / 01:56
连播
清屏
智能
倍速
点赞2
00:00 / 02:28
连播
清屏
智能
倍速
点赞NaN
00:00 / 04:25
连播
清屏
智能
倍速
点赞5
00:00 / 00:22
连播
清屏
智能
倍速
点赞212
00:00 / 00:17
连播
清屏
智能
倍速
点赞NaN
00:00 / 04:24
连播
清屏
智能
倍速
点赞11
00:00 / 01:10
连播
清屏
智能
倍速
点赞642
00:00 / 00:22
连播
清屏
智能
倍速
点赞1
00:00 / 00:34
连播
清屏
智能
倍速
点赞52
00:00 / 02:01
连播
清屏
智能
倍速
点赞343
00:00 / 01:07
连播
清屏
智能
倍速
点赞134
00:00 / 06:14
连播
清屏
智能
倍速
点赞105
00:00 / 02:42
连播
清屏
智能
倍速
点赞13
00:00 / 00:13
连播
清屏
智能
倍速
点赞729