00:00 / 04:56
连播
清屏
智能
倍速
点赞151
00:00 / 08:47
连播
清屏
智能
倍速
点赞12
说说AI领域中的“通行证”:Token(中文名:“词元”)(2) Token这个词源自古英语,原意是“符号”或“标志”。 在现代数字化时代,大模型火了之后,大家常讨论的“算力计量单位”,被引申为某种事物的最小单位或凭证。 其实,这个词它还是:登录App时的“身份令牌”,加密货币里的“代币”。 1.身份的“通行证”(信息安全领域) 在计算机安全和登录认证中,Token是一种临时的身份凭证。 •它是:当你用微信登录某个网站时,微信服务器发给该网站的一串加密字符串。 •它代表“这个用户已经通过验证了”。网站拿着这个Token就能确认你的身份,而不需要每次都让你输入密码。 •常见形式:JWT(JSONWebToken)、APIKey、硬件U盾等。 2.区块链的“权益代表”(加密领域) 在区块链(Web3)中,Token通常指数字资产或权益。 •它是:基于智能合约发行的代币。 •有啥用: o支付/治理:比如用来支付网络手续费,或者持有者拥有投票权(如Uniswap的UNI)。 o非同质化(NFT):每个Token都是独一无二的,用来代表数字艺术品、门票等。 3.语言的“积木块”(AI与NLP领域) 这是目前最热的话题。在大语言模型眼里,Token(“词元”)是处理文字的最小单位,你可以把它理解成“词块”。 •它不是简单的“字”: o英文:通常按单词或词根拆分。比如"playing"可能会被拆成"play"和"ing"两个Token。 o中文:通常按词或字拆分。比如“人工智能”可能会被算作2个Token(人工+智能)。 •为什么它很重要? 1.算钱的单位:现在的AI服务大多是按Token(“词元”)数量收费的。你输入一段话,大模型生成一段话,都要计算Token(“词元”)。 2.决定记忆长度:模型有“上下文长度限制”(比如32K Token)。如果你的对话太长,超过了这个限制,大模型就会“失忆”,忘记最前面的内容。 3.影响速度:Token(“词元”)越多,计算量越大,响应速度可能越慢。 最近新闻里提到的“Token”,默认它指代的是AI算力消耗的计量单位。 理解了这一点,你就能看懂很多关于大模型成本和性能的讨论了。 部分内容由AI生成,仅供参考,请仔细甄别。#词元#token#大模型 #科普 #教育
00:00 / 02:16
连播
清屏
智能
倍速
点赞10
拒绝死记硬背!妈耶!这个语法顺口溜太顶了! [星R]一、be的用法口诀 • 我用am你用are,is连着他、她、它 • 例:I am a teacher.我是老师。 • You are a teacher. 你是老师。 • She is a teacher. 她是老师。 • 单数名词用is,复数名词全用are。 • 例:Here is a book.这有一本书。 • Here are some books. 这有一些书。 • 变疑问,往前提,句末问号莫丢弃。 • 例:She is a student.(陈述句) • Is she a student?(疑问句) • 变否定,更容易,be后not莫忘记。 • 例:She is a student.(陈述句) • She is not a student.(否定句) • 疑问否定任你变,句首大写莫迟疑 [星R]二、时间名词前所用介词速记 • 年月周前要用in,日子前面却不行 • 遇到几号要用on,上午下午又是in • 要说某日上下午,用on换in才能行 • 午夜黄昏须用at,黎明用它也不错 • at也用在明分前,说差可要用上to • 说过只可使用past,多说多练牢牢记 • 莫让岁月空蹉跎 [星R]三、英语九大词性 • 名词n.(是什么)动词v.(干什么) • 形容词adj.(什么样的) • 副词adv.(表达方式) • 数词num.(数量多少) • 代词pron.(事物的代替) • 冠词art.(a/an/the) • 介词prep.(表示方位) • 连词conj.(连接) [星R]四、可数名词的复数变化规律 • 名词复数有规律,一般词尾+s • 辅音字母+y型,变y为i+es • ch,sh真有趣,s, x, es • f,fe真小气,字母v来把它替 • es在后别忘记,字母o来真神奇 • 有生命来es,没有生命+s. [星R]五、介词 • in 在……里,out 在……外, • 在旁边的是 beside,靠近的为 by。 • on 在……上,under 在……下, • above 在上头,below 在底下。 [星R]六、肯定句变一般疑问句 • have和be提句首,其它助词Do开头。 • 时间、人称由do变,动词只把原形留。 • 谓语助词有几个,第一助词提句首。 …… #英语 #英语学习 #英语语法 #学英语
00:00 / 00:11
连播
清屏
智能
倍速
点赞0
00:00 / 03:10
连播
清屏
智能
倍速
点赞72
00:00 / 01:04
连播
清屏
智能
倍速
点赞32
00:00 / 38:08
连播
清屏
智能
倍速
点赞10
00:00 / 02:07
连播
清屏
智能
倍速
点赞32
汉语的词类划分问题是语言学界的一大难题。 同样是动词“打”,在“打人”里是谓语,在“打是亲”里却成了主语——词没变,位置变了,它还算动词吗?需不需要像英语那样区分动名词、不定式? 这套视频介绍了一种从汉语自身特点出发,用计算语言学思路给汉语划分词类的方法。 核心逻辑用一个比喻就能说清: 西方形态语言像“车型绑定线路”的公交系统——BRT用铰接车,普通公交用12米车,社区公交用8米车,看车型就知道线路。汉语则像“车型统一”的系统——所有车长得一样,想区分线路,只能看它们实际跑了哪些路段。 问题来了:哪些路段真有鉴别力? 如果拿“是否经过火车站”来分类,你会发现所有线路都经过——这是个“万能位置”,分类等于白做。主语、宾语在汉语里就是这样的“火车站”,几乎所有词类都能进,不能作为分类依据。 真正有效的是那些“双向比例相当”的路段。比如北城区的A大道和B大道:经过A的车有多少也经过B?经过B的车有多少也经过A?如果这两个比例差不多,说明它们共同指向同一类线路。 这就是“等价功能”的数学内核——通过计算功能之间的双向蕴含关系,筛选出真正有鉴别力的句法位置。排除掉“火车站”式的万能位置后,再用这些关键位置去计算词与词之间的行为相似度,让相似的词自动聚成一类。 这套方法把汉语词类研究从“凭经验分类”推进到了“可计算聚类”。它告诉我们:汉语的词类不是贴标签,而是找位置。每一个词,在句法功能交织成的路网里,都有独一无二的行驶路线。 视频将用三分钟讲清这套方法的来龙去脉,带你换个角度看汉语。 #语文知识分享 #汉语言文学 #语法 #拒绝废话#科普#冷知识#省流
00:00 / 07:37
连播
清屏
智能
倍速
点赞0