00:00 / 04:42
连播
清屏
智能
倍速
点赞2255
00:00 / 01:15
连播
清屏
智能
倍速
点赞83
惠姐6天前
身份证上的公民身份号码,最后一位“Ⅹ”,哪个发音才是正确的?Ⅹ”表示的是罗马数字“10”,读作shí最为妥当,它是罗马数字的基本符号之一,代表数字10。身份证的最后一位,其实是个“校验码”,通过身份证前17位数字推算出来的。这套算法采用的是MOD 11-2(取模11)国家标准算法,通过加权求和、取余换算后,校验码字符值会在0到10之间。问题来了,如果校验码算出是10,直接写成“10”的话,这一位就占了两个数字的位置,身份证号码就变成19位了,这不符合国家标准规定的18位格式。于是,罗马数字X就这样水灵灵地出现了,被派来顶替数字10的位置。“X”有什么作用,国家费这么大劲,其实就是为了防错。因为你填身份证号码时,可能出现各种错误,除了漏字、多字这种位数显而易见的错误外,输错数字都不容易被发现,但系统会悄悄把前17位重新算一遍,发现跟最后一位对不上,立马报错。甚至还可以识别出相邻两位填反、错位等错误。一个小小的校验码,就是身份证系统的“保安”。平时不吭声,你一错它立刻吹哨。所以各位“X战警”们,下次再有人问“你身份证怎么还有个叉啊?”请挺起胸膛告诉他:“这不是叉,这是罗马数字10!我是经过国家认证、数学算法加持的‘完美校验码选手’!”毕竟,这串号码可不只是冷冰冰的数字,它更是每一个独一无二、闪闪发光的你。#和春天的花花合个影
00:00 / 00:25
连播
清屏
智能
倍速
点赞3
00:00 / 00:28
连播
清屏
智能
倍速
点赞4
00:00 / 00:34
连播
清屏
智能
倍速
点赞1646
说说AI领域中的“通行证”:Token(中文名:“词元”)(2) Token这个词源自古英语,原意是“符号”或“标志”。 在现代数字化时代,大模型火了之后,大家常讨论的“算力计量单位”,被引申为某种事物的最小单位或凭证。 其实,这个词它还是:登录App时的“身份令牌”,加密货币里的“代币”。 1.身份的“通行证”(信息安全领域) 在计算机安全和登录认证中,Token是一种临时的身份凭证。 •它是:当你用微信登录某个网站时,微信服务器发给该网站的一串加密字符串。 •它代表“这个用户已经通过验证了”。网站拿着这个Token就能确认你的身份,而不需要每次都让你输入密码。 •常见形式:JWT(JSONWebToken)、APIKey、硬件U盾等。 2.区块链的“权益代表”(加密领域) 在区块链(Web3)中,Token通常指数字资产或权益。 •它是:基于智能合约发行的代币。 •有啥用: o支付/治理:比如用来支付网络手续费,或者持有者拥有投票权(如Uniswap的UNI)。 o非同质化(NFT):每个Token都是独一无二的,用来代表数字艺术品、门票等。 3.语言的“积木块”(AI与NLP领域) 这是目前最热的话题。在大语言模型眼里,Token(“词元”)是处理文字的最小单位,你可以把它理解成“词块”。 •它不是简单的“字”: o英文:通常按单词或词根拆分。比如"playing"可能会被拆成"play"和"ing"两个Token。 o中文:通常按词或字拆分。比如“人工智能”可能会被算作2个Token(人工+智能)。 •为什么它很重要? 1.算钱的单位:现在的AI服务大多是按Token(“词元”)数量收费的。你输入一段话,大模型生成一段话,都要计算Token(“词元”)。 2.决定记忆长度:模型有“上下文长度限制”(比如32K Token)。如果你的对话太长,超过了这个限制,大模型就会“失忆”,忘记最前面的内容。 3.影响速度:Token(“词元”)越多,计算量越大,响应速度可能越慢。 最近新闻里提到的“Token”,默认它指代的是AI算力消耗的计量单位。 理解了这一点,你就能看懂很多关于大模型成本和性能的讨论了。 部分内容由AI生成,仅供参考,请仔细甄别。#词元#token#大模型 #科普 #教育
00:00 / 02:16
连播
清屏
智能
倍速
点赞10
00:00 / 00:15
连播
清屏
智能
倍速
点赞6396