粉丝1977获赞1.3万


下面给大家去说一下如何把文本改成 utf 八的一个编码。首先我们在这个文本上点右键选择编辑或者记事本,编辑啊或者没有的话点打开方式,在打开方式里面选择记事本啊都是可以的。 打开之后呢,我们看一下这里右下角,右下角这里有显示 a n s i, 那怎么去变成 u t f 八呢?首先我们在文件上点右键选择另存为,另存为的时候的话,然后我们在这个 编码上面选择 utf 八,然后点击这里的一个确定,然后我们点是 就可以了,这样的话这个文件就变成 u t f 八的一个编码了,我们在打开的时候可以看到右下角这里是 u t f 八,这样的话特别是有在一些旧系统里面做的一些资料,用新版的开发软件啊,就不会导致乱码的问题。

哈喽,各位小板好,我是小刀,好久不见啊,最近在忙着九三年冲业绩哈,好,我们言归正传,今天我们高扣的和大家聊一聊加瓦中的编码,这些所谓的编码呢,我们以 iy i s o 和 utf 杠八和大家去举例说明一下。 首先从面试的角度来说,编码这一块呢,其实问的并不多,但是一旦问了这个问题你没答出来,那面试官觉得这个扣分就扣的比较多,如果答出来呢,加分其实加的并不多啊,因为大家觉得这是常见的问题,谁还没遇到过一个编码问题呢,对不对?好,这里呢,我们以这个加把小小刀为例子, 如果说我们在编程中会使用到这个字母串的话,我们会写一个 cs 等于六十对,然后把加二下到传进去,这个是跟我们人交互的时候去看到这些,但是我们跟计算机去交互的时候,计算机他是不会理解这句话的,计算机能够理解的什么,他只能够理解 零和一对,这个时候就有了这么一个需求,我们怎么能够让计算机去读懂这句话呢?那就是把它转用一个编码转成零和一,然后让计算机能够读得懂,这个时候就出现了不同的编码啊,有 rso 编码,有 utf 杠八编码,然后还有 utf 杠十六,就是 udq 的编码,就是这种, 我们看看啊,加把小小刀,他直接转成叉数组的话,这个就是接 av a 小小刀。然后我们这边有一个支点,就是在加法中你的每一个叉, 他和一个硬的数字,只要是可以画等号的,你可以直接用墙转把它转过来,那么我这边把这个尖用墙转,用数字转了之后,然后再给他改成转成十六星纸啊,就我们从十星纸再转成十六星纸,这就是一个结果,就是尖对应的六 a, 然后 a 对应的六幺啊,然后面小对应着五 c 零 f, 然后 到最近呢五二零零就是一个结果,那么这个结果呢?他实际上就是一个 utf 杠十六油离扣的编码,其实就是一个,那么除此之外,我们还可以把这个数字就是把这一串给他转成一个 rso 编码, 然后这个编码呢?我们看着啊,前面是半的数组,就是我们在转的时候,一定是先把这个字母串给他转成半的数组, 然后把这个半的数组,他这个是已经是二进制了吗?然后给他改成十六进制的一个展示方式。因为我们再去打开一个二进制文件的时候,基本上现在市面上提供的一些软件,比如 happy bland 各种之类的,我们去打开,包括打开那个加入的点可拉斯文件吗?大家看到的就是这些什么,呃,害死这些什么六 a 啊什么以及之类的所有精致的,我们常见的什么,大家还记得点 文件开头什么咖啡、 baby, 对吧?啊?那就是一个小知识点,那就是一个好,这边呢,我们看过来,他转到 iso 这边, 第一个是拜托数组先直接转过来啊,这边是一个实践制的表示,幺零六九七幺幺八,然后最后三个是比较那啥的啊, 六十三、六十三、六十三,就对中文来说,无论说我的中文是什么,他全部转成六十三,这为什么?因为 rso 他的一个编码他只有一个字节,他表示的范围非常非常有限,对于后面这些中文他没法表示的那么统一,都转成六十三,六十三他表示什么呢?就是个问号, 对啊,有时候看到自己的编码,哎,怎么就变成问号了?这个时候就是 i s 编码的,然后他转换不了,就给你转换成六十三,然后有个问号显示出来的。然后我们来看一下一个小知识点,就是六十三怎么能变成三 f 呢?对吧? 这有个东西啊,这边有个图例,我们六十三给他转成二进制,是不是就是零零幺幺幺幺幺,然后转成十六进制也非常简单,就中间画个线,这边四位就是 f, 这边四位就是三,对吧?这就是三 f, 还有是这个二进制非常越,非常便于阅读的一种形式。 好,我然后我们再看这个 utf 杠八这种格式,这种也一样,他首先是把你的这个字串啊 s, 然后我们有个方法叫什么 s 点盖的 bos, 然后后面传这个编码进去,对吧?我们传个 utf 杠八进去,就会得到这么个结果,他编码出来之后得到这个半的数组,前面 前前面英文字母里面还是一样的,然后后面到中文这一块时候就不一样了,前面还是一个半的去表示一个字符,对吧?后面的时候变成三个字节去表示一个字符了,这就说明我们 uti 杠八 他是一个变长的,他到底是用一位还是三位?这个呢?是根据你实际的转化的内容不一样,他是可以变化的,所以这里你看,我们是接 a、 v、 a 这三个字母是小,然后这三个 是刀。好,然后关于这一块呢,大家记得不需要太多啊,就是知道这么一个转化关系就可以了。面试方不可能说问你的,说我这个尖,你转成 utv 杠八密码是多少?他不可能这么问的对吧?他最多问,他最多问你就 utv 杠八跟 is 有什么区别对吧?你答个变长的就就就可以了, 而且这玩意都是死玩意,不可能问的。面试的时候最可能问的是什么呢?是下面这一块,医用这一块,就说我们这个边啊, 他是哪里用到的?像现在呢,我们都用 suprem boos 开发,基本上好像没遇到什么编码问题了,但是像以前我们在用那个外部点 xm 二,还是在用那个 super 开发的时候,你这个变 稍不注意设置就是你设置的,稍不注意就会发现,哎,怎么返回去又乱码了,哎,怎么我穿的参数又乱码了,今天就找这些问题,找到那个头都痛死了。后来呢,你就得到一个经验,就是但凡你只要能看到设置编码地方,全部设置成 udf 杠八啊,说不定你把哪个一设置就好了。 当然这个这种方式能解决问题,但是我们还要细致看一下有哪些地方可以设置编码的,我们从一个请求过来看的啊,我们有驴筷子的,驴筷子里面有 ui, 有嗨的,有包里,对吧?这三个地方是都有可能出现中文的, ur 里面可以可能出现中文吗?是可能出现的,对吧?我们如果盖子请求公众号后面传的参数的话,哎,比如说用户名,我们是一个中文传到后台去,对吧? 然后我们嗨段里面有没有可能有中文呢?也有可能,因为你嗨段里面兴趣可以自定义嗨段吗?你也考里面塞着中文,然后包里面就更不用说了,对吧?现在基本上 你提交一个表单,你提交一个表单到后台的话,基本都是都会有中文的。 这三块他会存在一个编码的问题,就在这边先进行编码,先给他全部变成二进制的,然后通过说 k 的,然后到你的死喷这边之后就开始解析这个流 cast。 那解析的时候呢?也是分开解析的啊?第一个是 ur 这边解析我们通过什么啊?最原始的方式就是先不讲四川那些猪肉的方式,就最原始的方式的话,就是瑞筷子的点开的拍照美团,对吧?瑞筷子的点开的包底, 然后这时候去解析,那怎么去设置编码呢?我还记得以前对于每一个 sol like 进来的时候,都会去写一遍 readows 的点赛的 carry, 那个 carrk encol 定去解析,然后 resparas 点赛的 carrk encol 定,这样都设置一遍,才能把这个中文正确的给他解析出来,然后正确的给他 返回回来。那现在大家用了十分 boss 之后呢?基本上就只需要把你的页面两个地方,就是第一个是我们返回过去之后可能会返回给页面吗?也有可能会返回给这个程序接收的,对吧?我们只需要把这个页面给他设置成 那个 utf 杠八的,然后整体基本上这个中文就能够正确显示了。那么前面这一块实际上是外国这一块, 后来发现呢,就是你往数据库存的时候也会有一个编码问题啊,在数据库编码呢,还有额外的问题,就 utf 杠八和 utf 八 mb 四,这两个有什么区别?大家可以现在看一看,打开你的数据库,看一看你的表的编码是什么?如果是以前老的表的话,他的编码可能是 jbk 的, 那么现在基本上新建的表的话,都用的是优铁不钢八 mb 四,这两个有什么区别?这个面的话会喜欢问的,那么注意啊,只有这个才是才,才,才才是那个蚂蚁色购中真正的优铁不钢八编码 基本都用这个。那其实呢,如果从实践来问的话,有这么一个问题,就比如说,哎,现在大家起的微信名啊,都有什么表情啊,各种符号啊,资金的东西,那么请问你的数据库怎么样才能够去存储这些东西,对吧?这个问题出来之后, 立马就要想到编码一定要设置成 uto 杠八的开心,然后你这个 gdpc 的这个 url 后面也有一个,那个什么开出特型扣的那个参数也要设置好,两个相对应起来, 哎,然后这个这这这个什么表情就可以存到数据库里面去了,然后就可以也可以成功返回了,我的上家公司是吃过这个亏的啊, 当时那个数据库就是一个用户,然后我当时通过用户名去匹配的,然后发现他用户名就塞了表情,然后这个用户给我们反馈说,哎,怎么死活都登不上,然后这个订单怎么就搞不了,往后面一查,发现,哎,原来是这个,我们我们以前老酷啊,所以 都是 gpk 的编码,那时候存的都是汉字吗?谁能想到突然出来个表情,出来了,对吧,然后就就就就就坑了,然后再往后面就我们就所有的表都是用前刚把 mv 四了。 好,以上就是和大家聊了一个编码的问题,总结一句啊,编码这个问题,您只要把对应的设置好就可以了,对吧?我们一个请求 编码,然后这边一个解码,然后再编码,然后再解码。只要把这两个地方给他设置好啊,给他对应设置好,基本上就不会出现编码问题了,而且现在 suprem bos 已经已经都给你设置好了。好,今天内容就先到此结束,如果对你有帮助的话,记得帮忙收藏点赞加关注,我们下期再见!

大家好,我是搜搜,这一节我们接着讲 excel 高校办公五百荔枝第一百零二例批量转换文本文件的编码格式, 可以支持 utf 干八和 ansi 格式的这个转换操作方法法就是点击我们这个搜索公式集中的这个新增功能,下面有一个批量转换文本文件的编码,设置我们的文本文件的路径,给予我们的格式,还要转换后的那个编码, 比如说我们讲成 ansi 点十一开始转换,自动会转换好了,我们可以打开看一档, 这个地方会显示他的这个编码,这个 at 我们就是我们转换后的效果,我们可以转换一款 utfa 八的,看一下,选择 utf 干八点 开始转换,这个时候我们转换后呢,他这里就是 utf 干八的这个格式,非常快捷的这个把这个文件批量转换成对应的编码格式。好,这一节就给大家介绍到这里,谢谢大家。

大家好,我是克莱梦。之前呢,我们用两节课的时间去说了怎么去读写 t x t 的数据,那么有的同学就会发现,如果跟着我的代码一起打一遍的话,可能有的同学他读到的数据是乱码,比如说我这里有一个文本文档,里面有姓名这些 字母这些汉字,如果我们去读取的话,有的同学他就会发现,用我之前的读取数据的方法读出来的是一堆乱码,这是为什么呢?因为我们的 t x t 文件,它在系统在保存的时候,它默认是保存为 u t f 八的, 但是实际上呢,我们的 v b a 里面用的是什么呢?我们 v b a 里面用的是 a n、 s i 这两种不同的编码方式,所以它用 a n、 s i 的方式去读取 u t f 八,它就 肯定会出现错误,那么我们怎么去解决这个错误呢?我们有一个简单的方式,如果你只是读取单个文本文档的话,我们把这个文本文档在这个另存为这里用记事本打开,然后把它另存为在这里我们把编码方式,把这个编码改成 ansi 就可以了, 然后保存,把原来的给替换掉。这样呢,我们再执行这个代码,我们看一下 他执行的就是正常的银行,银行的数据了,那么如果我们这样有很多文件的话,我们这样改就很麻烦的,那么我们有没有一种方法可以直接读取到这个系统默认的 utf 八这种编码方式的 方法呢?当然是有的,今天我们就来做一个新的对象,叫做 a d o d b, 这个 a d o d b。 我先来说文解字一下啊,什么叫 a, d, o, d, b 呢?这个 a 是 active, 这个 d 是 data, 然后这个 o 是 object, d, b 两个的意思呢?就是 data base。 有人说这几个英文我都懂啊,拼到一起我就不懂了,其实你就可以理解为活动数据对象数据库,那么这个对象是干嘛用的呢? 他可以按照任何一种编码方式去读写我们的文本文件,那么我们怎么去用它呢?我们首先还是跟之前的那些东西一样,我们要在引用里面,他是要在引用里面引用的, 我们首先要在引用里面勾选这个 active data object, 然后勾选了之后我们点确定,这样呢我们就可以直接去 对他进行一个声明了,所以我们第一步就是定去声明一个 ado db 这个对象,比如说我就声明,我就把名字,把这个对象名就叫做 ado 吧。 d o, s new, 我们建立一个新的 a, d, o, d, b 对象,我们声明一个新的 a, d, o, d, b 点 stream 这样的一个对象,然后我们怎么去使用这个对象呢?按照我的这个格式来就可以了, a, d, o 点 open, 就是打开这个对象,然后下一句是 a, d, o 点 type, 这个 type 是设置一个参数。设置什么参数呢?就是设置你是用二进制的方式去打开这个数据,还是用文本数据的方式去打开。我们这里肯定是设置成二,因为我们要打开的是个文本嘛,我们如果设置成一的话,就会设置成二进制, 如果我们设置成这个二,就是这底下的这个 text, 左右打数字二就可以了,我们这里直接打数字二就可以了,然后再下一个参数,我们就是重中之重了,我们不就是想用这个方法去打开它的 utf 八吗? 所以我们在这里要给他设置一个很重要的参数,就是 char set, 就是设置我们打开的这个编码方式,我们在这里输入 utf 杠八,好,这样呢我们就可以去读取数据了, 下一句就是读取我们的数据,读取数据呢,我们用这个 not from fear, 就是从文件里面去加载,在这个后面呢,我们就写我们想要获得的文件的路径,比如说这里 今天文本文档,刚才我已经把文本文档给改成这个 nsi 了,我现在把它改回 utf 八,就是给大家看一下怎么去读取 utf 八,它也是可以读取的,我们把它的路径给粘贴过来,然后我们就可以获得它里面的数据,比如说 ado 点 red text 这句呢,就可以获得它里面所有的文本数据,然后我们可以把它付给一个字符串,比如说我们付给 or, 这是我自己起的 or text 好,这样就付给他了,然后我们就可以把它关掉。 ado 点 close, 这样呢就可以把它关掉,然后我们为了验证一下,我们可以设置一个 message box, 我们把这个 or text 就是我们刚才获得的这里面这个文件里面所有的字符,这个字符串,我们就把它给输出出来。 啊,这个,这个不是数据,是文本文档。好,我们来看一下, 看,这样呢,他就把里面的文本全部都放到了这个 or text 里面,这样我们就可以获得 u t f 八编码的这个文件格式了。那么我们能不能把它变回 a n s i 呢?当然可以了,我们之前不是学过写入吗?我们之前有个代码是写入,我们把这个写入给它复制过来,把它放到下面,我们把它隔开。啊,之前我们不是这个代码是写入吗?在这个写入这里, 我们直接把原来的覆盖覆盖掉,我们直接不用这个了,我们直接 print, 我们打印什么呢?我们我们直接把这个奥 text 给打印进去,这样的话,其实这一串其实实现了一个什么了?实现了一个把这个文本文档从 utf 八直接转变成了 a n s i, 因为这个 v b a 在执行写入的时候,它在执行这个写入过程的时候,它永远把这个文件变成 a n s i, 这其实就可以实现一个从 u t f 八转变为 a n s i 的这样的一个过程。 我们来看一下,这里要打个井号一 好,现在它已经完成了这个呢,其实它已经是看着好像没有变化,其实它已经变成了 a n s i。 不信的话我们来看一下,这里另存为看 它这里我刚才没有调,它自己就是 a n s i 了,我们怎么确定它是 a n s i 呢?我们用 input 再去给它看一下就行了,这里我们用 input 去读取它一下, 看 input 就可以读取它了。之前我们读的时候是不是乱码,现在它就不是乱码,所以就是这样的一个方式。然后我们总结一下这几个参数啊,这个是肯定要打的,这个是打开,这个是打开 ado, 这个是设置参数。注意啊,这里的一是 二进制,二是文本,然后这里是编码,打开这个文件所用的编码,然后这里我们用到的是一个 red text, 这个 red text 不加参数可以获得里面所有的文本。 对,就是这样的一个步骤,这就是这几个参数的作用。前面的这一段呢,就是读取这个呢,就是把它重新写入,就会把它变成 a、 n、 s、 i, 这这个讲的有点长,如果不懂的话多看一下,就跟着跟着这些代码念一遍,比较好理解一些。

大家好,今天我们讲一下啊自助穿的大小鞋转换,因为这一块也是比较简单,然后我就代码就直接就是七号,然后他操作的话主要就包括这六个,然后解释注视也在后面,着急运的同学可以直接看到,这就可以拿去运了。然后下来的话,我是主要是执行一下,给大家看一下效果, 然后对比一下出石化的这个字母传,然后第一个 oppo, 然后他就是全部转大写,这个很好的写第二个和第一个相反,全部转小写,他都是一样的,就本来大写他不会动,如果是小写的转大写,第二个一样的就是本来小写本来大写转小写,然后第三个就比较特别了,然后他是把里面的大写本小写里面的小写转大写,就是做这个图图 啊。第四个是把首字母转成大写,他只是首字母,他不是单词的首字,他是一串字符串的一个手字母,第一个字字字符,然后这个推掉,他是什么?他是把一串字符串里面每一个单词都呃转成一个呃大写, 看一下这两个的区别。第一个百度和点 comcom 这一块是没有转的。第四个他是判断是否大写的,咱们这边是把第一步转完的这个拿出来去做个判断,他这边判断是判断所有的字不算,只要有一个字不算不是大写,就返回 foss, 然后咱们可以把这一块删掉看一下,再执行一下去看,这边就立马变成 boss 了,然后他主要的操作就这么几个。

我给大家介绍一下由你靠的这个编码哈,由你靠在实际上历史上呢,出现了很多种这个编码的这个方式,但是呢最常见的就是 这个所谓的 utf 八,这是我们今天要重点给大家介绍的,除了之外呢,还有两个比较简单一点的啊,就分别是什么 utf 五十六 和 utf 三十二、三十二这两种。那么 unico 的这个文字符的编码方式呢?基本上就这三种啊,就这三种,我们分别给大家介绍一下他这个三种的这个特点啊, u t f 八呢,他的这个编码方式呢,实际上是跟那个阿斯科是接入的,也就是说你把阿斯科表示的这个字符啊和 u t f 八表示的中文呐 啊,这个日文呐啊,美文啊,藏文啊,放在一起的时候,他不会混淆啊,不会混淆。那他的这个特点呢,实际上呢,我们就可以说是跟那个 euc 啊,就是我们介绍个 euc 啊,那种东西实际上有点像啊,就是说 对于阿斯他是一个字节,然后呢其他的东西呢,就是可以用两个字节,三个字节,四个字节,五个字节这样来表示啊,那他最大的特点就是说阿斯兼容,还有一个特点呢,就是变长, 跟 ucjp 一样变长的啊,他的这个编码方式是变长,他最长呢可以有六个字写来表示,但是呢, 呃,用力靠的字符呢,他因为是那个只有幺零 f f f 那么多吗?所以呢用最长的四个字接就可以了。我们常见的中文,比如说是上海北京啊这样的,这个普通的这种 文字啊,普通的这种汉字,那他的这个 utf 吧,编码的长度是三啊, 大家一定要记住啊,但是有一些,有一些排的比较靠后的,那可能就是四了啊,那大部分汉字他的编码 utm 把编码上都是三个字写啊,这个一定要记住啊,不是两个字写, 现在再再把国标三样那个东西拿出来啊,说一个汉字用两个字节来表示那个时代已经过了,那个时代已经过了。好,再往下 你看,八十六三十二是吧,直接使什么呢?就是说他的一个基本单元是八位,就是一个字节,那他的基本单元什么?就是一个十六位的 十六位的一个长度的一个字啊,我们叫沃尔,对吧?啊,这是 bite, 这是沃尔三, 上面呢就是 w 双字,那也就是说 utf 十六的时候就是用一个十六倍的东西来表示一个什么呢?表示一个由你靠的字 在用力靠的三点零之前的时候。那会呢,他不是用力靠的只定义了六五五三四个啊,马妹吗?是吧?所以呢, utf 幺六可以干什么啊?可以用来表示所有的用力靠的, 对吧?但是后来不是变成了到了,大概到了七点零吧,人员到了七点零的时候,这个马路一下就扩展到了这个超过这个 十六位字母来来显示,所以呢,实际上用 tf 幺六呢,看也是什么也是变长的,只不过他这个变长呢,有两种,一种是两个字结,要么是四个字结, 一种是两臂,一种是四臂啊,那 utm 三十二呢?这个东西简单,为啥呢?因为三十二位基本上可以覆盖目前由于靠的所有的这个马位啊,所以呢,他就没有那么多,没有那么多大大,所以他是定场 就是四倍,四个字结搞定啊,每一个字母都是四个字结,当然了,很多人都会一下子就会想到说每个东西都是四个字结,那可多浪费啊,对吧?你说,你说,我表示一个什么? a b、 c、 d 是吧?阿斯玛, a b、 c、 d、 u t f 八四个字接就够了吧,对不对?然后 u t f 三二的时候呢,那就变成四乘四了啊,对吧?四乘四,那就用十六字接来表示,那不就是浪费了吗?对不对?那 u t f 幺六的时候呢,那最起码也是四乘二啊,八个字接, 对吧?啊?所以的话呢,实质上呢,这些东西啊,有一点幺六九点三十二这种东西呢,他为什么在在我们日常使用里面很少用到呢?就是因为 他比较浪费啊,他这是比较浪费。还有一个问题,就是我们在表示诊说的时候讲到的什么问题呢?就是大小头问题啊,大小头问题, 他既然是一个 word, 那那就有一个 l e 是吧?有一个 b e 的问题, deword 也有 l e b e 的问题,是吧? 就是里头 nd 和那个 bnd, 那也就是说实际上这俩编码真正的啊,他就是有两种,有 tf 幺六 l e, 比如 tf 幺六 b e 啊,然后这个东西呢,他也实际上是两种编码, 三十二到一, 对不对?所以说你想想,要是一个正常的人选择,你会用哪种东西来编码这优密 code 来,是不是就是 u p f 八是最好的,对吧?

加一个 div 表情, 把 id 属性设为 diy v 一、 每个 html 标签的 id 是唯一的,就好比人的身份证号不能重复,重复了就分不清谁是谁了。根据 id 给他设置样式。 用 id 做选择器,需要在前边加上井号。把 div 一的宽度和高度都设置成四百像素, 把边框设为蓝色,以像素实心的 看一下。 div 是一个巨型的区域,可以看成有长和宽的一个框, 里面能摆放其他的东西。我在里面加入一个图片, 再加一个 diy 标签,把 id 属性设为 diy 二、在里面也加入一个图片,给他设置样式。 div 默认是从上到下平铺排列,如果改成从左到右, 需要声明 flow 的属性为 left, 这样就 就从左到右排练了。 再加一个 div 标签,把 id 属性设为 div 三,给他设置同样的样式。浏览一下 三个 diy 排列好了。网页排版布局是不是很简单?

大家好,我是西红柿武士,欢迎观看分钟学编程系列视频。在学习计算机之前,我也曾经被这个问题困扰, 既然计算机的底层的最小单位是零合一,而且内存中的数据是连续的零和一,计算机是如何自动区别?有一个字节组成阿斯匹马的字符和需要两个、三个甚至是四个字节组成的 uniqo 的字节, 并能够自如的在不同数量的字节之间切换和读取数据的。今天的视频就来聊一聊可变长度编码 utf 八是如何在大量的零一中识别中文制服的。 提到中文,不得不提的是优尼扣字符级,大家可以把它看着是一个数字和符号一一对应的一张表,包括中文字符。之前介绍的阿斯匹马完美的成 有你口的一个字机,虽然包含所有的大小写,英文字符和数字,还有键盘符号,八位就够了,因为二的七次方可以表达一百二十八个不同的字符,留下最高位作为定位符。 但是这个世界是丰富多彩的,不止一种语言观世中文就需要上万的致富级,所以八位的出存储位置显然不够。 utf 八的八表示最小的编码单位是八位,也就是一个字节,所以每增加一个字节都是八位。十六位可以表示的变化总数可以是二的十六次分,也就是六万五千多,这下够了吧。可是还有一个问题需要解决, 在内存中,数据是连续的零和一,计算机怎么知道是该按八位读取还是按十六位读取?这又得提到定位付了。 聪明的科学家让高位字结的前三位为定位字符,同时设定幺幺零,为十六位两字节编码的起始标志。 同时让低位字节的前两位也为定位制服,并设定为幺零。这样当计算机读到这个幺幺零时,知道这是一个十六位两字节的代码,而且为高位字节。读到后面零幺零时,知道这是低位字节。解决了定位问题,但是又来了新问题, 十六位中有五位用作了定位符,剩下的有效位数为十一位,只能解决两千多个不同的字符,离中文词符及要求还很远。 有了之前的经验,只要增加字节就可以增加有效数据存储位数,同样需要解决定位服务问题。为了区别十六位二字节的编码方式,二十四位三字节的编码方式 需要四位,最高位字节尾定为符,并设置为幺幺幺零,后面两个字节的前两位也同样尾定位符设置为幺零。 这样计算机只要读取到幺幺幺零,就知道是三字节的编码,而且后面会有连续两个以十开头的字节来存储单位 数据。这下绿色有效存取位数正好有十六位,所以至少能存储二的十六次方,不同的数据量足够存储世界上所有语言的不同制服。 utf 八最多可以使用四个字节的编码,但是除了非常特殊的符号,常用的就是一到三字节的编码方式。 字结定位规则确定,接下来就是数据存取规则,也就是编码规则。我们看一下例子,世界的事的 uniq 号码是, 这里快速介绍一个超级方便的,需要命令 bc 可以轻松的进行各种禁止的转化,只需要在 a 口语句中设置 ibase 输入禁止和 obase 输出禁止,然后将数据放在最后,就得到了二禁制的代码。 存取数据也是编码过程,如下, uta 八看到这个二禁止代码后,会把前四位放在高位字节的四个绿色宽中,接着是六位放在中间字节的六个绿色宽中,最后六位放在低字节的六个绿色宽中。 重新把定位码还宽的数据和数据码绿宽的数据编码后,输出的十六进禁止表达是这样子的,读取数据的时候就是编码的反向操作,也就是解码,忽略了定位符号,提出有效 小数数据信息。在计算机看来,这两个代码是等效的,一个是 unico 代码,一个是 utf 编码,利用 ico 迷你都可以同样的答应出来。 总结, unico 是制服机, utf 八是可变长编码方式,利用定位符号,并根据数据的 unicol 所需要的长度来灵活选择字节的长度。这也正是因为定位符 utf 八能够在不同的 字节长度的数据流中轻松提取信息,也就能看到中文了。好了,今天的视频就到这里了,有喜欢的朋友可以关注西红柿武士头条号,谢谢收看,下次再见啦!

这节呢,我们来看一下有人在那个嗯我录的视频下面呢,给我提出了一个疑问,就是 utf 杠八和 utf mb 四呢,有什么不一样的啊,至于他的排序规则啊,我们是不是用这个 啊,就说我们为什么不用这个尤恩 ico 的啊,也就是说优力库的为什么不用这个编呢,去啊,就排序规则去做啊。就我这里呢,我给大家截个图看一下吧。嗯,我们来看 看一下。首先呢,第一个用户呢,是问了我这样的一个问题,然后呢,第二嗯,我们来看 看一下我的一个回答啊,我给大家截个图看一下啊,我的回答就是这个,嗯,其实我们这个 uts 八 mb 四呢,他这个编码呢,其实他嗯 就咋说呢啊,其实我更喜更喜欢用下面这个,这个只是一个个人的一个爱好啊,嗯,有一个区别就是他这个油田杠八啊,其实这个第二条非常重要啊,第二条非常重要,就是这油油田八, 他无法支持这个富有表情啊,不用啊,就是我们可能有时候这个用户名啊,就是我们在起这个用户名的时候可能会嗯,就比如说我们一些嗯 用户名,他会用一些表情呀,字符啊,就是表情类的字符啊,这种字符他是不能存储在 uti 八的,他是显示不出来的。嗯,那个然而这个 ut f 八 mb 四呢,他是可以显示出来,只是多多表情的一个支持。 其实我最最初呢也是用这个 uts 八的,但是后来就是因为做那个有关一些小程序的开发之类的,他这个用户名 他起的比较个性化一点,在这个时候我就必须得用这个 utf 八 mb 四啊,这个是他的一个区别。还有就是我们 呃,嗯,用这个詹格瑞 c i 和这个优力扣的 ci 啊,这两个的一个区别, h 规则的一个区别啊。嗯,还有就是上面这个,嗯, b 啊, b i n 啊,和 c i 的有区别,一个是支持大小写的啊,呃,就是不区分大小写的,一个是区分大小写的, 就是我们啊,这个后缀啊。速度呢来说的话,这个这个 aci 的话更加的快一点。然后下面这个用力扣的 ci 的话更加的慢一点啊,相相比而言啊,是更慢一点,所以我选择这个比较快的啊。其他都是支持中文的啊,支持中文的,这个是没有关系的啊,只是说这一方面啊,我也给出了这样的一个回复啊。这个也是 是七月九号,也就刚才啊,刚才,现在是两点多呢,现在是两点零六的时候给他的一个回复。这个呢,是这样说了一下。然后呢我们嗯 完了啊。我们再来看一下下面这个问题呢,其实就就是说我这个编辑啊,是不是盗版的,其实并不是啊,并并不是,我是有一个简单的授权啊。啊, 这个我这个天气还有点卡了啊,电脑最近有点卡。嗯嗯,继续看下面的问题啊。在 这个就是这个美举美举这一块,还有就是编码规范说我这个不太好啥的,我也都给了一些回复。然后嗯,说了一些嗯话吧。啊,嗯,最后就说这个编码这一块啊,过于复杂啊,要不要去做啊。这个这个呢,其实我到后面可以给大家 可以把这个具体的在写代码的时候可以说一下,这个就是如果有大量的啊,下面这个如果有大量的异常,方法路线过长,如何定位错误啊,嗯,有有一个常用的异常和错误是不一样的啊, 他觉得是这样子的。其实呢,每个人在编码的过程中啊,其实每个人都有自己的一套,在接触到的知识点不一样啊,都会有自己的一些见解。 我这边呢就是我并不是说要坚持自己的这个观点,这个编码风格呢,就是对的。但是呢,我我相信这个是一个循序渐进的过程,因为我现在技术来说只能说是一个。嗯,可以给大家讲一些简单的东西, 比如说这个憨到哪 psp 啊啊这样的一个文件。嗯哦,这个编辑好看哦。嗯,这个编辑 切,我我我其实呃因为嗯就说这块啊,这块我做了一些相应的一些优化啊,做了一些相应的优化,把第八个呢,第八个呢是引入了进来啊,这个呢没有给大家去说,但是呢,这个原码都是在的啊,大家可以去看。其实这块我是把第八个这块是 做了处理啊,看看能不能把这个异常啊,再去优化。其实我也自己想到的这个异常过于过于,就是你看非常 很多的遗传,这个只是冰山一角,可能还有非常多。其实我也想 pvp 这个弱力型语言,如何把它做成跟加瓦,或者说是跟其他的强力性语言,比如说 cxr 这样的语言呢,进行一些 嗯,像他去学习到,虽然说这个是我们用皮皮写,但是我们难免会用到一些加法呀啥的其他语言一些东西,然后我们需要慢慢的去加强他。 所以我说这个异常处理其实是对于这个普通的,就是说 psp 开发其实是够的,但是呢,再再想,再过来,再去加强的话,其实 ppp 也显得有些不足啊。啊,这个语言本身就是这个样子,然后再加上这框架里面的异常 非常多啊,非常多的呀。我这里呢也是引了一部分,也不完全。我在接下来的日子打算就是如果说有时间我会把这块进行继续的去 去做优化啊。去做优化,并不是说现在这个样子啊。至于这个代码规范,其实我们可以看到我这个索尔索尔贝斯里面其实就是我这个。这可能就是一个自己的一边吧,习惯吧,比如说 你,你比如说这样简单的一个方法啊,他的一个他的一个返回之下啥的啊,我们是不是去要去做相应的油画, 说我要传一个瓷砖类型的,传一个硬的类型的啊,这个也是通过跟其他语言去做对比,去慢慢的把这个去完善的啊。用并不是说这个就一定是最好的。嗯。其实我嗯 嗯后面的问题呢,其实都不呃,就不是说我特别容易能回答的,但是这个问题就是这个 utf 八和这个 utf 八 nb 四这两个字字头编码呢。其实我是这个是比较容易回答的一个问题啊。 我在这里呢给大家说一下啊,有人问问题,这个是好事情,谢谢大家啊。这节我们先插上这么一段,然后下节我们去讲那个嗯解 wts 啊,这样做一下。嗯,后面我们会生成掏啃会用到的一个东西啊,一个扩展。好,那这节就到这,谢谢大家。

遇到这个问题怎么办?四步教你轻松解决!第一步,选择我的电脑右键单击属性。 第二步,在系统属性面板高级左键单击环境变量。第三步,进入环境变量面板系统变量左键单击新建。第四步,输入变量名为 ugi iutf8mode, 变量值为一,确定就 ok 了,记得收藏哦!