粉丝1.7万获赞5.7万

你好,我是艾文,我们接下来学习一下正则表达式。首先来看一下我们的学习目标,第一个知道什么是正则表达式,积极作用。第二个能够应用 id 翻的 ol 方法提取数据。 第三个理解而原创在正则中的作用。首先来看一下正则表示的概念与作用。首先来看一下正则表示的概念, 那什么是政策表示呢?政策表示是一种自助串的匹配模式,或者称之为匹配规则。那有了这样一种匹配模式和匹配规则,我们可以做什么呢?我们接下来看一下政策表示的作用。 第一个他可以检查一个字母串里面是不是包含某个子串,第二个他可以替换匹配的子串,第三个他可以 提取某个自助串中匹配的子串。这个第三个功能是我们在爬窗里面用的最多的一个功能,这个功能对应到我们的阿姨模块,里面的方法就是阿姨点翻的哦,方法好了,接下来我们来看一下正则表示中常见的语法。首先 我们来看一下关于字符匹配,一般字符是用来匹配自身的,比如说 abc 与 abc 是匹配的,然后点号呢,是匹配除框符以外的任意一个字符,比如说 adc, 他可以和 abc 匹配,也可以写和 acc 匹配, 也可以和 adows 匹配。斜杠是转音符,比如说这个点号在我们的正则里面有特殊的含义,但我此时呢就想让他成为一个点号,这时候呢我们就需要做个 转义,还有中括中框就是表示他里面的字符呢,出现任意一个,出现一次都可以。 好了,接下来给大家去演示一下这些语法,那回到我们的代码里面,我接下来给大家去创建一个拍摄文件,写个零六,这是 正则表达式的常见语法。首先呢我们要导入正则表达式的模块,导入正则模块,正则模块在我们的拍森里面叫二一 这样一个模块,因为你没有这样一个模块,你就没办法使用正则表示。我首先说字符匹配,字符 匹配,然后在这里面呢我们要使用一个范德奥方法,我们先用范德奥呢就是查找所有的他,第一个呢要写正德表达式,比如说我写个 abc, 然后这后面呢我们也写个 abc, 那么前面是钟头表示,后面呢是我要查找的自助串,我要从这个自助串里面查找和 abc 匹配的内容,那找都找不到啊,答案是 肯定的,对吧?打印一个 rs 运行,这时候是不是 abc 就可以找到啊?但是如果要是我把它改成 adc, 还找得到吗?是不就匹配不上了,因为这个 b 和这个 d 是匹配不上的,所以的话就会出现一个空。 ok, 好了, 有人说为什么说要从这个子窗里面进行查找啊?因为前面可以巴拉巴拉巴拉,然后面也可以巴拉巴拉,只要是这里面有个 abc 就可以, 他就可以找到 abc, 这就是发的奥方法的特点。 ok, 他可以从一长串里面找到我们所要的内容。好了,我现在把它给去掉,这是关于 普通字符的匹配,然后向我们来说点号,点号它可以匹配除荒符以外的任意一个字符,写个点翻。哦,这里呢我们写个 a 点 c, 那在这个位置呢,我们写一个 abc, 能不能匹配呢?我们来运行一下,走你是不是可以匹配啊?然后这个地方我写一个 a 百分号 c 能不能匹配啊?走你是不是也可以匹配啊?但是我在这写一个 a 换行负 c, 能不能匹配呢?我再来走你,我发现匹配不上了,因为这个点号呢,是匹配除换安符以外的任意一个字符,就是不能匹配换安符,所以呢,这就让大家需要注意一下就可以了。在这呢,我们 依然把它给改回来,改成一个 abc 应该是没问题的,对吧?但有些时候呢,我只想匹配一个 adc, 我现在呢就要匹配 adc, 然后这时候呢,能不能匹配上 adc 呢?我来运行一下,走你,我发现他是可以匹配 adc 的,但是呢,我这里面 abc 是不是也能匹配啊?我 acc 是不是也能匹配啊?我现在只想要 a 点 c, 那怎么办呢?那这时候呢,我们就需要最前面这个点号呢,自我转移,让他变成一个普通的字符,而不是一个通配符, 老叫我把它转移一下。转移一下之后呢,我们家再来运行你,我发现 a 点 c 是可以匹配的,那这时候 abc 还能匹配吗?我再来运行一下,走你,我发现 abc 就匹配不上了,他就只能匹配 a 点 c, 这是关于转音符的作用。 ok, 那接下来说中括号,我们来 r、 s, i 点 fanto, 然后这时候呢,我写一个 a、 b、 c, 然后这里面呢,我们写个 d, 那这位置他 能不能和 abd 匹配啊?可不可以?应该是可以的,对吧?然后这时候这里面有个 b, 所以他是匹配上的,然后能不能和 acd 匹配呢?我就要再来运行,你走,你 是不是 acd 也可以啊,他能不能和 a、 e、 d 匹配呢?肯定是不行的,对吧?因为这个中框里面不包含 e 啊,所以他就匹配不上。 ok, 好了,接下给他改成一个 abd 运行,是不可以匹配啊。到此呢,我们的字符匹配就说完了,我们接下来回到 ppt 来看一下预定意义的字符级。首先来看一下斜杠低,他用来匹配零到九的数字的,想大的呢, 就是匹配非数字的,只要不是数字都可以。斜杠 s 是用来匹配空白辅的,比如空格杠 t, 杠二杠 n 杠 f 杠 v, 想大 s 呢,是来匹配非空白符的,想 w 呢,是匹配所有的字母数字下压线以及中文。斜杠大 w 呢,就是匹配非单词字符,只要不是上面的都可以进行匹配。 我现在回到代码里面给大家去演示一下,我在这呢,就给他说一下关于预定义的字符集 语,定一的自负级在这呢,依然是 r、 s, 他就优等一个阿一点发音的哦,在这呢,我写个斜杠低,后面呢写个自负串叫一二三,能不能 杯呢?我们来运行一下,走你,我发现呢,他是可以匹配一二三的,对吧?这时候呢,你会发现他这个一是一个,二是一个,三是一个,因为这个斜杠低呢,只能匹配一个字符,所以呢,他不是 整体的一二三,而是一是一个,二是一个,三是一个。因为他要先拿这个斜杠低找一次找到 a, 再找一次找到二,再找一次找到三,是这样一个情况。好了,那接下来我们来说一下斜杠 w 选 w 呢,他用来匹配字母,比如说大写的 a, 小写的 v, 小线,然后这些呢,能不能匹配啊?我来运行一下走你是不是都可以匹配上啊?那能不能匹配中文呢? 我试验一下,中文可以吗?中文来运行一下走你,我发现中文是不是也 ok 啊?那能不能匹配一些特殊字符啊?比如说刀老虎百分号,可不可以啊?我再来运行一下走你, 我发现他是不匹配的, ok, 所以说写上 w 呢,他就只能匹配字母、数字下线和中文,其他的就不匹配了。 然后这两个呢也是在我们爬窗里面用的最多的,我们就给大家演示一下其他的,大家有兴趣的话自己玩了。当然有些 时候呢,我们可能说需要让他出现很多次,而不能说他出现一次我就写一个,出现一次就写一个,这时候呢我们就需要用到一个数量词,比如说这个信号就表示前面的匹配模, 表示出现过零次或者是无限次。这个加号呢,就是前面的那个匹配模式呢,出现一次或者是无限次。这个问号呢,就是匹配前面那个匹配模式出现过零次或者是一次。这个 m 呢,就表示匹配前面那个字符出现过 m 次。 那好了,接下来给大家去演示一下数量词,我们把上面这个拿过来, 在这里面呢,我在这加上一个信号,就表示前面这个斜杠低呢,出现零次或者是多次, 这时候呢他就可以把一二三整体上匹配下来,但是下面呢会有一个空串,空串的原因是因为这整体上是允许匹配空的,所以呢他会出 空串这样一个种情况。但如果要是你通过一个限定服给他做一个限定,比如说这边写个 a, 那就前面一定要有一个 a, 这时候呢,你后面也需要加上一个 a, 然后这时候呢,他就不会出现这种空了,因为这个圈里面要求一定要有一个 a, 你后面没有 a, 他就匹配不上。好了,这个 给大家做了一个演示,这是关于这个信号,用来修饰前面这个正则,出现零次或者是多次,让我们来看加号,加号的话就表示前面他出现过一次或者是多次, 这样我们来这运行一下,走你,他是不是一样可以匹配到啊?然后呢,如果要是说这样呢,我只有一个 a, 能不能匹配上呢? 我只有一个 a, 他就匹配不上了,那上面这个地方只有一个 a, 能不能匹配上呢?我把这个地方给住了,上面只有一个 a, 能不能匹配上呢?是可以的,因为他可以允许前面这个出现零次,但他要求呢至少要出现一次, 所以呢他这里面你至少要是个 a 一才能匹配上,否则就匹配不上, ok, 是这样一个情况,我再把它给拿过来啊,这是关于这个加号和信号的区别,除了他之外呢,还有一个是问号,问号就表示 当前的字符出现零次或者是一次,这边写个 a 斜杠低来问号,这时候呢,我们在后面写一个 a 一,但 a 二也可以啊,来这运行一下走你,所以 a 二是是不是可以匹配上啊?那 a a 能不能匹配上呢? a 也可以匹配上, ok, 就是说这个数字可以有,也可以没有,当然 a 是必须要有的,那一二三的话,他只会匹配一个,所以呢只能拿到 a 一。 另外一个我们还可以指定次数,我们可以通过花框来指定次数,比如说我就要两个,然后这是指定为二,那这时候呢,他出来的结果就是 a 一二对不对? 一二。好了,到此我们就把这个数量词给大家说完了。信号表示前面这个出现 零次或者是多次。加号呢,表示前面这个匹配模式出现一次或者多次。问号呢,就表示前面这个匹配模式出现零次或者是一次。 这个花框里面写个数字就表示前面这个出现过多少次。写二就表示他出现两次。写个三就表示前面这个呢出现三次,可以在这里面进行指定。 到此呢我们就把正则表示的常言语法给大家说完了,回来接下来对我们的内容做一个小结。 首先是正则表示的概念,正则表示呢是一种自创的匹配模式,接下来就是正则表示在我们爬床中的作用, 他是从某一个字串中提取符合条件的子串,这样说一下他的常见语法。第一个就是点号,他可以匹配除匡扶以外的任意一个字符, 想的呢就是匹配零到九的数字,想 w 呢,他可以匹配所有的字母数字和下划线 以及中文新号表示前面的一个匹配模式出现零次或者是多次。加的话就表示前面的一个匹配模式出现一次或者是多次。问号的话,就表示前面一个匹配模式出现零次或者是一次。 另外还有一个是花框,花框就表示它里面写一个己,就表示前面那个匹配模式出现过多少次。好了,到此呢,我们正则表示的常言语法就说完了。然后下一页我们将给大家介绍阿姨模块的翻的 olo 方法。

