当前位置：首页 > 手机资讯 > 正文

正则表达式,看完这篇还是不够的。手机号码搜索「正则表达式,看完这篇还是不够的。」

yu
手机资讯
2025-02-19
55

看了好几次正则表达式，稍微碰到复杂的还是看不懂。

很多文章宣称，看完这编就够了。够了，真是够了，有多少人看完还是不会复杂表达式？大部分文章都没有去分析复杂例子，没有写任何体会。把教材基本语法说一说，就敢宣称，你懂了。

还是推荐https://github.com/ziishaned/learn-regex/blob/master/translations/README-cn.md#41--%E6%AD%A3%E5%85%88%E8%A1%8C%E6%96%AD%E8%A8%80

配合在线练习来学习。

这次认真根据每个语法符号做了几个例子，比较清晰了。记录几点要点。

最基本要记住，正则表达式可以称为，贪婪得到子字符串的表达式。

1.正则表达式的基本目的就是查找目标字符串中符合表达式的 ‘子字符串’。

1.1明确这个很重要。因为不同的语言会给表达式类附加很多功能和函数。match,find.等等。这些功能都是从这个基本目的引申出来的。千万别忘记了这些功能都是基于正则表达式的基本目的。

1.2而且明确了这个目的也会帮助理解正则语法中的^和$符号。记住^和$也是来找 ‘子字符串‘的，只不过^$同时出现，恰巧表达了整体匹配表达式的含义，表达出了 ‘子字符串’是整体字符串的特例的情况。

理解^$同时出现的解释：某个子串，必须开头匹配表达式，而且结尾也必须匹配表达式，那么如果存在匹配的子串，它也只能是整个字符串。

2.表达式的每个符号的语法还是要清晰的掌握。随便看一眼，是懂非懂，无济于事。

2.1 [ ] ,表达的是单个字符。所以才可以[^xxx],来表示非某的单个符号。而 (||)，表达的选择其中的字符串。(^||)是无法表达非字符的意思的。因为这个语法无法确定非之后，你需要字符的长度。它不会表达非的语法。而是表达开头匹配的意思。

要表达非子串，必须依赖预查功能，仔细想想，(^||)，无法表达长度，而且语法也没有支持它表达任意长度。所以必须依赖否预查，

一段语法表示你要查的东西，附加一个预查功能，还有一个重点依然是第一要点。会有很多子串满足非子串的功能。

3.表达式默认的是贪婪模式，所以很多时候，我们并没有输入^$, 但结果是整个字符串，而不是子串。当我们明确整个全匹配，最好加上^$，而不要依赖贪婪模式，这有助于我们理解正则表达式的本意。

　　还有贪婪模式的方向是贪婪的包含，而不是贪婪的非包含，所以再表达非的时候，往往表达式和我们想要表达的意思不同。

4.零宽度断言，必须时刻清醒的认识到断言的意义是断言。是对左边或者右边的表达式进行判断的，就算符合，符合断言的表达式，是不会加到结果中的。所以是零宽度断言。

以几个例子来分析正则表达式。

常用语法

1. . 代表一个任意字符。 * 号不是通配符，在正则中，它是表示无限重复前面的表达式。它本身单独是没有作用的。

2. [ ] 表示的是选择出一个单个字符。 ( ) 这个符号有很多组合，是最容易混淆的。 (| |) 表示选择 . ()表示子表达式，用于分组，或者让某些符号起作用如()*，让子表达式可以重复。 (?=) 又可以表示断言。

3. ^(?!.*apple).*$ 是否含有apple，含有返回位置0，不含有不返回数字。返回的数字，表示从那个位置开始进行下一个匹配。而我们一般的表达式返回的是2个数字。表示这段区间是匹配的。从这段区间开始下一次表达式的匹配。

4. 断言语法又是个有个性的表达式。后断言，写在某子表达式的后面。前断言又需要写在表达式的前面。太戏精了。都有不同的符号表达前后之分。为什么不都放在表达式的后面呢？

一。表示一个不包含apple 的字符串，该如何写。

如字符串为 this is an apple! 我们如何写一个表达式，让他不匹配 'this is an apple!'
1.(^apple)
这里^没有表示非的意思。^只能和[]单个字符来组合。这里的()表示了一个组，而不是选择符号。^表示的是要开头匹配表达式，也就是^符号的另外一个语法含义。
我是如何知道的? 点这里。https://regex101.com/r/IDDARt/76 输入 (^apple) 这个表达式。它就会告诉你。这个网址是你掌握表达式的利器。
2.[^a][^p][^p][^l][^e]
这样呢？那我一个一个组合啊。聪明吗？毛线。仔细想想[]表示的是一个字符。那么这里表示的是我要匹配5个字符，任意5个字符。只要1位置不是a，2位置不是p，3位置不是p,4l.5.e。如果只有1或2个或6个以上字符。是不会匹配的。
3.再认真想想，我们的需求：表示一个不包含apple 的字符串。‘不包含apple’ 这个是一个修饰，而不是要找的东西。是不是很眼熟，这个不就是预查的语法意义吗,?= ?! ?<= ?<!
3.1首先必须加上^$,因为不加的话是子串不包含apple，这个就太多匹配的了。不是我们的本意，我们要的是整个字符串不包含apple，而不是其中某子串不包含也可以。
3.2 那这样行不行？ ^.*(?!apple).*$ 。初看是可以，其实也不行。因为正则表达式是贪婪匹配，可以匹配很多。this is an apple!中，第一个 .* 可以匹配 this is an app .那那么后面只有le.也是符合表达式的。
3.3 想不出来，因为我是隐约记得有这个表达式，但是自己没去认真看，想自己推写出来。到这里卡壳了。
3.4... 往前预查，可以用.*来贪婪作弊。但是我们可以用往后预查吧。已经得到的字符串，没法作弊吧。 ^.*(?<!apple)$ ，不行 ^.*(?<!apple).*$ 也不行。仔细思考。因为他不是准确表示了不包含的意思。
^.*(?<!apple)$ 这个可以准确表示结尾不能是apple,但不是包含， ^.*(?<!apple).*$ 这个就离谱了，解释器可以可以通过末尾的 .* ，对字符床进行任何的切割来使他不包含apple。如这里.*可以表示ple!。又是作弊。
3.5 唯一想到的是 ^.*(?<!apple.*)$ 。但是它不是个合法的表达式。看别人的写法吧。不想了。 ^((?!hede).)*$
3.6 ^((?!hede).)*$ ，某个字符的前面不包含hede，之后再对此类字符扩展。恩。没想到还能这样写。因为.*之后再描述它的限制，会让解释器利用.*来暴力匹配合适的情况。而 (?!hede). .让解释器只有一种解释。恩。不错。。。

3.7 自己做密码验证又发现一个更简单的写法。用空表达式的后查 ^(?!.*apple).*$ 。可以匹配是否包含apple。并从0位置。开始继续下面的匹配。

二，常见密码验证，必须包含大写字母，小写字母。长度9到16，而且只能是字母和数字。

^(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z])[0-9a-zA-Z]{9,16}$

1.自己真是不容易才推出来。涉及到的语法细节，很多文章都没有介绍。首先我们的要求是必须包含。含有此意思的语法符号又是断言语法(?xxx).但是想想，断言语法，是不包含断言语句的。也就是匹配之后是不包含数字，字母的。这个。。。

2.所以这里有个大部分文章没有讲的一个细节。如果 (?=) 之前，没有表达式的话，那么返回的不是匹配的子串，而是一个位置,position. (?=.*[0-9])，这个的意思是返回出现数字之前的位置，而且可以有任意符号。那么对于abc123456789A

会返回除下A之前的位置的所有位置。如果我们加上^，那么把匹配缩到0位置。所有 ^(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z]) 这个会匹配含有小写，大写，数字的字符串的0位置。

我是如何没有了解相关介绍，而自己推出来的？

还是我们的利器。https://regex101.com/r/IDDARt/13 。自己写例子。自己看右边的解释，一点一点测试推测，求证。

3.加上^返回了我们匹配的其实位置。那么这个时候才开始写匹配表达式。因为已经包含了大写，小写字母，数字。所以我们的要求就变成了长度了。所以后面写[0-9a-zA-Z]{9,16}$。结束。

4.再总结下，前面没有表达式直接写(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z]) 会返回一个位置，告诉你符合这些预判条件的初始位置在那里。因为我们是要求初始位置必须是0.所以加上^,看看是否匹配，或者说去掉非0位置的其他匹配。

得到初始位置，就是我们下面语句匹配的开始位置。我们设定了为0，也就是字符开头。我们只要长度和类型就可以。所以[0-9a-zA-Z]{9,16}，并且必须包含结尾。$

5. 受这里启发。我发现表示不包含有个更简洁的表示方法。 ^(?!.*apple).*$

3.省份证。

(^d{15}$)|(^d{18}$)|(^d{17}(d|X|x)$)

很简单了。不解释。

其实仔细看下正则表达式语法真的很少了。

正则表达式的全部语法字符。

元字符

元字符描述 . 句号匹配任意单个字符除了换行符. [ ] 字符种类. 匹配方括号内的任意字符. [^ ] 否定的字符种类. 匹配除了方括号里的任意字符 * 匹配>=0个重复的在*号之前的字符. + 匹配>=1个重复的+号前的字符. ? 标记?之前的字符为可选. {n,m} 匹配num个大括号之前的字符 (n <= num <= m). (xyz) 字符集, 匹配与 xyz 完全相等的字符串. | 或运算符,匹配符号前或后的字符. 转义字符,用于匹配一些保留的字符 ^ 从开始行开始匹配. $ 从末端开始匹配.

正则表达式提供一些常用的字符集简写. 如下:

简写描述 . 除换行符外的所有字符 w 匹配所有字母数字, 等同于 W 匹配所有非字母数字, 即符号, 等同于: d 匹配数字: D 匹配非数字: s 匹配所有空格字符, 等同于: S 匹配所有非空格字符: f 匹配一个换页符匹配一个换行符匹配一个回车符匹配一个制表符 v 匹配一个垂直制表符 p 匹配 CR/LF (等同于 )，用来匹配 DOS 行终止符

零宽度断言，

说人话：匹配表达式的附加条件，

我要找小红旁边的（断言）男孩子。所以我要找的是男孩子，小红的不要（零宽度）。

符号描述 ?= 正先行断言-存在 ?! 负先行断言-排除 ?<= 正后发断言-存在 ?<! 负后发断言-排除

后面应该有

后面不应该有

前面应该有

前面不应该有

其他语法规则

下面列出了最常用的一些：

表4.常用分组语法分类代码/语法说明捕获零宽断言注释

最后还有平衡组/递归匹配

学习中途的理解

//思考一个表达式语法如何可以表示任何东西?首先必须有语法表示：
//某子段表达式出现0到无数次。只有掌握重复自己的技能，才有从有限到无限的可能。
//所以需要有1，表示子段的能力。2表示重复次数的能力。
//其次必须有1.表示某个符号的能力，2.表示任意符号的能力，3.表示某组符号中的一个的能力。那么这样的话，和前面的能力结合，理论上就可以表示任何东西。
//当然扩展开来，有一个非符号，在某些情况下，可以表达更简洁,特别注意非，首先是某个可以表示确定含义的语法（确定的长度和符号范围）才能去非。[]是确定的语法，确定了1长度。任意字符为范围。
//而对于匹配后的继续子匹配，可以在一次匹配中就表达出。需要扩展语法。java 用().
//其实 regex 晦涩就在于细节多，碎片学习的话，可能就会对于()的分组作用漏学。导致误认为是选择含义，产生各种疑惑。因为各种组合表示可以有多种语法表示，有的简洁，有的复杂。所以加大了看懂别人表达式的难度。
//[]是单个字符含义，()是选择和分组。{} 是表示重复概念。

1 . 校验密码强度

密码的强度必须是包含大小写字母和数字的组合，不能使用特殊字符，长度在8-10之间。

2. 校验中文

字符串仅能是中文。

3. 由数字、26个英文字母或下划线组成的字符串

4. 校验E-Mail 地址

同密码一样，下面是E-mail地址合规性的正则检查语句。

5. 校验身份证号码

下面是身份证号码的正则校验。15 或 18位。

6. 校验日期

“yyyy-mm-dd“ 格式的日期校验，已考虑平闰年。

7. 校验金额

金额校验，精确到2位小数。

8. 校验手机号

下面是国内 13、15、18开头的手机号正则表达式。（可根据目前国内收集号扩展前两位开头号码）

9. 判断IE的版本

IE目前还没被完全取代，很多页面还是需要做版本兼容，下面是IE版本检查的表达式。

10. 校验IP-v4地址

IP4 正则语句。

11. 校验IP-v6地址

IP6 正则语句。

12. 检查URL的前缀

应用开发中很多时候需要区分请求是HTTPS还是HTTP，通过下面的表达式可以取出一个url的前缀然后再逻辑判断。

13. 提取URL链接

下面的这个表达式可以筛选出一段文本中的URL。

14. 文件路径及扩展名校验

验证windows下文件路径和扩展名（下面的例子中为.txt文件）

15. 提取Color Hex Codes

有时需要抽取网页中的颜色代码，可以使用下面的表达式。

16. 提取网页图片

假若你想提取网页中所有图片信息，可以利用下面的表达式。

17. 提取页面超链接

提取html中的超链接。

18. 查找CSS属性

通过下面的表达式，可以搜索到相匹配的CSS属性。

19. 抽取注释

如果你需要移除HMTL中的注释，可以使用如下的表达式。

20. 匹配HTML标签

通过下面的表达式可以匹配出HTML中的标签属性。

正则表达式手机号码这篇还是

本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕，E-mail：xinmeigg88@163.com
本文链接：http://jy.tttmy.cn/news/9021.html

上一篇
手机开机慢是什么原因手机开机慢怎么办「手机开机慢是什么原因」

下一篇
火影vs死神正式版死神vs火影手机版「火影vs死神正式版」