转 PHP正则表达式,看这一篇就够啦!
文章对PHP正则的一个概要,其实一篇肯定不够,就比如匹配任意字符为[\s\S]*,这样的例子没怎么举,但是这些是很常用的。后续还会加些例子 20200412
原文链接: https://www.cnblogs.com/Johnson-lin/p/10875388.html
前言#
不知道你们有没有这个感觉,看正则表达式就像看天文数字一样,什么电话号码、邮箱的正则表达式,上网复制一下粘贴下来就搞定了。完全不知道这写的是什么玩意。后来我自己也想学一下,因为感觉用处还是挺大的。看了看视频,额...真**简单。这里的话如果想看视频学习的话我推荐一下慕课网这门鬼斧神工之正则表达式课程,上手真的太快了。好了,废话不多说,开始搞事情。
基本语法#
界定符:#
标识一个正则表达式的开始和结束,用'/'或'#'或'{ }',因为语法'{ }'也可能是正则表达式的运算符,为了避免混淆,所以不建议使用。建议的用法如下:
Copy
$pattern = '/[0-9]/'; //我喜欢这个,看起来比较简洁
$pattern = '#[0-9]#';
原子:#
可见原子:Unicode编码表中可用键盘输出后肉眼可见的字符,例如:标点 ; . / ? 或者英文字母,汉字等等可见字符
不可见原子:Unicode编码表中可用键盘输出后肉眼不可见的字符,例如:换行符 \n,Tab制表符\t, 空格等等,
一般只用这三个(换行符一般和其他字符一起匹配,因为只有换行符是匹配不到的)
小提示:匹配运算符前面需要加'\' 例如:'+' 号,匹配的话需要写出 '\+'
元字符#
原子的筛选方式:
| 匹配两个或者多个分支选择
[] 匹配方括号中的任意一个原子
[^] 匹配除方括号中的原子之外的任意字符;
例子:Duang|duang 或者 [Dd]uang 都可以匹配到Duang和duang
区间写法:[a-z]匹配a到z的字符, [0-9]匹配0到9的字符。也可以[a-z0-9]
. 匹配除换行符之外的任意字符
\d 匹配任意一个十进制数字,即{0-9]
\D 匹配任意一个非十进制数字[^0-9] 相当于[^\d]
\s 匹配一个不可见的原子,即[\f\n\r\t\v]
\S 匹配一个可见的原子,即[\f\n\r\t\v],相当于[\s]z
\w 匹配任意一个数字、字母或下划线,即[0-9a-zA-Z_]
\W 匹配任意一个非数字、字母或下划线,[0-9a-zA-Z_],相当于[\w]
量词#
{n} 表示其前面的原子刚好出现了n次。
[n] 表示其前面的原子最少出现n次
{n,m} 最少出现n次,最多出现m次
* 匹配0次、一次或者多次,即{0,}
+ 匹配一次或多次,即{1,}
? 匹配0或1次,即{0,1}
边界控制#
^ 匹配字符串开始的位置
$ 匹配字符串结尾的位置
例:^John 可以匹配到:John 但是匹配不到:123John,因为规定了字符串以John开头
模式单元#
() 匹配其中的整体为一个原子, 如: (X|x)iaomi , 可以匹配到 xiaomi
修正模式#
贪婪匹配#
匹配结果存在歧义时取其长(默认)
懒惰匹配#
匹配结果存在歧义时取其短,只需在正则表达式的后面'/'加上'U',例如'/[0-9]/U';
例子:
Copy
$subject = "test__123123123";
preg_match('/test.+123/', $subject, $matches); //贪婪模式
var_dump($matches);
preg_match('/test.+123/U', $subject, $matches); //懒惰模式
var_dump($matches);
常见的修正模式:#
U 懒惰匹配
i 忽略英文字母的大小写
x 忽略正则表达式的空白符
s 让元字符'.' 匹配包括换行符在内的所有字符
常用函数#
preg_match#...
|-原 PHP正则匹配中文汉字和中文字符(亲测有效)
网上有些代码不对,能匹敌到韩文等文字
匹配中文汉字的代码是,注意匹配不到中文的标点符号
preg_match('/[\x{4e00}-\x{9fa5}]/u',$str,$matches)
另外要判断单个字符是不是中文的标点,可以这样 ...
|-原 PHP正则表达式提示Warning: preg_match(): Delimiter must not be alphanumeric or backslash
Warning: preg_match(): Delimiter must not be alphanumeric or backslash...