PHP正则匹配中文汉字注意

preg_match('/^[a-zA-Z\x{4e00}-\x{9fa5}]+$/u', $str)

如上,是匹配字母或者汉字的,一定要在后面加模式修饰符 u , 不然就出错!

u (PCRE_UTF8)
此修正符打开一个与 perl 不兼容的附加功能。 模式字符串被认为是utf-8的. 这个修饰符 从 unix 版php 4.1.0 或更高,win32版 php 4.2.3 开始可用。 php 4.3.5 开始检查模式的 utf-8 合法性。
utf8格式的匹配模式字符串必须要使用 u 修饰符。 否则出现程序意料之外的异常情况。
代码 :
preg_match('/[<>\\\′""&#=\+]/', '张利', $match);
var_dump($match);
结果 :array(1) {

[0]=>

string(1) "�"

}

preg_match('/[<>\\\′""&#=\+]/u', '张利', $match);

var_dump($match);

结果 :array(0) {

}

u (PCRE_UTF8)
此修正符打开一个与 perl 不兼容的附加功能。 模式字符串被认为是utf-8的. 这个修饰符 从 unix 版php 4.1.0 或更高,win32版 php 4.2.3 开始可用。 php 4.3.5 开始检查模式的 utf-8 合法性。
utf8格式的匹配模式字符串必须要使用 u 修饰符。 否则出现程序意料之外的异常情况。
代码 :
preg_match('/[<>\\\′""&#=\+]/', '张利', $match);
var_dump($match);
结果 :array(1) {

[0]=>

string(1) "�"

}

preg_match('/[<>\\\′""&#=\+]/u', '张利', $match);

var_dump($match);

结果 :array(0) {

}