五5-2Python常用正则表达式

2024-04-28 06:50•python•阅读 4596

1、常用正则表达式

Python支持的正则表达式元字符和语法：

正则表达式里的元字符及其作用

2 re正则对象和正则匹配效率比较

re模块

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。

re 模块使 Python 语言拥有全部的正则表达式功能。

compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

re模块也提供了与这些方法功能完全一致的函数，这些函数使用一个模式字符串做为它们的第一个参数。

re模块是python中处理正则表达式的一个模块，通过re模块的方法，把正则表达式pattern编译成正则对象，以便使用正则对象的方法。

正则匹配时，优先编译成正则对象，然后进行匹配，程序的执行效率高。

3 编译正则对象

正则匹配字符‘r’

r表示raw的简称。raw string意思是原生字符，这个字符串中间的特殊字符不用转义

如表示'\n',可以这样：r'\n' 或者'\\n'

1、re.compile([pattern[,flags]])

这个方法就是把字符串的正则表达式编译成正则对象，第二个flag是匹配模式，取值可以使用按位或运算符"|"表示同时生效。如：re.I|re.M,flag的可选项有：

re.I(re.IGNORECASE)：忽略大小写

M(MULTILINE):多行模式，改变'^'和'$'的行为

S(DOTALL):点任意匹配模式，改变'.'的行为

X(VERBOSE):详细模式。这个模式下增长表达式可以是多行，忽略空白字符，并可以加入注释，下面两个正则是等效的

a = re.compile(r"""\d + # the integral part

\. # the decimal point

\d * # some fractional digits""", re.X)

b = re.compile(r"\d+\.\d*")