正则表达式规则
普通字符 |
正则匹配 |
\n |
匹配换行符 |
\t |
匹配制表符 |
\w |
匹配字母,数字,下划线 |
\W |
与上面相反 |
\d |
匹配十进制数字 |
\D |
与上面相反 |
\s |
匹配空白字符 |
\S |
与上面相反 |
[ab89x] |
匹配ab89x中任意一个 |
[^ab89x] |
与上面相反 |
. |
匹配除换行外任意一个字符 |
^ |
匹配开始位置 |
$ |
匹配结束位置 |
* |
前一个字符出现0\1\多次 |
? |
前一个字符出现0\1 |
+ |
前一个字符出现1\多次 |
{n} |
前一个字符恰好出现n次 |
{n,} |
前一个字符至少出现n次 |
{n,m} |
前一个字符至少n次最好m次 |
| |
模式选择符或 |
() |
想要提取的部分 |
*? |
懒惰模式(精准匹配) |
+? |
同上 |
语法
- 导入集成包
import re
- re.S | 使其匹配多行
- re.l | 使其匹配忽略大小写
re.compile('',re.S或者re.l).findall('')
p.s
import re
string = 'a89cdefg'
pat = '.c(.*?)f'
data = re.compile(pat).findall(string)
print(data)
>>> ['de']