Python正则表达式-基础-创新互联

本文转载自昔日暖阳,原文地址:http://www.osheep.cn/4806.html

创新互联建站是一家专注网站建设、网络营销策划、微信小程序定制开发、电子商务建设、网络推广、移动互联开发、研究、服务为一体的技术型公司。公司成立10余年以来,已经为上1000+成都水电改造各业的企业公司提供互联网服务。现在,服务的上1000+客户与我们一路同行,见证我们的成长;未来,我们一起分享成功的喜悦。

python使用正则,需要先引入re模块

import re

匹配符

单个字符表达式含义
[0-9]0123456789任意之一
[a-z]小写字母任意之一
[A-Z]大写字母任意之一
\d等同于[0-9]
\D等同于[^0-9]匹配非数字,即\d的取反
\w等同于[a-z0-9A-Z_]匹配大小写字母、数字和下划线
\W等同于[^a-z0-9A-Z_]等同于上一条取反
.一个任意字符

匹配模式

匹配模式表达式含义
?指定字符一次或者不出现
+至少出现一次
*出现任意次,包括不出现
^从字符串开头进行匹配
$匹配到字符串的结尾
()分组符、也可用于或匹配

案例一:匹配邮箱

  • 匹配126,163邮箱地址
# 匹配126,163邮箱地址
ret = re.match(r"^[0-9a-zA-Z_]{4,20}@(163|126)\.com$", 'hello@126.com')
if ret:
    print('符合要求 - ', ret.group(), ret.group(1))
else:
    print('不符合要求!')

案例二:匹配邮箱并进行分组取值

  • 匹配126,163邮箱地址
# 使用()对匹配值进行分组,可以方便的取得匹配值
# 分组1表示@前面的字符串
# 分组2表示163或者126
ret = re.match(r"^([0-9a-zA-Z_]{4,20})@(163|126)\.com$", 'hello@126.com')
if ret:
    print('符合要求 - ', ret.group(), ret.group(1), ret.group(2))
else:
    print('不符合要求!')

案例三:在正则表达式中使用分组

  • 匹配网页源代码块
# 在正则表达式中使用分组
# 使用\分组数表示需要使用的分组
ret = re.match(r"^<(\w+)>.*$", '

hello

') if ret: print('符合要求 - ', ret.group()) else: print('不符合要求!')
  • 使用多个分组
# 在正则表达式中使用分组
# 使用\分组数表示需要使用的分组,这里表示多个分组
ret = re.match(r"^<(\w+)><(\w+)>.*$", '

hello

') if ret: print('符合要求 - ', ret.group()) else: print('不符合要求!')

案例四:在正则表达式中对分组进行命名

  • 对分组进行命名 语法:标记分组 ?P 引用分组 ?P=name
# 在正则表达式中使用分组
# 使用\分组数表示需要使用的分组,这里表示多个分组
ret = re.match(r"^<(?P\w+)><(?P\w+)>.*$", '

hello

') if ret: print('符合要求 - ', ret.group()) else: print('不符合要求!')

创新互联www.cdcxhl.cn,专业提供香港、美国云服务器,动态BGP最优骨干路由自动选择,持续稳定高效的网络助力业务部署。公司持有工信部办法的idc、isp许可证, 机房独有T级流量清洗系统配攻击溯源,准确进行流量调度,确保服务器高可用性。佳节活动现已开启,新人活动云服务器买多久送多久。


文章标题:Python正则表达式-基础-创新互联
浏览路径:http://pwwzsj.com/article/eshdo.html