Python中使用正则表达式的环视功能
2019-8-16 13:28:30 Author: cloudsjhan.github.io(查看原文) 阅读量:3 收藏

Python中使用正则表达式的环视功能

发表于 | 分类于 | 阅读次数: |

| 字数统计: 633 | 阅读时长 ≈ 2

正则表达式中的环视功能解析以及在Python中的使用

什么是环视

环视只是进行子表达式的匹配,并不占字符,匹配到的内容不保存,因此也叫做零宽断言,环视最终的匹配结果就是一个位置。

环视按照方向可以分为顺序环视和逆序环视两种,按是否进行匹配分为肯定和否定两种,组合起来就是四种模式。

环视表达式 解释
(?=expression) 顺序肯定环视,表示所在位置右侧能匹配expression
(?!rexpression) 顺序否定环视,表示所在位置右侧不匹配expression
(?<=expression) 逆序肯定环视,表示所在位置左侧能匹配expression
(?<!expression) 逆序否定环视,表示所在位置左侧不匹配expression

只说概念可能有些抽象,分别举例子来演示一下具体的使用场景。

一些示例

  1. 顺序肯定环视
1
2
3
4
# s = 'xiaomi9iphone8iphone7',需要在每个手机型号后面加上逗号,变成 s= 'xiaomi9,iphone8,iphone7'
import re
print(re.sub(r'(?=iphone)',',',s))
# 顺序肯定环视,所确定的位置右边是字符串iPhone,在此位置即可添加逗号
  1. 逆序肯定环视
1
2
3
4
5
6
# s = 'Takes Reservations:No Delivery:No Take-out:Yes Accepts Credit Cards:Yes Good for Groups:No'
# 需求是要在Yes,和No的后面加上逗号,使之变成
# s = 'Takes Reservations:No, Delivery:No, Take-out:Yes, Accepts Credit Cards:Yes, Good for Groups:No'
import re
re.sub(r"(?<=(No))(?=(\s+))|(?<=(Yes))(?=(\s+))",',',s)
# 逆序肯定环视,所要确定的位左边必须能匹配上No,或者Yes
  1. 顺序否定环视
1
2
3
4
# s = '123aaa',将s字符串变成 s='123,a,a,a,'
# 分析一下,就是在字符串右侧非数字的位置,添加逗号,即使用顺序否定环视,匹配右侧非数字位置
s = '123aaa'
re.sub(r'(?!\d+)',',',s)
  1. 逆序否定环视
1
2
3
4
# 将 s= 'aaa123'变成 s=  ',a,a,a,123'
# 分析一下,就是在非数字左侧的位置加逗号,使用逆序否定环视,匹配左侧非数字的位置
s= 'aaa123'
re.sub(r'(?<!\d)',',',b)

有些例子不是很合理,尽量能表达清楚环视的含义即可。

总结:

1
环视的功能非常强大,也是正则中的一个难点,对于环视的理解,可以从应用和原理两个角度理解,如果想理解得更清晰、深入一些,还是从原理的角度理解好一些,正则匹配基本原理参考 NFA引擎匹配原理

-------------The End-------------

cloud sjhan wechat

subscribe to my blog by scanning my public wechat account

0%


文章来源: https://cloudsjhan.github.io/2019/08/16/Python%E4%B8%AD%E4%BD%BF%E7%94%A8%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E7%9A%84%E7%8E%AF%E8%A7%86%E5%8A%9F%E8%83%BD/
如有侵权请联系:admin#unsafe.sh