Python re正则表达式操作指南
PYTHON正则表达式指南
python re正则表达式模块中文简介:
python re模块(Regular Expression正则表达式)提供了与Perl等编程语言类似的正则匹配操作,
它是一个处理python字符串的强有力工具,有自己的语法和独立的处理引擎。几乎所有的编程语言中,正则表达式的语法都是一样的,区别只在于它们实现支持的正则表达式语法的数量不一样。
- PYTHON RE模块目录
一、python re正则表表达式语法
1、匹配字符
. 匹配任意除换行符,也就是“\n”以外的任何字符。
\ 转义符,改变原来符号含义,后面会有演示。
[ ] 中括号用来创建一个字符集,第一个出现字符如果是^,表示反向匹配。
2、预定义字符集
\d 匹配数字,如:[0-9]
\D 与上面正好相反,匹配所有非数字字符。
\s 空白字符,如:空格,\t\r\n\f\v等。
\S 非空白字符。
\w 单词字符,如:大写A~Z,小写a~z,数字0~9。
\W 非上面这些字符。
3、可选项与重复子模式
* 匹配前一个字符0次或无限次数。
+ 匹配前一个字符1次或无限次数。
? 匹配前一个字符0次或1次。
{m} 匹配前一个字符m次。
{m,n} 匹配前一个字符m至n次。
二、python re模块重要函数变量
1 )、compile() 根据正则表达式字符串,创建模式的对象。
2 )、search() 在字符串中寻找模式。
3 )、match() 在字符串开始处匹配模式。
4 )、split() 根据模式的匹配项来分割字符串。
5 )、findall() 显示出字符串中模式的所有匹配项。
6 )、sub(old,new) 方法的功能是,用将所有old的匹配项用new替换掉。
7 )、escape() 将字符串中所有特殊正则表达式字符转义。
三、python re模块的主要功能
re.compile()方法功能是将正则表达式转换为re的模式对象,更高效率的匹配字符串。
re.search() 方法会在给定的字符串中,寻找第一个匹配的正则表达式子串。
函数找到子字符串的话会返回MatchObject,值为 True,找不到会返回None,值为False。
re.match() 函数会在字符串的最开始部分进行匹配。
re.split() 函数会根据模式的匹配项来分割字符串,类似于我们字符串的split方法,不过它是用完整的正则表达式来替代了固定的分隔符。
re.findall() 会以列表的形式返回给定模式的所有匹配项。
re.escape()是一个很实用的函数,它可以对我们要查找的字符串中所有可能会被解释为正则运算符的字符进行转义。
四、python re模块实例源码演示
五、python re正则模块小结
以上玩蛇网www.iplaypy.com只介绍了一些python正则表达式指南,在我们编程过程中的方方面面,都会被使用到,
所以,它也是我们每一个编程爱好者必会的一种技能,尤其是网络抓取,匹配我们需要的信息,如:汉字、标题、邮箱、电话、产品价格等信息时,更会突出它的作用。
玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/module/re.html
相关文章 Recommend
- • Python正则表达式匹配不成功,值为None
- • 怎么能保证python抓取页百标题的正确率
- • Python对JS型数据抓取有什么特别好的方法吗
- • python批量抓取二级域名标题的方法
- • Python模拟登录人人抓取内容页问题
- • 请问Beautifulsoup抓取select标签中option文本方法是什
- • Python requests库页网页抓取乱码问题
- • 我的python正则表达式写的对吗
- • 用Python进行网页抓取:selenium 还是 X ?
- • Python除scrapy外,还有哪些优秀开源爬虫抓取框架
- • Python requests多线程抓取请求都报异常无解
- • Python requests抓取速度变慢求分享应对经验
PYTHON基础入门必备教程 Must Know PYTHON Tutorials
- • python 解释器
- • python idle
- • python dir函数
- • python 数据类型
- • python type函数
- • python 字符串
- • python 整型数字
- • python 列表
- • python 元组
- • python 字典
- • python 集合
- • python 变量
- • python print
- • python 函数
- • python 类定义
- • python import
- • python help
- • python open
- • python 异常处理
- • python 注释
- • python continue
- • python pass
- • python return
- • python global
- • python assert
- • python if语句
- • python break
- • python for循环
- • python while循环
- • python else/elif
- • lambda匿名函数
PYTHON进阶提高必备教程 Must Know PYTHON Modules
- • os 模块
- • sys 模块
- • re 正则表达式
- • time 日期时间
- • pickle 持久化
- • random 随机
- • csv 模块
- • logging 日志
- • socket网络通信
- • json模块
- • urlparse 解析URL
- • urllib 模块
- • urllib2 模块
- • robotparser 解析
- • Cookie 模块
- • smtplib 邮件
- • Base64 编码
- • xmlrpclib客户端
- • string 文本
- • Queue 线程安全
- • math数学计算
- • linecache缓存
- • threading多线程
- • sqlite3数据库
- • gzip压缩解压
最新内容 NEWS
- • Python linecache模块缓存读取大文件指定行
- • Python OS模块常用功能 中文图文详解
- • Python json解析模块loads/dumps中文encode教程
- • Python random模块sample、randint、shuffle、cho
- • Python urllib2模块post/get 下载网络资源
- • Python re正则表达式操作指南
- • Python time模块 函数格式 时间操作源码演示
- • Python Gzip压缩与解压模块
- • 第三方时间日期库 Python Arrow模块
- • Python Queue模块 多线程安全 先进先出的实
图文精华 RECOMMEND
-
Python linecache模块缓存读取大文件
-
Python OS模块常用功能 中文图文详
-
Python json解析模块loads/dumps中文e
-
Python random模块sample、randint、shu
-
Python re正则表达式操作指南
-
Python time模块 函数格式 时间操作
热点文章 HOT
- Python json解析模块loads/dumps中文encode教程
- Python re正则表达式操作指南
- Python threading多线程模块
- Python string模块 字符串函数方法操作教程
- Python robotparser 网络蜘蛛robots.txt搜索访问
- Python Cookie HTTP获取cookie并处理
- Python urllib模块 网络资源访问安装下载
- Python csv模块读写中文乱码等问题解决
- Python urllib2模块post/get 下载网络资源
- Python sys模块 argv path常用方法图文详解