想获取html中time用python正则如何实现
想做一个爬虫,使用BeautifulSoup假使获取以下内容:
<div class="authi"> <img class="authicn vm" id="" src="static/image/common/online_member.gif" /> <em id="">发表于 <span title="2013-4-2 08:30:11">4 天前</span></em> <span class="pipe">|</span><a href=>倒序浏览</a> <div style="float:right;position:relative;top:-6px;"><ul> <li style="float: left; width: 130px; height: 24px;"><wb:follow-button uid="" type="gray_2" width="136" height="24"></wb:follow-button></li> <li style=" float:left; width: 160px; height: 24px;"></li> </ul></div></div>
如何获取以上内容中的2013-4-2 08:30:11这个时间呢?
我试着写了一个
re.compile('^20\d{2}-\d+-\d+\s\d{2}:\d{2}:\d{2}')
可是这个在使用的时候不能匹配到时间?如何解决?谢谢!
re.compile('20\d{2}-\d+-\d+\s\d{2}:\d{2}:\d{2}')
https://gist.github.com/greatghoul/53...
# -*- coding: utf-8 -*- from BeautifulSoup import BeautifulSoup import re def get_timestamp(html): soup = BeautifulSoup(html) authi_elems = soup.findAll('div', { 'class': 'authi' }) for authi_elem in authi_elems: date_elem = authi_elem.find('span', title=re.compile(r'20\d{2}-\d+-\d+\s\d{2}:\d{2}:\d{2}')) print date_elem.get('title') if __name__ == '__main__': html = """ <div class="authi"> <img class="authicn vm" id="" src="static/image/common/online_member.gif" /> <em id="">发表于 <span title="2013-4-2 08:30:11">4 天前</span></em> <span class="pipe">|</span><a href=>倒序浏览</a> <div style="float:right;position:relative;top:-6px;"><ul> <li style="float: left; width: 130px; height: 24px;"><wb:follow-button uid="" type="gray_2" width="136" height="24"></wb:follow-button></li> <li style=" float:left; width: 160px; height: 24px;"></li> </ul></div></div> """ get_timestamp(html)
玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd20273.html
相关文章 Recommend
- • 想转业学python,请问应该如何规划自己的学习计划
- • 学过Java想再学一门新的语言,选择python怎么样?
- • 想把print输出后的空格删除怎么做
- • 用python获取带图片的验证码怎么样
- • 用Python方法获取桌球游戏坐标怎么写?
- • 想用python调用windows录音机保存文件需要怎么做
- • Python想创建一个相对安全的unique session id应该怎么
- • python提交表单并获取页面操作方法,求解答
- • 求python BeautifulSoup能获取到无标签文本的方法
- • Python获取XML表中CDATA数据的方法
- • Python获取实例名称用什么方法
- • 想做一个“去哪儿”那种垂直搜索的在线工具,
您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:
必知PYTHON教程 Must Know PYTHON Tutorials
- • python 解释器
- • python idle
- • python dir函数
- • python 数据类型
- • python type函数
- • python 字符串
- • python 整型数字
- • python 列表
- • python 元组
- • python 字典
- • python 集合
- • python 变量
- • python print
- • python 函数
- • python 类定义
- • python import
- • python help
- • python open
- • python 异常处理
- • python 注释
- • python continue
- • python pass
- • python return
- • python global
- • python assert
- • python if语句
- • python break
- • python for循环
- • python while循环
- • python else/elif
- • lambda匿名函数
必知PYTHON模块 Must Know PYTHON Modules
- • os 模块
- • sys 模块
- • re 正则表达式
- • time 日期时间
- • pickle 持久化
- • random 随机
- • csv 模块
- • logging 日志
- • socket网络通信
- • json模块
- • urlparse 解析URL
- • urllib 模块
- • urllib2 模块
- • robotparser 解析
- • Cookie 模块
- • smtplib 邮件
- • Base64 编码
- • xmlrpclib客户端
- • string 文本
- • Queue 线程安全
- • math数学计算
- • linecache缓存
- • threading多线程
- • sqlite3数据库
- • gzip压缩解压
最新内容 NEWS
- • django app提供pv信息的方法是什么
- • Django项目版本升级如何操作?
- • django较多数据传递如何优雅的呈现
- • django1.7获取参数问题求助
- • Django1.7使用内置comment遇到问题
- • python mysql数据库做insert操作时报_mysql_ex
- • 关于python mysql的duplicate insert机制的疑问
- • pymongo使用insert函数批量插入被中断要怎么
- • Python程序员解决棘手问题的常用库
- • 求助关于restfull api接口几个问题
图文精华 RECOMMEND
-
django1.7获取参数问题求助
-
Python程序员解决棘手问题的常用库
-
求问str()同__str__原理上有什么不同
-
scrapy框架里面用link extractor怎么能
-
python {}.fromkeys创建字典append添加操
-
python3 类型Type str doesn't support th
热点文章 HOT
- 学习Python有什么好的书籍推荐?
- Python匿名函数 Lambda表达式作用
- Python与Java、C、Ruby、PHP等编程语言有什么
- Python 正则中文网页字符串提取问题
- 如何为实时性应用存取经纬度?django my
- 想用python做个客户端,在二维码登录这个地
- 有让IDE可识别Python函数参数类型的方法吗
- Python字符串转换成列表正则疑问