玩蛇网提供最新Python编程技术信息以及Python资源下载!

Python正则表达生成器问题

为什么/s/blog_4701280b0102elmo在正则表达生成器里生成不出来?

原地址 http://blog.sina.com.cn/s/blog_4701280b0102elmo.html

start_urls =['http://blog.sina.com.cn']
rules = [Rule(LinkExtractor(allow=['/s/blog_4701280b0102e[\da-zA-Z]+']), 'parse_torrent')]

rules里的正则表达式(黑体倾斜的)对吗?

后面的.html没有匹配,这样就匹配不到完整的URL了。
应该加上后面的.html,正则规则如下:
/s/blog_4701280b0102e[\da-zA-Z]+.html

不知道你是想要匹配出什么内容

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd19165.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月22日 - 08时36分11秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules