玩蛇网提供最新Python编程技术信息以及Python资源下载!

是python的scrapy框架,xpath中可否以插入正则表达式

想要爬取一个网站,这个网站的不同网页的正文部分的xpath是不一样的,比如:
有个页面的正文部分是://*[@id='postmessage_32199']
另一个是://*[@id='postmessage_32153']
......
它们的格式是postmessage_xxxxx,x为数字。

我的问题是:xpath中可以使用用正则表达式吗?如果不能那怎么匹配这么多不同的xpath?

ps:我是用的是python的scrapy框架

提前感谢各位了。

你用 https://github.com/binux/pyspider 我就告诉你


//*[starts-with(@id, "postmessage_")]
或者
doc.xpath(r'//*[re:match(@id, "postmessage_\d+")]', namespaces={"re": "http://exslt.org/regular-expressions"})

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd19159.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月31日 - 11时03分58秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules