玩蛇网提供最新Python编程技术信息以及Python资源下载!

目标提取内容在网页的()中,re正则需要怎么来写能匹配到?

    <dt>
    <span class="gray6 ">名称:</span>
    <a title="查看" class="blue" id="agantesfxq_B02_08" href="http://xiandai007.com/esf/" target="_blank">安现</a>
    ( 
    <a class="blue" id="agatdesf_B02_09" href="/ho-a021551/" target="_blank">
                                                       中间
    </a><a class="blue" id="agatdesf_B02_10" href="/ho-a011551-b03497/" target="_blank">
                            草原牧场  #这是我要抓取的内容我把它放到组(.*?)里面。
     </a>
     ) [
     <a class="blue" id="agantdesf_B02_11" href="acchor">图文</a>
     ]
     </dt>

我就是想抓取第9行那里的中文内容,放到一个组里面。本来应该很简单,但是试了好多次就是抓不到,报错是没有内容。估计和第5行,和11行的括号有关。请问怎么写正则才能抓得到?
我原来这样写

d = re.search(r'<a class="blue" id="agatdesf_B02_10".*?>\s*(.*?)\s*</a>', s).group(1)  

抓不到,谁帮我看下错在哪里?

推荐一本书 精通正则表达式 看看就都会了!

python3

html='''
    <dt>
    <span class="gray6 ">名称:</span>
    <a title="查看" class="blue" id="agantesfxq_B02_08" href="http://xiandai007.com/esf/" target="_blank">安现</a>
    ( 
    <a class="blue" id="agatdesf_B02_09" href="/ho-a021551/" target="_blank">
                                                       中间
    </a><a class="blue" id="agatdesf_B02_10" href="/ho-a011551-b03497/" target="_blank">
                            草原牧场  #这是我要抓取的内容我把它放到组(.*?)里面。
     </a>
     ) [
     <a class="blue" id="agantdesf_B02_11" href="acchor">图文</a>
     ]
     </dt>
'''
import re
p=re.compile(r'<a\s+?[^>]*?id="agatdesf_B02_10"[^>]*>([^<]*)</a>')
print(p.findall(html)[0].strip())
##草原牧场  #这是我要抓取的内容我把它放到组(.*?)里面。

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd13791.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月22日 - 09时15分36秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules