玩蛇网提供最新Python编程技术信息以及Python资源下载!

请问python正则分组这样的理解对吗

数据

<li><a href='/html/zjly/'>走进临沂</a></li>
<li><a href='/html/csmp/'>城市名片</a></li>
<li><a href='/html/tzys/'>投资优势</a></li>
<li><a href='/html/zzcy/'>支柱产业</a></li>
<li><a href='/html/xyjj/'>县域经济</a></li>
<li><a href='/html/tzfw/'>投资服务</a></li>

正则1:

(?<=href=(\"|'))([^\"']*)(?=(\1))

匹配结果


正则2:

(?<=href=(\"|'))([^(\1)]*)(?=(\1))

匹配结果

问题
正则1和正则2只有中间的(\1)\"',按我的理解,此时的分组结果:\1要吗是"或',此时的正则表达式2((?<=href=(\"|'))([^(\1)]*)(?=(\1)))应该能够正常匹配url才对,而结果却不是这样的(如第2图所示)

([^(\1)]*)的问题在于方括号里面不能使用编号...

------------------

补充: \1在方括号是没有后向引用的作用的. \1在方括号中代表的意思是ctrl-a,16进制的\x01.就如\11匹配的是tab.
参考:Escape sequences

还有, \1如果有反向引用的作用,就有可能与 []是针对字符集里的单个字符为单位进行匹配这个规则冲突.所以,\1[]没有反向引用的作用.

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd19759.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月24日 - 18时38分30秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules