玩蛇网提供最新Python编程技术信息以及Python资源下载!

Python提取网站根域名用URL如何操作

我写的这段代码有很多情况都未考虑到,希望各位提出比较全面的方法:

import re

reg = r'^https?:\/\/([a-z0-9\-\.]+)[\/\?]?'
url = 'http://segmentfault.com/blog/biu/1190000000330941'
m = re.match(reg, url)
uri = m.groups()[0] if m else ''
print uri[uri.rfind('.', 0, uri.rfind('.')) + 1:]

# 输出结果:segmentfault.com

python有一个内置的模块专门做url解析的 可以自己指定scheme
https://docs.python.org/2.7/library/urlparse.html?highlight=urlparse#module-urlparse
3.*的python也有

from urlparse import *

url = 'http://segmentfault.com/blog/biu/1190000000330941'

r = urlparse(url)
print r

输出

ParseResult(scheme='http', netloc='segmentfault.com', path='/blog/biu/1190000000330941', params='', query='', fragment='')

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd18970.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月21日 - 20时21分27秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules