玩蛇网提供最新Python编程技术信息以及Python资源下载!

python批量抓取二级域名标题的方法

# -*- coding: utf-8 -*-
import urllib
import re

d = 1000
url = 'http://gae-xseven01.appspot.com/2'
html = urllib.urlopen(url).read()
m = re.search(r'<title>(.*)</title>', html, flags=re.I)
print  m and m.group(1)or ''
i = m.group(1)
if (i == '503 Over Quota'):
    d =d-1
    print d

我有APPID从01到09.请问如何批量抓取呢

你是问 请问有人可以提供一个搭建在openshift(或者其他免费云平台)上的一个监测gae appid是否超出配额的源代码么?(供公共goagent服务端使用) 这个吧,应该说的比较清楚了,请求一下http://wwqgtxxproxy-1.appspot.com/2就可以了。

看你申请的id名字不太规律,建议你将名字放到一个数组里面,遍历数组即可。遍历数组过程中取一下对应网页标题(比如写一个获取函数),最后怎么保存结果就看你自己了

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd20225.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月22日 - 09时18分23秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules