玩蛇网提供最新Python编程技术信息以及Python资源下载!
您现在的位置: 玩蛇网首页 > Python源码实例 > 正文内容

Python抓取分享页面的源代码示例

本文章是关于利用Python方法来抓取某网站分享页面中的源码方法示例。需要大家注意的是Python抓取分享页面的源代码示例,是要在运行时导入BeautifulSoup.py文件后才可以使用。

Python抓取分享页面的源代码示例,需要用到python urllib2模块方法,及BeautifulSoup模块。

源码如下:

#coding:utf-8
import urllib2
from BeautifulSoup import BeautifulSoup

'''
www.iplaypy.com
'''
#define
def readPage(Url):
    page = urllib2.urlopen(Url).read()
    pageContent = BeautifulSoup(page)
    OSC_Content = pageContent.find("div",{'id':'OSC_Content'})
    preHandleCode = OSC_Content.find('pre').next
    print preHandleCode
    

'''
页面的url需指定
'''  
#call  
readPage('http://www.xxxxxx.net/code/snippet_580365_11857')

这里的目标网站已经隐藏,大家可针对自己要抓取的目标站,参考本python源码适当修改。

玩蛇网文章,转载请注明出处和文章网址:http://www.iplaypy.com/code/c2163.html [复制]



我要小额赞助,鼓励作者写出更好的教程↓↓↓

玩蛇网Python QQ群,欢迎加入: ① 279974227 玩蛇网Python新手群
修订日期:2017年03月08日 - 20时33分48秒 发布自玩蛇网

我要分享到:
评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules