玩蛇网提供最新Python编程技术信息以及Python资源下载!

Python BeautifulSoup解析网页获取节点疑惑

soup = BeautifulSoup(urlopen(url).read()) 这样做就解析不了网页
soup.findAll('') 获取什么节点都没有
而把html = urlopen(url).read(),html打印出来,在控制台复制粘贴给变量 content,然后这样做 soup = BeautifulSoup(content),就能解析成功呢?

from bs4 import BeautifulSoup
import urllib

url = 'http://soccerdata.sports.qq.com/playerSearch.aspx?lega=epl&pn=9'
soup = BeautifulSoup(urllib.urlopen(url).read())
print len(soup.findAll())
print len(soup.findAll(''))
print len(soup.findAll('div'))

content = '

<div><h1>This is my homepage.</h1><p>Do you know?</p></div>

'
soup2 = BeautifulSoup(content)
print len(soup2.findAll())
print len(soup2.findAll(''))
print len(soup2.findAll('div'))

输出:

856
0
38
3
0
1
[Finished in 1.5s]

测试平台:

运行结果,供楼主参考。


有图有真相:

看一下你用的是哪个版本的bs吧

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd19644.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月23日 - 17时05分56秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules