玩蛇网提供最新Python编程技术信息以及Python资源下载!
您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容

Python爬虫完成js页面内容抓取方案是怎么样的

自己先搜了一下,发现要解析js就必须得用一个js解析器,或者直接使用webkit这样的网页解析,但都没有成熟的做法, 想问一下是否有开源的较成熟的解决方案?

spidermonkey

QPython上面怎么获取js加载后的内容?

SF五大月经贴之JS动态页面的抓取:http://segmentfault.com/q/1010000000581910#a-1020000000582320

当然有。搜索关键词“Headless browser”

比如http://phantomjs.org/

其实你分析一下js,完全不必用那些环境。

必须是 http://jeanphix.me/Ghost.py/

ghost.py is a webkit web client written in python.

玩蛇网文章,转载请注明出处和文章网址:http://www.iplaypy.com/wenda/wd19581.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年06月01日 - 15时10分16秒 发布自玩蛇网

我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules