pyspider cookies用requests设置cookies成功登录微博报错
from pyspider.libs.base_handler import *
class Handler(BaseHandler):
user_url = "http://weibo.cn/"
crawl_config = {
'itag': 'v1',
'headers': {
'User-Agent':'Mozilla/5.0 (Linux; U; Android 2.3.6; en-us; Nexus S Build/GRK39F) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1',
"Host": "weibo.cn",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
"Accept-Language": "zh-CN,zh-TW;q=0.8,zh-HK;q=0.6,en-US;q=0.4,en;q=0.2",
"Accept-Encoding": "gzip, deflate",
"DNT": "1",
"Connection": "keep-alive"
},
'cookies':{
"_T_WM":"791e0d5962c38c757bead1a106a4dcc5",
" ALF":"1489404939",
" SCF":"AmNkSminRmi2L6WiP0tbn2H_p-TOZQIRRTLwEL5OhwHOohm56wHRk_9Jy1w7iXftduUAJihNuU3B-8cYnWBT3Lk.",
" SUB":"_2A251modoDeRxGeNG7VEV9ibIyT6IHXVXZCkgrDV6PUJbktBeLXXZkW2HyTgXsruSYnviSU7hXUjfdGTOig..",
" SUBP":"0033WrSXqPxfM725Ws9jqgMF55529P9D9W5wqBjzJ2m1XohsTfpMwPVx5JpX5o2p5NHD95Qf1hq0ShqRShzEWs4Dqcjci--fi-i8iK.7i--fi-2Xi-2Ni--fi-2Xi-2Ni--fi-2Xi-2Ni--fi-2Xi-2Ni--fi-zRiKnf",
" SUHB":"0tKqtAdy5rivMy",
" SSOLoginState":"1486812984"
}
}
@every(minutes=60*24 * 60)
def on_start(self):
self.crawl(Handler.user_url, callback=self.index_page,method="GET")
@config(age=1 * 24 * 60 * 60)
def index_page(self, response):
print(response.text)
用requests可以实现登录效果,但是用pyspider是一直访问的是默认的未登录的网页
在crawl_config 和在self.crawl 中设置cookies都不行
建议你用selenium来做, 微博的登入好像要走一遍它的js,反正怎么验证登入的我是没看懂
pyspider 是在同一台机器上运行吗?
我不确定 cookie 前带空格有什么不同,分别用 pyspider 和 requests 发送请求到 http://httpbin.org/get 看看请求有什么不同
另外: 0.3.8 版本在调试时,crawl_config 不生效。
玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd14057.html
相关文章 Recommend
- • 支付宝官方给力福利!每天可领1个红包,直接当
- • Python矩阵for循环应用,编程练习题实例三十八
- • 请python高手帮我看看这段python代码中函数setter的
- • 大家都来晒晒您见过的最优秀最实用的一段pyth
- • 如何为实时性应用存取经纬度?django mysql
- • 列表里边是元组数据,用python正则怎么完成匹配
- • 类似美元$这个符号pyCharm2.0里怎么输入不好用呢
- • 大家一起来讨论抽用正则取优酷视频并生成播放
- • 准备用python做下载器怎么样?需要了解些知识点
- • 使用django在做添加superuser操作时报错\xBA\xA3像是乱
- • python语言中的pcap与dpkt在统计中的作用分别是什么
- • 一段代码中使用了sqlite有部分不理解的地方,求老
您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:
必知PYTHON教程 Must Know PYTHON Tutorials
- • python 解释器
- • python idle
- • python dir函数
- • python 数据类型
- • python type函数
- • python 字符串
- • python 整型数字
- • python 列表
- • python 元组
- • python 字典
- • python 集合
- • python 变量
- • python print
- • python 函数
- • python 类定义
- • python import
- • python help
- • python open
- • python 异常处理
- • python 注释
- • python continue
- • python pass
- • python return
- • python global
- • python assert
- • python if语句
- • python break
- • python for循环
- • python while循环
- • python else/elif
- • lambda匿名函数
必知PYTHON模块 Must Know PYTHON Modules
- • os 模块
- • sys 模块
- • re 正则表达式
- • time 日期时间
- • pickle 持久化
- • random 随机
- • csv 模块
- • logging 日志
- • socket网络通信
- • json模块
- • urlparse 解析URL
- • urllib 模块
- • urllib2 模块
- • robotparser 解析
- • Cookie 模块
- • smtplib 邮件
- • Base64 编码
- • xmlrpclib客户端
- • string 文本
- • Queue 线程安全
- • math数学计算
- • linecache缓存
- • threading多线程
- • sqlite3数据库
- • gzip压缩解压
最新内容 NEWS
- • django app提供pv信息的方法是什么
- • Django项目版本升级如何操作?
- • django较多数据传递如何优雅的呈现
- • django1.7获取参数问题求助
- • Django1.7使用内置comment遇到问题
- • python mysql数据库做insert操作时报_mysql_ex
- • 关于python mysql的duplicate insert机制的疑问
- • pymongo使用insert函数批量插入被中断要怎么
- • Python程序员解决棘手问题的常用库
- • 求助关于restfull api接口几个问题
图文精华 RECOMMEND
-
django1.7获取参数问题求助
-
Python程序员解决棘手问题的常用库
-
求问str()同__str__原理上有什么不同
-
scrapy框架里面用link extractor怎么能
-
python {}.fromkeys创建字典append添加操
-
python3 类型Type str doesn't support th
热点文章 HOT
- 学习Python有什么好的书籍推荐?
- Python匿名函数 Lambda表达式作用
- Python与Java、C、Ruby、PHP等编程语言有什么
- Python 正则中文网页字符串提取问题
- 如何为实时性应用存取经纬度?django my
- 想用python做个客户端,在二维码登录这个地
- 有让IDE可识别Python函数参数类型的方法吗
- Python字符串转换成列表正则疑问