scrapy+selenium遇到重定向的问题

一、前言 

        最近我想爬取一个网站,需要登录才能爬取里面的消息,接着我就使用了selenium登录,获取cookie,接着交给scrapy.Request请求,然后发现他还是重定向到了登录的页面,这个问题困扰了我好久,大概有一周了吧,今天看了一个帖子才解决。

二、解决方案

在函数__init__初始函数里设置self.meta

self.meta = {
        'dont_redirect': True,  # 禁止网页重定向
        'handle_httpstatus_list': [301, 302]  # 对哪些异常返回进行处理
    }

766b224cb57d46aa99cf1d7949980039.png 

接着我们处理完cookie后,使用scrapy.Request返回cookie和self.meta

yield scrapy.Request(url=self.driver.current_url, callback=self.parse, cookies=self.cookies,meta=self.meta)

类似于这样,这样就可以防止爬取的页面重定向到登录页面。

三、结言

         如果这篇文章能帮到你,我很开心为你节约了去除试错的时间,如果还有什么不懂的可以私信我

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值