立即学习:https://edu.csdn.net/course/play/24797/282222?utm_source=blogtoedu
shell调试,从而可以进行交互式的调试。
1 启动shell调试爬取数据
首先 进入网页,打开源码,找到所要提取的数据
之后 使用“scrapy shell 目标网页”命令尝试爬取,若返回值为200,就表能能爬取到数据
2 浏览器伪装
scrapy shell -s USER_AGENT='Mozilla/5.0' https://www.zhipin.com/c101280100
3 使用xpath、css选择器提取数据
response.xpath('//div[@class="job-primary"]')
respose.css('div.job-primary>div.info-primary div.job-title').extract()
-使用shell调试&spm=1001.2101.3001.5002&articleId=105307678&d=1&t=3&u=c6d867bcc18a4098852309799d1c65d8)
427

被折叠的 条评论
为什么被折叠?



