本文由我司收集整编,推荐下载,如有疑问,请与我司联系
【
OpenCV
图像处理入门学习教程六】基于
Python
的网络爬虫与
OpenCV
扩展库中的人脸识别算法比较
OpenCV
图像处理入门学习教程系列,上一篇第五篇:基于背景差分法的视频
目标运动侦测
一、网络爬虫简介(
Python3
)
网络爬虫,大家应该不陌生了。接下来援引一些
Jack-Cui
在专栏《
Python3
网络
爬虫入门》中的内容来帮助初学者理解。博客内容均仅用于学习交流,请勿用于任
何商业用途!
网络爬虫,也叫网络蜘蛛(
Web
Spider
)
。它根据网页地址(
URL
)爬取网页内
容,而网页地址(
URL
)就是我们在浏览器中输入的网站链接。比如:
https://baidu/
,它就是一个
URL
。
标准的爬虫架构如下:(摘自维基百科)
网络爬虫的主要工作流程:
(
1
)将种子链接加入到队列(
2
)调度器从队列获取链接,执行爬虫访问该链接
(
3
)爬虫提取页面指定的新的链接,交付给队列(重复第二步)
,或者下载器(下
载资源)
在讲解爬虫内容之前,我们需要先学习一项写爬虫的必备技能:审查元素(如果
已掌握,可跳过此部分内容)
。
1.
审查元素
在浏览器的地址栏输入
URL
地址,在网页处右键单击,找到检查,如下图所
示:(不同浏览器的叫法不同,
Chrome
浏览器叫做检查,
Firefox
浏览器叫做查看
元素,但是功能都是相同的)
我们可以看到,右侧出现了一大推代码,这些代码就叫做
HTML
。什么是
本文介绍了Python网络爬虫的基础知识,并引用了《Python3网络爬虫入门》的内容。文章探讨了网络爬虫的工作流程,以及如何使用OpenCV进行人脸识别。同时,提到了审查元素作为编写爬虫前的必备技能。接着,文章转向了OpenCV图像处理入门教程系列的第六部分,讨论了基于Python的网络爬虫与OpenCV中的人脸识别算法的比较。

3839

被折叠的 条评论
为什么被折叠?



