JAVA高级面试进阶训练营视频教程

admin · 发表于 2021-7-2 21:19:37

在爬取的过程中难免发生 ip 被封和 403 错误等等，这都是网站检测出你是爬虫而进行反爬措施，在这里为大家总结一下 Python 爬虫动态 ip 代理防止被封的方法。

PS：另外很多人在学习Python的过程中，往往因为遇问题解决不了从而导致自己放弃，为此我建了个Python全栈开发交流.裙：一久武其而而流一思（数字的谐音）转换下可以找到了，里面有最新Python教程项目可拿,不懂的问题有老司机解决哦，一起相互监督共同进步

\

首先，设置等待时间：

\

常见的设置等待时间有两种，一种是显性等待时间（强制停几秒），一种是隐性等待时间（看具体情况，比如根据元素加载完成需要时间而等待）图 1 是显性等待时间设置，图 2 是隐性。

第二步，修改请求头：

\

识别你是机器人还是人类浏览器浏览的重要依据就是 User-Agent，比如人类用浏览器浏览就会使这个样子的 User-Agent：’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36’

第三步，采用代理 ip / 建代理 ip 池

\

直接看代码。利用动态 ip 代理，可以强有力地保障爬虫不会被封，能够正常运行。图 1 为使用代理 ip 的情况，图 2 是建 ip 代理池的代码，有没有必要需要看自己的需求，大型项目是必须用大量 ip 的。

做好以上 3 个步骤，大致爬虫的运行就不成问题了。

都明白了吗？另外很多人在学习Python的过程中，往往因为遇问题解决不了从而导致自己放弃，为此我建了个Python全栈开发交流.裙：一久武其而而流一思（数字的谐音）转换下可以找到了，里面有最新Python教程项目可拿,不懂的问题有老司机解决哦，一起相互监督共同进步

本文的文字及图片来源于网络加上自己的想法,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

		自动登录	找回密码
密码			立即注册

JAVA高级面试进阶训练营视频教程	Java架构师系统进阶VIP课程	分布式高可用全栈开发微服务教程	Go语言视频零基础入门到精通	Java架构师3期(课件+源码)
Java开发全终端实战租房项目视频教程	SpringBoot2.X入门到高级使用教程	大数据培训第六期全套视频教程	深度学习（CNN RNN GAN）算法原理	Java亿级流量电商系统视频教程
互联网架构师视频教程	年薪50万Spark2.0从入门到精通	年薪50万！人工智能学习路线教程	年薪50万大数据入门到精通学习路线	年薪50万机器学习入门到精通教程
仿小米商城类app和小程序视频教程	深度学习数据分析基础到实战	最新黑马javaEE2.1就业课程	从 0到JVM实战高手教程	MySQL入门到精通教程

JAVA高级面试进阶训练营视频教程

Java架构师系统进阶VIP课程

Python爬虫老是被封的解决方法【面试必问】