Python使用scrapy采集数据时为每个请求随机分配user-agent的方法

2020年6月10日 23:08:49python教程评论759 views阅读模式

本文实例讲述了Python使用scrapy采集数据时为每个请求随机分配user-agent的方法。分享给大家供大家参考。具体分析如下：

通过这个方法可以每次请求更换不同的user-agent，防止网站根据user-agent屏蔽scrapy的蜘蛛

首先将下面的代码添加到settings.py文件，替换默认的user-agent处理模块

代码如下:

DOWNLOADER_MIDDLEWARES = {
'scraper.random_user_agent.RandomUserAgentMiddleware': 400,
'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware': None,
}

自定义useragent处理模块

代码如下:

from scraper.settings import USER_AGENT_LIST
import random
from scrapy import log
class RandomUserAgentMiddleware(object):
def process_request(self, request, spider):
ua = random.choice(USER_AGENT_LIST)
if ua:
request.headers.setdefault('User-Agent', ua)
#log.msg('>>>> UA %s'%request.headers)

希望本文所述对大家的Python程序设计有所帮助。

python实现根据ip地址反向查找主机名称的方法

python实现根据ip地址反向查找主机名称的方法

如何让Eclipse中pydev为此跳过这些编译error

如何让Eclipse中pydev为此跳过这些编译error

新手python用什么版本好？

新手python用什么版本好？

python中队列的实现方法（代码示例）

python中队列的实现方法（代码示例）

Python OS模块常用函数说明

Python OS模块常用函数说明

Python解析JSON详解

Python解析JSON详解

python中正则表达式的简单介绍（附代码）

python中正则表达式的简单介绍（附代码）

分享Python中用于计算指数的exp()方法实例教程

分享Python中用于计算指数的exp()方法实例教程

Python的内置字符串方法分析

Python的内置字符串方法分析

python中while，if，for语句的使用方法

python中while，if，for语句的使用方法

本文由企鹅博客发表于 2020年6月10日 23:08:49
转载请务必保留本文链接：https://www.qieseo.com/330737.html

发表评论