Python爬虫后获取重定向url的两种方法_Python

Python爬虫后获取重定向url的两种方法

2021-08-27 00:08lemon_tree1002 Python

这篇文章主要介绍了Python爬虫后获取重定向url的两种方法,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下

下面给大家分享Python爬虫后获取重定向url的两种方法，具体内容如下所示；

方法（一）

				?

									# 获得重定向url

									 from urllib import request

									 # https://zhidao.baidu.com/question/681501874175782812.html

									 url = "https://www.baidu.com/link?url=IscBx0u8h9q4Uq3ihTs_PqnoNWe7slVWAd2dowQKrnqJedvthb3zrh9JqcMJu3ZqFrbW_DKVuTnTypDbMkZx_hwCQIGFPRVWGyxRXA-65jK&amp;wd=&amp;eqid=f7aeecba00092ed7000000065ec62596"

									 print(request.urlopen(url).geturl())

方法（二）

				?

									# 请求头，这里我设置了浏览器代理

									 headers = headers = {'User-Agent': 'xx'}

									 # 这里chrome的user-agent获取方式：在浏览器地址栏输入 about://version 即可得到结果

									 url = "https://www.baidu.com/link?url=IscBx0u8h9q4Uq3ihTs_PqnoNWe7slVWAd2dowQKrnqJedvthb3zrh9JqcMJu3ZqFrbW_DKVuTnTypDbMkZx_hwCQIGFPRVWGyxRXA-65jK&amp;wd=&amp;eqid=f7aeecba00092ed7000000065ec62596"

									 # 请求网页

									 response = requests.get(url, headers=headers)

									 # print(response.status_code) # 打印响应的状态码

									 print(response.url) # 打印重定向后的网址

									# 两个结果都是：https://zhidao.baidu.com/question/681501874175782812.html