爬虫初阶requests模块的使用

发布时间 2023-09-20 14:00:04作者: 小张不爱吃泡面

一、安装requests库

pip install requests

二、引用这个模块

import requests

三、requests的基本使用

1.发送GET请求

调用requests模块中的get()函数

import requests  # 引入第三方库
response = requests.get('https://www.baidu.com')
print(response.text)  # 以文本形式打印响应的内容

带参数的GET请求,有时候需要在URL中加入一些参数来完成请求,requests提供使用params参数来传递参数

import requests

url = 'https://www.baidu.com'
params = {'key1': 'value1', 'key2': 'value2'}
response = requests.get(url, params=params)
print(response.text)

2.发送POST请求

发送POST请求时需要设置data参数或json参数

import requests

data = {'key1': 'value1', 'key2': 'value2'}
response = requests.post('https://www.baidu.com', data=data)
print(response.text)
or 
response = requests.post('https://www.baidu.com', json=data)
print(response.text)

3.设置请求头信息

在很多情况中,我们都需要进行请求头伪装,需要在请求中添加一些HTTP头信息。设置一个user-agent的请求头来模拟浏览器请求的方式。使用requests时,只需要调用请求对象的headers属性

import requests

headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'}
response = requests.get('https://www.baidu.com', headers=headers)
print(response.text)