本篇文章给大家带来了关于python的相关知识,其中主要介绍了requests模块的相关问题,Requests模块是一个用于网络请求的模块,主要用来模拟浏览器发请求,希望对大家有帮助。
推荐学习:python学习教程
Requests模块是一个用于网络请求的模块,主要用来模拟浏览器发请求。其实类似的模块有很多,比如urllib,urllib2,httplib,httplib2,他们基本都提供相似的功能。但是这些模块都复杂而且差不多过时了,requests模块简单强大高效,使得其在众多网络请求模块中脱引而出。
环境安装:pip install requests
使用流程:
案例:爬取百度首页的数据
#1. 导包 import requests #2. 指定url url = "https://www.baidu.com" #3. 使用GET方法发送请求,该方法会返回一个响应对象 response = requests.get(url=url) #4. 获取响应数据 print(response.status_code) # 打印状态码 print(response.url) # 打印请求url print(response.headers) # 打印响应头头信息 print(response.text) #以文本形式打印网页源码 #保存数据 response.encoding = 'utf-8' #指定编码格式,不然打开乱码 text = response.text with open('./2.html','w',encoding='utf-8') as f: f.write(text)
解决requests请求的数据中文乱码问题——》requests请求返回内容 中文乱码问题
上面的案例requests发送了一个GET请求方法,除此之外还有其他的请求方法。最常用的就是GET和POST方法。
且在指定方法发送请求的时候,有时候还需要在请求方法括号中requests.get(url=url, xx = xx)指定一些参数,如下。先了解一下
方法 |
参数名字 |
HTTP头部 |
headers |
GET参数 |
params |
POST参数 |
data |
文件 |
files |
Cookies |
cookies |
重定向处理 |
allow_ redirects = False/True |
超时 |
timeout |
证书验证 |
verify = False/True |
工作流(延迟下载) |
stream=False/ True |
事件挂钩 |
hooks=dict(response=) |
身份验证 |
auth= |
代理 |
proxies= |
在上面爬取百度首页时,response = requests.get(url=url)其返回的是一个响应对象,而如果我们想要获取具体的数据比如响应码或者网页源码时,就需要通过指定响应对象的属性进行获取。如response.status_code获取响应码
网站题目:实例详解python之requests模块
URL链接:http://www.csdahua.cn/qtweb/news23/464373.html
网站建设、网络推广公司-快上网,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 快上网