python爬虫

爬虫

了解板块

1、http协议
	概念:就是服务器和客户端进行数据交互的一种形式。
2、常用请求头信息
	-User-Agent:请求载体的身份标识
	-Connection:请求完毕后,是断开连接还是保持连
3、常用响应头信息
	-Content-Type:服务器响应回客户端的数据类型
4、https协议:
	安全的超文本传输协议
	加密方式
5、对称秘钮加密
	-非对称秘钥加密
	-证书秘钥加密

request 模块

代码-爬取搜狗首页的页面数据在这里插入图片描述

requests模块
	-urllib模块
	-requests模块
requests模块:python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高。作用:模拟浏览器发请求。

如何使用:(requests模块的编码流程)
	-指定url
	-发起请求
	-获取响应数据
	-持久化存储
环境安装:pip install requests
实战编码:
-需求:爬取搜狗首页的页面数据






代码-破解百度翻译2

代码-破解百度翻译1
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值