一.功能1.
实现百度的关键词的搜索以及保存,查询多个一样的词的时候,产生随机数字进行保存
import random
import urllib.request
import urllib.parse
"""
实现百度的关键词的搜索以及保存,查询多个一样的词的时候,产生随机数字进行保存
"""
basebaidu="https://www.baidu.com/s?wd=" #百度搜索页面
keyword=input("请输出你在百度中搜索的关键词:") #要搜索的关键词语
key_code=urllib.request.quote(keyword) #对请求进行编码,把‘中文’关键词编码,编码
url_all=basebaidu+key_code #搜索的全路径
# print(url_all)
#头部信息
headers={
'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Mobile Safari/537.36',
}
#我的请求,封装
myrequest=urllib.request.Request(url=url_all,headers=headers)
#模拟浏览器登录
myrespose=urllib.request.urlopen(myrequest).read()
#关键字+100~99随机数字 +“.html"文件===》保存文件格式
savename=keyword+str(random.randint(100,999))+".html"
fw=open(savename,"wb") #将文件写入到当前目录中
fw.write(myrespose)
fw.close()
功能2:下载任意网站内容到本地
import urllib.request
from urllib.re