使用需要的python 库:requests,lxml,you-get
主要目的:体验you-get 的强大
代码还有很多不足的地方,容易被反爬
import requests
from lxml import etree#xpath
import os
#导入需要的3个库
def get_url_list():
url='https://v.qq.com/x/cover/a6nzna6g01salwa/f0027v09j3q.html'
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36 Edge/15.15063'}#设置代理
r=requests.get(url,headers=headers)#获取网页信息
html=r.text#获取网页的html
mytree=etree.HTML(html)#使用lxml解析html
url=mytree.xpath('//div[@class="mod_episode"]//@href')#获取播放视频的l超级链接的地址
return url#返回所有的每集播放视频的超级链接地址
url=get_url_list() #将获取播放视频的l超级连接的地址,赋值给url
for i in url:#获取列表中单个播放视频的超级链接地址
start_url='https://v.qq.com.{i}'.format(i=i)#初始化you-get 将要使用的url
print(start_url)
path='./'#当前变成目录
os.system('you-get -o {path} {url}'.format(path=path,url=start_url))#使用os操作有个you-get