想要统计一下bilibili网站的在线人数变化,写了一个简单的爬虫程序。
主要是对https://api.bilibili.com/x/web-interface/online返回的参数进行分析,获取在线人数对应位置。程序关键点在于requests模块的使用。
具体步骤
1、网页中寻找数据元素对应接口
2、设置代理库
3、请求接口,json读取数据,获得当前在线人数
4、10次求平均
5、配置定时任务,每分钟执行一次
6、excel导出图表
最终结果
----------欢迎加入我的python新手交流群851211580------------
# !/usr/bin/env python3
# -*- coding: utf-8 -*-
import requests
import random
import json
import time
# ---------------------------------------------------------------------------------------
# 计算时间差,格式: 时分秒
def gettimediff(start, end):
seconds = (end - start).seconds
m, s = divmod(seconds, 60)
h, m = divmod(m, 60)
diff = ("%02d:%02d:%02d" % (h, m, s))