题目简介
这里的数据主要包括2010年1月1日至2014年12月31日间北京pm2.5指数以及相关天气指数数据,包括露点、温度、压强等等。在这些数据中抽出其中的某些天,并抹去其PM2.5值,通过其他数据对这些天的PM2.5进行回归,得出PM2.5的预测值。用这个预测值和真实值进行比较,看看效果如何。好的预测效果将有利于对PM2.5的成因、趋势、相关影响有更深入的认识作用。
来源
题目
代码
import xgboost
import math
from sklearn import cross_validation, tree, linear_model
from sklearn.model_selection import train_test_split
from sklearn.metrics import explained_variance_score
import pandas as pd
import n