sklearn中的线性模型

最新推荐文章于 2025-01-22 15:08:38 发布

原创最新推荐文章于 2025-01-22 15:08:38 发布 · 842 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #python

本文通过使用线性回归模型，从下载的数据集中预测城市的人口与利润之间的关系。代码使用了Python的pandas、numpy和sklearn库进行数据处理和模型训练，并利用matplotlib绘制了预测结果与实际数据的对比图，清晰地展示了模型的预测效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据下载：

https://pan.baidu.com/s/1eHYQ6YHWXx8E-BZJk1qTFg
提取码：o87r

代码：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import linear_model
path = "ex1data1.txt"
data = pd.read_csv(path, names=["Population", "Profit"])
model = linear_model.LinearRegression()

cols = data.shape[1]  # 获取列数
x = data.iloc[:, 0:cols - 1]  # 输入向量X为前cols-1列
y = data.iloc[:, cols - 1:cols]  # 目标变量y为最后一列
model.fit(x, y)
f = model.predict(x).flatten()
fig, ax = plt.subplots(figsize=(8,5))
ax.plot(x, f, 'r', label='Prediction')
ax.scatter(data.Population, data.Profit, label='Traning Data')
ax.legend(loc=2)
ax.set_xlabel('Population')
ax.set_ylabel('Profit')
ax.set_title('Predicted Profit vs. Population Size')
plt.show()