要导入StandardScaler类进行数据标准化，请使用以下语句：

最新推荐文章于 2025-08-20 18:30:48 发布

Yn312

最新推荐文章于 2025-08-20 18:30:48 发布

阅读量233

点赞数 1

CC 4.0 BY-SA版权

文章标签： sklearn

本文链接：https://blog.csdn.net/Yn312/article/details/150450481

要导入StandardScaler类进行数据标准化，请使用以下语句：

from sklearn.preprocessing import StandardScaler

使用步骤详解

创建实例
scaler = StandardScaler()
拟合数据（计算均值和标准差）
scaler.fit(X_train)
说明：X_train是训练集特征矩阵，形状为(n_samples, n_features)

转换数据（应用标准化）

X_train_std = scaler.transform(X_train)  # 标准化训练集
X_test_std = scaler.transform(X_test)     # 用训练集的参数标准化测试集

关键特性

标准化公式：
$\frac{x - \mu}{\sigma}$
其中 $μ\mu$ 是均值， $σ\sigma$ 是标准差。
作用：将数据转换为均值为0、标准差为1的分布，消除量纲影响。
注意事项：测试集必须使用训练集计算的 $μ\mu$ 和 $σ\sigma$ ，避免数据泄露。

示例代码

import numpy as np
from sklearn.preprocessing import StandardScaler

# 生成示例数据（3个样本，2个特征）
data = np.array([[1.0, 2.0], [3.0, 1.0], [2.0, 3.0]])

# 标准化
scaler = StandardScaler()
scaler.fit(data)                # 计算均值和标准差
transformed_data = scaler.transform(data)  # 应用转换

print("原始数据:\n", data)
print("标准化后:\n", transformed_data)
print("均值:", scaler.mean_)     # 输出: [2.0, 2.0]
print("标准差:", np.sqrt(scaler.var_))  # 输出: [0.82, 0.82] (近似)