归一化处理（2023寒假每日一题 14）

原创已于 2023-07-11 19:45:48 修改 · 794 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#模拟

于 2023-05-04 12:58:52 首次发布

寒假每日一题2023 专栏收录该内容

20 篇文章

订阅专栏

文章介绍了在机器学习中对数据进行归一化处理的方法，即将数据转换为平均值为0、方差为1的标准分布，以加速模型训练。给出了处理数据的数学公式，并提供了一个输入输出示例，展示了如何计算和输出归一化后的数值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在机器学习中，对数据进行归一化处理是一种常用的技术。

将数据从各种各样分布调整为平均值为 $0$ 、方差为 $1$ 的标准分布，在很多情况下都可以有效地加速模型的训练。

这里假定需要处理的数据为 $n$ 个整数 $a_1,a_2,⋯,a_n$ 。

这组数据的平均值：

在这里插入图片描述

方差：

在这里插入图片描述

使用如下函数处理所有数据，得到的 $n$ 个浮点数 $f(a_1),f(a_2),⋯,f(a_n)$ 即满足平均值为 $0$ 且方差为 $1$ ：

在这里插入图片描述

输入格式
第一行包含一个整数 $n$ ，表示待处理的整数个数。

第二行包含空格分隔的 $n$ 个整数，依次表示 $a_1,a_2,⋯,a_n$ 。

输出格式
输出共 $n$ 行，每行一个浮点数，依次表示按上述方法归一化处理后的数据 $f(a_1),f(a_2),⋯,f(a_n)$ 。

如果你输出的每个浮点数与参考结果相比，均满足绝对误差不大于 $10^{−4}$ ，则该测试点满分，否则不得分。

数据范围
全部的测试数据保证 $n,|a_i|≤1000$ ，其中 $a_i|$ 表示 $a_i$ 的绝对值。且输入的 $n$ 个整数 $a_1,a_2,⋯,a_n$ 满足：方差 $D (a) \geq 1$ 。

输入样例：

7
-4 293 0 -22 12 654 1000
输出样例：
-0.7485510379073613
0.04504284674812264
-0.7378629047806881
-0.7966476369773906
-0.7057985054006686
1.0096468614303775
1.9341703768876082

样例解释

平均值： $aˉ≈276.14285714285717\bar a ≈ 276.14285714285717$

方差： $D (a) \approx 140060.69387755104$

标准差： $D(a)≈374.24683549437134\sqrt{D(a)}≈374.24683549437134$

#include<iostream>
#include<cmath>

using namespace std;

const int N = 1010;

int n;
int a[N];

int main(){
    
    scanf("%d", &n);
    
    int sum = 0;
    for(int i = 0; i < n; i++) scanf("%d", &a[i]), sum += a[i];
    double avg = sum * 1.0 / n;
    double sdiff = 0;
    for(int i = 0; i < n; i++) sdiff += (a[i] - avg) * (a[i] - avg);
    sdiff = sqrt(sdiff / n);
    for(int i = 0; i < n; i++) printf("%.16f\n", (a[i] - avg) / sdiff);
    
    return 0;
}