
机器学习项目
HU_LSS
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
特征工程
特征工程很复杂,涉及到的知识非常多,这里就简要叙述几点,以及讨论一下为什么要这么做。特征是原始数据的数值表示。特征工程就是在给定数据,模型和任务的情况下设计出最合适的特征的过程。1.什么时候需要对特征进行标准化?K-均值聚类,最近邻方法,径向基核函数,以及所有使用欧式距离的的方法,对于这类模型和模型成分,通常需要对特征进行标准化,以便将输出控制在期望的范围内。相反,逻辑函数对输入的尺度并不敏...原创 2020-03-28 17:35:53 · 301 阅读 · 0 评论 -
1.数据分析
项目竞赛第一章EDA-数据探索性分析1.观察数据通过 .head()和shape简略观察数据通过 .describe()来观察数据的相关统计量,包括count,mean,std.min,中位数25%,50%,75%,max。这里重点注意的是,如果出现9999999-1等值是nan的另一种表现形式通过 .info()可以观察到是否有缺失值的情况,并查看特征的数据类型(当类型为object...原创 2020-03-23 19:52:49 · 221 阅读 · 0 评论