3 机器学习工具Scikit-learn

Scikit-learn是一个强大的Python机器学习库,基于numpy和Scipy开发,受到谷歌资助。它提供了多种机器学习算法,如聚类、流形学习、矩阵分解、集成分析等,并具有开发周期短、易于部署的优势。建模过程中,Scikit-learn使用fit和predict函数,还支持Pipeline工具进行数据预处理和自动化建模,提高了效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

传统统计软件R:SAS、R、MatLab软件为代表,主要应用于统计、数学、物理等理论统计

Weka:java实现。

Mahout:运行基于java在hadoop上的软件包,现在基于Spark的MLLib取代了Mahout

C语言被python和R取代


Scikit 基于了numpy 和Scipy 进行迭代开发,由谷歌开发资助,紧扣实际。

优势:开发周期短,直接部署。


查阅API官方文档

sklearn.cluster  聚类分析

sklearn.manifold_learning 流形分析

sklearn.decomposition 矩阵分析

sklearn.emsemble 集成分析

sklearn.gaussian_process 高斯过程

sklearn.linear_model 广义线性模型

sklearn.mixture 高斯混合模型

sklearn.naive_bayes 朴素贝叶斯

sklearn.neighbors 最近邻估计

sklearn.neural_network 神经网络

sklearn.tree 决策树


建模函数 fit ,预测函数 predict


数据预处理

处理任务 对应模块
对缺失值进行补全 imputer
对数值变量进行转换 Func
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值