【机器学习】机器学习上机作业聚类算法

本文详细介绍了在鸢尾花数据集上使用C均值和模糊C均值(FCM)聚类算法的过程。通过实验,作者展示了如何加载数据、预处理、执行聚类并计算准确率。实验结果显示,K-means和FCM在鸢尾花数据集上都能取得较高的分类准确率,但在处理重叠分布的数据时可能有不同的表现。作者在实验中深化了对聚类算法的理解,提升了编程技能,并意识到选择合适算法、参数及数据预处理的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、实验内容

自编代码实现C均值聚类和FCM聚类,在“IRIS数据集(鸢尾花数据集)”上进行实验,验证所编代码是否正确,并计算准确率。
Iris鸢尾花数|据集:包含花萼长度、花萼宽度、花瓣长度、花瓣宽度四个属性,用于预测鸢尾花种类,标签0、1、2分别表示山鸢尾、变色鸢尾、维吉尼亚鸢尾。

二、实验设计

若实验内容皆为指定内容,则此部分则可省略;若实验内容包括自主设计模型等内容,则需要在此部分写明设计思路、流程,并画出模型图并使用相应的文字进行描述。

三、实验环境及实验数据集

简单介绍实验环境和涉及的数据集。

数据集:

下载地址:https://archive.ics.uci.edu/ml/datasets/Iris和scklearn自带的Iris数据集
数据集共有150条数据,分为三类,每类50条数据
每一条数据都有四个属性:花萼长度,花萼宽度,花瓣长度,花瓣宽度
标签数据共有三种,分别是Setosa,Versicolour,Virginica,可用1,2,3代替。一般使用前面的四种属性数据来预测样本属于哪种鸢尾花。可以与Python和MATLAB自带函数计算的结果进行对比。

四、实验过程

实验过程包括整个实验流程说明和在编写代码时一些需要注意的事项,可附代码片段进行说明;
注:为了代码片段尽量的美观、统一,建议附代码片段时只附加关键的片段,不要全部粘贴,并尽量使用下面提供的网站进行代码高亮等格式转换后再粘贴。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

沐风—云端行者

喜欢请打赏,感谢您的支持!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值