【机器学习】机器学习上机作业聚类算法

最新推荐文章于 2025-08-18 20:35:45 发布

沐风—云端行者

最新推荐文章于 2025-08-18 20:35:45 发布

阅读量645

点赞数 10

CC 4.0 BY-SA版权

分类专栏：深度学习实验文章标签：机器学习算法聚类分类鸢尾花

本文链接：https://blog.csdn.net/yuzhangfeng/article/details/135555161

深度学习实验专栏收录该内容

20 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了在鸢尾花数据集上使用C均值和模糊C均值（FCM）聚类算法的过程。通过实验，作者展示了如何加载数据、预处理、执行聚类并计算准确率。实验结果显示，K-means和FCM在鸢尾花数据集上都能取得较高的分类准确率，但在处理重叠分布的数据时可能有不同的表现。作者在实验中深化了对聚类算法的理解，提升了编程技能，并意识到选择合适算法、参数及数据预处理的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、实验内容

自编代码实现C均值聚类和FCM聚类，在“IRIS数据集(鸢尾花数据集)”上进行实验，验证所编代码是否正确，并计算准确率。
Iris鸢尾花数|据集:包含花萼长度、花萼宽度、花瓣长度、花瓣宽度四个属性，用于预测鸢尾花种类，标签0、1、2分别表示山鸢尾、变色鸢尾、维吉尼亚鸢尾。

二、实验设计

若实验内容皆为指定内容，则此部分则可省略；若实验内容包括自主设计模型等内容，则需要在此部分写明设计思路、流程，并画出模型图并使用相应的文字进行描述。

三、实验环境及实验数据集

简单介绍实验环境和涉及的数据集。

数据集：

下载地址:https://archive.ics.uci.edu/ml/datasets/Iris和scklearn自带的Iris数据集
数据集共有150条数据，分为三类，每类50条数据
每一条数据都有四个属性:花萼长度，花萼宽度，花瓣长度，花瓣宽度
标签数据共有三种，分别是Setosa，Versicolour,Virginica，可用1,2,3代替。一般使用前面的四种属性数据来预测样本属于哪种鸢尾花。可以与Python和MATLAB自带函数计算的结果进行对比。