首页数据挖掘决策树算法鸢尾花代码

数据挖掘决策树算法鸢尾花代码

时间: 2025-08-24 10:52:34 AIGC 浏览: 17

在数据挖掘中，使用决策树算法对鸢尾花数据集进行分类是一种常见实践。以下是一个完整的Python代码示例，它演示了如何使用`scikit-learn`库来实现这一目标。首先，我们需要导入必要的库并加载鸢尾花数据集： ```python from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score # 加载鸢尾花数据集 iris = datasets.load_iris() X = iris.data # 特征数据 y = iris.target # 分类数据 ``` 接下来，我们将数据集划分为训练集和测试集： ```python # 将数据集划分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) ``` 然后，创建决策树分类器实例，并对其进行训练： ```python # 创建决策树分类器实例 dt_model = DecisionTreeClassifier() # 训练模型 dt_model.fit(X_train, y_train) ``` 使用训练好的模型对测试集进行预测，并计算准确率： ```python # 使用模型进行预测 y_pred = dt_model.predict(X_test) # 计算准确率 accuracy = accuracy_score(y_test, y_pred) print(f"模型准确率为: {accuracy}") ``` 此外，还可以直接使用模型自带的`score`方法来验证模型的表现： ```python # 使用模型自带的score方法计算准确率 score = dt_model.score(X_test, y_test) print(f"模型评分结果为: {score}") ``` 以上代码展示了从数据准备到模型训练再到预测和评估的基本流程。通过这些步骤，可以有效地应用决策树算法于鸢尾花数据集上进行分类任务。

阅读全文