数据挖掘决策树算法鸢尾花代码
时间: 2025-08-24 10:52:34 AIGC 浏览: 17
在数据挖掘中,使用决策树算法对鸢尾花数据集进行分类是一种常见实践。以下是一个完整的Python代码示例,它演示了如何使用`scikit-learn`库来实现这一目标。
首先,我们需要导入必要的库并加载鸢尾花数据集:
```python
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
# 加载鸢尾花数据集
iris = datasets.load_iris()
X = iris.data # 特征数据
y = iris.target # 分类数据
```
接下来,我们将数据集划分为训练集和测试集:
```python
# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
然后,创建决策树分类器实例,并对其进行训练:
```python
# 创建决策树分类器实例
dt_model = DecisionTreeClassifier()
# 训练模型
dt_model.fit(X_train, y_train)
```
使用训练好的模型对测试集进行预测,并计算准确率:
```python
# 使用模型进行预测
y_pred = dt_model.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print(f"模型准确率为: {accuracy}")
```
此外,还可以直接使用模型自带的`score`方法来验证模型的表现:
```python
# 使用模型自带的score方法计算准确率
score = dt_model.score(X_test, y_test)
print(f"模型评分结果为: {score}")
```
以上代码展示了从数据准备到模型训练再到预测和评估的基本流程。通过这些步骤,可以有效地应用决策树算法于鸢尾花数据集上进行分类任务。
阅读全文
相关推荐



















