机器学习算法——混淆矩阵（Confusion Matrix）之鸢尾花实例

原创

已于 2022-08-23 15:05:10 修改 · 5.4k 阅读

35 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #机器学习 #人工智能 #svm

于 2022-04-27 10:02:19 首次发布

本文介绍了混淆矩阵的概念及其在类别不平衡问题中的重要性，详细阐述了TP、FP、FN、TN等核心指标，并探讨了准确率、精确率、召回率等评价指标。通过SVM在鸢尾花数据集上的应用，展示了混淆矩阵的计算与可视化，强调了F1-Score在评估模型性能中的作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、理论

什么是混淆矩阵？其实就是把所有类别的预测结果与真实结果按类别放置到了同一个表里，在这个表里我们可以清楚地看到每个类别正确识别的数量和错误识别的数量。

混淆矩阵在什么情况下最好呢？答案是类别不平衡时。

混淆矩阵是除了ROC曲线和AUC之外的另一个判别分类好坏程度的方法。

TP=True Positive=真阳性（真实为0，预测为0，即将正类预测为正类）

FP=False Positive=假阳性（真实为1，预测为0，即将负类预测为正类）

FN=False Negative=假阴性（真实为0，预测为1，即将正类预测为负类）

TN=True Negative=真阴性（真实为1，预测为1，即将负类预测为负类）

针对二分类来说，混淆矩阵为

	预测值=0	预测值=1
真实值=0	TN	FP
真实值=1	FN	TP

即，矩阵的每一列表示的是模型预测的样本情况，矩阵的每一行表示的样本的真实情况。

准确率ACC（在所有样本中，预测正确的样本所占的比例）：

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Vicky_xiduoduo

关注关注

4
点赞
踩
35

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【零基础学机器学习 13】 混淆矩阵 最佳指南以及代码实战

专注于图像领域，主要研究内容包括计算机视觉和深度学习，特别是在图像分类、目标检测和图像生成等方面有深入的研究和实践经验。

09-06

5461

在机器学习中，分类用于将数据划分为不同的类别。但在清理、预处理数据并训练我们的模型之后，我们如何知道分类模型的性能是否良好呢？这就是混淆矩阵的作用。

透析混淆矩阵(举例说明)

忘川的博客

11-25

8531

混淆矩阵（confusion matrix）衡量的是一个分类器分类的准确程度。理解其概念本身容易理解，但一些特定术语易被混淆。 混淆矩阵的基本模式：这里就给大家举一个例子来更好的说明一下混淆矩阵的各种情况观察混淆矩阵，可得如下结论：示例是一个二元分类问题，产生两种可能的分类：“是”或者“不是”。当预测一个事件是否发生时，“是”意味着该事件已经发生，而“否”则相反，该事件没有发生。该模型对这个事件进行了100次预测。在这100次预测结果中，“是”有45次，“否”有55次。但实际上

1 条评论您还未登录，请先登录后发表或查看评论

混淆矩阵举例说明

qq_35368303的博客

03-10

2135

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、动机二、概念三、数学式四、例子对比五、结论前言对混淆矩阵进行讲述一、动机为了查验算法是否合理，适用于不平衡数据集。避免算法准确率高是因为预测类别全部分为其中一类。二、概念下面先介绍常见的模型评价术语。我们分类目标有两类，计为正例（positive）和负例（negtive）： True positives(TP):被正确地划分为正例的个数，即实际为正例且被分类器划分为正例的实例数（样本数）。 False .

机器学习（混淆矩阵）

qq_55342245的博客

08-31

1275

混淆矩阵

学习笔记(33):matplotlib绘制简单图表-绘制混淆矩阵热图

热门推荐

梅森上校的博客业精于勤荒于嬉，形成于思毁于随。

03-24

21万+

混淆矩阵（Confusion Matrix）在机器学习领域，混淆矩阵（Confusion Matrix），又称为可能性矩阵或错误矩阵。混淆矩阵是可视化工具，特别用于监督学习，在无监督学习一般叫做匹配矩阵。在图像精度评价中，主要用于比较分类结果和实际测得值，可以把分类结果的精度显示在一个混淆矩阵里面。 混淆矩阵的结构一般如下图表示的方法。 混淆矩阵要表达的含义： 混淆矩阵的每一列代表了预测...

机器学习-混淆矩阵

weixin_44378235的博客

03-07

332

机器学习----混淆矩阵(Confusion Matrix)

__Miracle__

08-12

2万+

混淆矩阵(Confusion Matrix) 假设有一个算法，其预测某种癌症的准确率为99.9%。这个算法好吗？ 99.9%的准确率看上去很高，但是如果这种癌症本身的发病率只有0.1%，即使不训练模型而直接预测所有人都是健康人，这样的预测的准确率也能达到99.9%。更极端的情况，如果这种癌症本身的发病率只有0.01%，这算法预测的准确率还不如直接预测所有人都健康。对于极度偏斜的数据(癌症患者的人数和健康人数量差别特别大)（skewed data），用准确率评价分类算法好坏有局限性.] 解决方法：混淆矩阵

机器学习---Confusion Matrix混淆矩阵

qq_44599368的博客

11-27

2万+

混淆矩阵是ROC曲线绘制的基础，同时它也是衡量分类型模型准确度中最基本，最直观，计算最简单的方法。 混淆矩阵就是分别统计分类模型归错类，归对类的观测值个数，然后把结果放在一个表里展示出来。这个表就是混淆矩阵。数据分析与挖掘体系位置 混淆矩阵是评判模型结果的指标，属于模型评估的一部分。此外，混淆矩阵多用于判断分类器（Classifier）的优劣，适用于分类型的数据模型，如分类树（Classification Tree）、逻辑回归（Logistic Regression）、线性判别分析（Linear

（8）机器学习_混淆矩阵（分类模型评估）

xdg15294969271的博客

08-21

2237

1、什么是混淆矩阵 对于分类模型中，模型据测的结果有真和假两种情况，实际情况有分为正和负两种情况，因此呢，最终的结果会有呈现四种情况，也就是一个 n_classes×n_classern\_classes\times n\_classern_classes×n_classer的矩阵（n_classes表示分类类别），真正（True Positive），假正（False Positive），真负（True Negative），假负（False Negative）四个指标。（第二个字母表示预测的结果，第一个字

机器学习之混淆矩阵 confusion_matrix

hehe_www2012的博客

05-15

8250

1.这里介绍由sklearn.metrics.ConfusionMatrixDisplay所给出的关于混淆矩阵的一个小例子，来进行理解混淆矩阵及如何应用混淆矩阵来对数据进行分析

机器学习 - 混淆矩阵：技术与实战全方位解析

TechLead

10-16

5658

本文深入探讨了机器学习中的混淆矩阵概念，包括其数学原理、Python实现，以及在实际应用中的重要性。我们通过一个肺癌诊断的实例来演示如何使用混淆矩阵进行模型评估，并提出了多个独特的技术洞见。文章旨在为读者提供全面而深入的理解，从基础到高级应用。

混淆矩阵（解释+举例+解题）

m0_64565155的博客

05-13

2092

混淆矩阵是什么？如何根据描述绘制简单的混淆矩阵？

机器学习之混淆矩阵

年少的勇气已经用完，剩下的就是三思而后行

06-07

719

在得到模型后，你需要借助一些指标来评估这个模型的好坏。人在学习后，会通过考试来评价学习效果，最终会评出优等生、差等生。机器学习也是一样的。区别只是机器学习会根据问题的不同，用不同的指标来进行模型效果的评估。对于分类问题，混淆矩阵是一种直观的模型效果分析方法。假设有个二分类模型，可以对一件事的正（P）负（N）作出判断。这样，在一次判断中，存在真实结果 y^\hat{y}y^ 和预则结果y。如果二者相等，也就是本次预测结果正确；反之则错误。假设有100个不同的测试用例，就会有以下四种可能性：我们把这四种情况进

混淆矩阵

小C的博客

04-15

1841

一：混淆矩阵（引自qq_28448117的博客）监督学习—混淆矩阵 非监督学习—匹配矩阵矩阵每一列代表预测值，每一行代表的是实际的类别。这个名字来源于它可以非常容易的表明多个类别是否有混淆（也就是一个class被预测成另一个class）。假设有一个用来对猫（cats）、狗（dogs）、兔子（rabbits）进行分类的系统，混淆矩阵就是为了进一步分析性能而对该算法测试结果做出的总结...

机器学习中的混淆矩阵

行子的博客

11-25

1112

这些指标提供了关于分类模型性能的综合信息，可以帮助评估模型在不同方面的表现。是用于评估分类模型性能的表格，它展示了模型在不同类别上的预测情况。假设有两个类别：正例（Positive）和负例（Negative）。实际为正例的样本中被正确预测为正例的比例，计算公式为。分类正确的样本数占总样本数的比例，计算公式为。正例预测正确的比例，计算公式为。

【机器学习】混淆矩阵(Confusion Matrix)

AlanWang4523

08-13

887

机器学习之混响矩阵及精确率、召回率、正确率等指标的含义和计算

机器学习svm算法鸢尾花

12-30

### 使用SVM算法处理鸢尾花数据集的机器学习示例 #### 导入必要的库为了使用支持向量机(SVM)对鸢尾花数据集进行分类，首先需要导入一些基本的Python库以及Scikit-Learn中的特定模块。 ```python import numpy as np import matplotlib.pyplot as plt from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.svm import SVC from sklearn.metrics import accuracy_score, confusion_matrix, ConfusionMatrixDisplay ``` #### 加载并准备数据加载鸢尾花数据集，并对其进行预处理以便于后续建模工作。这里只选取前两维特征用于简化可视化过程[^2]。 ```python # Load dataset iris = datasets.load_iris() X = iris.data[:, :2] # we only take the first two features. y = iris.target # Splitting data into training and testing sets X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # Feature scaling scaler = StandardScaler().fit(X_train) X_train_scaled = scaler.transform(X_train) X_test_scaled = scaler.transform(X_test) ``` #### 训练线性SVM模型创建一个线性的支持向量分类器(`Linear SVM`)实例，并用训练集的数据拟合该模型。 ```python svc_linear = SVC(kernel='linear', C=1).fit(X_train_scaled, y_train) ``` #### 预测与性能评估应用训练好的模型到测试集中去预测标签值，并计算准确度得分以及其他评价指标如混淆矩阵等。 ```python predictions = svc_linear.predict(X_test_scaled) accuracy = accuracy_score(y_test, predictions) print(f'Accuracy of linear SVM on Iris dataset is {accuracy:.2f}') cm = confusion_matrix(y_test, predictions) disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=iris.target_names) disp.plot(cmap=plt.cm.Blues) plt.show() ``` 上述代码展示了如何基于`sklearn`库实现了一个完整的流程：从加载数据、划分训练/测试集合、标准化变换直到最后建立线性核的支持向量机来进行多类别的分类任务，并给出了最终的结果展示方式之一—混淆矩阵图[^1]。