感知机模型简介

最新推荐文章于 2025-07-01 11:10:49 发布

原创

最新推荐文章于 2025-07-01 11:10:49 发布 · 578 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习

一、综述

感知器（英语：Perceptron）是Frank Rosenblatt在1957年就职于康奈尔航空实验室（Cornell Aeronautical Laboratory）时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈神经网络，是一种二元线性分类器。

Frank Rosenblatt给出了相应的感知机学习算法，常用的有感知机学习、最小二乘法和梯度下降法。譬如，感知机利用梯度下降法对损失函数进行极小化，求出可将训练数据进行线性划分的分离超平面，从而求得感知机模型。

在人工神经网络领域中，感知机也被指为单层的人工神经网络，以区别于较复杂的多层感知机（Multilayer Perceptron）。作为一种线性分类器，（单层）感知机可说是最简单的前向人工神经网络形式。尽管结构简单，感知机能够学习并解决相当复杂的问题。感知机主要的本质缺陷是它不能处理线性不可分问题。

在神经网络、支持向量机等算法盛行的当下，感知机模型应用得并不多，但其却是神经网络和支持向量机的基础，所以还是很有必要学习一下的，本文接下来的内容将从感知机数学描述、损失函数、两个方面详细介绍感知机。

二、模型介绍

1.数学定义

对于给定的训练集 $(xi,yi)}i=1m,xi∈X⊆RnD=\{(x_{i},y_{i})\}_{i=1}^{m},x_{i}\in X\subseteq R^{n}$ 表示训练样本的特征向量, $+1,−1}y_{i}\in Y=\{+1,-1\}$ 表示样本类别，它们之间有如下关系：

$y = f (x) = s i g n (w x + b)$

这称为感知机。 $w∈Rnw\in R^{n}$ 称为感知机的权值系数或权值向量， $b∈Rb\in R$ 称为偏置,sign是符号函数:

$+1,x≥0−1,x<0sign=\left\{ \begin{array}{lr} +1,x\ge0\\ - 1,x<0 \end{array} \right.$

通过上式不难看出，感知机最终既是对 $w, b$ 的求解。从几何上来看，空间即被 $w x + b = 0$ 分成了两个区域，因此它可以做到二元线性分类。大家可以以二维空间为例来想象一下，在确定 $w, b$ 之后，直线 $w x + b = 0$ 随之确定，当一个样本 $x_{0}，y_{0})$ 位于直线上方时，此时 $s i g n (w x + b)$ 容易看出为 $+ 1$ ，反之，为 $- 1$ ，由此它便做到了分类。此外，这里要注意这条直线并不唯一，即 $w, b$ 并非唯一。