基于统计形状模型的眨眼模式自动评估
立即解锁
发布时间: 2025-08-20 02:15:52 阅读量: 1 订阅数: 5 


智能环境下的多模态注意力系统设计与实现
### 基于统计形状模型的眨眼模式自动评估
#### 1. 引言
在日常生活中,人的眨眼模式与警觉性密切相关。比如,在驾驶汽车或从事航空工作等需要高度警觉的任务时,眨眼频率和时长会随着任务时间的增加而发生变化。美国运输部曾报道,人在入睡之前眨眼频率会出现先相对下降后突然上升的独特模式;还有研究发现,人越困倦,眨眼时长会增加。
在众多用于监测眼部活动的指标中,PERCLOS(眼睛闭合百分比)被认为是衡量驾驶员警觉水平最可靠有效的指标。它是指在一分钟内眼睛至少闭合80%的时间比例。
以往监测眨眼的系统通常使用红外设备,但这些设备不仅需要专业且昂贵的器材,还会给使用者带来视觉阻碍。也有研究采用标准相机简化了设置,但未对PERCLOS测量结果进行真实数据验证。
现在提出了一种基于先进面部生物识别技术的非侵入式方法,用于分析用户的眨眼情况。该系统由面部检测器、基于不变最优特征的主动形状模型(IOF - ASM)的分割模块以及参数估计模块组成。
#### 2. 自动面部分割
- **检测**:面部检测器的作用是判断图像中是否存在面部。若存在,会输出每个面部的位置和大小。采用的检测器使用了带最优加权矩形的类Haar特征,在MIT + CMU数据集上测试时,误检率为5 × 10⁻⁶,能以实时速度正确分类数据库中93%的面部。
- **分割**:使用IOF - ASM算法对显著面部特征进行分割。该算法结合了局部图像搜索和基于点分布模型(PDM)的全局形状约束,能自动定位眼睛、嘴巴、鼻子、眉毛和面部轮廓,平均误差约为两眼间距的2%。系统在AR和Equinox数据库的1078张图像上进行了训练,这些图像包含睁眼和闭眼的情况,适合训练模型处理眨眼情况。
#### 3. 眨眼参数估计
给定视频流,可提取对应的形状序列。每个形状由98个地标点组成,每只眼睛有8个地标点。通过测量垂直对应地标点之间的距离并求平均值,可得到眼睛在时间t的开度估计值a(t)。
观察a(t)会有以下发现:
- 存在许多容易识别的最小值,对应眨眼情况。
- 信号有噪声,但噪声幅度小于表示最小值的峰值幅度。
- 最小值处的a(t)值未像直观预期的那样接近零,这是由于训练集标注方式导致,即使眼睛完全闭合,眼睛轮廓也有两条独立的线,所以a(t) > 0。
由于a(t)值可能因人而异,需要自动估计完全睁眼和完全闭眼时的a(t)值。将a(t)值视为分布样本,因为眼睛大部分时间是睁开的,眨眼会被检测为异常值。
具体步骤如下:
1. 将睁眼参考水平A0设为a(t)的中位数。
2. 把异常值样本集分割成不相交的子集,每个子集对应a(t)的一个向下峰值。只有当峰值的最小值
0
0
复制全文
相关推荐










