特征选择与图像检索的创新方法
立即解锁
发布时间: 2025-08-23 00:56:50 阅读量: 2 订阅数: 17 

### 特征选择与图像检索的创新方法
在机器学习和图像检索领域,特征选择和信号/语义集成是两个关键问题。下面将详细介绍基于粗糙集的特征加权特征选择方法以及图像检索的信号/语义集成框架。
#### 基于可分辨矩阵的特征加权
在特征选择中,特征排名机制至关重要。作者利用可分辨矩阵(Discernibility Matrix,DM)中的属性频率信息进行特征排名。粗糙集的核心概念对排名方法有重要影响,如果 DM 中的一个条目仅包含一个属性,且核心非空,那么这个属性必定是核心的成员,核心属性比 DM 中的其他属性更重要。
基于此,为每个属性 $a_i$ 分配一个权重 $w(a_i)$,初始权重为 0,当 DM 中的每个条目 $c_{ij}$ 加入时重新计算。权重计算公式如下:
$w(a_i) = w(a_i) + |A| / |c_{ij}| , ∀ a_i ∈ c_{ij}$
其中,$|A|$ 表示决策系统属性集 $A$ 的基数,$|c_{ij}|$ 是可分辨矩阵条目的基数。
#### 特征选择的两阶段方法
该特征选择方法分为两个阶段:
- **阶段一:特征排名与重排**
- **输入**:属性集 $A = \{a_1, ..., a_n\}$ 和决策系统 $DS$。
- **输出**:排名属性列表 $RA$ 和重排决策系统 $RDS$。
- **步骤**:
1. 初始化 $RA = \{\}$。
2. 初始化 $i = 1$ 到 $n$,$w(a_i) = 0$。
3. 构建等价类表 $EQT$。
4. 构建可分辨矩阵 $DM$ 并计算每个属性的权重。
5. 根据属性权重对特征集进行排名得到 $RA$。
6. 根据排名列表重排决策系统得到 $RDS$。
以下是该阶段的流程图:
```mermaid
graph TD;
A[开始] --> B[初始化RA = {}];
B --> C[初始化w(ai) = 0];
C --> D[构建EQT];
D --> E[构建DM并计算w(ai)];
E --> F[对特征集排名得到RA];
F --> G[重排决策系统得到RDS];
G --> H[结束];
```
- **阶段二:特征选择**
- **输入**:排名属性集 $RA$ 和有序决策系统 $RDS$。
- **输出**:最佳特征集 $FSet$。
- **步骤**:
1. 估计原始决策系统的分类准确率作为阈值。
2. 初始化 $AllSet = RA$,$FSet$ 为 $AllSet$ 的第一个属性。
3. 从 $AllSet$ 中移除 $FSet$。
4. 重复以下步骤:
- 估计 $FSet$ 的分类准确率 $FAccuracy$。
- 初始化增量因子 $Factor$ 为 $[1..10]$,每 10 次迭代重新初始化。
- 如果 $FAccuracy$ 在阈值的 $\alpha$ 范围内(如 $\pm 5\%$),则循环选择下一个或上一个因子;否则,$k = k + Factor$。
- 将 $AllSet$ 的前 $k$ 个属性添加到 $FSet$ 中,并从 $AllSet$ 中移除。
0
0
复制全文
相关推荐










