图像检索技术:从C-BIRD到现代关键技术
立即解锁
发布时间: 2025-09-02 00:19:41 阅读量: 12 订阅数: 35 AIGC 


多媒体技术核心解析
# 图像检索技术:从C - BIRD到现代关键技术
## 1. C - BIRD系统的搜索方法
### 1.1 光照不变性搜索
光照变化会极大地改变相机RGB传感器测量的颜色,例如在日光下为粉色的物体在荧光灯下可能变为紫色。为处理查询图像到不同数据库图像间的光照变化,C - BIRD系统采取了以下步骤:
1. **图像归一化与压缩**:对每个图像的每个颜色通道带进行归一化,然后压缩为36维向量。归一化R、G、B通道带能有效应对光照颜色变化导致的颜色改变。
2. **创建二维颜色直方图**:利用色度(即{R, G}/(R + G + B)的带比集合)创建二维颜色直方图。色度只捕捉颜色信息,不包含亮度信息。
3. **直方图压缩**:将128×128的二维颜色直方图视为图像,使用基于小波的压缩方案进行压缩。为进一步减少特征向量的分量数量,计算较小直方图的DCT系数并按锯齿顺序排列,只保留36个分量。
4. **匹配操作**:在压缩域中,通过计算两个DCT压缩后的36维特征向量的欧几里得距离进行匹配。
### 1.2 对象模型搜索
C - BIRD支持的最重要搜索类型是基于模型的对象搜索,具体操作步骤如下:
1. **进入对象选择模式**:用户选择一个缩略图并点击“Model”标签进入对象选择模式。
2. **选择对象区域**:用户可以使用矩形、椭圆等基本形状,或魔棒工具(基于种子的泛洪算法)、活动轮廓(“蛇”)、画笔工具等选择图像区域。所有选择可以通过布尔运算(如并集、交集、排除)进行组合。
3. **确定搜索对象**:将定义好的对象区域拖到右侧窗格,显示所有当前选择。虽然可以拖动多个区域到选择窗格,但只有选择窗格中的活动对象会被用于搜索。
4. **对象匹配流程**:
- 处理用户选择的模型图像并定位其特征。
- 应用基于简化色度直方图的颜色直方图交集作为初步筛选。
- 估计目标图像中对象的姿态(比例、平移、旋转)。
- 通过纹理直方图的交集进行验证。
- 使用广义霍夫变换(GHT)的高效版本进行形状验证。
## 2. 搜索结果量化
### 2.1 精度和召回率
在信息检索中,精度(Precision)是指检索到的相关文档数与所有检索到的文档数的百分比,召回率(Recall)是指检索到的相关文档数与所有相关文档数的百分比。其计算公式如下:
- \(Precision = \frac{Relevant\ images\ returned}{All\ retrieved\ images}=\frac{TP}{TP + FP}\)
- \(Recall = \frac{Relevant\ images\ returned}{All\ relevant\ images}=\frac{TP}{TP + FN}\)
其中,TP(True Positives)是返回的相关图像数,FP(False Positives)是返回的不相关图像数,FN(False Negatives)是未返回的相关图像数。一般来说,放宽阈值允许更多图像返回时,精度会降低,召回率会提高;反之亦然。因此,单独讨论精度或召回率的数值意义不大,通常会结合两者来衡量,例如召回率为50%时的精度、精度为90%时的召回率等。
### 2.2 平均精度均值(MAP)
当涉及多个查询时,为衡量CBIR系统的整体性能,通常将精度和召回率的值汇总为一个单一值,即平均精度均值(MAP)。单个查询q的平均精度(AP)定义为:
\(AP(q) = \frac{1}{NR}\sum_{n = 1}^{NR}Precision(n)\)
其中,\(Precision(n)\)是第n个相关图像被检索后得到的精度值,NR是相关图像的总数。MAP是所有查询图像的平均精度的平均值:
\(MAP = \frac{1}{NQ}\sum_{q\in Q}AP(q)\)
其中,Q是查询图像集,NQ是其大小
0
0
复制全文
相关推荐










