Selective Search for Object Recognition
This paper addresses the problem of generating possible object locations for use in object recognition. We introduce selective search which combines the strength of both an exhaustive search and segmentation. Like segmentation, we use the image structure to guide our sampling process. Like exhaustive search, we aim to capture all possible object locations. Instead of a single technique to generate possible object locations, we diversify our search and use a variety of complementary image partitionings to deal with as many image conditions as possible. Our selective search results in a small set of data-driven, class-independent, high quality locations, yielding 99% recall and a Mean Average Best Overlap of 0.879 at 10,097 locations. The reduced number of locations compared to an exhaustive search enables the use of stronger machine learning techniques and stronger appearance models for object recognition. In this paper we show that our selective search enables the use of the powerful Bag-of-Words model for recognition. The selective search software is made publicly available (Software: http://disi.unitn.it/similar to uijlings/SelectiveSearch.html). ### Selective Search for Object Recognition #### 摘要与引言 本文主要研究了在对象识别过程中生成可能的对象位置的问题。作者们提出了“选择性搜索”(Selective Search)这一概念,该方法结合了穷举搜索(Exhaustive Search)与分割(Segmentation)的优点。像分割一样,选择性搜索利用图像结构来指导抽样过程;像穷举搜索一样,其目标是捕捉所有可能的对象位置。选择性搜索并非采用单一技术生成可能的对象位置,而是多样化地进行搜索,并运用多种互补的图像分区方式来处理尽可能多的图像条件。结果是产生了一组数量较少、数据驱动、类独立且高质量的位置,能够达到99%的召回率以及10,097个位置上的平均最佳重叠均值(Mean Average Best Overlap)为0.879。相比传统的穷举搜索,这种减少的位置数量使得可以应用更强大的机器学习技术和更强的对象外观模型来进行对象识别。文章进一步展示了选择性搜索如何使得能够应用强大的“词袋模型”(Bag-of-Words Model)进行识别。 #### 方法论 选择性搜索的核心在于它不仅考虑了图像中的单个像素,还考虑了图像的内在层次结构。例如,在一张包含沙拉碗、勺子和桌子的照片中,选择性搜索会识别出沙拉碗包含了沙拉和勺子,而沙拉碗本身又位于桌子上。通过这种方式,选择性搜索能够在不同层次上识别出对象。 #### 关键特点 1. **数据驱动**: 选择性搜索是一种基于数据的方法,它不依赖于预定义的规则或模板。 2. **类独立**: 这种搜索方法对于不同的对象类别具有普遍适用性,无需特定于某个类别的训练。 3. **高质量定位**: 产生的对象位置质量高,能够准确捕捉到目标物体的位置信息。 4. **高效性**: 相比于穷举搜索,选择性搜索极大地减少了需要检查的位置数量,从而提高了效率。 5. **适用性强**: 减少的位置数量使得可以应用更复杂的机器学习算法和模型。 #### 应用示例 文章通过实验证明了选择性搜索方法的有效性。其中一个例子是将选择性搜索与词袋模型相结合用于对象识别。词袋模型是一种广泛应用于文本分类和检索的强大工具,它通过提取特征向量来表示图像内容。通过选择性搜索获得的高质量位置信息,可以进一步增强词袋模型的表现,提高对象识别的准确性。 #### 软件可用性 为了便于研究者和开发者使用选择性搜索方法,作者们提供了公开可用的选择性搜索软件。该软件可以在以下网址获取:[http://disi.unitn.it/~uijlings/SelectiveSearch.html](http://disi.unitn.it/~uijlings/SelectiveSearch.html)。 #### 结论 选择性搜索是一种创新的方法,它解决了对象识别中一个关键问题——如何有效地生成候选对象区域。通过结合分割和穷举搜索的优点,这种方法能够在保持高准确度的同时减少计算资源的需求。此外,选择性搜索还可以与其他高级技术如词袋模型结合使用,进一步提升识别效果。未来的研究方向可能包括探索更多样化的图像分区策略、改进搜索算法以及将其应用于更广泛的视觉任务中。























剩余17页未读,继续阅读


- 粉丝: 1
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 大数据时代下计算机网络信息安全问题探讨.docx
- 中国在国际煤炭市场定价格局中的地位与策略-基于贸易网络核心一边缘结构分析.docx
- JEE架构办公自动化系统设计方案与实现.doc
- 卫星通信接收技术知识.doc
- 项目管理中的第三方监控.docx
- 人工智能带来的伦理与社会挑战.docx
- vb学生宿舍管理系统设计方案.doc
- 数据库课程设计参考模版.doc
- 提取二值化指纹图像中特征数据算法研究分析报告.doc
- 大数据检测在公安信息安全中的应用.docx
- 提高路桥施工项目管理水平的措施探讨.docx
- 《不要沉迷于网络游戏》教案.doc
- 大数据时代档案信息化建设措施.docx
- Fortran结构化程序设计.ppt
- 图像处理与影视后期课程教学大纲.docx
- 搭上电子商务快车的传统机械制造企业-河南黎明重工科技股份有限公司发展态势分析与展望.docx


