Методы автоматического аннотирования изображений Докладчик: Баев Александр, 5 курс Научный руководитель: Лукашевич Наталья Валентиновна
В интернет много фотографий, картинок Нужно уметь искать, Один из видов поиска – по текстовой аннотации к изображению Не все фотографии, картинки имеют подписи  (аннотации) Задача:  автоматическое создание подписи изображения Поиск изображений в интернет:
Два метода автоматического аннотирования изображений 1) Анализ структурных элементов изображений, сопоставление их с текстовыми аннотациями на основе обучающей коллекции 2) Анализ текста (статьи, сообщения), к которому прикреплено изображение
Используемые статьи: Yong Wang   and   Shaogang Gong ,  « Refining Image Annotation Using   Contextual   Relations   Between Words » «Улучшение аннотации к картинке, используя контекстную зависимость между словами»
Ключевые методы: Binary image classi fi ers:  получение набора слов-подписей с их весом. The normalized Google distances (NGD's):  вычисление контекстной зависимости между словами. Conditional Random Field (CRF):  ранжирование с учётом веса и контекстной зависимости слов. Обзор статьи:
5000 цветных изображения, каждое содержит 1 ~ 5 слов-заголовков (проставленных вручную).  ( Corel Data set ) Всего 374 слова-заголовка. 4000 –  training set,  500 -  testing set,  500 -  validation set. Исходные данные:
Пример картинки: Corel data set
Схема работы системы Обзор статьи:
Необходимо подписать изображения (указав вес слов-заголовков). В качестве одного из методов был выбран: R elevance vector machine (RVM) Основан на выделении визуальных областей изображений и сопоставлении с ними слов-заголовков из исходной базы (всех слов в заголовках к исходным картинкам) с весом каждого из них. Binary Image Classification :
R elevance vector machine (RVM) Создаём словарь визуальных областей (кластеров) картинок. Размечаем области словами-заголовками Классифицируем их с помощью  RVM Получаем набор слов-кандидатов для каждой картинки (с весом).
R elevance vector machine (RVM)
w1, w2 –  слова. f(w1), f(w2), f(w1,w2) –  кол-во страниц, выданных  Google  на запрос со словом  w1, w2  и « w1 and w2 »   соответственно . M –  размер индекса  Google . Normalized Google Distance :
Normalized Google Distance :
Conditional Random Field (CRF) : Пример работы  CRF. Результат – ранжированный набор слов-аннотаций
Результаты: Сравнительный анализ трёх методов. RWR – Random Walk with Restarts
Пример:
Постановка задачи диплома Имеется текст новостного сообщения с иллюстрацией Нужно проанализировать текст и выдать список текстовых сущностей, которые могут быть изображены на иллюстрации
Визуальные сущности в тексте Слова: существительные и прилагательные Концепты из тезауруса НИВЦ МГУ (учет синонимов, словосочетания) Характеристики Частотность в документе Частотность в коллекции (1 млн. новостных сообщений ) Вхождение в заголовок Собственные имена Визуальность – приписана экспертами к концептам тезауруса
Формирование списка кандидатов для аннотации В отличие от метода, изложенного выше, я беру слова-кандидаты из текста статьи (новостной). Веса вычисляются по формуле  ( условной ) : Freq*iFreq*(a + b + v + n). a –  базовая оценка,  b  – учёт заголовка,  v  – учёт визуальности, n  – учёт имени собственного. iFreq –  относительная частота.
Оценка предложенных кандидатов Всем словам предварительно проставлены  оценки  (ManScore)  вручную.  (0 – нет на картинки, 1 –   косвенно присутствует, 2 – присутствует) Конечная оценка вычисляется по трем словам, имеющим наибольший вес, как: w1* ManScore 1  + w2* ManScore 2  + w3* ManScore 3 . где  w1 = 1, w2 = 0.5, w3 = 0.33 .
Дальнейшая работа Сейчас учет простых характеристик Первая задача: подобрать параметры, чтобы получить максимально хорошие аннотации – базовый уровень Следующая задача :  Более глубокий анализ текста статьи и / или списка кандидатов Учет начал предложений, подлежащих, местоимений Автоматическая сборка словосочетаний Контекстная зависимость кандидатов в аннотации

More Related Content

PPT
Personilized search
PDF
Digital Museum
PPT
Определение новизны информации в новостном кластере
PDF
Dich cankinh thuchanh
PPT
Автоматическое разрешение референции в новостных текстах
DOC
Vl6 b24 sunongchayvasudongdac-tranminhtho
XLS
Cd avan
Personilized search
Digital Museum
Определение новизны информации в новостном кластере
Dich cankinh thuchanh
Автоматическое разрешение референции в новостных текстах
Vl6 b24 sunongchayvasudongdac-tranminhtho
Cd avan

Similar to Методы автоматического аннотирования изображений (20)

PPT
Автоматический анализ текста для аннотирования изображения
PDF
CV2011 Lecture 10. Image retrieval
PPTX
автоматическое аннотирование новостного потока
PPTX
Мищенко. Методы автоматического определения наиболее частотного значения слова.
PPT
Алексей Колосов
PPT
Russir 2010 final
PDF
CV2015. Лекция 7. Поиск изображений по содержанию.
PPT
06 автоматические ответы на вопросы
PDF
20111001 information retrieval raskovalov_lecture2
PPT
Разрешение лексической неоднозначности
PPT
Проблемы автоматической рубрикации текстов
PPT
Классификация изображений
PPT
Классификация изображений
PDF
Реализация метода автоматического разрешения лексической многозначности
PDF
20120226 information retrieval raskovalov_lecture03-04
PPT
Почему оно не находится! / Андрей Аксенов (Sphinx)
PPTX
Концепция поисковых расширений
PPTX
Текстовое ранжирование и тз на копирайтинг
PDF
CV2011 Lecture 8. Detection
PPTX
Классификация текстовых документов на естественных языках
Автоматический анализ текста для аннотирования изображения
CV2011 Lecture 10. Image retrieval
автоматическое аннотирование новостного потока
Мищенко. Методы автоматического определения наиболее частотного значения слова.
Алексей Колосов
Russir 2010 final
CV2015. Лекция 7. Поиск изображений по содержанию.
06 автоматические ответы на вопросы
20111001 information retrieval raskovalov_lecture2
Разрешение лексической неоднозначности
Проблемы автоматической рубрикации текстов
Классификация изображений
Классификация изображений
Реализация метода автоматического разрешения лексической многозначности
20120226 information retrieval raskovalov_lecture03-04
Почему оно не находится! / Андрей Аксенов (Sphinx)
Концепция поисковых расширений
Текстовое ранжирование и тз на копирайтинг
CV2011 Lecture 8. Detection
Классификация текстовых документов на естественных языках
Ad

More from Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ (20)

PDF
Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...
PDF
Муромцев. Методы анализа социальных графов и поиска сообществ
PDF
Рой. Аспектный анализ тональности отзывов
PDF
Котиков Простые методы выделения ключевых слов и построения рефератов
PDF
Лукьяненко. Извлечение коллокаций из текста
PPTX
Иванов. Автоматизация построения предметных указателей
PPTX
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
PDF
Сапин. Интеллектуальные агенты и обучение с подкреплением
PDF
Смолина Пользовательские интерфейсы систем лингвистической разметки текстов
PDF
Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...
PDF
Савкуев. Построение формального описания фотографий на основе контекстно-собы...
PDF
Савостин. Системы и методы научного поиска и мониторинга
PPTX
Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...
PDF
Панфилов. Корпусы текстов и принципы их создания
PDF
Муромцев. Обзор библиографических менеджеров
PPTX
Можарова Тематические модели: учет сходства между униграммами и биграммами.
PDF
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
PDF
Баев Системы для обучения программированию
Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...
Муромцев. Методы анализа социальных графов и поиска сообществ
Рой. Аспектный анализ тональности отзывов
Котиков Простые методы выделения ключевых слов и построения рефератов
Лукьяненко. Извлечение коллокаций из текста
Иванов. Автоматизация построения предметных указателей
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
Сапин. Интеллектуальные агенты и обучение с подкреплением
Смолина Пользовательские интерфейсы систем лингвистической разметки текстов
Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...
Савкуев. Построение формального описания фотографий на основе контекстно-собы...
Савостин. Системы и методы научного поиска и мониторинга
Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...
Панфилов. Корпусы текстов и принципы их создания
Муромцев. Обзор библиографических менеджеров
Можарова Тематические модели: учет сходства между униграммами и биграммами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Баев Системы для обучения программированию
Ad

Методы автоматического аннотирования изображений

  • 1. Методы автоматического аннотирования изображений Докладчик: Баев Александр, 5 курс Научный руководитель: Лукашевич Наталья Валентиновна
  • 2. В интернет много фотографий, картинок Нужно уметь искать, Один из видов поиска – по текстовой аннотации к изображению Не все фотографии, картинки имеют подписи (аннотации) Задача: автоматическое создание подписи изображения Поиск изображений в интернет:
  • 3. Два метода автоматического аннотирования изображений 1) Анализ структурных элементов изображений, сопоставление их с текстовыми аннотациями на основе обучающей коллекции 2) Анализ текста (статьи, сообщения), к которому прикреплено изображение
  • 4. Используемые статьи: Yong Wang and Shaogang Gong , « Refining Image Annotation Using Contextual Relations Between Words » «Улучшение аннотации к картинке, используя контекстную зависимость между словами»
  • 5. Ключевые методы: Binary image classi fi ers: получение набора слов-подписей с их весом. The normalized Google distances (NGD's): вычисление контекстной зависимости между словами. Conditional Random Field (CRF): ранжирование с учётом веса и контекстной зависимости слов. Обзор статьи:
  • 6. 5000 цветных изображения, каждое содержит 1 ~ 5 слов-заголовков (проставленных вручную). ( Corel Data set ) Всего 374 слова-заголовка. 4000 – training set, 500 - testing set, 500 - validation set. Исходные данные:
  • 8. Схема работы системы Обзор статьи:
  • 9. Необходимо подписать изображения (указав вес слов-заголовков). В качестве одного из методов был выбран: R elevance vector machine (RVM) Основан на выделении визуальных областей изображений и сопоставлении с ними слов-заголовков из исходной базы (всех слов в заголовках к исходным картинкам) с весом каждого из них. Binary Image Classification :
  • 10. R elevance vector machine (RVM) Создаём словарь визуальных областей (кластеров) картинок. Размечаем области словами-заголовками Классифицируем их с помощью RVM Получаем набор слов-кандидатов для каждой картинки (с весом).
  • 11. R elevance vector machine (RVM)
  • 12. w1, w2 – слова. f(w1), f(w2), f(w1,w2) – кол-во страниц, выданных Google на запрос со словом w1, w2 и « w1 and w2 » соответственно . M – размер индекса Google . Normalized Google Distance :
  • 14. Conditional Random Field (CRF) : Пример работы CRF. Результат – ранжированный набор слов-аннотаций
  • 15. Результаты: Сравнительный анализ трёх методов. RWR – Random Walk with Restarts
  • 17. Постановка задачи диплома Имеется текст новостного сообщения с иллюстрацией Нужно проанализировать текст и выдать список текстовых сущностей, которые могут быть изображены на иллюстрации
  • 18. Визуальные сущности в тексте Слова: существительные и прилагательные Концепты из тезауруса НИВЦ МГУ (учет синонимов, словосочетания) Характеристики Частотность в документе Частотность в коллекции (1 млн. новостных сообщений ) Вхождение в заголовок Собственные имена Визуальность – приписана экспертами к концептам тезауруса
  • 19. Формирование списка кандидатов для аннотации В отличие от метода, изложенного выше, я беру слова-кандидаты из текста статьи (новостной). Веса вычисляются по формуле ( условной ) : Freq*iFreq*(a + b + v + n). a – базовая оценка, b – учёт заголовка, v – учёт визуальности, n – учёт имени собственного. iFreq – относительная частота.
  • 20. Оценка предложенных кандидатов Всем словам предварительно проставлены оценки (ManScore) вручную. (0 – нет на картинки, 1 – косвенно присутствует, 2 – присутствует) Конечная оценка вычисляется по трем словам, имеющим наибольший вес, как: w1* ManScore 1 + w2* ManScore 2 + w3* ManScore 3 . где w1 = 1, w2 = 0.5, w3 = 0.33 .
  • 21. Дальнейшая работа Сейчас учет простых характеристик Первая задача: подобрать параметры, чтобы получить максимально хорошие аннотации – базовый уровень Следующая задача : Более глубокий анализ текста статьи и / или списка кандидатов Учет начал предложений, подлежащих, местоимений Автоматическая сборка словосочетаний Контекстная зависимость кандидатов в аннотации