Электронная библиотека научно-
технической информации
Опыт, технологии, решения
2
Наиболее значимые аналогичные
проекты IBS
 Министерство образования РФ
Разработка инструмента, обеспечивающего информационную
поддержку управления идеями и развитием инноваций в рамках
ФЦП "Исследования и разработки по приоритетным
направлениям развития НТК России на 2014-2020 годы " (текущий
проект)
 Министерство транспорта РФ
Система доступа субъектов транспортного комплекса Российской
Федерации к научным и образовательным информационным
ресурсам
 Федеральное казначейство
Система электронного хранения документов Федерального
казначейства
Система полнотекстового поиска на портале госзакупок
Система анализа госзакупок (анализ содержания закупочной
документации)
 Государственная корпорация "Росатом"
Разработка концепции системы управления корпоративными
знаниями ГК и программы её реализации
3
Технологии, инструменты по обработке
неструктурированных данных в арсенале IBS
 RCO Zoom
 IBM FileNet
 EMC Documentum
 IBM DataCap
 EMC Captiva
 Abbyy FineReader, Abbyy
FlexyCapture
Платформы электронного
архива
Сканирование и распознавание
 RCO Zoom
 Sphinx (Open Source)
 IBM Content Analytics
 EMC Documentum Index Server
 Autonomy IDOL
Поисковые машины
 RCO Fact Extractor
 IBM Content Analytics
Извлечение знаний
4
4
Создание
Поиск
Ключевые функции библиотеки научных и
образовательных ресурсов
Обмен
Доступ
Учет
Библиотека
научных
и
образовательных
ресурсов
5
Функциональные составляющие решения
Поиск и извлечение
 Атрибутивный, контекстный и
«семантический» поиск
 Просмотр, печать документов
 Экспорт документов
Сбор, хранение
 Регистрация/загрузка
информационных ресурсов
уполномоченными пользователями
 Интеграция с внешними
системами-источниками
 Сбор данных из открытых
источников (Интернет)
Поддержка процессов
 Регистрация, учет, инвентаризация
информационных ресурсов
 Мониторинг и контроль
поступления и обновления
информационных ресурсов
 Регистрация пользователей
Атрибутирование и
классификация
 Автоматическая категоризация
 Выделение объектов, фактов
 Выявление похожих документов
Безопасность и верификация
 Аутентификация и авторизация
пользователей
 Поддержка электронной подписи
 Протоколирование запросов и
изменений
Ретроконверсия
 Сканирование
 Распознавание
 Верификация
Качество
данных
Методологическое обеспечение
6
Возможная концептуальная
архитектура решения*
*без учета ретро-конверсии
Пользовательский
интерфейс
Подсистема учета и
модерации ИР
Подсистема поиска и
анализа ИР
Личный кабинет
Подсистема
мониторинга и
контроля ИР
Подсистема
информационного
обмена
Файловая система
Пользователь
Администратор доступа
Внешние системы
БД
электронного
архива
Подсистема
управления
доступом
Внешние системы
Сервер(ы) индексации и
лексико-семантической
обработки
Сайты институтов, научных
журналов, прочие
открытые источники
Библиотекарь, модератор
Администратор
информационных ресурсов
Результаты
интеллектуальной
деятельности,
результаты НИОКР,
диссертации,
публикации и т.д.
7
Платформа RCO
 Российская разработка: компания «ЭР СИ О» (компьютерная лингвистика,
информационный поиск, фактографические БД, очистка данных)
 Внедрения: Банк России, Консультант+, Росфинмониторинг, СВР, ФСБ,
Аналитический Центр при правительстве РФ и пр.
 Платформа обработки и анализа неструктурированных данных:
 RCO Zoom: сбор, хранение, классификация, поиск документов, управление
доступом
 RCO Fact Extractor: извлечение объектов, связей, фактов.
RCO Zoom
Извлечение фактов
Поиск фактов
Поиск с учётом
семантической разметки
RCO Fact Extractor
8
Как это работает: семантическая
сеть
Результат разбора
предложения:
В ноябре 2003 года
Ивановым была
совершена сделка
по покупке акций
Лукойла у Петрова.
9
Извлечение фактов из текста
# Фрагмент Роли участников факта
1
Супруга бывшего мэра Москвы Юрия Лужкова
купила расположенный поблизости гольф-клуб
Eichenheim
Goods = ГОЛЬФ-КЛУБ EICHENHEIM
Buyer = СУПРУГА ЛУЖКОВА ЮРИЯ МИХАЙЛОВИЧА
2
…Barclays, купивший ранее индексную службу
обанкротившегося Lehman Brothers
Goods = ИНДЕКСНАЯ СЛУЖБА LEHMAN BROTHERS
Buyer = BARCLAYS
3
Группа БИН купила компанию МЛП у Виктора
Вексельберга
Goods = МЛП
Buyer = БИН
Seller = ВЕКСЕЛЬБЕРГ ВИКТОР ФЕЛИКСОВИЧ
4
…компания "Росевродевелопмент" за $250
млн купила у Renaissance Construction
торговый центр "Аура" в Новосибирске.
Goods = ТОРГОВЫЙ ЦЕНТР "АУРА"
Buyer = РОСЕВРОДЕВЕЛОПМЕНТ
Seller = RENAISSANCE CONSTRUCTION
~Money = $250 МЛН
~Place = НОВОСИБИРСК
5
В мае 2013 года "РТ-Инвест" за $40 млн купил
крупнейшую казанскую мусорную компанию
"Предприятие ЖКХ"
Goods = МУСОРНАЯ КОМПАНИЯ "ПРЕДПРИЯТИЕ ЖКХ"
Buyer = РТ-ИНВЕСТ
~Money = $40 МЛН
~Time = В МАЕ 2013 ГОДА
… … …
10
Поисковые запросы по шаблону
события/факта
При помощи данного шаблона можно извлечь факт
«покупки акций» из различных текстов, например: В
ноябре 2003 года Ивановым была совершена сделка по
покупке акций Лукойла у Петрова.
Результат извлечения
факта «покупка акций»:
BUYER = ‘Иванов’
ISSUER = ‘ЛУКОЙЛ’
SELLER = ‘Петров’
DATE = ‘В ноябре 2003
года’
фигурант
«покупатель»
фигурант
«эмитент»
фигурант
«продавец
»
11
Результат поисковой выдачи
12
Возможности и характеристики решения
 Сбор, индексация и аналитическая обработка данных из внешних источников в режиме онлайн
 Настройка лингвистического обеспечения на предметную область и стилистику документов
 Тематическое рубрицирование
 Выделение из текста персон, организаций, адресов, событий и их участников. Построение
фактографической базы
 Выявление заимствований и поиск похожих текстов
 Выявление в текстах ссылок на другие документы
 Стандартные поисковые возможности:
 Морфология – словарная, бессловарная
 Поисковые шаблоны для слов *,?
 Учет контекста – расстояние в словах, в одном предложении, в одном абзаце
 Специальные операторы для поиска ФИО, телефонов
 Нечеткий поиск, синонимы
 Атрибутивный поиск
 ИнфоПортрет - список слов и словосочетаний, отличающий данную выборку от прочих (выводится вместе
с выборкой)
 Уточнение запроса - позволяет за минимальное время ознакомиться со всей интересующей областью
 Частотный анализ слов, объектов, категорий в поисковой выборке
 Пользовательские сохраняемые подборки документов
 Версионное хранение, протоколирование
 Надежность, производительность, масштабируемость
 Отечественная платформа, может быть представлена в исходных кодах для сертификации
 В разы дешевле зарубежных аналогов
Россия, 127434, Москва,
Дмитровское шоссе, 9Б
тел.: +7 (495) 967-8080
факс: +7 (495) 967-8081
ibs@ibs.ru
www.ibs.ru
www.facebook.com/IBS.ru
www.twitter.com/ibs_ru
Татьяна Лякишева
tljakisheva@ibs.ru

More Related Content

PPT
информационные и информационно поисковые системы интернет
PPT
Поиск информации в интернете при помощи поисковых систем
PPT
поисковые системы
PPT
Информационно поисковые системы
PDF
Semantic archive for economic security servecis
PPTX
Дистанционный курс «Куратор содержания - 4» (3 неделя обучения)
PPTX
Поисковая система
PPT
поисковые системы презентация ученика
информационные и информационно поисковые системы интернет
Поиск информации в интернете при помощи поисковых систем
поисковые системы
Информационно поисковые системы
Semantic archive for economic security servecis
Дистанционный курс «Куратор содержания - 4» (3 неделя обучения)
Поисковая система
поисковые системы презентация ученика

What's hot (20)

PDF
Дата расследования в России.
PPT
Search systems
PPT
поисковые системы рунета
DOC
тест система управления базами данных
PPTX
Использование цифрового идентификатора объекта (DOI) в современной научной ко...
PDF
Запуск клуба "Поисковые системы"
PPTX
Современное программное обеспечение в работе психолога
PPTX
Как грабить корованы
PDF
Как грабить корованы
PPTX
Журналистика данных 101
PPTX
Digital Society Laboratory (Аршавский)
PPT
презентация Lexpro (1)
PPTX
Ispras (трудаков, коршунов)
PDF
Полезные программы и сервисы для психологов
PPT
документы в сети
PPTX
поиск информации с использованием компьютера на зачёт
ODP
Linked Open Data (EIS)
POT
Algorithms overview for content discovery and distribution (on russian)
PPT
Поиск информации в Интернете
Дата расследования в России.
Search systems
поисковые системы рунета
тест система управления базами данных
Использование цифрового идентификатора объекта (DOI) в современной научной ко...
Запуск клуба "Поисковые системы"
Современное программное обеспечение в работе психолога
Как грабить корованы
Как грабить корованы
Журналистика данных 101
Digital Society Laboratory (Аршавский)
презентация Lexpro (1)
Ispras (трудаков, коршунов)
Полезные программы и сервисы для психологов
документы в сети
поиск информации с использованием компьютера на зачёт
Linked Open Data (EIS)
Algorithms overview for content discovery and distribution (on russian)
Поиск информации в Интернете
Ad

Viewers also liked (20)

PPTX
01 продукты ами banking v8
PPTX
ланит презентация финнополис фин
PDF
Textocat news 360
PDF
презентация алетдинов а. - ооо бкс
PPTX
презентация каминский дмитрий
PDF
Cryptogramm
PDF
видбез
PPTX
презентация короп с. - банк россии
PDF
PDF
Web эскроу
PPTX
стартап Gct для инвесторов
PPTX
презентация поцелуевская е. - лаборатория касперского
PPTX
презентация джон тернер - Xbrl
PDF
Check u
PPTX
презентация козырев
PPTX
презентация комлев - нспк
PPTX
презентация россвифт
PPTX
презентация о.а. гончарова
PPTX
презентация зарипов
PPSX
финансовая доступность и защита прав тарусов Finopolis2016_13окт
01 продукты ами banking v8
ланит презентация финнополис фин
Textocat news 360
презентация алетдинов а. - ооо бкс
презентация каминский дмитрий
Cryptogramm
видбез
презентация короп с. - банк россии
Web эскроу
стартап Gct для инвесторов
презентация поцелуевская е. - лаборатория касперского
презентация джон тернер - Xbrl
Check u
презентация козырев
презентация комлев - нспк
презентация россвифт
презентация о.а. гончарова
презентация зарипов
финансовая доступность и защита прав тарусов Finopolis2016_13окт
Ad

Similar to 20150129 минобороны презентация v02 (20)

PPT
Fani Lots1
PDF
Система интегрированной обработки информации (СИОИ) кратко
PPTX
зао «эвентос»
PPT
Information Extraction Overview
PDF
Интеллектуальный анализ текста
PDF
извлечение объектов и фактов из текстов
PDF
FactBook 2014
PPT
PPT
Cognitive Forms - описание технологий
PPT
04 извлечение информации
PPTX
StoredIQ - управление контентом
PPT
2 неделя 27_03_2013
PDF
2008_Справочно-информационное обслуживание руководителей и специалистов Красн...
PDF
InfoWatch. Александр Горский. "Развитие современных угроз информационной безо...
PPT
Semantic Web & электронные сми илья клинцов
PDF
Савостин. Системы и методы научного поиска и мониторинга
PPT
SCIPorgua, CompetitiveCamp-2010, ИАС-Семантический-архив
PPT
извлечение фактов из текста
PPT
извлечение фактов из текста
PPT
извлечение фактов из текста
Fani Lots1
Система интегрированной обработки информации (СИОИ) кратко
зао «эвентос»
Information Extraction Overview
Интеллектуальный анализ текста
извлечение объектов и фактов из текстов
FactBook 2014
Cognitive Forms - описание технологий
04 извлечение информации
StoredIQ - управление контентом
2 неделя 27_03_2013
2008_Справочно-информационное обслуживание руководителей и специалистов Красн...
InfoWatch. Александр Горский. "Развитие современных угроз информационной безо...
Semantic Web & электронные сми илья клинцов
Савостин. Системы и методы научного поиска и мониторинга
SCIPorgua, CompetitiveCamp-2010, ИАС-Семантический-архив
извлечение фактов из текста
извлечение фактов из текста
извлечение фактов из текста

More from finnopolis (20)

PDF
Easy finance finnopolis
PDF
Cryptogramm
PDF
презентация проекта кнопка
PDF
презентация город денег
PPTX
видбез
PDF
Sweet card for finnopolis
PDF
Places prez
PPTX
Pay me
PDF
Cards mobile presentation
PDF
аксиоматика аксикредит-цб рф
PDF
арбитрос проект. презентация для всех банков
PDF
Frank rg. xbrl. эспертные интервью
PDF
сбербанк
PDF
видео конференц-связь Mind
PDF
Do sightseeing
PDF
1 c zup_overview
PDF
1 c treasurybudgetcontrol
PDF
1 c kpi_businesscase
PDF
1 c kpi
PDF
1 c itil
Easy finance finnopolis
Cryptogramm
презентация проекта кнопка
презентация город денег
видбез
Sweet card for finnopolis
Places prez
Pay me
Cards mobile presentation
аксиоматика аксикредит-цб рф
арбитрос проект. презентация для всех банков
Frank rg. xbrl. эспертные интервью
сбербанк
видео конференц-связь Mind
Do sightseeing
1 c zup_overview
1 c treasurybudgetcontrol
1 c kpi_businesscase
1 c kpi
1 c itil

20150129 минобороны презентация v02

  • 1. Электронная библиотека научно- технической информации Опыт, технологии, решения
  • 2. 2 Наиболее значимые аналогичные проекты IBS  Министерство образования РФ Разработка инструмента, обеспечивающего информационную поддержку управления идеями и развитием инноваций в рамках ФЦП "Исследования и разработки по приоритетным направлениям развития НТК России на 2014-2020 годы " (текущий проект)  Министерство транспорта РФ Система доступа субъектов транспортного комплекса Российской Федерации к научным и образовательным информационным ресурсам  Федеральное казначейство Система электронного хранения документов Федерального казначейства Система полнотекстового поиска на портале госзакупок Система анализа госзакупок (анализ содержания закупочной документации)  Государственная корпорация "Росатом" Разработка концепции системы управления корпоративными знаниями ГК и программы её реализации
  • 3. 3 Технологии, инструменты по обработке неструктурированных данных в арсенале IBS  RCO Zoom  IBM FileNet  EMC Documentum  IBM DataCap  EMC Captiva  Abbyy FineReader, Abbyy FlexyCapture Платформы электронного архива Сканирование и распознавание  RCO Zoom  Sphinx (Open Source)  IBM Content Analytics  EMC Documentum Index Server  Autonomy IDOL Поисковые машины  RCO Fact Extractor  IBM Content Analytics Извлечение знаний
  • 4. 4 4 Создание Поиск Ключевые функции библиотеки научных и образовательных ресурсов Обмен Доступ Учет Библиотека научных и образовательных ресурсов
  • 5. 5 Функциональные составляющие решения Поиск и извлечение  Атрибутивный, контекстный и «семантический» поиск  Просмотр, печать документов  Экспорт документов Сбор, хранение  Регистрация/загрузка информационных ресурсов уполномоченными пользователями  Интеграция с внешними системами-источниками  Сбор данных из открытых источников (Интернет) Поддержка процессов  Регистрация, учет, инвентаризация информационных ресурсов  Мониторинг и контроль поступления и обновления информационных ресурсов  Регистрация пользователей Атрибутирование и классификация  Автоматическая категоризация  Выделение объектов, фактов  Выявление похожих документов Безопасность и верификация  Аутентификация и авторизация пользователей  Поддержка электронной подписи  Протоколирование запросов и изменений Ретроконверсия  Сканирование  Распознавание  Верификация Качество данных Методологическое обеспечение
  • 6. 6 Возможная концептуальная архитектура решения* *без учета ретро-конверсии Пользовательский интерфейс Подсистема учета и модерации ИР Подсистема поиска и анализа ИР Личный кабинет Подсистема мониторинга и контроля ИР Подсистема информационного обмена Файловая система Пользователь Администратор доступа Внешние системы БД электронного архива Подсистема управления доступом Внешние системы Сервер(ы) индексации и лексико-семантической обработки Сайты институтов, научных журналов, прочие открытые источники Библиотекарь, модератор Администратор информационных ресурсов Результаты интеллектуальной деятельности, результаты НИОКР, диссертации, публикации и т.д.
  • 7. 7 Платформа RCO  Российская разработка: компания «ЭР СИ О» (компьютерная лингвистика, информационный поиск, фактографические БД, очистка данных)  Внедрения: Банк России, Консультант+, Росфинмониторинг, СВР, ФСБ, Аналитический Центр при правительстве РФ и пр.  Платформа обработки и анализа неструктурированных данных:  RCO Zoom: сбор, хранение, классификация, поиск документов, управление доступом  RCO Fact Extractor: извлечение объектов, связей, фактов. RCO Zoom Извлечение фактов Поиск фактов Поиск с учётом семантической разметки RCO Fact Extractor
  • 8. 8 Как это работает: семантическая сеть Результат разбора предложения: В ноябре 2003 года Ивановым была совершена сделка по покупке акций Лукойла у Петрова.
  • 9. 9 Извлечение фактов из текста # Фрагмент Роли участников факта 1 Супруга бывшего мэра Москвы Юрия Лужкова купила расположенный поблизости гольф-клуб Eichenheim Goods = ГОЛЬФ-КЛУБ EICHENHEIM Buyer = СУПРУГА ЛУЖКОВА ЮРИЯ МИХАЙЛОВИЧА 2 …Barclays, купивший ранее индексную службу обанкротившегося Lehman Brothers Goods = ИНДЕКСНАЯ СЛУЖБА LEHMAN BROTHERS Buyer = BARCLAYS 3 Группа БИН купила компанию МЛП у Виктора Вексельберга Goods = МЛП Buyer = БИН Seller = ВЕКСЕЛЬБЕРГ ВИКТОР ФЕЛИКСОВИЧ 4 …компания "Росевродевелопмент" за $250 млн купила у Renaissance Construction торговый центр "Аура" в Новосибирске. Goods = ТОРГОВЫЙ ЦЕНТР "АУРА" Buyer = РОСЕВРОДЕВЕЛОПМЕНТ Seller = RENAISSANCE CONSTRUCTION ~Money = $250 МЛН ~Place = НОВОСИБИРСК 5 В мае 2013 года "РТ-Инвест" за $40 млн купил крупнейшую казанскую мусорную компанию "Предприятие ЖКХ" Goods = МУСОРНАЯ КОМПАНИЯ "ПРЕДПРИЯТИЕ ЖКХ" Buyer = РТ-ИНВЕСТ ~Money = $40 МЛН ~Time = В МАЕ 2013 ГОДА … … …
  • 10. 10 Поисковые запросы по шаблону события/факта При помощи данного шаблона можно извлечь факт «покупки акций» из различных текстов, например: В ноябре 2003 года Ивановым была совершена сделка по покупке акций Лукойла у Петрова. Результат извлечения факта «покупка акций»: BUYER = ‘Иванов’ ISSUER = ‘ЛУКОЙЛ’ SELLER = ‘Петров’ DATE = ‘В ноябре 2003 года’ фигурант «покупатель» фигурант «эмитент» фигурант «продавец »
  • 12. 12 Возможности и характеристики решения  Сбор, индексация и аналитическая обработка данных из внешних источников в режиме онлайн  Настройка лингвистического обеспечения на предметную область и стилистику документов  Тематическое рубрицирование  Выделение из текста персон, организаций, адресов, событий и их участников. Построение фактографической базы  Выявление заимствований и поиск похожих текстов  Выявление в текстах ссылок на другие документы  Стандартные поисковые возможности:  Морфология – словарная, бессловарная  Поисковые шаблоны для слов *,?  Учет контекста – расстояние в словах, в одном предложении, в одном абзаце  Специальные операторы для поиска ФИО, телефонов  Нечеткий поиск, синонимы  Атрибутивный поиск  ИнфоПортрет - список слов и словосочетаний, отличающий данную выборку от прочих (выводится вместе с выборкой)  Уточнение запроса - позволяет за минимальное время ознакомиться со всей интересующей областью  Частотный анализ слов, объектов, категорий в поисковой выборке  Пользовательские сохраняемые подборки документов  Версионное хранение, протоколирование  Надежность, производительность, масштабируемость  Отечественная платформа, может быть представлена в исходных кодах для сертификации  В разы дешевле зарубежных аналогов
  • 13. Россия, 127434, Москва, Дмитровское шоссе, 9Б тел.: +7 (495) 967-8080 факс: +7 (495) 967-8081 [email protected] www.ibs.ru www.facebook.com/IBS.ru www.twitter.com/ibs_ru Татьяна Лякишева [email protected]