Public.Ru представила прототип новой поисковой системы
Москва, 29 апреля, 2010, 17:12 — ИА Регнум. 28 апреля состоялась презентация прототипа новой поисковой системы, совместно разрабатываемой интернет-библиотекой СМИ Public.Ru и компанией "Авикомп Сервисез", основанной на технологиях семантического поиска и анализа текстовой информации. Мероприятие собрало более 60 гостей, среди которых: клиенты Public.Ru, партнеры, представители госструктур, журналисты.
Директор по развитию интернет-библиотеки СМИ Public.Ru Дмитрий Шемигон продемонстрировал рабочие возможности тестовой версии новой системы. Филипп Дудчук, директор по маркетингу "Авикомп Сервисез", рассказал о технологиях поэтапной обработки неструктурированной информации, методике семантического анализа текстов и принципах сохранения результатов в специализированном семантическом хранилище.
Недавно заключенное соглашение о стратегическом партнерстве компаний Public.Ru и "Авикомп Сервисез" подразумевает совместную разработку новых технологических продуктов, которые позволят в будущем сократить количество "ручного труда" при извлечении из текста объектов, событий и фактов. Процесс обработки основывается на созданном компанией "Авикомп Сервисез" семантическом процессоре - Ontos Miner, который включает тысячи лингвистических правил распознавания информационных объектов, их свойств и взаимоотношений в естественно-языковых текстах. Гибкая и мощная система семантического анализа неструктурированной информации, разработанная "Авикомпом", будет интегрирована с крупнейшими и постоянно обновляющимися фондами русскоязычных СМИ Public.Ru - более 3 500 источников, около 40 млн. документов. Ежедневно электронный архив пополняется на более чем 30 тысяч новых публикаций. Полнотекстовый поиск в Public.Ru по информационному массиву реализован на технологиях OpenText (ведущего мирового разработчика в области поисковых систем) и включает поиск по атрибутам и ключевым словам.
По словам генерального директора интернет-библиотеки СМИ Public.Ru Олега Владеса, "...семантические технологии - это следующий шаг в развитии поисковых сервисов Public.Ru, который изменит специфику работы с информацией и расширит сферы ее применения. Пользователи получат новые, уникальные возможности для аналитической обработки информации".
Справка. Public.Ru - крупнейшая интернет-библиотека русскоязычных СМИ. С 2000 года Public.Ru развивает собственную базу данных материалов СМИ. Сегодня в архивах доступно более 40 млн. документов из более 3500 источников - газет, журналов, информационных агентств, телеканалов, радиостанций и интернет-изданий. Глубина архивов интернет-библиотеки составляет 20 лет. География источников охватывает все регионы России, а также страны ближнего и дальнего зарубежья, такие как Украина, Белоруссия, Грузия, Латвия, США и др. Службы сбора информации Public.Ru работают круглосуточно и без выходных - ежедневно обрабатывается и загружается в базу около 30 000 документов. Мы самостоятельно сканируем около 400 центральных изданий, обеспечивая 100% соответствие текстов вышедшим номерам изданий. Благодаря Службе технической поддержки фонды доступны в любое время суток. За эти годы у Public.Ru сложился широкий круг постоянных корпоративных и частных клиентов. Среди них Аналитический центр при Правительстве РФ, Российская Академия Наук, ФГУП "СКЦ Росатома", Министерство юстиции, Сбербанк РФ, "Русский Стандарт", Росбанк, ОАО "Сургутнефтегаз", ОАО НГК "Славнефть", ЗАО "Москва-Макдоналдс", ООО "Корпорация Уралхетнострой", ведущие маркетинговые и PR-агентства, инвестиционные, промышленные, юридические, политические и консалтинговые компании, федеральные телеканалы и медиа-холдинги. Со многими из клиентов компания сотрудничает с момента основания.
Компания "Авикомп" с 1991 года работает на рынке информационно-аналитических систем России, Средней Азии и Восточной Европы. Предмет деятельности компании - создание и внедрение комплексных решений для управления данными в крупных коммерческих и государственных организациях. Среди заказчиков компании - ОБСЕ, SAP.info, РИА "Новости", Минфин РФ, Генеральная прокуратура, Московский фонд обязательного медицинского страхования, государственные министерства и ведомства стран Средней Азии, Грузии, Армении, Молдовы и других стран. С 2001 года совместно с компанией Ontos AG Авикомп развивает собственные технологии семантического анализа документов для распознавания объектов, событий и фактов в неструктурированном тексте. На сегодняшний день технология успешно позволяет работать с данными на русском, английском, французском и немецком языках. Успешно реализовано несколько десятков проектов в госсекторе и в электронных СМИ по внедрению информационно-аналитических систем, основанных на семантических технологиях Авикомпа.