Яндекс.Новости теперь снабжены "пресс-портретами"
Москва, 4 апреля, 2006, 16:04 — ИА Регнум. Яндекс открыл доступ к справочной информации о людях, упоминаемых в российских СМИ. Теперь при поиске в Яндекс.Новостях (http://news.yandex.ru) пользователи видят ссылки на "пресс-портреты" тех, чьи имена более всего соответствуют заданному запросу. Как сообщил ИА REGNUM руководитель пресс-службы компании "Яндекса" Михаил Ушаков, пресс-портреты создаются автоматически специальной компьютерной программой; исходным материалом служат сообщения от СМИ. Каждый пресс-портрет содержит опубликованную в СМИ краткую информацию о человеке: сведения о местах работы и должностях, прямую речь и высказывания третьих лиц. Все сведения о персоналиях сопровождаются фрагментами документов, из которых они были извлечены; это позволяет быстро понять контекст и достоверность информации. Как пояснил Ушаков, по сути, пресс-портрет - это еще один вариант страницы результатов поиска по Яндекс.Новостям. Искать людей можно не только по фамилии (например, "Анатолий Чубайс" или "Остап Бендер"), но и по названию организации (например, "Союзмультфильм", "Microsoft" или "Палата лордов") - в этом случае будут найдены все, кто, по сведениям СМИ, имеет или имел к ней отношение.
"В прошлом году на страницах службы появились "Новости в лицах" - рейтинги наиболее популярных персон, автоматически формируемые для каждого сюжета, рубрики или результатов поиска. Сегодня же мы начали применять технологии, которые позволяют не только определить, о ком идет речь в сюжете, но и дать справку по каждому участнику событий, - говорит Татьяна Платонова, руководитель службы Яндекс.Новости. - Пресс-портреты особенно полезны, когда СМИ пишут о тех, кто неизвестен широкой аудитории. Теперь за считанные секунды пользователь сможет разобраться, кто есть кто". Новый сервис основан на уникальной технологии, принадлежащей компании "Яндекс". И извлечение фактов из текста, и группировка их в пресс-портрет (то есть определение, какие факты относятся к одному и тому же лицу) делается автоматически, без участия человека. "Впервые в России технология извлечения фактов (fact extraction) внедрена на массовом веб-сервисе и обрабатывает большие текстовые массивы. Назначение этой технологии - определять тождество различных обозначений одного объекта и различать объекты с одинаковыми именами, - говорит Лев Гершензон, ведущий разработчик компании "Яндекс". - Мы научились автоматически связывать два типа объектов - людей и организации. Несмотря на то, что сейчас мы получили важный результат, информация о персонах может оказаться неполной и неточной, ведь пресс-портреты составляются компьютерной программой. Мы планируем дорабатывать технологию и с благодарностью примем любые отклики и предложения по повышению качества сервиса".
Справочная часть службы Яндекс.Новости состоит более чем из 1 млн. пресс-портретов, 30 тыс. из которых обновляется ежедневно. Новостная служба Яндекса была открыта шесть лет назад, поэтому большая часть пресс-портретов создана на основе анализа сообщений СМИ с 2000 года; в настоящее время к службе подключаются архивы новостных источников за предыдущие годы, что повышает полноту и точность сервиса. Всего в базе Яндекс.Новостей на сегодняшний день хранится более 9 млн информационных сообщений от более 1000 источников.
- Цирк в суде, позднее раскаяние и УДО с 3-го раза: хронология преступления и наказания Михаила Ефремова
- В Эр-Рияде завершились переговоры США и Украины — 1124-й день спецоперации
- Переговоры России и США в Эр-Рияде продлились более 12 часов
- Шесть человек, в том числе журналист Федорчак, погибли при обстреле ЛНР
- В ООН поднимут вопрос о гибели российских журналистов