Выпускник Санкт-Петербургского государственного университета Олег Кенунен разработал мобильное приложение для распознавания голосов птиц, работающее на основе нейронной сети. Это первая в мире программа, позволяющая автоматически узнать вид птицы по её пению.

На данный момент в мире не существует систем, которые позволяют автоматически распознавать виды птиц. Имеющиеся приложения делают это либо с помощью анализа фотографий, либо проводят весьма грубый анализ голосов. Некоторые программы и вовсе предлагают пользователю самостоятельно сравнивать услышанные голоса с образцами записей.

Олег Кенунен решил изменить ситуацию и создал информационную систему, позволяющую автоматически распознавать голоса птиц. Она состоит из мобильного приложения, записывающего голосовые сигналы, и серверной части, которая при помощи нейронной сети определяет, какая птица поёт.

Сейчас программа распознаёт только 20 видов птиц, но при этом точность анализа составляет около 90%. Как отмечает разработчик, библиотеку голосов можно будет дополнить, а нейронную сеть — продолжить обучать, так как точность распознавания будет расти в зависимости от количества проанализированных записей.

«Самая большая проблема в обучении нейронных сетей — данные для обучения. Найти большое количество записей голосов птиц не так-то просто, особенно записей высокого качества, — рассказывает Кенунен корреспонденту ИА REGNUM. — Именно поэтому в моей изначальной задумке было разделение на мобильную и серверную части. Пользователь записывает звуковой файл из приложения и отправляет его на сервер, нейронная сеть на сервере анализирует полученный файл и отправляет ответ обратно в мобильное приложение. Такая архитектура позволяет собирать на сервере коллекцию записей и в дальнейшем дообучать нейронную сеть для повышения качества распознавания».

Сейчас готов прототип приложения, для корректной работы которого нужно подключение к интернету. Летом Олег Кенунен планирует провести серию полевых экспериментов, чтобы найти слабые места нейросети и устранить их.

«Безусловно, я планирую дополнительно встроить распознавание локально в мобильном приложении, чтобы можно было использовать его при отсутствии интернета, но взаимодействие с сервером мне показалось очень важным моментом, поэтому я начал с него, — отметил разработчик. — Сейчас я занимаюсь доработкой мобильного приложения, чтобы летом можно было провести полевые испытания. Думаю ориентироваться пока на самые массовые виды вроде зяблика или большой синицы. Мне сейчас важнее не гнаться за количеством видов, а обкатать технологию».

Если все пройдет хорошо, уже через несколько месяцев разработчик планирует выложить бета-версию приложения для свободного скачивания. Он отмечает, что оно пригодится как любителям, так и профессиональным орнитологам. Кенунен добавил, что, если доработать систему, с её помощью можно будет записывать голоса птиц в нескольких точках леса, после чего определять расположение разных особей и проводить автоматический учет их численности.

«Если всё сработает, то уже летом можно будет провести закрытое тестирование среди энтузиастов. Важно, чтобы первые пользователи разбирались в предмете и могли отметить те случаи, когда вид определен неверно. Ко мне уже обращались желающие поучаствовать в тестировании», — поделился Кенунен.

Олег Кенунен — профессиональный орнитолог, защитивший в СПбГУ магистерскую диссертацию по изменчивости демонстративной песни самцов вальдшнепа. Мобильное приложение для распознавания голосов птиц стало его выпускной квалификационной работой в рамках обучения по программе переподготовки специалистов СПбГУ «Математическое обеспечение и администрирование информационных систем».