Фильтр для фейков: студенты МАИ предложили меры борьбы с коронавирусом

24 апреля 2020
Фильтр для фейков: студенты МАИ предложили меры борьбы с коронавирусом

86 проектов для борьбы с пандемией коронавируса разработали участники первого онлайн-хакатона Кружкового движения Национальной технологической инициативы (НТИ). Участники хакатона на протяжении двух дней искали технологические решения для борьбы с новым заболеванием. В условиях пандемии команды работали онлайн, зачастую объединяя жителей разных регионов. Чтобы передать атмосферу реальных IT-марафонов и обеспечить полное погружение в рабочий процесс, участники взаимодействовали на специально разработанной игровой платформе.

В числе победителей — сборная команда Московского авиационного института и МГТУ им. Баумана. Студенты 3-го курса института № 8 «Информационные технологии и прикладная математика» МАИ Денис Семёнов и Ярослав Поскряков вместе со своим товарищем из МГТУ Семёном Комисаровым запустили телеграм-бот (@ml_vs_covid_bot), который с точностью 86 % проверяет статью на наличие фейков — как на русском, так и на английском языке.

Задание трека хакатона по индикации фейковых новостей предполагало разработку удобного для пользователя интернет-сайта. Однако ребята решили, что среднестатистическому пользователю будет удобнее использовать для проверки новостей мессенджер, и создали телеграм-бота. Для определения достоверности информации чат-бот использует методы машинного обучения, обработки естественного языка, дата-сеты российских и зарубежных новостных агентств.

Механика его работы такова: человек отправляет в чат ссылку на новость или её текст, а бот через пару секунд даёт ответ — правдивая новость или ложная. В основе разработки — Data Science. На первом этапе разработчики собрали пул достоверных и фейковых новостей про коронавирус. Далее на обучающем наборе данных начали «тренировать» свою модель, а после того, как модель обучилась, проверили её на тестовом наборе данных. Фишка разработки заключается в том, что модель обучалась не на отдельных словах, а на парах и тройках слов.

В роли ментора на хакатоне выступал ведущий эксперт Microsoft в области искусственного интеллекта и машинного обучения, преподаватель МАИ Дмитрий Сошников.

Microsoft активно поддерживает образовательные проекты для молодёжи, которые помогают укрепить цифровые навыки и научиться использовать облачные технологии и программирование для поиска решений глобальных проблем. По мнению Сошникова, технологии, позволяющие качественно анализировать текст, которые ребята использовали в своём решении, появились сравнительно недавно.

«Прорыв в области анализа естественного языка случился в 2018–2019 годах, и маёвцы использовали одну из последних моделей для построения классификатора. Наверное, рано говорить о том, что они создали совершенный сервис, способный анализировать новости на предмет фейка, за двое суток это сделать сложно. Были и другие команды с очень здравыми идеями, и собрав всё вместе, в перспективе можно двигаться к такому „идеальному“ продукту. То, что выгодно отличало наших ребят от соперников — это готовое решении в виде чат-бота, которым можно уже сейчас начинать пользоваться. В результате маёвцы сделали серьезный шаг в борьбе с фейками», — сказал Дмитрий Сошников.

В этот день было

Первый полет МиГ-21-93
Первый серийный Як-18Т
Первый полет многоцелевого вертолета Ка-26

На сайте МАИ можно разместить своё объявление или новость