В МИФИ разработали ИИ для распознавания голосовых фейков
В МИФИ разработали уникальную систему для выявления поддельных аудиозаписей. Нейросеть "Сипуха" анализирует голос и определяет, настоящий он или создан искусственным интеллектом.
Сотрудники и студенты кафедры криптологии и кибербезопасности НИЯУ МИФИ под руководством кандидата технических наук, доцента Дмитрия Ефанова, разработали интеллектуальную систему для выявления голосовых дипфейков.
Проект под названием "Сипуха" - в честь птицы с острым слухом - победил в конкурсе "Новатор Москвы". В основе системы лежит нейросеть, обученная на более чем 200 тыс. записей, включающих как реальные голоса, так и подделки, сгенерированные разными алгоритмами. Анализ кепстральных коэффициентов - ключевых математических характеристик аудиосигналов - позволяет системе обнаруживать дипфейки даже в коротких фрагментах длиной 20-40 микросекунд.
Изначально проект, начатый в 2022 году, носил чисто академический характер, так как подделка голоса тогда требовала значительных ресурсов и не была массовым явлением. Первую поддержку оказал Фонд содействия инновациям. Однако к 2024 году технологии синтеза голоса стали доступнее, и мошенники начали активно их использовать. Это придало разработке прикладное значение. "Сипуха" вошла в число финалистов Технологического акселератора МИФИ и "Росатома", пройдя отбор из 60 заявок.
Сейчас команда работает над созданием облачного сервиса, который позволит интегрировать проверку на дипфейки в колл-центры, мессенджеры и другие системы коммуникации. Интерес к сервису уже проявили "ТБанк" и "Информзащита". В будущем планируется открыть исследовательскую лабораторию для постоянного улучшения нейросети, поскольку методы создания дипфейков непрерывно развиваются.
Источник: