Люди распознают поддельную речь лишь в 73% случаев, показало исследование 🗣️🤖
Новое исследование показало, что люди способны определить искусственно сгенерированную речь лишь в 73% случаев. Исследование, проведённое в University College London, показало одинаковые результаты как для носителей английского, так и мандаринского языков.
Учёные использовали алгоритм синтеза речи, обученный на двух открытых наборах данных — один на английском, другой на мандаринском, — чтобы создать по 50 образцов поддельной речи для каждого языка. Эти аудиозаписи были проиграны 529 участникам эксперимента, чтобы проверить, смогут ли они отличить настоящую речь от искусственно созданной.
Результаты показали, что участники определяли подделку только в 73% случаев. После краткого обучения, направленного на распознавание особенностей искусственной речи, точность немного повысилась, но значительного улучшения это не дало.
«Мы показали, что обучение людей распознаванию поддельной речи не гарантирует высокой точности», — отметила Кимберли Май, ведущий автор исследования. Она добавила, что автоматические детекторы также пока ненадёжны: «Они хорошо работают, если уже видели подобные примеры или аудио записано в схожих условиях. Но при изменении условий, например с другим говорящим, их точность падает».
Эксперты подчёркивают необходимость улучшения автоматических систем распознавания и разработки стратегий для снижения рисков, связанных с поддельной речью. В видео подделки заметить синтетические признаки легче, чем в аудио, где признаки более скрытны.
Карл Джонс, руководитель инженерного факультета Liverpool John Moores University, отметил: «Поддельная речь почти идеальна для преступления, потому что невозможно сразу понять, что она была создана искусственно».
Сэм Грегори, исполнительный директор организации Witness, работающей над вопросами поддельного контента и генеративного ИИ, добавил, что существует проблема «неравного доступа к инструментам распознавания». Журналисты, проверяющие факты, представители гражданского общества и специалисты по выборам — именно они больше всего нуждаются в таких инструментах, но не имеют доступа к ним.
«Нам не обязательно предоставлять инструменты всем, это может снизить их надёжность, — говорит Грегори. — Но необходимо инвестировать в поддержку тех, кто реально использует эти технологии».
Исследование подчёркивает растущую угрозу поддельного аудио и необходимость сочетания технологий и подготовки людей для минимизации рисков.