Программы для выявления ИИ могут несправедливо оценивать людей, не являющихся носителями английского языка 🤖✍️
Исследование показало, что компьютерные программы, используемые для выявления текстов, эссе и заявок на работу, созданных искусственным интеллектом, могут необъективно относиться к людям, для которых английский не является родным языком. Статьи и эссе таких авторов нередко ошибочно помечаются как созданные ИИ, что может серьёзно повлиять на студентов, исследователей и соискателей.
С появлением ChatGPT — программы генерации текста, способной писать эссе, решать задачи и создавать код — многие преподаватели стали рассматривать системы обнаружения ИИ как «важное средство против современной формы списывания». Однако учёные предупреждают, что заявленная точность 99% у некоторых детекторов является «в лучшем случае вводящей в заблуждение».
Как проходило исследование 🧪
Учёные под руководством Джеймса Зоу, доцента Стэнфордского университета, протестировали семь популярных детекторов GPT на 91 эссе на английском языке, написанном людьми, для которых английский не является родным. Более половины этих текстов были ошибочно классифицированы как созданные ИИ, а один из детекторов отметил 98% эссе как машинные.
Для сравнения, эссе восьмиклассников-носителей английского языка из США были распознаны как написанные людьми более чем в 90% случаев.
В чём причина ошибки ❓
Программы оценивают текст по показателю «текстовой запутанности» (text perplexity) — насколько трудно модели предсказать следующее слово в предложении. Если текст легко предсказуем, запутанность низкая, если сложно — высокая. Большие языковые модели вроде ChatGPT создают тексты с низкой запутанностью. Поэтому, если человек использует простые, часто встречающиеся слова и структуры, детектор может принять текст за ИИ.
Риск особенно велик для авторов, не являющихся носителями английского, так как они чаще используют простую лексику.
Возможные решения ✨
Учёные попросили ChatGPT переписать эссе на более сложном языке. После этого детекторы все тексты признали написанными людьми. «Парадоксально, но детекторы GPT могут вынудить авторов, не владеющих английским на уровне носителя, использовать ИИ, чтобы избежать ошибочной маркировки», — отмечают исследователи.
Авторы предупреждают, что подобные программы могут неправомерно пометить студенческие работы или заявки на работу, а также ограничить видимость материалов в интернете, так как поисковые системы понижают приоритет AI-созданного контента.
«В сфере образования, где детекторы GPT наиболее востребованы, студенты-не носители английского сталкиваются с высоким риском ложных обвинений в списывании, что может негативно сказаться на их учебной карьере и психологическом состоянии», — добавляют исследователи.
В сопроводительной статье Яна Оттербахер из Кипрского центра алгоритмической прозрачности отмечает: «Вместо того чтобы бороться с ИИ с помощью ИИ, нужно развивать академическую культуру, которая поощряет творческое и этичное использование генеративного ИИ. ChatGPT постоянно учится на данных пользователей и в итоге может научиться обходить любые детекторы».