The Guardian заблокировал OpenAI от использования своего контента для обучения ИИ 📰🤖

The Guardian принял решение заблокировать OpenAI и запретить использование материалов из своих публикаций для обучения искусственного интеллекта, включая ChatGPT. Поводом стали опасения, что компания использует не лицензированный контент, что вызвало судебные иски со стороны авторов и призывы отрасли защищать интеллектуальную собственность.

The Guardian подтвердил, что запретил использование программного обеспечения, собирающего его контент. Генеративный ИИ — это технологии, создающие убедительный текст, изображения и аудио на основе простых команд человека. С момента запуска ChatGPT общественность впечатлилась возможностями таких систем, однако возникли опасения по поводу массового производства дезинформации и способов обучения ИИ.

Технология за ChatGPT и аналогичными системами обучается на огромных объёмах данных из открытого интернета, включая новостные статьи, что позволяет ИИ предсказывать наиболее вероятное продолжение текста после команды пользователя. OpenAI не раскрывает, какие именно данные использовались для создания модели. В августе компания объявила о возможности блокировать её веб-сканер GPTBot, но это не позволяет удалить уже использованные данные из обучающих наборов.

Сейчас ряд издателей и сайтов блокируют GPTBot. Среди них — CNN, Reuters, Washington Post, Bloomberg, New York Times, The Athletic, а также Lonely Planet, Amazon, Indeed, Quora и dictionary.com.

Представитель Guardian News & Media отметил: «Сбор интеллектуальной собственности с сайта The Guardian для коммерческих целей всегда противоречил нашим правилам. Команда по коммерческому лицензированию поддерживает множество взаимовыгодных отношений с разработчиками по всему миру и рассчитывает на дальнейшее сотрудничество».

На этой неделе британские издатели направили письмо премьер-министру с просьбой включить защиту авторских прав на саммит по безопасности ИИ, который пройдёт в ноябре в Великобритании.

Ранее в июле Илон Маск ограничил возможности Twitter (ныне X) для предотвращения массового сбора данных компаниями, создающими ИИ. Он отметил, что почти все компании в сфере ИИ используют «огромные объёмы данных» с платформы, что создаёт нагрузку на серверы. В то же время Маск подтвердил, что публичные твиты будут использоваться для обучения моделей его нового стартапа xAI.

Google в своей политике конфиденциальности сообщает, что может собирать общедоступную информацию для обучения ИИ, включая чатбота Bard. Meta✱ тоже обновила политику, позволяя пользователям запрещать использование их данных для обучения ИИ.

OpenAI была запрошена о комментариях по поводу ситуации.

📌 Эта история подчёркивает растущую важность защиты контента и прозрачности использования данных при обучении ИИ.

        * Упомянутые организации запрещены на территории РФ

Технологии и гаджеты

+ Читать