Является ли генеративный ИИ угрозой для креативных специалистов? 🤖🎨

Когда художник и иллюстратор Р. Дж. Палмер впервые увидел потрясающий фотореализм композиций, созданных генератором изображений ИИ Dall-E 2, его первое ощущение было беспокойство. Этот инструмент, выпущенный исследовательской компанией OpenAI, значительно улучшился по сравнению с предыдущей версией Dall-E, и вскоре ему составили конкуренцию такие соперники, как Stable Diffusion и Midjourney. Напишите любую абсурдную фразу, от «Кермит-лягушка в стиле Эдварда Мунка» до «Голлум из Властелина колец, лакомящийся кусочком арбуза», и эти инструменты через несколько секунд создадут поразительно точное изображение.

Интернет с радостью оценил новые возможности для создания мемов, а аккаунт в Twitter, который документирует «странные генерации Dall-E», набрал более миллиона подписчиков. Cosmopolitan громко заявила о первой в мире обложке журнала, созданной ИИ, а инвесторы в технологии поспешили объявить о новой эре «генеративного ИИ». Возможности генерации изображений уже распространились и на видео, с выходом продуктов от Google — Imagen Video и Meta✱ — Make-A-Video.

Но не все творческие люди с радостью восприняли новое искусство ИИ. «Главная моя тревога — что это означает для будущего не только моей отрасли, но и для творческих профессий в целом», — говорит Палмер.

ИИ уже давно доказал свою превосходство над человеком в ряде задач, благодаря своим алгоритмам, способным обрабатывать большие массивы данных и анализировать шаблоны. Именно эта способность ИИ позволила победить чемпиона мира по игре в го еще в 2016 году, вычислив наиболее выгодную стратегию игры. Однако до недавнего времени создание оригинальных произведений, особенно в области искусства, считалось сугубо человеческим занятием. Совсем недавно ИИ достиг таких высот, что теперь может не только создавать изображения по текстовым описаниям, но и генерировать речь с уровнем fluency, который убедил хотя бы одного исследователя Google в «сознательности» машины.

Этот класс технологий известен как генеративный ИИ. Он работает через процесс, называемый диффузией. Идея заключается в том, что ИИ обучается на огромных наборах данных и создает новый контент, который напоминает эти данные, но не является их точной копией. Например, обучившись на миллионах изображений собак, ИИ может нарисовать абсолютно новое изображение собаки, которое будет достаточно похоже на те, что он видел, чтобы мы могли сказать: «Да, это собака!»

Эти новые технологии на удивление эффективны, но для некоторых художников это стало проблемой. Многие используют имена известных художников в запросах, чтобы стиль изображения был более эстетичным. Например, обычная чаша с апельсинами может превратиться в нечто впечатляющее, если её изобразить в стиле Пикассо. Однако, поскольку ИИ обучается на миллиардах изображений, некоторые из которых защищены авторскими правами, художники обеспокоены тем, что их творчество может быть использовано без согласия.

Грег Рутковски, художник, известный своими эпическими фантастическими сценами, уже заметил, что его имя используется в тысячах запросов по платформам, таким как Midjourney и Stable Diffusion. Он опасается, что с течением времени его работы могут быть затмиты искусственно созданными изображениями: «Через год, наверное, я не смогу найти свои работы в интернете, потому что [он будет] переполнен искусственным искусством», — сказал Рутковски.

Dall-E 2 остаётся закрытой «чёрной коробкой», так как OpenAI отказывается публиковать код или делиться данными, на которых инструменты обучались. Однако Stable Diffusion выбрала путь открытого исходного кода и поделилась информацией о базе данных изображений, использованных для обучения. Коллектив художников Spawning создал инструмент под названием Have I Been Trained?, который позволяет художникам узнать, были ли их работы использованы для обучения Stable Diffusion, и дать согласие или отказаться от участия в будущих наборах данных.

С другой стороны, компании, разработавшие такие инструменты, утверждают, что генеративный ИИ демократизирует искусство. Эмэд Мостаки, основатель Stability AI, на недавнем мероприятии сказал, что «мир творчески застойный», и его цель — дать людям возможность создавать искусство без границ. Однако, если теперь каждый может использовать ИИ для создания технически безупречных изображений, то что это говорит о самой сути творчества?

Художница Анна Ридлер, известная работой с ИИ, считает, что, несмотря на «волшебство» использования Dall-E 2, она пока не почувствовала искры вдохновения при работе с этим инструментом. Ридлер предпочитает работать с другим типом ИИ, называемым генеративными соревнующимися сетями (GAN). Такие сети позволяют создавать совершенно новые образы, которые отличаются от обучающих данных, но при этом остаются в рамках того, что люди воспринимают как визуальное искусство.

Тем не менее, обсуждения вокруг замены художников ИИ часто упрощают сам процесс творчества. «Идея о замене художников — это недооценка самого творческого процесса», — считает исследователь Мэттью Драйхерст. Он также выражает недовольство по поводу того, как СМИ часто создают панику, поднимая тему замены художников ИИ.

Возможно, ажиотаж вокруг этих технологий не оправдан, и они не станут такими революционными, как представляют их разработчики. Но точно одно: ИИ продолжает открывать новые возможности и вызовы в сфере искусства.

* Упомянутые организации запрещены на территории РФ

Технологии и гаджеты

+ Читать