«Если журналистика сгорает, я могу хотя бы кайфовать от дыма»: откровения помощника чат-бота 🤖✍️
Некоторое время я работаю для технологической компании стоимостью миллиарды долларов, рядом со мной — опубликованные писатели, академики и фриланс-журналисты. Работа гибкая, зарплата выше привычной, и заданий хватает. Но наши тексты никто не читает. Мы пишем не для людей — мы пишем для искусственного интеллекта.
Современные языковые модели, такие как ChatGPT, могут автоматически обрабатывать тексты, составлять письма, эссе и даже целые книги. Но прежде чем они смогут работать автономно, им нужно обучение, а для этого нужны люди. Мы создаём примеры правильных ответов на вопросы чат-ботов, чтобы модели понимали, как выглядит «хорошее» письмо. Мы также помогаем им учиться не «галлюцинировать», то есть не придумывать ложные факты, предоставляя корректные источники.
Да, у моделей уже миллиарды слов в базе. Но интернет конечен, а цифровой архив книг, статей и документов — тоже. Когда эти ресурсы исчерпаются, модели всё равно останутся несовершенными. Обучение на собственном выводе («синтетические данные») не помогает: модели начинают терять редкие данные, память о малоизвестных фактах, и качество генерации падает.
Поэтому людям по-прежнему нужен «живой» текст. Без нас их выход был бы очень плохим. Франсуа Шоле, автор учебников по компьютерным наукам, оценивает число специалистов, занятых аннотированием данных для обучения моделей, примерно в 20 000 человек. Мы создаём «золотой стандарт» текста, на котором модели учатся.
Это похоже на работу в фабрике: ты производишь материал для машины, которая со временем может заменить тебя. Но пока технологии совершенствуются, человеческий вклад критически важен. Компании платят высокие зарплаты — до £30 в час за дистанционную аннотацию, оценивают качество текста и помогают модели писать грамотно, точно и понятно.
Задача аннотатора — не просто создавать текст, а формировать «голос» будущего ИИ, помогать ему быть полезным, безопасным и корректным. Несмотря на то, что технологии развиваются, люди остаются центральным элементом процесса: без нас модели не смогут обучаться и совершенствоваться.
В этом есть своя ирония: индустрия высоко ценит письменный труд, одновременно считая его временным и подлежащим автоматизации. Мы пишем, чтобы машины учились, а наши слова могут никогда не быть замечены. Но пока модели нуждаются в данных, работа писателя-аннотатора остаётся востребованной и хорошо оплачиваемой. ✨🖋️
В итоге, хотя ИИ кажется автономным, он по-прежнему «зависим» от человеческого слова, а будущее аннотации зависит от того, насколько мы сможем создавать качественные примеры для машинного обучения.