Пост

Искусственный интеллект в аудиокнигах: может ли цифровой голос стать новым фаворитом читателей? 🎧🤖

Когда начинаешь слушать новую романтическую аудиокнигу Кристен Этридж «Shelter from the Storm», первые секунды голос кажется обычным человеческим. Чёткая дикция, плавный ритм — всё как у профессионального чтеца: «Приближается буря, и её имя — Надежда». Но затем слышится лёгкая неровность в интонации: голос слишком равномерный, почти роботизированный. По словам Этридж, «он не звучит точно как человеческий, но качество для ИИ достойное».

Этридж, автор бестселлеров из Далласа, стала одной из первых писателей, приглашённых к участию в закрытом пилоте Apple Books по созданию аудиокниг с искусственным интеллектом. Apple отмечает такие книги как «озвученные цифровым голосом на основе человеческого». Google Play предлагает аналогичную функцию с «автоозвучкой», поддерживающую разные акценты на английском, испанском, французском, немецком и португальском.

Для Этридж решение использовать ИИ было очевидным: «Мой выбор был не между живым диктором и цифровым голосом, а между отсутствием аудиоформата и использованием ИИ». Профессиональные актёры могут создать богатую драматическую подачу, знают, как расставить паузы и произнести редкие слова, но стоимость их работы для независимого автора часто слишком высока — от $2 000 до $2 500 за одну книгу. Для сравнения, аудиокнига с человеческой озвучкой у Этридж стоит $21,99, что недоступно многим её читателям, особенно пожилым, которые любят слушать несколько книг в неделю.

Использование ИИ даёт возможность сделать книги более доступными и дешевыми: «Многие читатели больше заботятся о цене и не нуждаются в полной драматической озвучке», — объясняет Этридж. Кроме того, многие слушают книги ускоренно — в 1,5 раза быстрее, что ещё меньше акцентирует внимание на нюансах интонации.

Эксперты прогнозируют, что рынок аудиокниг будет развиваться по двум направлениям: с человеческой озвучкой и с ИИ. Как бумажные книги и электронные версии, эти форматы смогут сосуществовать. Этридж уверена, что искусственный интеллект не заменит полностью профессиональных дикторов, но станет полезным инструментом для авторов и читателей с ограниченным бюджетом.

Спрос на аудиокниги растёт: по оценкам, в США в 2021 году рынок достиг $1,6 млрд, а к 2030 году глобальный рынок может вырасти до $35 млрд. Возможность озвучки с помощью ИИ делает аудиоформат более доступным и открывает новые возможности для независимых авторов. 🎙️📚

Для ответа вы можете авторизоваться