Google представила новую модель ИИ Gemini, которая опережает ChatGPT по большинству тестов 🤖✨

Google анонсировала новую модель искусственного интеллекта под названием Gemini, которая, по заявлению компании, превосходит ChatGPT по большинству тестов и демонстрирует «продвинутое рассуждение» в разных форматах, включая анализ домашних заданий по физике.

Gemini — это первая крупная разработка Google после глобального саммита по безопасности ИИ, где компании договорились сотрудничать с государствами для тестирования сложных систем до и после их выпуска. В настоящее время Google ведёт переговоры с недавно созданным Британским институтом по безопасности ИИ о проверке самой мощной версии Gemini, которая будет представлена в следующем году.

Существуют три версии модели: Ultra, Pro и Nano. По данным Google, Ultra опередила «передовые» модели ИИ, включая GPT-4, в 30 из 32 тестов на логику и понимание изображений. Pro превзошла GPT-3.5, на базе которой работает бесплатная версия ChatGPT, в шести из восьми тестов. Модель является мультимодальной, что означает способность одновременно обрабатывать текст, аудио, изображения, видео и код.

Gemini будет интегрирована в продукты Google, включая поисковик, а первая публичная версия уже доступна более чем в 170 странах в виде обновления для чат-бота Bard. Однако в Великобритании и Европе обновление пока не доступно, так как Google ожидает одобрения регуляторов.

Демис Хассабис, CEO DeepMind, подразделения Google, разработавшего Gemini, отметил: «Это был самый сложный проект, над которым мы когда-либо работали. Огромное усилие всей команды».

Модель Ultra пройдёт внешнее тестирование безопасности («red team»), а результаты будут предоставлены правительству США в рамках исполнительного указа. Ultra показала 90% в тесте MMLU, охватывающем 57 предметов, включая математику, физику, право, медицину и этику. Она также станет основой нового инструмента для программирования AlphaCode2, способного превзойти 85% людей на профессиональном уровне.

Презентационные видео показывают, как Gemini анализирует рукописные задания, решает уравнения, распознаёт рисунки и определяет сцены из фильмов по коротким видео. Google подчёркивает, что модель демонстрирует новые возможности, ранее недоступные ИИ, включая способность выполнять задачи, которые раньше модели не показывали.

Несмотря на достижения, Google признаёт проблему «галлюцинаций» — выдачи неверных ответов, которая остаётся нерешённой. Пока Pro и Nano могут отвечать только текстом или кодом, а Ultra ожидает более широкой интеграции и тестирования в начале 2024 года.

Хассабис подчеркнул, что мультимодальные модели, такие как Gemini, станут ключевым компонентом будущего искусственного общего интеллекта (AGI), хотя пока остаются аспекты, которые требуют дальнейших исследований.

Данные для обучения Gemini были собраны из различных открытых источников в интернете, что вызвало протесты со стороны издательской и креативной индустрии из-за использования защищённого авторским правом контента.

Gemini демонстрирует серьёзный шаг вперёд в области ИИ и открывает новые возможности для анализа, творчества и программирования, оставаясь при этом под вниманием регуляторов и экспертов по безопасности. 🚀

Технологии и гаджеты

+ Читать