Google DeepMind близка к покорению высшей математики 🧮🤖
Хотя компьютеры умеют считать быстрее любого человека, высший уровень формальной математики оставался прерогативой человека. Однако исследователи Google DeepMind сделали шаг к тому, чтобы искусственный интеллект смог решать задачи на уровне лучших математиков.
Два новых проекта компании, AlphaProof и AlphaGeometry 2, объединили силы для решения задач Международной математической олимпиады — престижного конкурса для старшеклассников, который проводится с 1959 года. Олимпиада включает шесть крайне сложных заданий по алгебре, геометрии и теории чисел. Золото олимпиады делает победителя одним из лучших молодых математиков мира.
Системы DeepMind пока не достигли такого уровня. После оценки профессора Тимоти Гоуверса, обладателя медали Филдса и золотого медалиста олимпиады, AlphaProof и AlphaGeometry 2 набрали 28 из 42 баллов — серебро, уступив золоту всего один балл.
В отличие от человека, AI либо решает задачу идеально, либо не справляется вовсе. В двух из шести заданий системы не смогли даже начать работу. При этом им не было установлено ограничение по времени: если ученики решают задачи за 9 часов, DeepMind потребовалось три дня круглосуточной работы, чтобы справиться с одной задачей, при этом другую они решили за считанные секунды.
AlphaProof использует комбинацию больших языковых моделей (как в чатботах) и методов обучения с подкреплением, применяемых DeepMind для игры в Go. Система обучена на огромном количестве математических задач на английском языке и использует знания для генерации формальных доказательств, которые можно проверить. Этот метод позволяет системе учиться и совершенствоваться, но иногда занимает много времени: на одну сложную задачу ушло три дня.
AlphaGeometry 2 сосредоточена на геометрии и продемонстрировала ошеломляющий результат: решение одной задачи заняло всего 16 секунд. Эксперты отметили оригинальность подхода системы — алгоритм строил окружность вокруг точки, а затем использовал её для доказательства решения. Решение оказалось элегантным и необычным, напоминая знаменитый ход «37» в игре Go, когда AI сделал ход, который не пришёл бы в голову человеку, и выиграл.
Примеры задач, которые решили системы:
AlphaGeometry 2 (легкая геометрическая задача)
Дано треугольник ABC с AB < AC < BC. Определены инцентр I и вписанная окружность ω. Найти точки X и Y на BC так, чтобы линии через них, параллельные AC и AB, были касательными к ω. Доказать, что ∠KIL + ∠YPX = 180°. Решено за 19 секунд.
AlphaProof (сложная комбинаторная задача)
Улитка Turbo проходит игру на доске 2024×2023 с 2022 скрытыми монстрами. Нужно определить минимальное число попыток, чтобы Turbo гарантированно достиг последней строки, независимо от расположения монстров. Эта задача пока не решена.
Эти эксперименты показывают, что искусственный интеллект постепенно приближается к решению сложнейших математических задач, которые ранее считались доступными только человеку. Впереди ещё долгий путь, но потенциал AI в области математики впечатляет и открывает новые возможности для науки. 🌟