Пост

Передовые ИИ терпят «полный крах точности» на сложных задачах, выяснили исследователи Apple 🤖📉

Исследователи Apple выявили фундаментальные ограничения современных моделей искусственного интеллекта, о чём говорится в недавней публикации компании. Согласно статье, модели крупного рассуждения (Large Reasoning Models, LRM) — продвинутый тип ИИ — сталкиваются с «полным крахом точности», когда им предлагают особенно сложные задачи.

📊 Что показало исследование

  • В задачах низкой сложности обычные модели ИИ показывали себя лучше, чем LRM.
  • Для задач высокой сложности обе модели терпели полный крах, не справляясь с решением.
  • LRM пытаются решать сложные вопросы, разбивая их на последовательные логические шаги. Однако при приближении к критической точке производительности модели снижали усилия на рассуждения, что исследователи сочли особенно тревожным.

Gary Marcus, американский академик, известный критическим взглядом на возможности ИИ, назвал результаты исследования Apple «довольно разрушительными». По его словам, эти выводы ставят под сомнение гонку за созданием искусственного общего интеллекта (AGI) — гипотетической стадии ИИ, на которой система может выполнять любые интеллектуальные задачи на уровне человека.

🧩 Проблемы с решением задач
Модели тратят ресурсы на поиск правильного решения для простых задач уже на ранних этапах рассуждения. При немного более сложных задачах они сначала пробуют неверные решения, а потом находят правильные. Но на сложных задачах LRM просто «впадают в крах», не находя верного ответа даже при наличии алгоритма, который бы мог решить проблему.

Исследователи Apple отмечают, что это указывает на фундаментальное ограничение масштабирования возможностей рассуждения текущих моделей. В качестве тестовых задач использовались головоломки вроде Башни Ханоя и задач на переправу через реку.

💡 Выводы исследования

  • Современные подходы к ИИ могут достигать предела своих возможностей в задачах сложного рассуждения.
  • Даже крупные модели, которые успешно справляются с средними и низкой сложности задачами, теряют эффективность на сложных вызовах.
  • Это открытие показывает, что индустрия ИИ ещё ищет оптимальные подходы к созданию универсальных интеллектуальных систем.

Эксперт Эндрю Рогоисски из Института человеко-центрированного ИИ при Университете Суррея отметил, что исследование Apple демонстрирует: отрасль ИИ пока «ходит на ощупь» в вопросе AGI и может столкнуться с тупиком в текущем подходе к развитию моделей.

🔍 Исследование затрагивает ключевой вопрос: насколько современные ИИ-модели готовы к сложным, нестандартным задачам, и подтверждает, что разработчикам предстоит ещё много работы, чтобы создать по-настоящему универсальный интеллект.

Для ответа вы можете авторизоваться