Тревожный факт: автономный автомобиль, несущийся по шоссе и лавирующий по пробкам, меньше понимает, что может привести к аварии, чем ребенок, который только учится ходить.
Новый эксперимент показывает, насколько трудно даже самым лучшим системам искусственного интеллекта усвоить элементарную физику, а также определить причину и следствие. Он также предлагает подход к созданию систем искусственного интеллекта, которые могут определять причины происходящего.
Эксперимент был разработан, чтобы «выйти за рамки простого распознавания закономерностей, — говорит профессор MIT Джош Тененбаум, который работал над проектом вместе с исследователем из MIT Чуанг Ганом и аспирантом Гарварда Кексином Йи. — Крупные технологические компании хотели бы иметь системы, которые на это способны».
Глубокое обучение — самая популярная передовая методика искусственного интеллекта — в последние годы достигло ошеломляющих успехов и подпитывает восхищение потенциалом искусственного интеллекта. В числе этих успехов — возможность «скормить» нейронным сетям большое количество обучающих данных, после чего алгоритмы глубокого обучения могут эффектно находить в данных закономерности, в том числе распознавать изображения и голос. Но им не хватает других способностей, тривиальных для человека.
Чтобы продемонстрировать эти изъяны, Тененбаум и его коллеги создали своего рода интеллектуальный тест для систем искусственного интеллекта. В его ходе программе ИИ показывается простой виртуальный мир, наполненный несколькими движущимися объектами, вместе с вопросами и ответами о сцене и о том, что происходит. Вопросы и ответы помечаются так же, как сотни картинок с надписью «кошка», которые ИИ просматривает, учась распознавать кошек.
У систем, использующих передовое машинное обучение, оказалась большая слепая зона. На описательный вопрос вроде «Какого цвета этот объект?» ультрасовременный алгоритм ИИ ответит правильно в более чем 90% случаев. Но на более сложные вопросы, такие как «По какой причине мяч столкнулся с кубом?» или «Что произошло, если бы объекты не столкнулись?», та же самая система отвечает правильно только в 10% случаев.
Дэвид Кокс, директор лаборатории MIT-IBM Watson AI Lab, участвовавшей в работе, говорит, что понимание причинно-следственной связи принципиально важно для ИИ. «Мы, люди, способны рассуждать о причине и следствии, и нам нужны системы ИИ, которые могут делать то же самое».
Отсутствие этого понимания может иметь серьезные последствия. Промышленные роботы учатся лучше ощущать близлежащие объекты, чтобы брать или перемещать их. Но они не знают, что, если они что-то толкнут, это может упасть или сломаться. Для этого их нужно специально запрограммировать — но невозможно предсказать каждый возможный сценарий.
Однако, если бы робот мог рассуждать в логике причинно-следственных связей, он смог бы избежать проблем, на понимание которых он не был запрограммирован. То же самое относится к автономному автомобилю. Он мог бы инстинктивно знать, что, если грузовик свернет и ударится о препятствие, его груз может вывалиться на дорогу.
Осмысление причин было бы полезно практически для любой системы ИИ. Системы, обученные на медицинской информации, а не на трехмерных картинках, должны понимать причину заболевания и вероятный результат возможных вмешательств. Вопрос причинно-следственных связей вызывает растущий интерес у многих выдающихся деятелей ИИ. «Все это ведет к системам ИИ, которые могут не только учиться, но и рассуждать», — говорит Кокс.
Профессор Университета Карнеги-Меллона Кун Чжан считает тест, разработанный Тененбаумом, важным, поскольку он обеспечивает хороший способ измерения причинно-следственной связи, хотя и в очень ограниченных условиях. «Методы обучения причинно-следственным связям и репрезентации принесут большую пользу в разработке более универсальных систем ИИ», — говорит он.
Тененбаум и его коллеги не только выявили слабые места в существующих программах искусственного интеллекта, но и создали новый тип системы ИИ, способной понимать причину и следствие. Эта система показала более высокие результаты в их интеллектуальном тесте. Их подход сочетает в себе несколько техник искусственного интеллекта. Система использует глубокое обучение для распознавания объектов сцены. Результаты обучения передаются в программное обеспечение, которое строит трехмерную модель сцены и взаимодействия объектов друг с другом. Этот подход требует больше создаваемых вручную компонентов, чем многие алгоритмы машинного обучения, и Тененбаум предупреждает, что он хрупкий и плохо масштабируется. Но, похоже, что для продвижения ИИ вперед понадобится сочетание подходов — в сочетании с новыми идеями.
«Наш разум строит причинно-следственные модели и используют эти модели для ответа на произвольные запросы, но лучшие системы ИИ далеки от того, чтобы воспроизвести эти способности», — говорит доцент кафедры психологии и наук о данных Нью-Йоркского университета Бренден Лэйк.
Профессор Гарвардского университета Сэмюэль Гершман, который сотрудничал с Тененбаумом в других проектах, добавляет, что машина не сможет приблизиться к человеческому интеллекту без понимания причинно-следственных связей. Он указывает на хорошо известный медицинский факт: женщины реже умирают от чрезмерного употребления алкоголя, чем мужчины. «Система искусственного интеллекта, не понимая причинно-следственную связь, может сделать вывод, что способ снижения смертности заключается в проведении операций по смене пола для мужчин», — говорит он.