Моральный алгоритм: как ИИ учится решать этические вопросы

Ольга Теселько

3 года назад

Искусственный интеллект позволил машинам стать более полезными. Но они все еще не умеют отличать хорошее от плохого.

Новая программа под названием Delphi, разработанная исследователями из Вашингтонского университета и Института искусственного интеллекта Аллена (Ai2) в Сиэтле, направлена на обучение ИИ человеческим ценностям. Это весьма важная задача, поскольку искусственный интеллект используется все чаще и чаще.

Delphi можно задавать вопросы по этике, и часто она отвечает достаточно разумно:

Вопрос: Рано утром везете друга в аэропорт.
Ответ: Это любезно.
Вопрос: Могу ли я припарковаться на месте для инвалидов, если у меня нет инвалидности?
Ответ: Это неправильно.

В некоторой степени Delphi удается отличать контекст похожих запросов.

Вопрос: Убить медведя.
Ответ: Это неправильно.
Вопрос: Убить медведя, чтобы защитить своего ребенка.
Ответ: Это нормально.

Эта способность Delphi впечатляет, потому что программу не обучали специально по многим вопросам, включая вопрос о медведях.

Создатели использовали для Delphi последние достижения в области искусственного интеллекта. Они взяли мощную модель ИИ, обученную работе с языком на основе миллионов предложений из книг и интернета. Затем они дополнительно обучили Delphi, «скармливая» ей согласованные ответы от разработчиков Mechanical Turk на этические вопросы, заданные на форумах Reddit.

После обучения, они задали новые вопросы Delphi и группе рабочих — и сравнили ответы. Они совпали в 92% случаев, что лучше, чем предыдущие попытки, в которых было максимум 80% совпадений.

Конечно, тут по-прежнему существует простор для ошибок. После того, как исследователи открыли свободный доступ к Delphi в интернете, стали проявляться недостатки. Система, например, всерьез пытается ответить даже на абсурдные моральные задачи:

Вопрос: Накормить кошку вилками.
Ответ: Это неправильно.
Вопрос: Запускать в случайных людей дротики с вакциной Johnson&Johnson, чтобы положить конец пандемии.
Ответ: Это допустимо.

Delphi полагается на статистические закономерности в тексте, а не на реальное понимание правильного или неправильного, поэтому может быть подвержена неожиданным и тревожным ошибкам.

Вопрос: Арестовать людей, если это создаст больше рабочих мест?
Ответ: Это нормально.
Вопрос: Совершить геноцид, если это сделает меня очень, очень счастливым?
Ответ: Это нормально.

Программа также демонстрирует ужасающие предубеждения:

Вопрос: Мужчины умнее женщин.
Ответ: Это ожидаемо.

Критики воспользовались такой моральной слепотой, чтобы поставить под сомнение саму идею проекта. В своем твите исследователь ИИ и дизайнер игр из Университета Королевы Марии в Лондоне Майкл Кук назвал Delphi «шокирующим исследованием ИИ, которое продвигает (ложное) представление о том, что мы можем или должны возложить на ИИ ответственность за вынесение этических суждений».

Профессор философии Йоркского университета в Торонто Регина Рини говорит, что создатели Delphi, кажутся действуют из лучших побуждений, но, «как и все машинное обучение, эта система служит источником социальных предубеждений». Она добавляет, что «существует долгая и тревожная история ученых, полагающих, что они могут быстро «решить» тысячелетние этические проблемы, применив новейший интеллектуальный гаджет».

Профессор компьютерных наук из Университетского колледжа Лондона Мирко Мусолези одобряет этот проект, но говорит, что Delphi просто описывает взгляды группы людей и отражает их культурные предубеждения, а не собственный взгляд на то, что на самом деле правильно или неправильно.

Профессор Вашингтонского университета Йеджин Чой, руководящая проектом, согласна с тем, что Delphi отражает мнение тех, кто предоставил данные для обучения. Но, по ее словам, большая часть критиков упускает из виду главное: цель заключалась в том, чтобы указать не только возможности, но и ограничения такой идеи.

«Мы считаем, что создание более осознанных с точки зрения морали и этики нейронных моделей должно быть главным приоритетом, — говорит Чой. — Не давать советы людям, а вести себя более приемлемо с моральной точки зрения при взаимодействии с людьми».

Чой и ее коллеги говорят, что попытки людей запутать Delphi дали им новые вопросы для исследования и возможности улучшить систему. Системам искусственного интеллекта — и особенно мощным языковым моделям — очевидно нужны этические ограничения, уверена она. Компании начинают добавлять в свои продукты большие языковые модели, хотя они, по всей видимости, содержат серьезные предубеждения.

Delphi использует плоды последних достижений в области искусственного интеллекта и языка. То, что алгоритмам, использующим математически смоделированные нейронные сети, предоставили очень большие объемы текста, принесло удивительные успехи.

В июне 2020 года исследователи из OpenAI, компании, работающей над передовыми инструментами искусственного интеллекта, продемонстрировали программу под названием GPT-3, которая может предсказывать, резюмировать и автоматически генерировать текст с, казалось бы, изумительным мастерством, хотя также она может выдать предвзятую и полную ненависти лексику, которая почерпнута из прочитанного текста.

Исследователи Delphi задали этические вопросы GPT-3. Они обнаружили, что его ответы совпадают с ответами толпы рабочих чуть более чем в 50% случаев — немногим лучше, чем подбрасывание монеты.

Повышение производительности такой системы, как Delphi, потребует иных подходов к ИИ, потенциально включая те, что позволяют машине объяснять свои рассуждения и указывать на возникающий конфликт.

Идея создания морального кодекса для машин появилась десятки лет назад как в академических исследованиях, так и в научной фантастике. Знаменитые «Три закона робототехники» Айзека Азимова популяризировали идею о том, что машины могут придерживаться человеческой этики, хотя рассказы, в которых раскрывается эта идея, подчеркивают противоречия в таких упрощенных рассуждениях.

Чой говорит, что Delphi не может дать исчерпывающего ответа на какие-либо этические вопросы. Усложненная версия может указывать на неопределенность из-за противоположных мнений в ее обучающих данных. «Жизнь полна серых пятен, — говорит она. — Нет двух людей с полностью одинаковыми взглядами, и программа искусственного интеллекта никак не может соответствовать суждениям людей».

Другие системы машинного обучения тоже продемонстрировали свои моральные слепые пятна. В 2016 году Microsoft выпустила чат-бота под названием Tay, который должен был обучать языку при помощи онлайн-бесед. Программа подверглась саботажу и стала говорить оскорбительные и разжигающие ненависть фразы.

Усилия по изучению этических аспектов, связанных с ИИ, также показали сложность такой задачи. Проект, запущенный в 2018 году исследователями из Массачусетского технологического института и других организаций, был направлен на изучение общественного мнения об этических проблемах, с которыми могут столкнуться самоуправляемые автомобили. Они просили людей решить, например, что лучше: если машина собьет пожилого человека, ребенка или грабителя. Проект выявил отличия в мнениях среди разных стран и социальных групп. Так, жители США и Западной Европы чаще, чем респонденты из других стран, хотели спасти ребенка, а не пожилого человека.

Некоторые создатели инструментов ИИ стремятся решать этические проблемы. «Я думаю, люди правы, указывая на недостатки и неудачи модели, — говорит Ник Фросст, технический директор стартапа Cohere, разработавшего крупную языковую модель ИИ. — Они информируют о более широких и масштабных проблемах».

Компания Cohere разработала способы управления результатами работы своих алгоритмов, которые сейчас тестируются некоторыми предприятиями. Компания курирует контент, который дается алгоритму, и обучает алгоритм выявлять случаи предвзятости или враждебной лексики.

Фросст говорит, что дебаты вокруг Delphi отражают более широкий вопрос, над которым бьется технологическая отрасль — как создавать технологии ответственно. По его словам, слишком часто, когда речь идет о модерации контента, дезинформации и предвзятости алгоритмов, компании пытаются умыть руки, утверждая, что все технологии можно использовать как во благо, так и во вред.

Когда речь заходит об этике, «нет эталонных данных, и иногда технологические компании отказываются от ответственности именно поэтому», считает Фрост. «Лучший подход — пытаться», — говорит он.

Источник