Больше похоже на веру: как ИИ меняет фундаментальные научные принципы

Вера Купавцева

1 год назад

Этим летом препарат для лечения опасного хронического заболевания легких прошел промежуточную фазу испытаний на людях. Предыдущие исследования показали, что препарат безопасен, но улучшит ли он симптомы тяжелого фиброза, на который нацелен, пока неизвестно. Это предстоит выяснить в ходе новых испытаний, возможно, в следующем году. Это условное достижение не стоило бы упоминать, если бы не одно обстоятельство: это первый препарат, полностью разработанный искусственным интеллектом, который продвинулся так далеко на стадии исследований.

Биотехнологическая компания Insilico Medicine использовала сотни моделей искусственного интеллекта, чтобы найти причины возникновения фиброза в организме и молекулы, которые можно синтезировать для самого лекарства. Эти программы позволили пройти путь от нуля до запуска препарата в первую фазу испытаний на людях за два с половиной года, а не за пять или больше. Даже если лекарство окажется неэффективным, что вполне реально, множество других препаратов, разработанных с помощью искусственного интеллекта, уже на подходе. Ученые и компании надеются, что они доберутся до аптек гораздо быстрее, чем традиционные лекарства, на вывод которых на рынок обычно уходит более десяти лет, а процент неудач очень высок.

Медицина — это лишь одна сфера масштабных научных преобразований. Только за последние несколько месяцев ИИ стал давать прогноз о тропических штормах с такой же точностью и гораздо быстрее, чем обычные способы. Google недавно использовал ИИ, чтобы предложить огромное количество новых типов материалов для производства суперкомпьютеров, электромобилей и многого другого. Подобно тому, как технология стирает границы между текстом и изображениями, созданными человеком и компьютером, меняя способы работы, обучения и общения людей, инструменты ИИ ускоряют и изменяют некоторые базовые элементы науки.

Наука никогда не развивалась так быстро, как сегодня. Но внедрение ИИ в определенном смысле делает науку менее человечной. На протяжении веков познание мира основывалось на наблюдении и объяснении. Многие из современных моделей ИИ меняют это представление, давая ответы без обоснования и побуждая ученых изучать алгоритмы так, как раньше изучалась природа. При этом ИИ, похоже, ставит под сомнение саму природу открытий.

ИИ существует для того, чтобы находить невероятно сложные закономерности в массивах данных, которые слишком велики для любого человека. Это удивительное явление стало более привычным после появления ChatGPT в прошлом году. Чат-бот (инструмент, внезапно оказавшийся у каждого под рукой и, кажется, вобравший в себя весь интернет) изменил способы доступа к знаниям и их применения, но в то же время вызвал глубокие сомнения. Мы не понимаем, как именно генеративные чат-боты с искусственным интеллектом дают ответы. При этом видно, что они звучат удивительно по-человечески. Поэтому трудно понять, что является реальным, логичным или заслуживающим доверия, а также то, является ли письменная речь, даже наша собственная, полностью человеческой или имеет некий искусственный оттенок. Порой кажется, что полученный ответ, который имеет смысл, предлагает скорее короткий путь, чем истинное понимание того, как и почему он был получен.

Вероятно, ИИ покажет себя похожим образом в широком спектре научных дисциплин. Среди наиболее заметных научных разработок с помощью ИИ, можно назвать достижения в области молекулярной биологии от DeepMind, ведущей исследовательской лаборатории ИИ, которая теперь принадлежит Google. После того как в 2016 году программы DeepMind победили в игре го (многие считали, что компьютеры никогда не смогут ее освоить), Демис Хассабис, генеральный директор DeepMind, рассказал, что он начал думать о том, как создать программу ИИ для решения проблемы фолдинга белка, которая существует уже несколько десятилетий. Всевозможные биологические процессы зависят от белков, а каждый белок состоит из последовательности аминокислот. То, как эти молекулы складываются в трехмерную форму, определяет функцию белка, и анализ этих структур может помочь ученым разработать новые вакцины, уничтожить бактерии, устойчивые к антибиотикам, и найти новые методы лечения рака. Без трехмерной модели белка у ученых есть не более чем кучка кирпичиков Lego без инструкции по сборке.

Раньше на определение структуры одного белка уходили годы. Но в 2022 году ведущая научная модель DeepMind, AlphaFold, нашла наиболее вероятную структуру почти всех известных науке белков — около 200 миллионов. Подобно программам для игры в шахматы и го, которые ищут наилучший возможный ход, AlphaFold перебирает множество возможных структур для последовательности аминокислот, чтобы найти наиболее вероятную. Программа сокращает до нескольких секунд работу, сравнимую с затратами времени на получение докторской степени. Программа AlphaFold получила широкую известность за революционное влияние как на фундаментальную биологию, так и на разработку новых методов лечения. Тем не менее независимые исследователи отмечают, что, несмотря на нечеловеческую скорость, модель не полностью объясняет, почему та или иная структура является вероятной. В результате ученые пытаются разобраться с возможностями AlphaFold, и Хассабис отметил, что эти усилия приносят хорошие результаты.

По словам Хассабиса, ИИ позволяет исследователям изучать сложные системы в «мире битов», то есть компьютерных моделях, а не в «мире атомов», то есть в реальности. А в завершении можно проверить гипотезы. Эта технология обеспечивает прогресс во многих других областях: не только повышая скорость и масштабы, но и меняя представления о том, какие исследования возможны. Например, нейробиологи из компании Meta и исследовательских центров используют искусственные нейронные сети, обученные «видеть» фотографии или «читать» текст, для гипотез о том, как мозг обрабатывает изображения и язык. Биологи используют искусственный интеллект, обученный на генетических данных, для изучения редких заболеваний, совершенствования иммунотерапии и изучения редких вариантов атипичной пневмонии (SARS-CoV-2). «Теперь у нас есть обоснованные гипотезы, а раньше были лишь догадки», — поясняет Джим ДиКарло, нейробиолог из Массачусетского технологического института, который одним из первых применил технологии ИИ для изучения функции зрения.

Астрономы и физики используют ИИ для обработки данных из Вселенной, которые раньше были слишком огромны, чтобы к ним подступиться, по словам Брайса Менара, астрофизика из Университета Джона Хопкинса. Некоторые эксперименты, такие как коллайдер частиц CERN, производят слишком много информации, чтобы ее можно было физически хранить. Исследователи полагаются на искусственный интеллект, который отбрасывает знакомые наблюдения, сохраняя неизвестные для анализа. «Мы пока не знаем, как выглядит искомая иголка, потому что это необнаруженные физические явления, но мы знаем, как выглядит сено, — объясняет Александр Салай, директор Института интенсивной обработки данных в Джонсе Хопкинсе. — И поэтому мы научили программу распознавать сено и разбирать стог».

По словам Зитник, в долгосрочной перспективе можно даже объединить модели ИИ и физические эксперименты в своего рода автономную лабораторию, где компьютерные программы и роботы будут выдвигать гипотезы, планировать эксперименты для их проверки и анализировать результаты. До создания таких лабораторий еще далеко, хотя прототипы уже существуют, например, роботизированная система Scientific Autonomous Reasoning Agent (SARA), которая смогла выявить новые материалы для возобновляемых источников энергии. SARA использует лазер для последовательного анализа и изменения материалов. По словам Карлы Гомес, специалиста по информатике из Корнелла, каждый цикл анализа длится несколько секунд, что позволяет сократить дни исследований до нескольких часов. Если в будущем такие работы станут обыденностью, то программное обеспечение и роботы превратятся из инструментов в партнеров и даже соавторов науки.

Квантовые наблюдения слишком многочисленны, эксперименты слишком быстры, а нейронаучные гипотезы слишком сложны для человеческих способностей. Даже когда искусственный интеллект позволяет выполнять научную работу, которая раньше казалась невозможной, эти же инструменты создают эпистемическую дилемму. ИИ дает революционные знания, одновременно с этим разрушая наше представление о том, что вообще такое научное знание.

«Понимание — это Святой Грааль науки, — считает Зитник. — Чтобы понять явление, будь то жизнь клетки или планетарной системы, нужно уметь выявлять причины и следствия». Но модели ИИ, как известно, до конца непонятны. Они выявляют закономерности на основе гигантских массивов данных с помощью программных структур, внутреннее устройство которых не поддается человеческой интуиции и рассуждениям. Эксперты называют их «черными ящиками».

Это создает очевидные проблемы для научного метода. «Мы должны понимать, что происходит внутри этого черного ящика, чтобы понять, откуда взялось это открытие», — считает Салай. Прогнозирование событий без понимания, почему этот прогноз точен, может быть сигналом к другому типу науки, в которой знания и вытекающие из них действия не всегда сопровождаются объяснением. Модель ИИ может предсказать наступление грозы, но не объяснить физику и атмосферные изменения, которые ее вызвали, проанализировать рентгеновский снимок, не показав, как она пришла к своему диагнозу, или выдвинуть абстрактные математические гипотезы, не доказав их. Подобные переходы от наблюдений и обоснованных рассуждений к математическим вероятностям случались в науке и раньше. Уравнения квантовой механики, появившиеся в XX веке, точно предсказывают субатомные явления, которые физики до сих пор не до конца понимают (именно это в свое время заставило Альберта Эйнштейна усомниться в квантовой теории).

Наука сама может предложить решение этой головоломки. За последнее столетие физические эксперименты многое открыли о квантовом мире, и точно так же инструменты ИИ могут казаться непостижимыми отчасти потому, что исследователи не потратили достаточно времени на их изучение. «Сначала нужно создать объект, прежде чем разбирать его на части и анализировать с научной точки зрения», — считает Хассабис, а ученые только недавно начали создавать модели ИИ, достойные изучения. Даже старые численные симуляции, хотя они гораздо менее сложны, чем современные модели ИИ, трудно интерпретировать интуитивно, тем не менее они десятилетиями служили основой для новых открытий.

Если исследователи поймут, как искусственные нейроны реагируют на изображение, они смогут распространить эти данные на биологические нейроны. Если исследователи поймут, какие части модели ИИ связывают мутацию с болезнью, ученые смогут получить новые знания о человеческом геноме. «Такие модели представляют собой полностью контролируемые системы. Вы можете измерить все части», — поясняет ДиКарло. Ученый не может измерить каждый нейрон и синапс в мозге обезьяны во время операции, но он может сделать это для модели ИИ. При правильном подходе программы ИИ могут быть не столько «черными ящиками», сколько новым типом объектов, требующих других исследований: не столько «модели» естественного мира, сколько дополнения к нему. Некоторые ученые даже надеются создать «цифровых двойников» для моделирования клеток, органов и планет.

Однако искусственный интеллект не всемогущ. Модель ИИ AlphaFold, конечно, — это нечто особенное, и возможно, Insilico действительно радикально сократит время, необходимое для разработки новых лекарств. Но у этой технологии есть существенные ограничения. Например, модели ИИ должны обучаться на большом количестве релевантных данных. «AlphaFold — это впечатляющий успех, — считает Дженнифер Листгартен, специалист по вычислительной биологии и компьютерным наукам из Калифорнийского университета в Беркли, — однако, он обучался на очень дорогом, тщательно контролируемом наборе данных, которые десятилетиями собирались в лаборатории по очень четко определенной проблеме, которую можно оценить с высокой степенью точности». Если таких данных нет в других областях, то это может помешать или ограничить использование ИИ.

Даже при наличии этих данных реальный мир может быть более сложным и изменчивым, чем абстрактная модель. Например, по словам Андреаса Бендера, изучающего молекулярную информатику в Кембриджском университете, преобразование статической структуры молекулы в ее взаимодействие с различными системами организма — проблема, над которой исследователи все еще работают. «ИИ может быстро предложить новые лекарства, но вам все равно нужно запустить процесс разработки, который, конечно, довольно длительный», — поясняет Джон Джампер, исследователь из DeepMind, возглавлявший разработку AlphaFold.

Клинические испытания препарата занимают годы, и многие из них не приносят успеха. Многие стартапы и проекты по созданию лекарств на основе искусственного интеллекта провалились. В определенном смысле эти неудачи являются доказательством того, что наука работает. По словам Анимы Анандкумар, специалиста по информатике из Калифорнийского технологического института, результаты экспериментов, наряду с известными физическими законами, позволяют ученым предотвратить «галлюцинации» моделей ИИ. Аналогичных законов лингвистической точности для чат-ботов не существует — потребителям приходится доверять Big Tech.

В лаборатории новые разработки можно безопасно проверить в изолированных условиях. Но при разработке лекарств или лечении пациентов ставки гораздо выше. Например, существующие генетические карты человека ориентированы на белых европейцев, но проявление многих заболеваний, таких как диабет, значительно различается в зависимости от расы и этнической принадлежности. По словам Бендера, как предвзятые наборы данных порождают расистские высказывания чат-ботов, так и перекосы в биологических данных могут означать, что разработанные решения нельзя применять к людям с другим генетическим происхождением или к людям другого возраста, или с уже имеющимися заболеваниями, или принимающим сопутствующие лекарства. Программа диагностики рака или лечения, разработанная ИИ, может быть особенно эффективной только для небольшой части населения.

Модели ИИ могут изменить не только то, как мы постигаем мир, но и смысл, который мы вкладываем в понятие «понимание». Если это так, то мы должны создать новые модели знания: чему мы можем доверять, почему и когда. В противном случае наше доверие к чат-боту, инструменту для поиска лекарств или прогнозу урагана с помощью ИИ может выйти за рамки науки. Вероятно, это будет больше похоже на веру.

Источник