Полностью расшифрованный геном
Примерно одна десятая часть генома человека оставалась неизученной, когда в 2019 году исследователи геномики Карен Мига из Калифорнийского университета в Санта-Круз и Адам Филлиппи из Национального исследовательского института генома человека в Бетесде создали консорциум Telomere-to-Telomere (T2T). И теперь в геноме нет неизведанных мест. В препринте, опубликованном в мае прошлого года, консорциум сообщил о первой сквозной последовательности генома человека. Они добавили почти 200 млн новых пар оснований к широко используемой согласованной последовательности генома человека, известной как GRCh38, и написали последнюю главу проекта «Геном человека».
Появившийся в 2013 году, GRCh38 стал ценным инструментом — каркасом для картирования ридов секвенирования. Но он весь в дырах. Во многом это связано с тем, что широко используемая технология секвенирования, разработанная компанией Illumina в Сан-Диего, дает точные, но короткие риды. Их длины недостаточно, чтобы однозначно картировать повторяющиеся геномные последовательности, включая теломеры, закрывающие концы хромосом, и центромеры, которые координируют разделение вновь реплицированной ДНК во время деления клетки.
Все изменили технологии секвенирования с длительным чтением. Разработанные Pacific Biosciences и Oxford Nanopore Technologies (ONT), они могут секвенировать десятки или даже сотни тысяч оснований за одно чтение, но — по крайней мере, вначале — не без ошибок. Однако к тому времени, когда в 2020 году команда T2T реконструировала свои первые отдельные хромосомы — X и 8 — секвенирование Pacific Biosciences продвинулось до такой степени, что ученые T2T могли обнаруживать крошечные вариации в длинных участках повторяющихся последовательностей. Благодаря этим тонким «отпечаткам» длинные повторяющиеся сегменты хромосом стало легко обрабатывать, и остальная часть генома быстро встала на свои места. Платформа ONT фиксирует множество модификаций ДНК, которые модулируют экспрессию генов, и T2T также смог картировать эти «эпигенетические метки» по всему геному.
Решенный T2T геном был получен из линии клеток, содержащей два идентичных набора хромосом. Нормальные диплоидные геномы человека содержат две версии каждой хромосомы, и исследователи в настоящее время работают над стратегиями «фазирования», которые уверенно соотносят каждую последовательность с соответствующей копией хромосомы. «У нас уже есть довольно феноменальные фазированные сборки», — говорит Мига.
Эта работа по сборке диплоидов проводится в сотрудничестве с партнерской организацией T2T, Human Pangenome Reference Consortium, которая стремится создать более репрезентативную карту генома на основе сотен доноров со всего света. «Мы стремимся охватить в среднем 97% аллельного разнообразия человека», — говорит один из ведущих исследователей консорциума, генетик Рокфеллеровского университета в Нью-Йорке Эрих Джарвис. Как председатель проекта Vertebrate Genomes Project он также надеется использовать эти возможности для создания полных последовательностей для каждого вида позвоночных на Земле. «Я думаю, в течение следующих 10 лет мы будем рутинно делать геномы от теломеры до теломеры», — говорит он.
Определение белковой структуры
Структура определяет функцию. Но ее трудно измерить. Крупные экспериментальные и вычислительные достижения за последние два года дали исследователям дополнительные инструменты для определения белковых структур с беспрецедентной скоростью и разрешением.
Алгоритм предсказания структуры AlphaFold2, разработанный DeepMind, дочерней компанией Alphabet, основан на стратегиях «глубокого обучения» для экстраполяции формы свернутого белка на основе его аминокислотной последовательности. После убедительной победы на конкурсе «Критическая оценка предсказания структуры белка» в 2020 году, в котором вычислительные биологи тестируют свои алгоритмы предсказания структуры лицом к лицу, репутация AlphaFold2 — и внедрение — резко выросли. «Для некоторых структур прогнозы почти устрашающе хороши», — говорит старший научный сотрудник и бывший директор Европейского института биоинформатики в Хинкстоне Джанет Торнтон. С момента публичного выпуска в июле прошлого года AlphaFold2 применялся к протеомам для определения структур всех белков, экспрессируемых у людей и в 20 модельных организмах, а также почти 440 тысяч белков из базы данных Swiss-Prot. Это значительно увеличило количество белков, для которых доступны данные моделирования с высокой степенью достоверности. Алгоритм AlphaFold также доказал свою способность работать с многоцепочечными белковыми комплексами.
Параллельно с этим усовершенствования криогенной электронной микроскопии (крио-ЭМ) позволяют исследователям экспериментально определять даже самые сложные белки и комплексы. Крио-ЭМ сканирует мгновенно замороженные молекулы электронным лучом, создавая изображения белков в различных ориентациях, которые затем собираются в трехмерную структуру. В 2020 году усовершенствования аппаратного и программного обеспечения крио-ЭМ позволили двум командам создать структуры с разрешением менее 1,5 ангстрем, фиксируя положение отдельных атомов.
«До этого мы с диким энтузиазмом обсуждали термин «атомное разрешение», но оно было лишь околоатомным, — говорит содиректор Центра электронной микроскопии Симонса при Нью-Йоркском центре структурной биологии Бриджит Каррагер. — Это действительно атомное». И хотя обе команды использовали хорошо изученный модельный белок под названием апоферритин, по словам Каррагер, эти исследования показывают, что близкое к атому разрешение возможно и для других, более сложных целей.
Многие экспериментаторы, которые изначально скептически относились к AlphaFold2, теперь видят в нем явное дополнение к экспериментальным методам, таким как крио-ЭМ, где его вычислительные модели помогают в анализе и реконструкции данных. А крио-ЭМ может генерировать результаты, которые в настоящее время недоступны для компьютерного прогнозирования. Команда Каррагер, например, использует крио-ЭМ с временным разрешением, чтобы фиксировать быстрые конформационные изменения, происходящие при взаимодействии белков с другими молекулами. «Мы можем улавливать вещи и видеть происходящее с точностью до сотни миллисекунд», — говорит она.
Существует также значительный интерес к родственному методу — криоэлектронной томографии (крио-ЭТ), которая фиксирует естественное поведение белков в тонких срезах замороженных клеток. Но интерпретация этих переполненных сложных изображений — непростая задача, и Каррагер считает, что вычислительные достижения мира машинного обучения будут иметь особое значение. «Как еще мы можем решить эти почти неразрешимые проблемы?» — задается она вопросом.
Квантовое моделирование
Атомы размером с… атом. Но при правильных условиях их можно привести в состояние сильного возбуждения, сверхразмерное состояние с диаметром порядка одного микрометра и более. Вызывая это возбуждение на тщательно уложенных массивах из сотен атомов, физики продемонстрировали, что могут решать сложные физические задачи, из-за которых обычные компьютеры работают на пределе возможностей.
Квантовые компьютеры управляют данными в виде кубитов. Соединенные при помощи явления квантовой физики, называемого запутанностью, кубиты влияют друг на друга на расстоянии. Эти кубиты могут резко увеличить вычислительную мощность, которая достигается при заданной доле кубитов по сравнению с эквивалентным количеством битов в классическом компьютере.
Несколько групп успешно использовали отдельные ионы в качестве кубитов, но из-за электрических зарядов их трудно собирать при высокой плотности. Физики, в том числе Антуан Брове из французского национального исследовательского агентства CNRS и Михаил Лукин из Гарвардского университета, изучают альтернативный подход. Команды используют оптический пинцет для точного расположения незаряженных атомов в плотно упакованных двухмерных и трехмерных массивах, а затем применяют лазеры для возбуждения этих частиц в «ридберговские атомы» большого диаметра, которые запутываются со своими соседями. «Ридберговские атомные системы индивидуально управляемы, а их взаимодействие можно включать и выключать», — объясняет физик Джевук Ан из Корейского передового института науки и технологий. Это, в свою очередь, позволяет их программировать.
Этот подход получил значительный импульс всего за несколько лет благодаря технологическим достижениям, которые повысили стабильность и производительность массивов ридберговских атомов, а также быстрому масштабированию от нескольких десятков кубитов до сотен. Ранние приложения были сосредоточены на определенных проблемах, таких как прогнозирование свойств материалов, но подход универсален. «До сих пор у любой теоретической модели был способ реализации», — говорит Бровейс.
Пионеры в этой области основали компании, разрабатывающие системы на основе массивов атомов Ридберга для лабораторного использования, и, по оценкам Бровейса, такие квантовые симуляторы станут коммерчески доступными через год или два. Но эта работа также открывает путь к квантовым компьютерам, которые будут применяться в более широком смысле, в том числе в экономике, логистике и шифровании. Исследователи пытаются определить место этой пока еще зарождающейся технологии в компьютерном мире, но Ан проводит параллели с прорывом братьев Райт в авиации. «У того первого самолета не было никаких транспортных преимуществ, — говорит Ан, — но в конце концов он изменил мир».
Точные манипуляции с геномом
Несмотря на все возможности редактирования генома, технология CRISPR-Cas9 больше подходит для инактивации генов, чем для восстановления. Нацеливание фермента Cas9 на геномную последовательность относительно точно, но клеточная репарация полученного двухцепочечного разреза — нет. Опосредованная процессом, называемым негомологичным соединением концов, репарация CRISPR-Cas9 часто осложняется небольшими вставками или делециями.
Большинство генетических заболеваний требуют коррекции генов, а не их разрушения, отмечает гарвардский биолог-химик Дэвид Лю. Для этого Лю и его команда разработали два многообещающих подхода. Оба используют точное нацеливание CRISPR с одновременным ограничением способности Cas9 разрезать ДНК в этом месте. Первый, называемый редактированием оснований, связывает каталитически нарушенную форму Cas9 с ферментом, который способствует химическому превращению одного нуклеотида в другой — например, цитозина в тимин или аденина в гуанин.
Но в настоящее время этим методом можно внести только определенные изменения. Праймированное редактирование, более новая разработка группы, связывает Cas9 с типом фермента, известного как обратная транскриптаза, и использует направляющую РНК, которая модифицируется, чтобы включить желаемое редактирование в геномную последовательность. В ходе многоэтапного биохимического процесса эти компоненты копируют направляющую РНК в ДНК, которая в конечном итоге заменяет целевую последовательность генома. Важно отметить, что при обоих методах редактирования разрезается только одна цепь ДНК, так как это более безопасно и менее губительно для клеток.
Впервые описанное в 2016 году, редактирование оснований уже на пути к клиническому применению: компания Beam Therapeutics, основанная Лю, в ноябре получила одобрение от Управления по санитарному надзору за качеством пищевых продуктов и медикаментов США, чтобы впервые испытать этот подход на людях с целью восстановления гена, вызывающего серповидно-клеточную анемию.
Праймированное редактирование продвинулось не так далеко, но появляются улучшенные итерации, и перспективы метода очевидны. Специалист по редактированию генома из Медицинского колледжа Университета Йонсей в Сеуле Хенбум Генри Ким и его команда достигли эффективности до 16% при исправлении мутаций генов сетчатки у мышей. «Если бы мы использовали более совершенные версии, о которых недавно сообщалось, эффективность была бы еще выше», — говорит он. Группа Лю также обнаружила, что первичный механизм способствует вставке последовательностей ДНК размером с ген в геном, потенциально предлагая более безопасную и более четко контролируемую стратегию генной терапии. Этот процесс не слишком эффективен, но иногда даже небольшая коррекция имеет большое значение, отмечает Лю. «В некоторых случаях болезнь можно вылечить, заменив ген на уровне 10% или даже 1%», — говорит он.
Таргетная генетическая терапия
Лекарства на основе нуклеиновых кислот влияют на клиническую практику, но они все еще в значительной степени ограничены с точки зрения тканей, в которых могут применяться. Для большинства методов лечения требуется либо местное введение, либо манипуляции ex vivo с клетками, которые берут у пациента, а затем пересаживают обратно. Одно заметное исключение — это печень, которая фильтрует кровоток и оказывается надежной мишенью для селективной доставки лекарств. В этом случае добиться результата помогает внутривенное или даже подкожное введение.
«Если всерьез задуматься, то сложно просто доставить препарат в любую ткань, — говорит инженер-химик из Массачусетского технологического института (MIT) Дэниел Андерсон. — Человеческое тело создано, чтобы использовать имеющуюся у нас генетическую информацию, а не принимать новую». Однако исследователи демонстрируют устойчивый прогресс в разработке стратегий, которые помогают направлять эти препараты в определенные системы органов, не затрагивая при этом другие ткани, которые не служат мишенями.
Часто в попытках использования генной терапии применяют аденоассоциированные вирусы, и исследования на животных показали, что тщательно отобранный правильный вирус в сочетании с промоторами тканеспецифических генов эффективно доставляет лекарство в определенные органы. Однако иногда вирусы сложно производить в больших масштабах, и они вызывают иммунные реакции, которые снижают эффективность или вызывают побочные эффекты.
Липидные наночастицы представляют собой альтернативу вирусам, и несколько исследований, опубликованных в последние годы, подчеркивают возможность настройки их специфичности. Например, подход селективного нацеливания на органы (SORT), разработанный биохимиком Дэниелом Сигвартом и его коллегами из Юго-западного медицинского центра Техасского университета, позволяет быстро генерировать и проверять липидные наночастицы, чтобы найти те, что могут эффективно воздействовать на клетки в таких тканях, как легкое или селезенка. «Это была одна из первых работ, которая показала, что если проводить систематический скрининг этих липидных наночастиц и менять их состав, можно исказить биораспределение», — говорит инженер-биомедик из Технологического университета Эйндховена Рой ван дер Мил. Андерсон отмечает, что несколько групп также изучают, как белковые компоненты, такие как клеточно-специфические антитела, помогают процессу нацеливания.
Андерсон особенно воодушевлен доклиническим прогрессом в воздействии на предшественников клеток крови и иммунных клеток в костном мозге, которого достигли компании Beam Therapeutics и Intellia. Обе используют специально разработанные составы липидных наночастиц. По его словам, успех в нацеливании на эти ткани избавит пациентов от изнурительного процесса, связанного с текущими методами генной терапии ex vivo, которые включают химиотерапию для уничтожения существующего костного мозга перед трансплантацией. «Применение этих методов in vivo может действительно изменить лечение пациентов», — говорит Андерсон.
Пространственная мультиомика
Взрыв в развитии одноклеточных омиков означает, что теперь исследователи регулярно получают генетические, транскриптомные, эпигенетические и протеомные данные из отдельных клеток — иногда одновременно. Но методы, нацеленные на одиночные клетки, приносят в жертву важную информацию, вырывая эти клетки из их естественной среды.
В 2016 году исследователи под руководством Йоакима Лундеберга из Королевского технологического института в Стокгольме разработали стратегию решения этой проблемы. Команда подготовила слайды со штрих-кодированными олигонуклеотидами — короткими цепями РНК или ДНК — которые могут захватывать матричную РНК из среза нетронутой ткани, так что каждый транскрипт можно отнести к определенному положению в образце в соответствии с его штрих-кодом. «Никто на самом деле не верил, что мы сможем провести полный транскриптомный анализ среза ткани, — говорит Лундеберг. — Но это оказалось на удивление легко».
Область пространственной транскриптомики взорвалась после этого. В настоящее время доступно несколько коммерческих систем, в том числе платформа Visium Spatial Gene Expression от 10x Genomics, основанная на технологии Лундеберга. Академические группы продолжают разрабатывать инновационные методы, которые картируют экспрессию генов с постоянно увеличивающейся глубиной и пространственным разрешением.
Теперь исследователи накладывают дополнительные «омические» идеи поверх своих пространственных карт. Например, инженер-биомедик из Йельского университета в Нью-Хейвене Ронг Фан разработал платформу, известную как DBIT-seq16, в которой используется микрожидкостная система, способная одновременно генерировать штрих-коды для тысяч транскриптов мРНК и сотен белков, меченных антителами-олигонуклеотидами. Это обеспечивает гораздо более точную оценку того, как экспрессия клеточных генов влияет на выработку и активность белка, чем можно было бы получить на основе транскриптомных данных, и команда Фана использует этот метод для изучения таких процессов, как активация иммунных клеток.
«Мы видим ранние признаки того, как иммунные клетки кожи реагируют на вакцину Moderna от Covid-19», — говорит он. Некоторые коммерческие системы также могут собирать пространственные данные от нескольких белков параллельно с транскриптомной информацией, включая платформу Visium и систему GeoMx от Nanostring.
Тем временем группа Лундеберга усовершенствовала свой метод пространственной транскриптомики для одновременного сбора данных о последовательности ДНК. Это позволило его команде начать картирование пространственно-временных событий, лежащих в основе онкогенеза. «Мы могли бы проследить эти генетические изменения в пространстве, как они эволюционируют в дополнительные генетические варианты, которые в конечном итоге приводят к опухоли», — говорит он.
Команда Фана продемонстрировала пространственное картирование модификаций хроматина в образцах тканей, что выявляет регуляторные ландшафты клеточных генов, влияющие на такие процессы, как развитие, дифференцировка и межклеточная коммуникация. Фан уверен, что метод можно сочетать с пространственным анализом РНК и даже белков. «У нас есть предварительные данные, показывающие, что это вполне осуществимо», — говорит он.
Диагностика на основе CRISPR
Способность системы CRISPR-Cas к точному расщеплению специфических последовательностей нуклеиновых кислот обусловлена ее ролью бактериальной «иммунной системы» против вирусной инфекции. Эта ссылка вдохновила первых пользователей технологии на размышления о применимости системы к диагностике вирусов. «Было бы очень правильно использовать то, для чего они созданы в природе», — говорит генетик из Института Броуда MIT и Гарварда Пардис Сабети. — На вашей стороне миллиарды лет эволюции».
Но не все ферменты Cas одинаковы. Cas9 — это основной фермент для манипулирования геномом на основе CRISPR, но большая часть работы по диагностике использовала семейство молекул, нацеленных на РНК, известное как Cas13. Оно было обнаружено в 2016 году молекулярным биологом Фэн Чжаном и его командой в Broad. «Cas13 использует свою РНК-инструкцию для распознавания РНК-мишени путем спаривания оснований и активирует рибонуклеазную активность, которую можно использовать в качестве диагностического инструмента с помощью репортерной РНК», — объясняет Дженнифер Дудна из Калифорнийского университета в Беркли, разделившая Нобелевскую премию по химии 2020 года за разработку возможностей редактирования генома CRISPR-Cas9 с Эммануэль Шарпантье, которая работает в Отделе науки о патогенах в Институте Макса Планка. Это связано с тем, что Cas13 не просто разрезает РНК-мишень направляющей РНК, он также выполняет «побочное расщепление» любых других близлежащих молекул РНК. Во многих диагностических средствах на основе Cas13 используется репортерная РНК, которая связывает флуоресцентную метку с молекулой-гасителем, подавляющей эту флуоресценцию. Когда Cas13 активируется после распознавания вирусной РНК, он разрезает репортер и высвобождает флуоресцентную метку из гасителя, генерируя сигнал. Некоторые вирусы оставляют достаточно сильные следы, поэтому их можно обнаружить без амплификации, что упрощает диагностику по месту оказания медицинской помощи. Например, в январе прошлого года Дудна и Мелани Отт из Института вирусологии Гладстона продемонстрировали быстрый тест CRISPR-Cas13 на для обнаружения SARS-CoV-2 без амплификации с помощью камеры мобильного телефона.
Процедуры амплификации РНК облегчают отслеживание вирусных последовательностей, и Сабети с коллегами разработали микрожидкостную систему, которая параллельно выявляет несколько патогенов, используя амплифицированный генетический материал всего из нескольких микролитров образца. «Сейчас мы можем одновременно исследовать 21 вирус по цене менее $10 за образец», — говорит она. Они разработали инструменты, позволяющие обнаруживать более 169 вирусов человека одновременно.
Дудна отмечает, что другие ферменты Cas дополняют набор диагностических инструментов, в том числе белки Cas12, которые обладают свойствами, сходными с Cas13, но нацелены на ДНК, а не на РНК. В совокупности они могут обнаруживать более широкий спектр патогенов или даже эффективно диагностировать другие неинфекционные заболевания. «Делать это относительно быстро очень полезно, тем более что различные подтипы рака определяются специфическими типами мутаций», — говорит Дудна.