Что такое deep learning и как эти компьютерные алгоритмы перевернут нашу жизнь
Будущее

Что такое deep learning и как эти компьютерные алгоритмы перевернут нашу жизнь

Главное, что нужно знать о технологиях, которые берут на вооружение Google и Facebook.

Люк Дормел — журналист, работает для BBC и Fast Company, пишет книгу The Formula об алгоритмах и их влиянии на нашу жизнь.

В прошлом месяце Google совершила крупную сделку — купила компанию DeepMind Technologies. Приобретя фирму, которая занимается исскусственным интеллектом, Google продемонстрировала серьезный интерес к deep learning, «глубокому обучению». Но что значит этот модный термин?

DeepMind была основана в 2012 году нейрологом и бывшим шахматным вундеркиндом Демисом Хассабисом и его двумя коллегами. На их сайте говорится: «Мы соединяем лучшие методики машинного обучения и нейронауки для создания мощных универсальных обучающихся алгоритмов» в целом ряде отраслей.

Что такое deep learning?

Это все более популярная тема в области искусственного интеллекта. «Глубокое обучение» — это вид машинного обучения, основанный на нейросетях. Они помогают усовершенствовать такие алгоритмы, как распознавание речи, компьютерное зрение и обработка естественного языка. Это одна из самых востребованных областей в компьютерной науке. Но как она всего за десятилетие превратилась из загадочной научной темы в одну из самых увлекательных технологических областей?

«Deep learning сейчас очень высоко ценится, — говорит Йошуа Бенгио, профессор факультета компьютерных наук Монреальского университета, одного из главных мировых центров deep learning. — Дело в том, что сейчас сильно не хватает специалистов в этой области. На подготовку PhD нужно около пяти лет, а пять лет назад очень немногие молодые ученые занимались этой темой. И сегодня эти немногие чрезвычайно востребованы».

В последние несколько лет «глубокое обучение» помогло добиться прорывов в самых разных областях, от распознавания объектов до машинного перевода, которые специалисты по ИИ никак не могли расколоть.

Не путать с машинным обучением!

Чтобы понять, что такое deep learning, нужно отделить его от других дисциплин в сфере искусственного интеллекта. Одна из них — машинное обучение, когда компьютер извлекает знания через управляемый опыт. Обычно в этом случае человек помогает машине учиться, подбрасывая ей сотни или тысячи учебных примеров и вручную исправляя ошибки.

Хотя машинное обучение доминирует в сфере ИИ, у него есть свои проблемы. Прежде всего, оно требует колоссального времени. Кроме того, пока компьютер полагается на человеческую изобретательность, на умение человека придумывать абстракции, это нельзя назвать в полной мере машинным интеллектом.

«Многие успешные приложения машинного обучения зависят от ручной работы, исследователь сам кодирует информацию о задаче, и обучение основано на его труде, — говорит Джордж Дал, исследователь группы машинного обучения в Университете Торонто. — Когда исследователь занимается deep learning, он старается заставить систему саму спроектировать свои функции, насколько это возможно».

«Глубокое обучение» по большей части не нуждается в человеке-операторе. Оно подразумевает, например, создание масштабных нейросетей, которые позволяют компьютеру учиться и «думать» самостоятельно, не прибегая к прямому человеческому вмешательству.

«То, что компьютер узнает при помощи алгоритмов deep learning — это скорее абстрактные представления концепций, — говорит Бенджио. — Deep learning основано на том, что у людей есть несколько типов представления идей: на нижних уровнях самые простые, на верхних — более сложные абстракции. Представляя информацию этим абстрактным способом, машине легче прийти к своим обобщениям».

Все хотят быть в игре

В 2011 году профессор Стэнфорда Эндрю Энг основал знаменитый проект Google Brain — это нейросеть, которую обучают при помощи алгоритмов deep learning. Она научилась распознавать высокоуровневые представления — например, понятие «кошка», — после просмотра всего лишь видео на YouTube и не имея никакого предварительного представления о том, что такое кошка.

В прошлом году Facebook назначил исследователя Янна Лекуна директором по исследованиям искусственного интеллекта. Это подразделение опирается на deep learning при создании решений для распознавания лиц и предметов на 350 млн фото и видео, что загружают на Facebook каждый день.

Другие примеры deep learning в действии — это сервисы Google Now и Apple Siri. Они многим обязаны Далу, чья работа 2012 года «Context-dependent pre-trained deep neural networks for large-vocabulary speech recognition» стала прорывом в распознавании речи методами deep learning.

«Все сегодняшние проекты по распознаванию речи в крупных компаниях или уже используют нейросети того вида, над которым я работают, или скоро начнут их использовать», — замечает Дал.

Впечатляет то, насколько сильно deep learning может изменить эти области по сравнению с более старыми моделями. По словам исследователей Google, ошибок при распознавании голоса в новой версии Android — после добавления механизмов deep learning — стало на 25% меньше.

Бенджио говорит, что deep learning в ближайшие пару лет, вероятно, кардинально изменит обработку естественного языка. «В этом крайне заинтересованы компании вроде Facebook и Google, поскольку способность понимать смысл слов, которые пишут или говорят люди, очень важна при разработке новых пользовательских интерфейсов, при показе рекламы и формировании персональной ленты новостей, — говорит он. — Если deep learning позволит добиться в этой сфере такого же эффекта, как в распознавании речи и предметов, это будет крайне важное и ценное достижение».

Этика deep learning

Что было уникально в сделке Google и DeepMind — это условие о введении этических правил. По словам людей, знакомых со сделкой, желание Google учредить совет по этике было решающим фактором, благодаря которому DeepMind решила продать свои акции именно ей, а не Facebook. Хотя этические вопросы ИИ звучали почти в каждом фантастическом фильме на эту тему, в реальном мире пока еще мало конкретных моральных правил по работе с искусственным интеллектом.

Бенджио говорит, что это и понятно: сегодняшние даже самые изощренные механизмы deep learning по числу нейронов сопоставимы лишь с мозгом насекомого. «Неуправляемое обучение все еще сталкивается с большими трудностями, и в плане вычислений, и чисто математически», — так он объясняет, почему страхи по поводу самовольного поведения ИИ пока преждевременны.

Джордж Дал согласен: «Компьютеры сейчас куда мощнее, чем 10 лет назад, но нужно еще столько всего добиться в научном плане, прежде чем реализовать амбиции исследователей, работающих в этой сфере».

«Но нельзя сказать, что deep learning не работает в коммерческом смысле: в целом ряде областей оно уже очень полезно людям», — говорит он. И восхищает, насколько это свежая область, непаханое поле. «Сейчас в пределах досягаемости еще много интересных результатов — многие проблемы не так уж сложны, просто взяться за них еще не было времени».

Оригинал поста — www.fastcolabs.com/3026423/why-google-is-investing-in-deep-learning

Подпишитесь на нашу рассылку, чтобы получать на почту еженедельный newsletter с анонсами лучших материалов «Идеономики» и других СМИ и блогов.

Fast Company 17 февраля 2014