Триша Уонг: Большим данным не достает данных от людей

Почему так много компаний принимают неверные решения, даже несмотря на доступ к безграничному объему данных? Рассказывая истории от случаев с Nokia и Netflix до легенд об оракулах Древней Греции, Триша Уонг ответит на этот вопрос и укажет на опасность «больших данных». Чтобы принимать правильные бизнес-решения и преуспевать в будущем, она предлагает нам сосредоточиться на «плотных данных» — ценнейшей, неисчисляемой цифрами информации от самих людей

В Древней Греции, когда кому-либо — от рабов до воинов, поэтов и политиков — нужно было принять ключевое решение в самых важных жизненных вопросах, вроде: «Стоит ли мне жениться?», или «Стоит ли отправляться в путь?», или «Стоит ли нашим войскам наступать на эти земли?», они всегда спрашивали совета у оракула, провидицы.

Вот как это было: придя к ней с вопросом, люди вставали на одно колено, после чего она впадала в транс. На это могло уйти два дня, и вот, наконец, она выходила из транса, и ее ответом было предсказание.

Начиная с гадальных костей Древнего Китая, оракулов Древней Греции и календарей Майя люди нуждались в пророчествах, чтобы узнать, что произойдет дальше. И все из-за того, что все мы хотим принять правильное решение. Мы не хотим ничего упускать. Будущее пугает, поэтому намного приятнее знать, что можно принять решение с некой долей уверенности в результате.

И у нас появилась своя провидица, и имя ее — «большие данные» [Big data], которую мы также называем Watson, «глубокое изучение» или «нейронная сеть». И вот какие вопросы мы задаем нашей провидице сегодня: «Как наиболее эффективно переправить эти телефоны из Китая в Швецию?», или «Каковы шансы родить ребенка с генетическим заболеванием?», или «Каков прогноз по объемам продаж для этого продукта?».

У меня есть собака. Ее зовут Эл, она терпеть не может дождь. Я все перепробовала, чтобы это исправить. Но у меня ничего не вышло, поэтому мне приходится обращаться к пророку по имени «прогноз погоды» перед каждым выходом на прогулку, чтобы получить самый точный прогноз на следующие 10 минут. Она просто прелесть. Из-за всего этого наша провидица стала 122-миллиардной индустрией.

Сейчас, несмотря на размер индустрии, ее доходы поразительно малы. Инвестировать в большие данные легко, но использовать их непросто. Более 73% проектов с большими данными совсем не приносят дохода. Ко мне приходили топ-менеджеры и говорили: «И у нас то же самое. Мы вложились в такую систему, но наши работники умнее не стали. И уж точно ничего передового не придумают».

Все это меня очень интересует, потому что я технологический этнограф. Я изучаю и консультирую компании в вопросах того, как люди используют технологии, и в частности меня интересуют данные. Так почему же доступ к большим данным не помогает принятию лучших решений, даже компаниям, владеющим ресурсами для инвестиций в большие данные? Почему им от них не становится легче?

Такая ситуация случилась со мной лично. В 2009 году я устроилась в исследовательский отдел Nokia. А в то время Nokia была одним из самых крупных в мире производителей сотовых телефонов, лидирующей на растущих рынках Китая, Мексики и Индии, в странах, где я провела множество исследований того, как используют технологии люди с низким доходом. В Китае я провела особенно много времени, знакомясь с теневым сектором экономики. Ради этого я даже поработала уличным торговцем, продавала пельмени рабочим со стройки. А еще собирала информацию, просиживая днями и ночами в интернет-кафешках и общаясь с китайской молодежью, чтобы узнать их отношение к играм и мобильным телефонам, и как оно менялось с переездом из сельской местности в город.

Благодаря всем тем качественным данным, что я собирала, я начала лучше понимать, что в жизни китайцев с низким уровнем дохода грядут большие перемены. Несмотря на то, что они были окружены рекламой предметов роскоши, вроде изысканных унитазов, — и как такой не захотеть? — рекламой квартир и машин, пообщавшись с ними, я поняла, что по-настоящему их завлекала только реклама iPhone, обещавшая перенести их в мир высоких технологий. Даже когда я жила с ними в городских трущобах, подобных этим, я видела людей, тративших больше половины месячного дохода на покупку телефона, или ещt хуже — его копии, одной из дешевых подделок iPhone или смартфонов других брендов. И они в большом ходу. Работают как надо.

И спустя годы жизни с мигрантами и работы с ними бок о бок, делая все то же, что они, я начала собирать по кускам всю эту информацию, начав с того, что казалось случайным, как моя торговля пельменями, до более очевидных вещей, как, например, отслеживание их счетов за телефон. И я смогла увидеть целостную картину того, что происходило. И именно тогда я начала понимать, что даже нищий китаец хотел себе смартфон, и что они были готовы на все, лишь бы его заполучить.

При этом не забывайте, что iPhone тогда только появились. Это был 2009 год. Это сколько? Восемь лет назад. И Android только начинали выглядеть как iPhone. И многие очень умные и адекватные люди говорили: «Эти смартфоны — лишь временное увлечение. Кто захочет носить с собой такую тяжесть, при том что батарея быстро садится, и они ломаются, стоит разок уронить?». Но я собрала много доказательств и утвердилась в своих предположениях, которыми с нетерпением хотела поделиться с Nokia.

Но в Nokia мне не поверили, потому что мои данные не были большими. Они сказали: «У нас миллионная выборка, и мы не видим признаков того, что кто-то хотел бы купить смартфон, а у вас всего 100 наблюдений, — какими бы пtстрыми они ни были, — слишком мало, чтобы принимать их всерьез». И я сказала: «Nokia, вы правы. Естественно, вы их не увидите, потому что рассылаете анкеты, полагая, что люди не знают, что такое смартфон, поэтому, естественно, вы не получите нужную информацию о людях, пожелающих купить смартфон через два года. Ваши опросы и ваши методы были разработаны для оптимизации существующей бизнес-модели, а я вижу среди людей динамику роста, которая еще не случилась. Если смотреть за пределы динамики рынка, его можно опередить». Всем известно, что случилось с Nokia? Их бизнес потерпел полный крах. Такова была плата за их упущения. Уму непостижимо.

И это случилось не только с Nokia. Я вижу организации, постоянно отбрасывающие наши данные из-за того, что они пришли не из сухой статистики или не подтверждают ее. Но вины больших данных тут нет. Просто мы их так используем. Мы сами за это в ответе. Репутация залога успеха пришла к большим данным из-за расчетов в очень специфических сферах, таких как электросети, логистика или генетический код, когда мы высчитываем данные в более-менее автономных системах.

Но не все системы настолько автономны. При расчетах в более динамичных системах, особенно системах, включающих людей, факторы сложны и непредсказуемы, и мы не знаем, как их правильно смоделировать. Стоит вам что-то предсказать в поведении человека, как появляются новые факторы, потому что условия постоянно меняются. Поэтому это бесконечный круг. Только вы решили, что что-то знаете, как появляется что-то неизвестное. Поэтому надежда лишь на большие данные увеличивает вероятность что-то упустить из виду. Хоть у нас и появляется иллюзия, что мы уже все знаем.

Увидеть этот парадокс и тем более уложить его в голове сложнее оттого, что в нас есть такая штука, которую я называю «креном к подсчету количества», когда все измеряемое подсознательно ценится больше, чем неизмеряемое. И мы часто сталкиваемся с этим на работе. Мы, возможно, работаем бок о бок с такими людьми или, может, такова вся наша организация, когда люди так сильно углубляются в цифры, что больше ничего за ними не видят, даже если подсунуть доказательства им прямо под нос. И это очень увлекает, ведь в подсчете количества нет ничего плохого, получается очень убедительно. Для меня смотреть на таблицы Excel — такой бальзам на душу! Даже на самые простые. Будто я такая: «Ага! Формула сработала. Все в порядке. Все идет как надо».

Но проблема в том, что к подсчетам количества привыкаешь. И когда мы забываемся, и когда нам не с чем свериться, очень легко просто выбросить данные из-за того, что не получается выразить их в цифровой форме. Очень легко уйти в размышления о простых, но верных решениях, будто такие бывают. Потому что в этом и состоит опасность для любой организации, потому что зачастую будущее, которое мы хотим предсказать, лежит не в стогу, а в торнадо, которое несется на нас из-за стен сарая. Нет большего риска, чем не видеть того, что неизвестно. Из-за этого можно принять неверное решение. Из-за этого что-то важное может пройти мимо.

Но нам не обязательно идти по этому пути. Оказывается, у провидиц Древней Греции был секретный ключ, который укажет нам дорогу вперед. Недавние геологические исследования доказали, что храм Аполлона, где обитал самый известный оракул, на самом деле был построен на месте двух разломов в земной коре. Из тех разломов в земной коре выходили петрохимические пары, то есть провидица сидела прямо над этими разломами и вдыхала немыслимое количество этилена, исходящего из этих трещин. Так и было. Все это правда. Вот из-за чего провидица бормотала, видела галлюцинации и впадала в транс. Да она просто обкуренная была!

Как вообще кто-то…? Как кто-то мог получить от нее ценный совет в таком состоянии? Видите этих людей вокруг нее? Видите, как они поддерживали ее, потому что она слегка одурманена? И видите того парня слева от нее, который держит оранжевую тетрадь? Так вот, это были жрецы храма, они работали рука об руку с провидицей. Когда просители приходили и вставали на колени, в тот же момент жрецы храма приступали к работе: после того, как вопрос был задан, жрецы следили за эмоциями просителей, а потом задавали им дополнительные вопросы: «А почему вы хотите знать это пророчество? Кто вы такие? Что вы будете делать с этой информацией?». Так жрецы храма собирали более этнографическую, более качественную информацию, после чего трактовали лепет провидицы. Так что она работала не одна. Также и системам больших данных нужна помощь.

Поясню: я говорю не о том, что наши системы больших данных надышались этилена, или что они делают неправильные прогнозы. Совсем наоборот. Я говорю о том, что, как провидица нуждалась в жрецах, так в них нуждаются и наши системы больших данных. Им нужны такие люди, как этнографы и исследователи пользователей, кто мог бы собрать то, что я называю «плотными данными». Это вся та ценная информация от людей, как истории, эмоции, общение, которые нельзя представить количественно. Это все то, что я собирала для Nokia, что поступало ко мне мельчайшими крупицами, но несло в себе значение невероятной глубины.

Что делает их такими плотными и содержательными, так это опыт правильного восприятия того, что тебе рассказывают люди. И именно это помогает увидеть прорехи в наших моделях. Плотные данные погружают вопросы бизнеса в проблемы человека, поэтому совмещение больших и плотных данных создает более полную картину. Тогда как большие данные способны объяснять процессы на самом высоком уровне машинного интеллекта, плотные данные могут помочь сохранить контекст, теряющийся при использовании только больших данных, и достичь высот человеческого интеллекта. При объединении обоих видов данных происходит удивительное, потому что вы не просто работаете с уже собранными данными. Теперь вы также работаете с еще не собранными данными. Вы хотите спросить о причине: почему так происходит?

Когда это делал Netflix, они открыли совершенно новый способ трансформации бизнеса. Netflix прославился своим действительно отличным алгоритмом рекомендаций, они объявили о призе в $1 млн тому, кто сможет его улучшить. И победители были. Но Netflix обнаружил, что улучшения были неравномерными. Чтобы узнать, что происходило, они наняли этнографа Гранта МакКрекена проанализировать плотные данные. И он выяснил нечто, чего не было видно изначально в количественных данных. Он обнаружил, что люди любят «приклеиваться» к телевизору. Люди даже своей вины за это не чувствуют. Они балдеют от этого.

Поэтому Netflix такой: «Это что-то новенькое». Поэтому они пошли к своим обработчикам данных, где смогли свести этот вывод из плотных данных со своими количественными данными. Стоило им сверить и утвердить их, как в Netflix решили сделать кое-что простое, но эффективное. Они сказали: «Вместо того, чтобы предлагать все те же разножанровые сериалы или чаще показывать разные сериалы для одной категории пользователей, мы просто будем больше показывать один и тот же сериал. Облегчим им прилипание к телевизору». И на этом они не остановились. Они сделали все, чтобы изменить всю практику трансляций, чтобы еще сильнее притянуть людей к телевизору. Поэтому люди и друзья разом исчезают на все выходные, боясь пропустить сериал вроде «Мастера не на все руки». Сведя вместе большие и плотные данные, они не только улучшили свой бизнес, но также изменили процесс потребления людьми медиа-информации. Ожидается, что их акции вырастут вдвое в следующие несколько лет.

Но дело не только в том, чтобы больше смотреть телевизор или продавать больше смартфонов. Для некоторых привлечение плотных данных в алгоритм — это дело жизни и смерти, особенно для тех, чье положение шатко. По всей стране полиция использует большие данные для прогнозирования своей работы, чтобы установить размер залога и рекомендовать меру пресечения, и это только усиливает существующую дискриминацию. Алгоритм машинного обучения АНБ США — Skynet — вероятно, поспособствовал смертям тысяч жителей Пакистана из-за неправильного прочтения метаданных с мобильного устройства. По мере того, как наша жизнь все больше автоматизируется, от автомобилей до медицинской страховки или устройства на работу, скорее всего, мы все будем склоняться к подсчету количества.

Сегодня хорошая новость в том, что прошло много времени с тех пор, когда для предсказаний нужно было дышать этиленом. У нас есть способы получше, и их можно еще улучшить. Давайте совмещать большие данные с плотными. Давайте сведем жрецов храма с провидицей, и если провести эту работу в коммерческих или некоммерческих организациях, или в правительстве, или даже в программном обеспечении, все это будет иметь смысл, потому что это будет значить, что мы действуем сообща ради больших данных, лучших алгоритмов, лучших результатов и лучших решений. Так мы ничего не потеряем.

Перевод: Ольга Груздь
Редактор: Наталия Ост

Источник

Лекции

Триша Уонг: Большим данным не достает данных от людей

Пол Грэм: Правильная настойчивость творит волшебство

«Нам нужен принцип планетарной субсидиарности, а не глобальное управление»

Волновые маркеры: как мозг отмечает то, что нужно запомнить