Как достичь эффекта снежного кома с помощью больших данных

Почему сетевой эффект дает преимущество не всегда и не всем

Статья, опубликованная в журнале «Гарвард Бизнес Ревью Россия»

Андрей Хагиу Джулиан Райт

18 марта 2020

Как достичь эффекта снежного кома с помощью больших данных

Keith Negley

читайте также

Многие топ-менеджеры и инвесторы полагают, что за счет использования клиентских данных компания может обеспечить себе неоспоримое конкурентное преимущество. Чем больше у вас клиентов, тем больше данных вы можете собрать и проанализировать средствами искусственного интеллекта, чтобы улучшить свой продукт и привлечь новых клиентов. Затем можно получить еще больше данных — и в конце концов оттеснить конкурентов, аналогично тому, как другим компаниям это удается благодаря мощным сетевым эффектам. По крайней мере, многие рассуждают именно так. Однако чаще всего этот расчет оказывается ложным. В большинстве случаев люди сильно переоценивают преимущества, которые могут обеспечить данные.

Обучение на данных запускает цикл положительных эффектов, по принципу действия напоминающих сетевые эффекты: чем больше людей пользуется вашим продуктом (например, социальной сетью), тем выше его ценность; в какой-то момент накапливается критическая масса пользователей, которая позволяет вам выбить конкурентов из игры. Однако на практике обычные сетевые эффекты действуют дольше и сильнее. Чтобы получить надежное конкурентное преимущество, необходимы и сетевые эффекты, и обучение на данных. Увы, немногим компаниям по силам развиваться в обоих направлениях. Впрочем, при определенных условиях данные, генерируемые пользователями, помогут вам выстроить надежную защиту от конкурентов даже в отсутствие сетевых эффектов. В этой статье мы расскажем, какими должны быть эти условия и как определить, применимы ли они к вашему бизнесу.

ЧТО ИЗМЕНИЛОСЬ?

Компании, работа которых основывается на данных, существуют давно: вспомним хотя бы бюро кредитных историй и информационные агрегаторы вроде LexisNexis, Thomson Reuters и Bloomberg. Войти в их круг нелегко: все они используют огромные массивы накопленных и структурированных данных. При этом их бизнес-модель не предполагает сбора информации от клиентов и использования ее с целью улучшить коммерческое предложение.

Сбор и использование клиентских данных для совершенствования продуктов и услуг — старый прием, но раньше этот процесс носил ограниченный характер, был медленным и с трудом подвергался масштабированию. Производители автомобилей, потребительских товаров и прочей традиционной продукции анализировали данные о продажах, опрашивали клиентов и собирали фокус-группы. Но данные о продажах ничего не говорили о конкретных потребителях, а опросы и фокус-группы обходились дорого, отнимали много времени и при этом позволяли получить сведения лишь о небольшом числе клиентов.

Все коренным образом изменилось с появлением облачных и других новых технологий, позволяющих быстро обрабатывать и осмыслять гигантские массивы данных. Сегодня подключенные к интернету продукты и сервисы могут напрямую собирать информацию о пользователях, в том числе личные данные, поисковые запросы, предпочтения в выборе контента, модели общения, публикации в соцсетях, передвижения и особенности использования продуктов. Проанализировав этот «цифровой выхлоп» с помощью алгоритмов машинного обучения, компания может автоматически скорректировать или даже персонализировать предложение.

Благодаря этим технологиям обучение на данных оказывается намного эффективнее, чем традиционные способы получения знаний о клиентах. Однако все это не гарантирует вам победы над конкурентами.

КАК ОБУЧЕНИЕ НА ДАННЫХ ПОМОЖЕТ ЗАЩИТИТЬСЯ ОТ КОНКУРЕНТОВ

Чтобы определить, насколько надежное конкурентное преимущество может получить компания от обучения на данных, нужно ответить на семь вопросов.

1. Насколько клиентские данные повышают ценность предложения? Чем больше дополнительная ценность, тем выше шанс, что она обеспечит долгосрочное преимущество. Рассмотрим компанию, для которой эта ценность весьма велика. Mobileye — ведущий поставщик современных систем помощи водителю (ADAS), среди прочего предупреждающих о риске аварии и смене полосы движения. Компания продает эти системы в основном автопроизводителям, которые тщательно тестируют их перед внедрением в свою продукцию. Система должна работать безотказно, а тестовые данные необходимы для повышения ее точности. Собрав информацию от десятков клиентов, Mobileye повысила точность ADAS до 99,99%.

А вот производители умных телевизоров получают от обучения на клиентских данных сравнительно небольшую выгоду. Некоторые из них устанавливают на свои телевизоры программы, предлагающие пользователям телепередачи и фильмы с учетом их личных предпочтений или популярности среди других зрителей. Но пока потребителей мало интересует эта функция (ее также предлагают поставщики потокового видео, такие как Amazon и Netflix). Выбирая телевизор, люди чаще ориентируются на размер экрана, качество изображения, удобство использования и надежность. Если бы обучение на клиентских данных играло здесь бóльшую роль, рынок умных телевизоров, вероятно, был бы менее конкурентным.

2. Как быстро снижается маржинальная ценность обучения на данных? Иными словами, как быстро компания достигает точки, после которой дополнительные клиентские данные перестают повышать ценность предложения? Чем медленнее снижается маржинальная ценность, тем лучше вы защищены от конкурентов. Помните: отвечая на этот вопрос, ценность обучения следует определять по готовности потребителей платить, а не по таким узким критериям, как, например, процент вопросов, на которые правильно отвечает ваш чат-бот, или доля рекомендаций фильмов, которыми воспользовался клиент.

Предположим, вы построили график точности ADAS производства Mobileye как функции от использования этой системы людьми (общего числа миль, которое проехали тестировщики от автопроизводителей) и выяснили, что для повышения точности до 90% достаточно нескольких автопроизводителей и среднего количества тестов, а вот для достижения точности 99% (не говоря уже о 99,99%) понадобится значительно больше компаний и тестов. Конечно, это не означает, что маржинальная ценность обучения на данных здесь быстро снижается: в данном случае ценность дополнительных девяти (и даже 0,99) процентных пунктов весьма высока, ведь речь идет о вопросах жизни и смерти. Какому-то отдельному автопроизводителю, даже самому крупному, было бы трудно самостоятельно сгенерировать нужный объем данных, а потенциальным конкурентам Mobileye — воспроизвести эти данные. Вот почему Mobileye удалось занять доминирующее положение на рынке ADAS и привлечь внимание Intel, которая в 2017 году купила ее за $15 млрд.

Если маржинальная ценность обучения на данных остается высокой даже после привлечения очень большой клиентской базы, продукты и услуги, как правило, обладают надежным конкурентным преимуществом. Это можно наблюдать на примере систем прогнозирования редких заболеваний (например, разработки RDMD) и поисковых движков (Baidu и Google). Несмотря на то, что Microsoft потратила на разработку поисковика Bing много лет и миллиарды долларов, в этой сфере ей не удалось свергнуть с пьедестала Google. Для стабильной выдачи релевантных результатов поисковым системам и решениям для прогнозирования болезней нужны колоссальные объемы данных.

Пример обратной ситуации — бизнеса, где маржинальная ценность клиентских данных быстро снижается, — умные термостаты. Этим устройствам достаточно нескольких дней, чтобы изучить температурные предпочтения пользователя в разное время суток. Здесь обучение на данных не дает значимого конкурентного преимущества. Компания Nest (приобретенная Google в 2014 году) выпустила первые умные термостаты, обучающиеся на поведении клиентов, в 2011 году, а сегодня ей приходится конкурировать с такими игроками, как Ecobee и Honeywell.

3. Как быстро данные от пользователей теряют актуальность? Если данные быстро устаревают, то при прочих равных условиях новичку проще выйти на рынок: ему не придется проходить долгий путь обучения на данных, чтобы догнать ветеранов.

Все данные, полученные Mobileye от автопроизводителей за долгие годы, остаются актуальными и для новых версий ее продуктов. То же можно сказать и о пользовательских данных, накопленных Google за десятилетия работы поисковика. Конечно, со временем какие-то запросы люди стали делать реже, а какие-то чаще, но огромные массивы поисковых данных из прошлого и сегодня обладают неоспоримой ценностью для выполнения запросов. Низкий коэффициент «амортизации» данных объясняет устойчивость бизнеса Mobileye и поисковика Google.

А вот в случае с казуальными социальными играми для ПК и мобильных устройств ценность обучения на данных, как правило, быстро снижается. В 2009 году Zynga взорвала этот рынок суперуспешной игрой FarmVille. Но несмотря на то, что компания славилась умением выстраивать дизайн на основе аналитики пользовательских данных, оказалось, что выводы, сделанные для одной игры, плохо применимы к другим. Дело в том, что этот жанр игр очень подвержен влиянию моды, предпочтения людей быстро меняются и получить от данных надежное преимущество почти невозможно. После череды успешных продуктов, включая FarmVille 2 и CityVille, Zynga перестала выпускать новые хиты и к 2013 году потеряла почти половину клиентов. Ее потеснили Supercell с игрой Clash of Clans и Epic Games с Fortnite. Рыночная стоимость Zynga, достигнув в 2012 году пика в $10,4 млрд, в последующие шесть лет редко поднималась до $4 млрд.

4. Являются ли данные проприетарными (то есть такими, которые нельзя получить из других источников, легко скопировать или воспроизвести)? Чтобы создать преимущество, которое защитит вас от конкурентов, ваши клиентские данные практически не должны иметь аналогов. Рассмотрим Adaviv — бостонский стартап, в который мы инвестировали. Он предлагает систему управления урожаем, позволяющую фермерам (сейчас — в основном выращивающим марихуану) постоянно следить за каждым растением. Система задействует искусственный интеллект, компьютерное зрение и проприетарную технологию аннотирования данных, чтобы отслеживать незаметные человеческому глазу биометрические характеристики растений, например ранние признаки болезней или недостатка питательных веществ. Эти данные конвертируются в аналитические выкладки, на основе которых фермер может предотвращать заболевания и повышать урожайность. Чем больше фермеров использует систему Adaviv, тем о более широком диапазоне вариантов, агрономических условий и других факторов узнает эта система и тем более точные прогнозы дает старым и новым клиентам. Сравните эту ситуацию с положением дел у поставщиков спам-фильтров, которые могут приобретать пользовательские данные за относительно небольшие деньги. Отчасти поэтому существует множество таких поставщиков.

Важно помнить, что технологический прогресс может поколебать ваши позиции, достигнутые благодаря уникальным или проприетарным данным. Это произошло, например, с программами распознавания речи. Когда-то пользователям приходилось обучать ПО понимать их голос и манеру речи: чем больше вы работали с программой, тем точнее был результат. Многие годы на этом рынке доминировало решение Dragon от компании Nuance. Однако в последние десять лет активно совершенствовались системы, не нуждающиеся в индивидуальной настройке: они обучаются на общедоступных массивах речевых данных, после чего сразу (или почти сразу) способны распознавать новый голос. Такой прогресс позволил целому ряду компаний создать новые решения для распознавания голоса в разных ситуациях (автоматизированное обслуживание клиентов по телефону, протоколирование совещаний, виртуальные помощники), и теперь эти фирмы постепенно вытесняют Nuance с ключевых рынков.

5. Насколько трудно скопировать усовершенствования продукта, основанные на пользовательских данных? Даже если ваши данные уникальны, проприетарны и конвертируются в ценную аналитику, будет непросто создать на их основе надежное конкурентное преимущество, если соперники смогут скопировать ваши усовершенствования, не располагая такими данными.

Удастся ли вам решить эту проблему? Это зависит от двух факторов. Первый — насколько глубоко усовершенствования встроены в сложный производственный процесс или скрыты в нем, чтобы их трудно было воспроизвести. Так работает служба потоковой передачи музыки Pandora. Ее предложение основано на проприетарном решении Music Genome Project, которое классифицирует миллионы песен примерно по 450 параметрам, позволяя Pandora точно подстраивать радиотрансляцию под предпочтения слушателя. Чем больше пользователь слушает музыку и оценивает ее (положительно или отрицательно), тем лучше Pandora выбирает подходящие для него треки. Такую персонализацию невозможно быстро скопировать: она привязана к Music Genome Project. И наоборот: усовершенствования, основанные на данных об использовании клиентами различного офисного ПО (например, Calendly для координации календарей или Doodle для согласования времени встреч), довольно легко подсмотреть и скопировать. Именно поэтому десятки компаний предлагают подобные решения.

Второй фактор — насколько быстро устаревают аналитические выводы, извлекаемые из пользовательских данных. Чем быстрее это происходит, тем труднее воспроизвести эту аналитику. Например, многие функции Google Maps довольно легко скопировать (как это сделали Apple Maps и другие), но главная ценность этих карт заключается в том, что они могут прогнозировать уличный трафик и рекомендовать оптимальный маршрут. А эту функцию скопировать значительно сложнее: ведь она требует анализа в реальном времени мгновенно устаревающих данных от пользователей. Воспроизвести ее по силам только компаниям со столь же крупной клиентской базой (в США это Apple). Apple Maps догоняют Google Maps на американском рынке — но не в тех странах, где у Apple относительно немного пользователей.

6. Данные от одного человека улучшают продукт для него или для других пользователей? В идеале, конечно, должно происходить и то и другое — но важно понимать разницу между этими вариантами. Если данные от клиента помогают совершенствовать продукт для него самого, фирма может все больше персонализировать предложение, повышая потенциальные издержки клиента от перехода к другому поставщику. Если же данные улучшают продукт для других пользователей, это может (хотя не всегда) порождать сетевые эффекты. Оба варианта осложняют конкурентам выход на рынок, но если в первом случае акцент делается на удержании нынешних клиентов, то во втором преимущество достигается за счет привлечения новых.

Так, Pandora была первым крупным игроком в сфере потокового воспроизведения музыки, но затем она уступила Spotify и Apple Music, которые по-прежнему продолжают расти. Как уже говорилось, главное преимущество Pandora — в умении учитывать индивидуальные вкусы людей. Но это умение не помогает ей лучше понимать других пользователей: на основе оценок от конкретного человека она выявляет свойства музыки, которая ему нравится, и предлагает новую с теми же свойствами. Spotify же сосредоточилась на функциях обмена музыкой и знакомства с новыми произведениями: пользователи могут находить и слушать то, что нравится другим. Так возникают прямые сетевые эффекты, привлекающие новых клиентов. Сервис Pandora до сих пор доступен лишь в США (где у него сформировалась база лояльных пользователей), в то время как Spotify и Apple Music вышли на глобальный рынок. И если Pandora в феврале 2019 года была куплена Sirius XM за $3,5 млрд, Spotify еще в апреле 2018 года стала публичной, а в ноябре 2019-го оценивалась в $26 млрд. Персонализация на основе данных от конкретных пользователей, конечно, повышает лояльность существующих клиентов — но не ведет к экспоненциальному росту, который способны порождать сетевые эффекты.

7. Как быстро можно внедрить в продукты знания, полученные в результате анализа пользовательских данных? Если в компании отлажены циклы быстрого обучения, конкурентам будет трудно ее догнать — особенно если за время работы с одним клиентом проходит несколько таких циклов. Но если для усовершенствования требуется несколько лет работы или несколько поколений продукта, у соперников больше шансов создать свои инновации и начать сбор клиентских данных. Поэтому конкурентное преимущество от таких данных сильнее там, где обучение на данных от нынешних клиентов гарантирует частые улучшения для них самих, а не для будущих пользователей. Сразу несколько из упомянутых выше продуктов — карты, поисковики, системы управления урожаем на базе ИИ — способны быстро обновляться с учетом знаний, полученных от существующих клиентов.

Пример обратной ситуации — онлайн-кредиторы, такие как LendUp и LendingPoint. Они совершенствуют процедуры принятия решений о выдаче займов, изучая кредитные истории клиентов и их корреляцию с разными особенностями их биографии и поведения. Здесь решения по новым заемщикам могут приниматься только на основе данных о прежних получателях кредитов (отраженных в договорах и ставках). Даже если кредитор получит множество новых данных, на уже заключенные договоры это никак не повлияет. Поэтому для человека, выбирающего кредитный сервис, не имеет значения, сколько еще клиентов им пользуется. Люди, уже бравшие займы, часто обращаются за новыми к своим прежним кредиторам, ведь те знают их лучше; однако конкуренция за новых заемщиков весьма велика.

МОГУТ ЛИ ДАННЫЕ ПОРОЖДАТЬ СЕТЕВЫЕ ЭФФЕКТЫ?

Ответы на шестой и седьмой вопросы помогут понять, вызовет ли обучение на данных сетевые эффекты. Если знания, полученные от обучения на данных одного пользователя, позволяют улучшить опыт других и могут быть внедрены в продукт достаточно быстро, чтобы принести пользу нынешним пользователям, клиенты будут заинтересованы в том, чтобы решением пользовалось больше людей. Здесь работает почти тот же механизм, что и в случае с сетевыми эффектами онлайн-платформ. Разница лишь в том, что пользователи платформ выбирают более крупные сети, чтобы общаться с бóльшим числом людей, а не потому, что огромное число пользователей генерирует какие-то ценные данные, улучшающие продукт.

Вернемся к Google Maps. Водители используют эти карты отчасти потому, что понимают: в ту же минуту ими пользуется множество их коллег, и чем больше данных об уличном трафике соберет программа, тем точнее будут прогнозы дорожных условий и времени в пути. Поисковик Google и система управления урожаем на базе ИИ Adaviv также получают от пользовательских данных сетевые эффекты.

Как и обычные сетевые эффекты, эффекты на основе данных могут оградить вас от конкурентов. Оба типа эффектов связаны с серьезной проблемой первичного накопления ресурсов: чтобы запустить обычные сетевые эффекты, необходимо привлечь некое минимальное число пользователей; а если вы хотите добиться эффектов на основе данных, придется накопить минимальный массив информации, чтобы запустить цикл обучения.

При всем сходстве двух типов сетевых эффектов между ними есть и важные различия, из-за которых преимущества, основанные на обычных сетевых эффектах, оказываются более надежными. Во-первых, накопить ресурсы для запуска сетевых эффектов на основе данных обычно проще: ведь купить данные легче, чем привлечь клиентов. Даже несовершенные альтернативные источники данных зачастую помогают уравнять шансы, что снимает необходимость в большой клиентской базе.

Во-вторых, чтобы достичь устойчивых сетевых эффектов на основе данных, необходимо постоянно анализировать пользовательскую информацию и извлекать из нее новые знания. А теперь вспомним слова Скотта Кука, сооснователя Intuit: «Продукты, работающие за счет [обычных] сетевых эффектов, улучшаются, даже когда я сплю». В случае с этим типом сетевых эффектов взаимодействие клиентов между собой (и, возможно, со сторонними поставщиками дополнительных решений) само по себе порождает ценность, даже когда платформа прекращает инновации. Даже если какая-нибудь новая соцсеть предложит пользователям объективно лучшие условия, чем Facebook* (скажем, лучшую защиту конфиденциальности), ей придется противостоять мощным сетевым эффектам Facebook*: ведь все хотят пользоваться той платформой, где больше других людей.

В-третьих, во многих случаях почти все преимущества обучения на клиентских данных можно получить от сравнительно небольшого числа пользователей. А в некоторых отраслях (таких, как распознавание речи) активное развитие ИИ может снизить потребность в клиентских данных до уровня, когда ценность обучения на них будет практически нулевой. При этом обычные сетевые эффекты простираются дальше и более устойчивы: новый клиент продолжает увеличивать ценность решения для существующих клиентов (которые могут с ним взаимодействовать), даже если число имеющихся пользователей и без того очень велико.

По мере того, как умными и подключенными становятся самые простые потребительские товары — сегодня уже есть одежда, реагирующая на изменения погоды, отслеживающая пройденный маршрут и жизненные показатели человека, — обучение на данных помогает улучшать и персонализировать все больше рыночных предложений. Однако поставщики этих решений не смогут обеспечить себе надежные конкурентные преимущества, если ценность, генерируемая данными, не будет достаточно высокой и устойчивой, если данные не будут проприетарными, а порождаемые ими улучшения — сложными для копирования, и если обучение на данных не будет порождать сетевые эффекты.

В ближайшие десятилетия улучшение товаров и услуг на основе клиентских данных станет необходимым фактором выживания на рынке и будет давать старожилам преимущество перед новичками. Однако в большинстве случаев эти данные не помогут добиться тотального доминирования. В ближайшем будущем самыми дорогими и влиятельными компаниями будут те, которые сделают ставку на обычных сетевых эффектах, а обучение на данных станет для них дополнительным подспорьем. Так работают маркетплейсы Alibaba и Amazon, App Store от Apple и соцсеть Facebook*.

Об авторах

Андрей Хагиу (Andrei Hagiu) — доцент по информационным системам Школы бизнеса Квестрома при Бостонском университете.

Джулиан Райт (Julian Wright) — профессор экономики в Национальном университете Сингапура.

* деятельность на территории РФ запрещена

Как достичь эффекта снежного кома с помощью больших данных

Эмоциональный ИИ

Руководство для переговорщиков в эпоху социальных сетей

Найти оптимальный темп запуска продукции

Что год грядущий нам готовит

«Идеи для лидера»: революция аутсайдеров и новая роль директора по персоналу

Когда люди слушают радостную музыку, рынок глядит веселее