Кто и как зарабатывает на ваших данных?

Биржи данных — путь в мир информационной синергии, где 1+1 может быть значительно больше, чем 2. И закон этот будет распространяться не только на абстрактные числа, но и на вполне реальные прибыли.

Дмитрий Изместьев

13 июля 2016

читайте также

У меня есть идея, как нашим футболистам победить на Чемпионате мира в 2018 году. Позаимствовал я ее у генерального менеджера бейсбольной команды «Oakland Athletics» Билли Бина. В 2002 году он оказался в безнадежной ситуации — всех лучших игроков Oakland Athletics выкупили другие клубы. Билли должен был заново собрать команду, имея бюджет в три раза меньше, чем раньше. Бин решил отказаться от покупки звезд бейсбола и сделал ставку на выпускника экономического факультета Йельского университета Питера Брэнда, который предложил подобрать игроков с помощью статистического анализа их индивидуальных характеристик.

Команда собралась настолько сильная, что выиграла двадцать матчей подряд. Впоследствии эта история легла в основу фильма Бенетта Миллера «Человек, который изменил все».

Впрочем, Big Data уже несколько лет применяют не только в «эксклюзивных», но и в повседневных бизнес-задачах. Классический пример — модель прогнозирования цен авиабилетов использует 12-тысячную выборку цен за 41 день, собранную на сайтах путешествий, — позволяет пассажирам планировать поездки с учетом изменения стоимости билетов и таким образом экономить.

Маркетинг — далеко не единственная сфера применения больших данных. Так, Yandex Data Factory совместно с компаниями РОКО RUSSCO и «АстраЗенека» создали платформу RAY. Ее задача — обрабатывать десятки гигабайтов информации в поисках мутировавших генов, что поможет врачам-генетикам и молекулярным биологам выявлять предрасположенность к раку и диагностировать эту страшную болезнь на ранней стадии.

Новая ступень развития Big Data — технология Machine Learning (ML). Несколько лет назад одна из крупнейших американских сетей магазинов Target оказалась в центре скандала. Отец двенадцатилетней школьницы подал в суд на компанию за то, что она, якобы перепутав адреса в базе покупателей, стала присылать его дочери рассылки с предложениями и акциями для беременных.

Target уже была готова признать ошибку и публично извиниться перед обиженными покупателями, но неожиданно выяснилось: девочка действительно беременна, правда, ни ее отец на момент жалобы, ни даже она сама не знали об этом. Виной всему оказалось не ошибка, а, напротив, безошибочная работа алгоритмов, анализировавших поведение покупателей на основе массива данных, собранных о них. Программа, делающая прогнозы о предпочтениях покупателей, обнаружила в поведении девочки изменения, характерные для беременных женщин.

Сегодня ML также успешно применяется различными сервисами мобильной аналитики — Amazon Mobile Analytics или Google Cloud Machine Learning. Благодаря ей мы регулярно получаем рекламные рассылки и предложения от самых разных компаний.

Читайте материал по теме: Цифровые бизнес-модели: лучше эволюция, чем революция

Это только видимая часть айсберга использования Machine Learning в бизнесе. На самом деле ML на основе больших данных — первый шаг к искусственному интеллекту. И перспективы на этом пути открываются головокружительные.

Однако пока использование Big Data не стало распространенным явлением.

Во-первых, сказывается дефицит специалистов, умеющих профессионально обрабатывать массивы данных.

Во-вторых, даже с трудом собранной команде аналитиков не с чем работать: данных одной компании для построения моделей и налаживания машинного обучения катастрофически не хватает.

Например, из 100 тыс. имеющихся у вас профилей клиентов пол может быть известен только у 5000. И это серьезная проблема. Ведь абстрактное знание о клиенте не дает возможности «точно в него прицелиться». Из 1000 разосланных вами предложений 800 придут не по адресу. И хорошо, если клиент их просто проигнорирует, а не отправляет письмо в спам.

Сейчас даже телеком-операторы не могут предложить более точные данные о потенциальном потребителе ваших товаров и услуг.

Ждать, пока соберется нужный объем данных, нельзя — этот товар устаревает очень быстро. Совсем другое дело — собрать полезную информацию из разных баз. Как это сделать?

Читайте материал по теме: Как Facebook* защищает данные своих пользователей

Самый простой вариант — с помощью биржи больших данных, стимулирующей компании делиться этими массивами. Эта идея уже несколько лет витает в воздухе, но пока не получила широкого распространения — в основном из-за нежелания делиться накопленной информацией. Как только массивы данных были объявлены ценностью, большинство компаний решило не выпускать их на рынок, а использовать самостоятельно. Кроме того, мало кто представляет принцип работы биржи и понимает, чем она может помочь, и напрасно — ведь она могла бы уже завтра монетизировать имеющиеся у вас данные.

Биржа данных может быть устроена так: компания заходит на биржу и задает конкретный вопрос о своем клиенте типа «Что женщина 50 лет с номером телефона 8 (903) ххх-хх-хх покупает в аптеке раз в неделю?». Если у кого-то такая информация есть, он продает ее вам или обменивает на вашу информацию. Сама биржа не покупает, не продает и не хранит данные. Она выступает в роли посредника, которая эти данные доставляет от одного клиента к другому.

При этом вся информация хранится в облаке и передается в защищенном режиме. Проблем с персональными данными в такой схеме не возникает, поскольку компании продают не персональные данные клиентов, а профили. Понятно, что успех биржи напрямую зависит от количества продавцов и покупателей.

Автор

Дмитрий Изместьев — вице-президент ЛАНИТ по инновационным проектам.

* деятельность на территории РФ запрещена

Кто и как зарабатывает на ваших данных?

Доктор цифровых наук: как COVID-19 трансформировал медицинскую отрасль

«Как» или «почему»: что говорить, представляя инновационную идею

Как связи с властью помогают (и мешают) стартапам

Диалоги. Подражатели против первопроходцев: чья возьмет?

Основатель компании ABBYY о своей неудаче на ниве инноваций

История одного IPO: как компания Google стала публичной