читайте также
В 2012 году HBR назвал работу специалистов по обработке и анализу данных «самой привлекательной работой XXI века». Можно сказать, что она является и самой загадочной. Чтобы взять на имеющиеся вакансии подходящих людей, важно различать типы специалистов по работе с данными. Конечно, у них существует множество отличительных особенностей, поэтому любые попытки классифицировать специалистов по анализу данных ведут к излишнему упрощению. Тем не менее, мне кажется полезным провести различия, опираясь на результаты их труда. Первый тип специалистов создает рекомендации по стратегическому управлению и производству, которыми пользуются люди. Это специалисты в области решений. Второй тип создает модели, данные для обучения и алгоритмы, которые используют машины. Это специалисты в области моделей.
Анализ и обработка данных для людей. Результатами труда специалистов по данным пользуются лица, ответственные за принятие решений, например, руководители, менеджеры по продукту, дизайнеры или врачи. Им необходимо делать выводы на основе данных, чтобы принимать решения о том, какой контент лицензировать, с какими потенциальными покупателями работать, какое лекарство не вызовет аллергическую реакцию, какой дизайн веб-страницы повысит вовлеченность или число покупок, какая рекламная рассылка принесет большую прибыль или какой элемент пользовательского опыта требует доработки. Специалисты этого типа разрабатывают и внедряют измерительные инструменты, проводят и анализируют эксперименты, создают панели индикаторов, устанавливают причинные связи и дают рекомендации, опираясь на модели и измерения.
Анализ и обработка данных для машин. Результаты труда специалистов (данные для обучения, модели и алгоритмы) используют компьютеры. Например, это могут быть рекомендательные системы, подсказывающие, какая рубашка понравится клиенту или какое лекарство выписать пациенту, в основе которых лежит функция, минимизирующая количество кликов или случаев повторной госпитализации. В зависимости от навыков специалистов этого типа их наработки могут или применяться напрямую, или служить прототипами, которые реализуют, оптимизируют и масштабируют разработчики ПО.
Специалисты по анализу данных широкого профиля существуют, но их довольно трудно найти. В большинстве организаций имеет смысл специализироваться на одном из типов работы. Впрочем, эти сотрудники отличаются любопытством и преуспевают, когда имеют возможность попробовать себя в разных сферах. Предоставив специалистам по данным такую возможность, вы принесете пользу и им, и компании. (В справке ниже можно прочитать подробнее о том, что два типа специалистов по анализу данных отличаются не только навыками и выполняемой работой, но и партнерами по работе и критериями успеха).
СПЕЦИАЛИСТЫ В ОБЛАСТИ РЕШЕНИЙ И СПЕЦИАЛИСТЫ В ОБЛАСТИ МОДЕЛЕЙ
Кто пользуется результатами трудаСпециалисты в области решений: люди.
Специалисты в области моделей: машины.
Что является результатом труда
Специалисты в области решений: панели индикаторов; презентации; памятки; новые метрики; модели прогнозирования, помогающие принимать решения; анализ возможностей, помогающий определить, во что инвестировать, или установить приоритеты; отчеты о результатах экспериментов и рекомендации.
Специалисты в области моделей: модели; данные для обучения; алгоритмы.
Каковы критерии успеха
Специалисты в области решений: более совершенный процесс принятия решений в организации.
Специалисты в области моделей: усовершенствованный продукт или бизнес в результате разработанного и внедренного кода.
Примеры
Специалисты в области решений: решения о том, какой контент лицензировать, с какими потенциальными покупателями работать, какое лекарство не вызовет аллергическую реакцию, какой дизайн веб-страницы повысит вовлеченность или число покупок, какая рекламная рассылка принесет большую прибыль или какой элемент пользовательского опыта требует доработки.
Специалисты в области моделей: рекомендательные системы, подсказывающие, какая рубашка понравится клиенту или какое лекарство выписать пациенту, в основе которых лежит функция, минимизирующая количество кликов или случаев повторной госпитализации.
Какие навыки требуются
Специалисты в области решений: статистический анализ, проведение экспериментов, аналитическое мышление, навыки коммуникации и сотрудничества для работы с техническими и нетехническими партнерами, знание языков сценариев и запросов (например, Python, R, SQL), также желательно образование в области информатики.
Специалисты в области моделей: информатика, машинное обучение, навыки написания кода, навыки коммуникации для работы с техническими и нетехническими партнерами.
Кто их основные партнеры по работе
Специалисты в области решений: лица, ответственные за принятие решений (руководители, бизнес-лидеры, менеджеры по продукту), специалисты по инжинирингу данных, разработчики ПО, отвечающие за приложения, генерирующие данные.
Специалисты в области моделей: back-end разработчики, менеджеры по продукту (чтобы определить, для чего оптимизировать тот или иной продукт), другие специалисты в области моделей (чтобы делиться методами работы), специалисты в области решений (для обсуждения необходимых свойств и используемых баз данных).
Более детальный взгляд на работу с данными
При более масштабной и сложной работе с данными требуются более узкие специалисты. Ниже представлены пять основных сфер, связанных с обработкой и анализом данных. В маленьких организациях один человек может отвечать сразу за несколько из них. В компаниях побольше в каждой сфере может работать один или несколько человек. В крупных организациях за каждую сферу отвечает отдельная команда. Эти направления включают создание, хранение и использование данных и дополняют функции специалистов, описанных выше (специалистов в области решений и моделей).
Инфраструктура данных: получение и обработка данных, обеспечение их доступности, операции с данными, создание рабочей среды для специалистов по данным, например, кластеров Kafka и Hadoop.
Инжиниринг данных: определение схем данных, необходимых для измерения и создания моделей, очистка и агрегирование данных, ETL, управление массивами данных.
Качество данных и управление данными: создание инструментов, процессов, инструкций, обеспечивающих корректность данных, их отслеживание, документирование и стандартизацию. Сюда относятся инструменты для отслеживания происхождения и преобразования данных и обеспечения безопасности данных.
Инжиниринг для анализа данных: помощь специалистам по анализу данных за счет увеличения масштаба исследований с применением аналитических приложений для внутреннего использования (например, библиотеки аналитического ПО, рабочих процессов и аналитических микросервисов).
Управление продуктами обработки и анализа данных: создание продуктов, которые могут использовать внутренние клиенты в своих рабочих процессах, чтобы интегрировать находки специалистов по данным. Примеры: портал для публикации результатов A/B тестов, инструмент анализа ошибок, панель индикаторов для самодиагностики причин изменений в показателях или работе модели.
Кого нанимать
Какого типа специалистов по работе с данными следует нанимать? Чтобы ответить на этот вопрос, сначала решите, на каком этапе работы с данными вы находитесь, и затем спросите себя, насколько важны данные для вашего продукта. Если у вас небольшая организация, только начинающая работу и нанимающая первого специалиста по работе с данными, постарайтесь пригласить человека, который сможет взять на себя как можно больше функций — того самого неуловимого специалиста широкого профиля. Если организация сравнительно крупная или не первый день работает с данными, ответ в большей степени будет зависеть от того, насколько необходимы вашему продукту данные. Если его производство с самого начала зависит от машинного обучения, вам понадобится специалист или руководитель с опытом в области машинного обучения. Если же вы хотите выявить возможности для разработки новых продуктов или усовершенствовать процесс принятия решений в организации, вам понадобится специалист, имеющий опыт в области решений, описательной и прогнозной аналитики, статистики, а также способный объяснить руководству и партнерам без технических знаний, как лучше использовать данные.
И, наконец, если у вас нет внутренних данных в разумном и подходящем для использования формате, вам понадобится специалист с образованием в области инжиниринга или информатики, который, прежде чем начать свою работу, объяснит вашим разработчикам, какие данные следует собирать и как это делать.
Как организовать работу
Много уже было написано о том, как организовать отдел по работе с данными. Возможно, главное правило звучит так: если анализ данных имеет важное стратегическое значение для организации, начальник отдела должен докладывать о результатах непосредственно CEO. Или, по крайней мере, руководителю, который разбирается в стратегии работы с данными и готов инвестировать свое время и ресурсы в функционирование отдела. Для обработки и анализа данных необходимы особые навыки, инструменты, процессы интеграции и культура. Если работа с данными важна для организации, ее лучше не отягощать взаимодействием с частями компании с другой культурой.
Еще один важный вопрос заключается в том, нужно ли включать обработку и анализ данных в другие бизнес-процессы и как это делать. Существуют три основных подхода: 1) одна централизованная команда специалистов по данным; 2) специалисты, распределенные по разным отделам; 3) гибридный подход (централизованная команда, подчиняющаяся одному руководителю, члены которой могут входить в состав различных подразделений). Если ваш отдел обработки и анализа данных не насчитывает несколько сотен сотрудников, то, пожалуй, гибридная модель наиболее эффективна. (Если вы достигли большого масштаба, возможно, имеет смысл применить второй подход, но его используют очень немногие компании).
В гибридной модели централизация системы подчинения позволяет специалистам по работе с данными подниматься по карьерной лестнице и развивать профессиональные навыки, связанные с анализом данных, расти вместе с коллегами и соревноваться с ними, помогать друг другу и обеспечивать распространение лучших методов работы, не находясь в изоляции. (Крайне важно сформировать такую группу коллег: специалистам по работе с данными свойственна любознательность, им нравится расти и учиться друг у друга). Благодаря такой структуре подчинения руководителю легче продвигать внутреннюю мобильность между подразделениями, и взаимное обогащение идеями обычно идет на пользу компании.
Включение же в разные отделы компании позволяет специалистам по данным утвердится в роли экспертов в своей области и построить отношения с коллегами, будучи важными членами команды. Партнерские отношения обеспечивают специалистам по работе с данными необходимый контекст, позволяя им оказывать максимальное воздействие на подразделение, так как они понимают, в каких аспектах его работы следует использовать данные, и как это делать.
Что необходимо специалистам по работе с данными для успеха
Различные типы специалистов по работе с данными могут иметь различную специализацию и обязанности, однако всем им необходимы для успеха несколько вещей. Они нуждаются в партнерах, которые могут помочь им интегрироваться в основные бизнес-процессы и производство. Им необходимы партнеры (например, разработчики приложений и инфраструктуры данных), которые помогут сделать так, чтобы необходимое базовое оборудование для работы с данными и потоки данных были корректными, полными и доступными. Они также нуждаются в лидерах, готовых инвестировать ресурсы в фундаментальные составляющие работы с данными: качество данных, управление данными, визуализацию и платформы доступа, а также культуру, в рамках которой данные считаются частью процесса ведения бизнеса и разработки продуктов. Для этого на работу с данными необходимо выделять необходимое время (его размер часто недооценивают) . Слишком часто команды разработки продуктов и ПО считают, что могут быстро добавить данные и оценку в конце.
И последний совет для тех, кто нанимает специалистов по работе с данными: ищите людей, которые любят решать задачи, а не владеют конкретными решениями или методами, и тех, кто обладает прекрасными способностями к сотрудничеству. Неважно, к какому типу относятся нанимаемые вами специалисты. Чтобы добиться успеха, они должны уметь работать с самыми разнообразными специалистами — от инженеров до менеджеров по продукту, маркетологов и руководителей высшего звена. И, наконец, ищите добросовестных людей. Мы несем ответственность перед обществом за использование данных на его благо. Специалисты по обработке и анализу данных отвечают за управление данными внутри своей организации и за ее пределами.
Об авторе. Яэль Гартен (Yael Garten) — директор отдела Siri Data Science and Engineering в компании Apple.