Технологии
Статья, опубликованная в журнале «Гарвард Бизнес Ревью Россия»

Как алгоритмы могут победить эпидемию коронавируса (и не только ее)

Антон Овчинников , Дэвид Хардун , Теос Евгениу
Фото: Orbon Alija/Getty Images

Уже почти полгода в мире то тут, то там возникают вспышки Covid-19. В целом они развиваются по одному сценарию: начальный этап с небольшим количеством зараженных и ограниченными ответными мерами сменяется резким подъемом пресловутой эпидемической кривой — и страна закрывается на карантин, чтобы спрямить эту кривую. Затем, когда кривая достигает пика, правительствам приходится принимать решение, которое президент Трамп назвал самым важным в его жизни, — когда и как снимать ограничения.

Во время пандемии все понимают, что каждая страна (особенно Китай) должна делиться с другим информацией о распространении болезни. Если государство не делится такой информацией, на это тоже обращают внимание. А вот о том, что справиться с Covid-19 было бы легче с помощью продвинутых технологий обработки данных, которые преобразили множество компаний за последние двадцать лет, говорят относительно мало. В этой статье мы рассказываем, как правительства могут заставить эти технологии бороться с грядущими пандемиями — и, возможно, даже с текущей, на ее финальных стадиях.

Могущество персонализированного прогноза

В инструментарий по борьбе с Covid-19 политикам стоит внести подход, основанный на персонализированных прогнозах, который преобразил многие отрасли за последние 20 лет. Используя машинное обучение и искусственный интеллект (ИИ), фирмы, специализирующиеся на обработке большого массива данных (от технологических гигантов до финансовых, туристических, страховых компаний и СМИ), советуют клиентам, что купить, и разрабатывают для них индивидуальные предложения в области ценообразования, управления рисками, кредитования и т. д., опираясь на собранные ими данные о потребителях.

В недавней статье в HBR Мин Цзэн, бывший директор по стратегии Alibaba, описал, как Ant Financial (подразделение его компании, специализирующееся на кредитовании малого бизнеса), может в реальном времени оценивать кредитоспособность претендентов на ссуды, анализируя данные об их сделках, заключенных на коммерческих платформах Alibaba, и сопутствующей переписке. А такие компании, как Netflix, оценивают предпочтения и другие характеристики потребителей, чтобы предсказать, что они захотят посмотреть дальше.

Этот подход может сработать и для борьбы с пандемией — и даже оказать влияние на течение Covid-19. Используя множество источников данных, можно было бы с помощью моделей машинного обучения оценивать, насколько для каждого человека велик клинический риск тяжело заболеть в случае заражения Covid-19. Какова возможность, что ему понадобится реанимация, доступ к которой ограничен? Какова вероятность, что человек умрет? Данные могут включать в себя базовый анамнез людей (в случае с Covid-19 тяжесть симптомов, по-видимому, нарастает с возрастом и при наличии сопутствующих диагнозов, таких как диабет или гипертония) и другие сведения вроде состава семьи. Например, молодой, здоровый человек (которого в противном случае отнесли бы к группе «Низкий риск») может попасть в группу «Высокий риск», если он живет с пожилыми или болезненными людьми, которым с высокой вероятностью понадобится реанимация в случае заражения.

Этот прогноз можно затем использовать для тонкой настройки ограничительной политики и распределения ресурсов на уровне отдельных людей и домохозяйств с учетом стандартных склонностей к заболеваниям и медицинских рисков. Это позволит в частности целенаправленно вводить социальное дистанцирование и прочие защитные меры только для тех, кто наберет много баллов при оценке клинического риска, а тем, у кого окажется мало баллов, разрешить жить более или менее нормально. Критерии для распределения населения по группам высокого и низкого риска, конечно, нужно разработать, принимая во внимание доступные ресурсы и компромиссы, связанные с угрозой осложнений и прочими рисками. Однако подходы к обработке данных, которые потребуются для этого, стандартны и используются в самых разных целях.

У персонализированного подхода множество преимуществ. Он может способствовать созданию группового иммунитета и одновременному снижению смертности — притом быстрому. Он также позволит быстрее и справедливее распределять ресурсы, например, редкое медицинское оборудование (вроде наборов для тестирования, защитных масок и больничных коек).

Эти преимущества распространяются и на стратегию снятия ограничений на более поздних стадиях пандемии — следующую ключевую меру по борьбе с Covid-19 для большинства стран. Вопрос, с каких людей начать снятие ограничений, по природе своей — задача классификации, знакомая большинству фирм, специализирующихся на обработке данных. Некоторые правительства уже назначают условия отмены ограничительных мер, ориентируясь на возраст как индикатор риска. Это относительно грубая классификация, которая позволяет упустить из виду других входящих в группу риска — например, упомянутых выше молодых людей, живущих с пожилыми.

Классифицируя людей на основе большого массива данных и с использованием моделей составления прогнозов, основанных на ИИ, можно подготовить почву для решений по поводу ограничительных мер, более безопасных на общественном уровне и гораздо менее затратных для каждого человека и экономики страны. Мы знаем, что ключевые черты Covid-19 — исключительно высокая заразность, относительно слабая выраженность опасных симптомов и низкая смертность. По имеющимся данным, более 90% зараженных переносят заболевание бессимптомно или с легкими симптомами.

Теоретически при наличии надежного прогноза относительно того, кто именно относится к этим 90%, мы можем снять ограничения со всех этих людей. Даже если они заразят друг друга, у них не будет тяжелых симптомов. Они не перегрузят систему здравоохранения и не умрут. Эти освобожденные от ограничительных мер 90% человечества с низким клиническим риском также могли бы помочь быстро сформировать групповой иммунитет, после чего ограничения сняли бы и с остальных 10%.

Если бы прогноз не оправдался, последствия коснулись бы только «самых защищенных» людей, раньше всех освобожденных от ограничений. Их можно было бы вылечить с использованием доступных медицинских ресурсов, не перегруженных лечением оставшихся 10 или более процентов людей, подверженных высоком риску осложнений, которые находились бы в самоизоляции. Конечно, на практике мы снимали бы ограничительные меры более постепенно, начиная с группы людей, для которой клинический риск минимален, и со временем создавая групповой иммунитет.

Разумеется, у нас нет идеальных моделей прогнозирования клинического риска, точно так же, как нет идеальных систем сортировки пациентов в больницах или моделей прогнозирования риска невозврата кредита. Однако это не мешает банкам кредитовать множество компаний и людей, которые, при наличии достаточно хороших инструментов оценки заемщиков, как правило, выплачивают кредиты. Разумеется, в данном случае ставки существенно выше, чем при невыплате ссуды, поэтому нужно сделать модели как можно более достоверными. Но это не означает, что их нельзя использовать.

В отличие от тестов, которые дорого стоят и медленно работают (и их не так много), этот подход к назначению и отмене защитных мер, основанный на цифровой персонализации с опорой на клинические данные, позволяет работать быстро и удобен для масштабирования. При наличии правильных моделей он может позволить разработать процесс снятия ограничительных мер, который будет быстрее и безопаснее нынешних передовых практик по борьбе с Covid-19, основанных на схеме «анализ-отслеживание контактов-изоляция», подразумевающей, что зараженные и контактировавшие с ними остаются на карантине, даже если риск тяжелых симптомов у них невысок.

Как получить нужные данные

Полная версия статьи доступна подписчикам на сайте