Управление инновациями

«Вчерашние студенты из России умеют проектировать не хуже зарубежных коллег»

Дмитрий Морозов
Фото: предоставлено пресс-службой Biocad

От редакции. Основатель и глава биотехнологической компании Biocad Дмитрий Морозов о том, как сократить сроки проектов с помощью цифровых методов и эджайл-практик.

Фармацевтический бизнес имеет важную особенность: в отличие от других отраслей, у нас очень долгий цикл разработки продуктов. Наш горизонт планирования не менее семи лет, примерно такой срок требуется, чтобы новый лекарственный препарат прошел путь от молекулы до выхода на рынок. Кроме того, нам приходится много инвестировать в исследования — 20—30% годового оборота. За последние четыре года Biocad потратил на НИОКР около 19 млрд руб. Учитывая, что не все проекты выстреливают (у нас и в мире это около 5%), мы должны создавать много заделов. Иными словами, мы варим весь этот исследовательский суп, поддерживаем его, a если что-то сварилось, то в нужный момент вытаскиваем молекулу действующего вещества из портфеля и начинаем ее детальную разработку.

Задача бизнеса — ускорить процесс разработки и сделать его эффективнее, и здесь нам помогают цифровые технологии. На ИT мы сегодня тратим около 5% годового оборота, что сопоставимо с расходами крупных корпораций.

СПРАВКА О КОМПАНИИ

Биотехнологическая компания Biocad была создана в 2001 году, штаб-квартира находится в Санкт-Петербурге. Специализируется на разработке и производстве препаратов для лечения онкологических, аутоиммунных, инфекционных и ряда других заболеваний. В портфеле компании 58 зарегистрированных лекарственных препаратов, еще около 40 находятся на разной стадии разработки. В структуре компании два завода и три исследовательских центра, в штате — 2,2 тыс. сотрудников. В 2018 году выручка Biocad составила 21,7 млрд руб. (на 40% больше, чем в 2017-м), из них более 9% приходится на экспорт.

Биология плюс информатика

Лет шесть назад мы переоснастили лаборатории новыми современными приборами для анализа геномов, проведения скрининга и других исследований. Все эти приборы стали выдавать огромное количество данных — больше терабайта за один запуск установки. Люди оказались просто заваленными такими объемами, они сидели с красными глазами и пытались как-то просмотреть информацию. Не говоря уже о том, чтобы детально проанализировать и сделать выводы. Нужны были другие методы обработки данных, и тогда в нашей структуре появилась новая группа — департамент вычислительной биологии.

Сегодня в этом подразделении работает около 40 человек — молекулярные биологи, физики, химики, программисты. Они используют для обработки данных различные математические алгоритмы. Поначалу они решали простые задачи — например, сравнивали последовательности ДНК, выясняли, как часто встречается тот или иной компонент генома. Эти расчеты серьезно облегчили жизнь исследователям.

Чем больше у нас накапливалось данных, тем более логичным становился следующий шаг — предсказывать поведение молекул в разных средах, a затем и моделировать молекулы с заданными свойствами в компьютере. Так мы стали заниматься биоинформатикой. Это научное направление, которое возникло на стыке математики, программирования и биологии. Раньше большинство биологических экспериментов ставились in vitro, то есть в пробирках, в так называемых «мокрых лабораториях», где проводят опыты с реальными веществами. А сейчас за счет алгоритмов и методов вычислительной биологии эксперименты можно проводить в виртуальной среде и там же проектировать новые объекты.

Мы купили коммерческий софт для моделирования лекарственных средств, но позже от него отказались — не устраивала ни его производительность, ни точность вычислений. Сейчас большинство алгоритмов разрабатываем самостоятельно. В результате мы научились создавать молекулы in silico, то есть на компьютере. Это можно сравнить с тем, как работает конструктор самолета, когда ему нужно спроектировать машину с определенной грузоподъемностью, предусмотреть определенную дальность полета и другие целевые показатели. Сначала мы описываем молекулу, какими свойствами она должна обладать, на какие биологические мишени воздействовать. Затем сотрудники департамента вычислительной биологии подбирают различные алгоритмы и, опираясь на принципы физики, квантовую механику и молекулярную динамику, моделируют поведение этой молекулы, как она будет взаимодействовать с другими веществами в различных субстанциях, оцениваем ее токсичность. После этого все расчеты проверяем в «мокрых лабораториях» и проводим другие необходимые эксперименты.

Компьютерная разработка в разы ускоряет и удешевляет создание нового препарата. Если успешно предсказывать свойства молекул, меньше времени уходит на прочие этапы тестирований. Сегодня цифровые методы внедряют все фармацевтические компании, потому что в противном случае можно отстать навсегда. Я более чем уверен, что в самом ближайшем будущем все основные лекарства будут проектироваться на компьютере. Мы научимся моделировать самые разные молекулы и предсказывать их свойства и поведение в организме.

Biocad разработал in silico уже довольно много молекул. Названий у них пока нет, мы обозначаем их условными кодами — BCD-200, BCD-300. Некоторые из них сейчас проходят клинические испытания. Например, очень сложную белковую молекулу, на основе которой планируем сделать лекарство для лечения рассеянного склероза, мы разработали за три месяца, a потом ее синтезировали. Это просто фантастика, потому что без математических методов в лучшем случае потребовалось бы месяцев восемь. Конечно, таргет (биологическая мишень, к которой должна будет прикрепляться молекула) был к тому времени уже хорошо изучен. Но мы почти три года бились в «мокрой лаборатории» и не находили ни одного варианта, который бы позволил перейти к дальнейшим этапам исследований. Вычислительные биологи начали проектировать эту молекулу заново и с нуля. Сначала они нашли четыре перспективных варианта, которые показали довольно хорошие результаты, и одну из этих молекул мы начали разрабатывать дальше.

Наши специалисты очень обрадовались, когда алгоритм начал подбирать молекулы с заданными свойствами. Но позже выяснилось, что далеко не все, что предлагает машина, можно синтезировать в реальной жизни. Какие-то химические реакции в принципе невозможны, где-то нужно создавать нестандартные температурные условия или, скажем, вещество можно синтезировать только в космосе. И вариантов бывает очень много — как-то алгоритм за несколько часов выдал список из 100 тыс. молекул. Как выбрать из такого количества? Наши специалисты снова зашли в тупик. Нужен был еще один алгоритм, который бы выбирал из множества молекул, созданных в виртуальном пространстве, те, которые возможно произвести физически.

Полная версия статьи доступна подписчикам на сайте