Президент SRI Ventures о том, как делали Siri | Большие Идеи

・ Управление инновациями
Статья, опубликованная в журнале «Гарвард Бизнес Ревью Россия»

Президент SRI Ventures о том, как
делали Siri

Прежде чем стать неотъемлемой частью iPhone, виртуальному персональному помощнику пришлось пересечь «долину смерти».

Автор: Винарски Норман

Президент SRI Ventures о том, как делали Siri

читайте также

Четыре особых качества лучших гендиректоров

Дина Ван,  Елена Лыткина-Ботельо,  Ким Пауэлл,  Стивен Кинкейд

Держать ответ

Андреа Руттенберг,  Джон Митчелл,  Кармел Дибнер,  Одри Трипп,  Уэйн Хуан

Ставьте не на лошадь, а на жокея

Как стать эффективным лидером в условиях глобализации

Маршалл Голдсмит

В долгом процессе создания и доводки продукта может наступить момент, когда, чтобы устранить одолевающие творца сомнения, нужно спросить потенциального потребителя.

В случае Siri, виртуального персонального помощника, без которого теперь немыслим iPhone, такой момент наступил в 2009 году, когда я летел в самолете. Я только что занял свое место на отложенном рейсе, когда мой сосед по салону спросил, во сколько мы приземлимся. Поскольку я входил в группу тестировщиков Siri — нас там было несколько десятков человек, — я вынул телефон и произнес: «Siri, во сколько ожидается посадка рейса 98 авиакомпании United?». Когда Siri сообщила уточненное время прибытия, мой сосед был поражен. «У меня к вам всего один вопрос, — сказал он. — Почему вы летите эконом-классом? Вы же наверняка миллиардер!».

Я к тому времени настолько погрузился в проблемы бизнеса, технологий, стратегий и финансов нашего проекта, что и забыл, насколько впечатляет технология Siri. Потрясенный попутчик вновь напомнил мне: мы разработали приложение для смартфона, способное понимать голосовые вопросы и отвечать на них. Мы были готовы вложить в руки миллионов потребителей настоящий искусственный ра­зум! И на пути к этому прошли долгий путь с парой неожиданных поворотов.

Долина смерти

Я президент SRI International — организации, основанной в 1946 году как Стэнфордский исследовательский институт (Stanford Research Institute) и ставшей независимой в 1970 году.

Я руковожу коллективом, который разрабатывает, проектирует и реализует проекты с применением технологий SRI. Я обожаю свою работу. Каждый день мне удается наблюдать за рождением революционных технологий, улучшающих здоровье, защищенность и продуктивность человека.

Но, как известно, между изобретением и внедрением пролегает «долина смерти». Этот образный термин — из венчурной отрасли, где большинство изобретений так и не доходит до потребителя: они гибнут, если нет крупного растущего рынка или если бизнес-план недостаточно продуман, если мало ресурсов или само ценностное предложение плохо сформировано.

Моя работа заключается в том, чтобы помочь идее пересечь долину смерти. Иногда успех превосходит самые смелые ожидания. Siri как раз стала одним из таких удивительных прорывов.

Понимание рынка, которое в итоге привело к появлению Siri, у нас было еще в 2003 году, когда мобильные приложения сводились к рингтонам и сообщениям. Уже тогда мы осознавали, что растущие возможности телефонов когда-нибудь превратят их в коммуникационные суперкомпьютеры — и верили, что SRI International готова стать лидером в неизбежной технологической и рыночной революции.

Мы создали команду для разработки новых рыночных концепций и назвали ее Vanguard. Сначала мы хотели, чтобы искусственный интеллект помогал смартфону выполнять приказания пользователя — например, назначить время телефонных звонков с несколькими абонентами, набрать номер или заказать продукты.

Примерно в то же время Агентство передовых оборонных исследовательских проектов США (DARPA) выделило $150 млн на разработку «понимающего» ПО (их вдохновил Радар О’Рейли из телесериала «Чертова служба в госпитале Мэш», который всегда раньше своего полковника знал, чего тот захочет). Концепты программы DARPA дополнили идеи Vanguard и в конечном итоге привели к появлению Siri.

Еще четыре года мы, не собираясь организовывать под проект отдельный венчур, вели переговоры с десятками телекоммуникационных компаний и производителей гаджетов, чтобы совместно с ними проектировать, лицензировать и коммерциализовать будущего интеллектуального помощника. Но ничего не получалось. Партнеры снова и снова выдвигали разные возражения: «Это невозможно: технология обогнала свое время на 20 лет»; «Слишком дорого» (мы просили $5—10 млн на разработку плюс стоимость лицензирования); «Не соответствует нашей бизнес-модели»; «Слишком долго — больше года»; «Доходы поступят нескоро»; «Мы сами сейчас разрабатываем нечто подобное»… Несколько проектов с компаниями реализовать удалось, но в них, увы, воплотилась лишь малая толика наших замыслов. В итоге мы решили создать собственный венчур для разработки революционного продукта.

Четыре компонента

Руководители по бизнесу и технологиям нового проекта SRI почти ежедневно встречались, чтобы обсудить возможности рынка и продукта. Мы знали, что для успеха нам понадобятся четыре компонента: решение для крупной или наболевшей проб­лемы — с перспективой быстрого роста рынка; оригинальная технология, способная обогнать конкурентов; команда, готовая свернуть горы; ценностное предложение и бизнес-план, полностью соответствующие стратегии и коммерческому потенциалу всего проекта. Если мы не соберем все четыре компонента воедино, вероятность успеха будет практически нулевой.

Мы также понимали, что времени у нас мало, денег тоже в обрез и надо суметь войти на рынок и завоевать его, прежде чем кончится бюджет и спохватятся другие игроки.

Наболевшая проблема. Наша команда несколько месяцев изу­чала рыночные возможности. Людям уже надоело нажимать множество кнопок на клавиатуре смартфона, добиваясь выполнения команд (тачскрин в 2007 году еще был мало распространен). Исследования рынка показывали, что с каждым кликом у приложения или интернет-магазина становилось на 20% больше пользователей или покупателей.

Революционная идея Siri была простой, как все гениальное: в пику всем существовавшим поисковикам это была еще и делающая машина — к тому же управляемая голосом. Она понимала запрос, сама обращалась к нужной информации и формулировала на ее основе ответ. Всю работу сделает не пользователь, а сама система Siri — она должна была стать полноценным виртуальным персональным помощником, который бы помогал людям покупать билеты на матчи, бронировать столики в ресторанах, узнавать прогноз погоды и находить интересный фильм в один-два клика.

Оригинальная технология. Решение было революционным, хотя разработки и потребовали десятилетий. Преобразование речевого сигнала в цифровой текст было самым простым этапом: еще в 1994 году SRI выпустила программу Nuance, мирового лидера в области голосовых решений. Самым сложным было извлечь из слов смысл, то есть понять намерение пользователя, найти ответ и сформулировать его. Компьютер должен был соотносить группы слов с концептами. Человек выполняет подобные задания с легкостью, но для искусственного интеллекта это считалось нереально сложным.

Однако нашей научно-исследовательской лаборатории по голосовым решениям и нашему Центру искусственного интеллекта и Лаборатории речи (поддерживаемым DARPA и собственными инвестициями) удалось заложить фундамент для технологий понимания естественного языка. Адам Чейер и Дидье Гуццони руководили внедрением технологии, которое позволило сделать из Siri продукт, доступный миллионам. Чейер, один из самых талантливых специалистов по интеллектуальным системам в SRI, почти два десятилетия создавал и внедрял делегированные вычисления и многоагентные системы, позволявшие человеку взаимодействовать с сетевыми программами и устройствами. Совместно со своим аспирантом Гуццони он разработал подходы к пониманию и анализу естест­венного языка, что позволило упростить для Siri задачу ответа на запросы.

Команда. Нам повезло: руководителем нового венчура стал выдающийся предприниматель Даг Киттлаус. Чейер решил перейти из SRI в новый проект. Том Грубер, ведущий инноватор в области интеллектуальных пользовательских интерфейсов, примкнул к нему спустя несколько месяцев и в итоге стал техническим директором. Билл Марк, президент SRI по информатике и компьютерным наукам, и я также вошли в число основателей нового предприятия. Мы с Биллом остались работать в SRI, и я вошел в совет директоров венчурной компании.

Ценностное предложение. Первые шесть месяцев в центре нашего внимания было ценностное предложение. Мы хотели решить важную для миллионов потребителей проблему с помощью мощного продукта, способного приносить миллиардную прибыль. В частности, Siri должна была снять фрустрацию пользователей от множества кликов, сэкономить их время, дать им оригинальную революционную технологию, включая распознавание речи, понимание естественного языка и искусственный интеллект, предложить способы извлечения дохода, удивлять и радовать потребителя. Мы решили, что Siri будет монетизироваться через сбор взносов с веб-сайтов, на которых с ее помощью проводятся транзакции. Мы понимали, что наводки Siri на отели, рестораны и авиакомпании могут принести немалую прибыль.

В конце 2007 года, после полугода работы над ценностным предложением, мы решили привлечь к проекту внешние инвестиции. Мы понимали, что найти спонсора будет непросто, поскольку Siri — это революция и для рынка, и для технологий. Многие венчурные капиталисты уже успели пережить шумиху вокруг искусственного интеллекта и смотрели на наш проект скептически. Они смотрели на каждую деталь ценностного предложения и бизнес-плана: каков рынок, какие технологии, кто наши конкуренты. А сможем ли мы вырастить серьезную клиентскую базу? Хватит ли для работы Siri мощности телефонов? Точно ли эта технология будет работать? А вдруг слишком медленно? Способна ли бизнес-модель с привлечением потенциальных покупателей сгенерировать достаточный доход? А что, если потенциальные конкуренты, например Google и Microsoft, мгновенно выпустят аналогичные продукты?

Все эти сомнения мы, конечно, могли лишь смягчить, но не развеять. Siri была очень рискованной — но очень многообещающей инвестицией. Ее уникальная технология неизбежно повлияла бы на рынок мобильных устройств. В ней соединились разные мировые тренды: появление смартфонов, рост вычислительной, емкостной и коммуникационной мощи носимых гаджетов, рост веб-услуг и интерфейсов, новые системы искусственного интеллекта. Мы выбрали правильное время.

Нам удалось собрать $8,5 млн инвестиций — достаточно для полутора лет работы. Поиски финансирования, впрочем, принесли нам далеко не только деньги. Мы обрели смелых, проницательных инвесторов и подлинных партнеров, которые помогли нам уточнить бизнес-модели, разработать стратегии, выстроить отношения с клиентами и так далее.

Тем не менее перед нами стоял ряд проблем. Слишком медленный ответ сервера и сложности с распознаванием речи уже затянули проект на полгода. За это время Google и другие конкуренты продвигались вперед с собственными решениями. Ряд компаний предлагал купить нас. Условия сотрудничества с провайдерами и веб-сервисными компаниями были не всегда удобными. У операторов сотовой связи появлялись предложения, отвлекавшие от нашего основного продукта.

Запуск

В конце концов после тестирования — оно проходило с ноября 2009 по февраль 2010, когда и произошел тот случай в самолете, мы были готовы запустить Siri в магазин App Store компании Apple. (Кстати, тот факт, что Siri похоже на SRI, — чистое совпадение. Мы выбрали это имя по ряду причин — в том числе потому, что оно короткое и не несет негативных коннотаций ни на одном языке.) Мы подготовили демонстрации и обзоры в самых популярных блогах, в том числе Scobleizer и TechCrunch. Демонстрации прошли с огромным успехом, и масс-медиа создали настоящий шквал потребительского интереса. Siri скачивали бесплатно в астрономических количествах. Она стала приложением №1 в категории «Стиль жизни» и вошла в топ-50 всех приложений Apple.

Спустя две недели после запус­ка Киттлаусу кто-то позвонил: «Привет, это Стив Джобс». Киттлаус решил, что это розыгрыш, и нажал отбой. Но телефон зазвонил снова: «Это правда Стив Джобс». И это был он. Они немного поговорили, Джобс поздравил Киттлауса с отличной работой Siri и пригласил его, Чейера и Грубера к себе домой. Они обсуждали технологию Siri. Стив понимал ценность созданного нами искусственного интеллекта, а также суть технологии и то, что при ее использовании неизбежны ошибки — например, в распознавании речи. Но его это не смутило. Уникальный случай, ведь все продукты Apple оттачиваются до полного совершенства.

Несколько последующих недель Джобс и Киттлаус обсуждали, за сколько бы мы согласились продать Siri. Мы не горели желанием ее продавать, потому что верили: по мере увеличения числа успешных применений и заключения новых дистрибуторских сделок ценность этого бизнеса будет постоянно возрастать. Но Джобс сделал нам предложение, от которого не смогли отказаться ни инвесторы, ни руководство (сумма сделки не разглашается по условиям контракта). Всей команде к тому же очень хотелось поработать со Стивом и компанией Apple.

Год спустя Siri стала основной платформой для очень популярного сервиса на новой модели iPhone 4S. 4 октября 2011 года Фил Шиллер, старший вице-президент Apple по международному маркетингу, представил Siri как «самую крутую фишку iPhone 4S». На следующий день Стив Джобс умер. Я благодарен судьбе, что он дожил до этой презентации и увидел ее. В первые недели после запуска устройства, по мнению аналитиков, наличие Siri увеличило продажи iPhone на миллиарды долларов. Siri до сих пор остается ключевым элементом всех устройств на iOS.

Apple и многие другие компании, включая SRI, стремятся обогнать друг друга в разработке продуктов, развивающих технологии и обслуживающих все новые рынки. У нас еще есть чем заняться. На самом деле и распознавание речи и естественного языка, и машинное обучение находятся только на начальном этапе развития. Новые виртуальные персональные помощники смогут еще лучше понимать язык и речь. Они будут в состоянии, придерживаясь темы, вести настоящие разговоры, учиться у пользователей и станут «специалистами», помогающими извлекать информацию из массивов вроде медицинских карт и банковских счетов. В частности, SRI не так давно запустила новый проект Kasisto: он позволяет упростить работу мобильного банкинга с помощью речевого, текстового и тактильного интерфейсов и способен вести беседу. Будущее рынка виртуальных персональных помощников, бесспорно, светлое.