Почему искусственный интеллект не смог бы (пока) написать эту статью

Машины все еще не способны создавать повествования, но могут стать хорошими помощниками в написании текстов

Статья, опубликованная в журнале «Гарвард Бизнес Ревью Россия»

Уолтер Фрик

21 мая 2018

Почему искусственный интеллект не смог бы (пока) написать эту статью

читайте также

В свое время исследователь Роджер Шенк поставил задачу для искусственного интеллекта: компьютер должен посмотреть «Вестсайдскую историю» и распознать в ней сюжет «Ромео и Джульетты». Шенк и его ученики считали повествование отправной точкой для разума, мышления и понимания. По критериям Шенка современный ИИ не обладает разумом.

Статья «Чем занять обучаемые машины?» о возможностях ИИ — хороший пример того, на что компьютер пока не способен. Она написана двумя экспертами, которым понадобилось 20 лет, чтобы сформулировать гипотезу, собрать доказательства и изложить концепцию. Затем три редактора помогли им создать итоговый вариант статьи.

Тот факт, что ПО пока не пишет статей, не бросает тень на ИИ и его потенциал — но заставляет задуматься, как работает машинное обучение, что у машин получается хорошо, а что не очень, и как они будут развиваться, чтобы стать средствами создания текстов — или даже самостоятельными авторами.

Много букв

Cегодня ИИ работает так: он формулирует задачи прогнозирования и решает их на основе статистических методов и больших данных. Простой пример текстовой задачи прогнозирования — автозаполнение. Когда я ввожу слово «как», мой телефон использует накопленные данные и статистические модели, чтобы угадать следующие слова. Он предлагает мне «сам», «ты» или «дела». Я выбираю «дела» — и телефон гадает дальше. Теперь он уверен, что дальше последует «у» (он прав), и даже не показывает других вариантов, предлагая выбрать из «у тебя» и «у вас». Так работает контролируемое обучение. Имея набор данных, содержащий нужный ответ (в данном случае — ранее написанные мною сообщения), алгоритм выявляет закономерности: например, что после «как дела» часто следует «у».

Процесс написания статьи невозможно (по крайней мере, пока) разложить на задачи прогнозирования. На недавней конференции по ИИ и журналистике профессор Нью-Йоркского университета Сэм Боумен признал: «До полноценного создания длинных связных текстов без использования предельно четких журналистских шаблонов еще очень далеко». Он отметил: хотя ученые доказали, что ПО может генерировать связные тексты по заданным параметрам, «в действительности создание систем, способных пройти весь путь от абстрактной идеи или набора фактов до длинного связного текста, все еще крайне непростая задача».

В доказательство Боумен приводит сценарий короткометражного фильма «Санспринг», написанного ИИ в 2016 году. Для создания этого сценария нейросети (алгоритму машинного обучения) «скормили» несколько десятков сценариев научно-фантастических фильмов. Единицей данных для обучения алгоритма был текстовый символ. Зная, какие символы уже использовались в тексте, алгоритм учился предсказывать следующие.

Впечатляет уже то, что сценарий состоит из реальных английских слов (пусть даже образующих странные фразы): до «чтения» сценариев нейросеть не только не умела писать тексты — она даже не знала английского языка. Программа выявила несколько характерных признаков сценария — таких, как распределение фраз по персонажам и наличие сценических ремарок. Это ей тоже удалось понять путем анализа множества текстов.

Однако программа не сумела научиться самому искусству повествования. В «Санспринге» отсутствует сюжет. Его герои существуют лишь в том смысле, что произносят какие-то реплики. Этот эксперимент показал, какой долгий путь предстоит пройти ИИ, прежде чем он сможет рассказывать истории — то есть станет разумным по Шенку. В то же время способность алгоритма складывать слова в предложения и выявлять основные свойства сценария говорит о том, что когда-нибудь ИИ можно будет использовать при написании текстов. Правда, в ближайшем будущем его роль будет довольно скромной.

Рефераты на заказ

Одна из сфер, где машинное обучение достигло значительного прогресса, — реферирование. Поиск в тексте основных идей и составление краткой выжимки — очень частая задача: СМИ делают сводки последних новостей, корреспонденты предваряют репортажи обзором информации по теме, научные институты сжато излагают суть исследований, редакторы издательств резюмируют содержание книжных глав. Часть этой работы уже сегодня можно передать машинам: стартапы и ИТ-компании наперегонки пытаются создать для этого доступные инструменты и продукты.

Методы автоматического реферирования обычно делят на экстрактивные и абстрактивные. Экстракция — это поиск в документе самых важных предложений и объединение их в единое резюме. Современные варианты этого метода весьма сложны, но исходную идею еще в 1958 году выдвинул Ханс Петер Лун из IBM. Лун предположил, что ключом к содержанию документа могут стать слова, которые чаще всего в нем встречаются (не считая самых частотных, таких как предлоги и союзы). Таким образом, самыми репрезентативными в документе будут те предложения, где есть эти слова. Если объединить их в один абзац, получится что-то похожее на краткое резюме текста. (Конечно, я упрощаю. Подробнее этот способ автоматического реферирования описали Кэти Маккиоун из Колумбийского университета и Ани Ненкова из Университета Пенсильвании.)

Метод абстракции работает иначе: алгоритм извлекает информацию из одного или нескольких документов и излагает ее в собственном оригинальном тексте. Этот подход более перспективен, но до недавних пор он не давал впечатляющих результатов. Как показала история «Санспринга», создать текст с нуля очень сложно. Однако прогресс, достигнутый в глубоком машинном обучении, возродил интерес к методу абстракции и позволил получить многообещающие результаты.

Чтобы понять, на что сегодня способно (и не способно) машинное обучение, сравните редакторское резюме статьи об ИИ с двумя машинными версиями — экстрактивной и абстрактивной (см. врезку «Три конспекта: человеческий, экстрактивный и абстрактивный»).

Первую версию написал редактор HBR. Она грамматически корректна, содержит основную идею статьи, и в ней используется третье лицо («авторы описывают…»).

Вторая создана методом экстракции и принадлежит прототипу, разработанному исследовательской организацией Fast Forward Labs. Используя реальные статьи и обзоры с сайта рекомендаций для чтения, команда Fast Forward обучила нейросеть оценивать вероятность включения тех или иных фраз документа в обзор. Фразы, получившие самые высокие оценки, выстраиваются в том порядке, в каком они встречаются в исходном тексте, и образуют итоговый конспект. В данном случае самый высокий рейтинг получило предложение, начинающееся со слов «В наши дни важнейшей технологией широкого применения стал искусственный интеллект». Этот тезис действительно можно считать исходным посылом статьи — здесь экстрактивный референт сработал хорошо. Но когда семь ключевых предложений были расположены в их исходном порядке, оказалось, что в первом есть неизвестно к чему относящееся местоимение «них». (Обучить систему находить существительные, обозначаемые местоимениями, очень сложно, и прототип Fast Forward даже не пытался их искать.)

Третью версию конспекта предоставил профессор из Гарварда Александр Раш. Она получена методом абстракции. Раш обучил свою систему писать трехфразовые обзоры статей CNN, и хотя он отмечает несовершенство алгоритма, мы решили испытать программу на первых 450 словах статьи об ИИ. «В принципе эта система абстрактивна, — поясняет Раш, — и может генерировать любые тексты. Но на деле она, похоже, в основном воссоздает фразы, которые видит в исходной статье». Другими словами, ее результаты не столь абсурдны, как «Санспринг», но и не столь оригинальны. Как и экстрактивный конспект, абстрактивный содержит основные мысли статьи, но сообщает о «технологиях» без необходимых уточнений.

Достаточно ли хороши эти конспекты, чтобы заменить написанные людьми? Пожалуй, нет. Однако вопрос скорее в том, могут ли созданные ИИ наброски обзоров помочь людям в работе. И здесь можно уверенно ответить: да.

Искусственный секретарь-референт

Может показаться, что использование ИИ для реферирования не поможет людям в процессе написания текстов. Однако в сочетании с другими технологиями это облегчает важнейшую часть работы — поиск данных. Сбор информации — «самое сложное, что приходится делать автору», признает Дэвид Хилл, главный редактор научно-технического издания SingularityHub.

Компания Google, алгоритмы поиска которой опираются на ИИ, уже произвела революцию в сфере сбора информации и значительно повысила продуктивность авторов. Однако поисковик Google нельзя назвать идеальным секретарем-референтом. Хилл называет его методы «неглубокими» и «бездумными». «Поиск данных — чрезвычайно трудоемкая работа», — говорит Сюзанна Локке, редактор Vox.com. Она задумалась о том, чтобы делегировать ее машине. Тим Ли из Ars Technica описывает свой метод «бессистемного» чтения: он находит 10—15 источников по теме, читает их и делает заметки. Его мечта — инструмент, который мог бы просмотреть 1000 страниц и выбрать 10 из них, которые человеку нужно прочесть прежде всего.

Не обязательно сразу полностью автоматизировать процесс сбора данных — для начала достаточно сделать его более удобным и структурированным. «Не понимаю, почему на новостных сайтах нельзя кликнуть имя человека и получить краткую справку о нем», — недоумевает Брайан Юлисны, специалист по анализу данных из Thomson Reuters Labs. В 2006 году, работая в Lycos, Юлисны опубликовал работу с описанием «системы для синтеза информации». В нее можно ввести имя или тему, как в Google, но вместо набора ссылок алгоритм сформирует из найденных в сети материалов небольшие «упорядоченные обзоры или справки». Юлисны сравнивает их с «черновым наброском статьи Википедии».

Юлисны не единственный, кто предложил идею автоматически генерировать тематические обзоры. Специалисты по вычислительным машинам более 15 лет разрабатывают такие системы. Эти проекты технически сложны и весьма разнообразны, однако разработчики сталкиваются с общими проблемами и используют похожие методы.

Хилари Мейсон, специалист по анализу данных и основательница Fast Forward Labs, перечисляет основные задачи, стоящие перед такой системой. Во-первых, она должна найти источники данных (текстовые документы, новостные статьи). Во-вторых — вычленить из этих источников самое главное. И в-третьих — подать информацию конечному пользователю. В процессе многие системы выполняют еще один шаг — пытаются структурировать повествование. Будет ли это хронология отдельных событий? Или биография человека? Или часть более длинной истории? Структура помогает системе оценить важность информации и подсказывает, как лучше ее подать.

Этот процесс напоминает шаги, с помощью которых человек решает задачи поиска и изложения информации — хотя бы самые простые. Джон О’Нил работает редактором в службе QuickTake компании Bloomberg и объясняет сложное простыми словами, а до этого писал тематические статьи для The New York Times. Он вспоминает, как шла работа над этими статьями (с тех пор формат уже изменился). Для начала надо было найти несколько материалов по теме, ранее опубликованных изданием. Затем в каждом из них следовало отделить историю вопроса от новых сведений. Наконец, требовалось обобщить историю вопроса из этих материалов. Так что по крайней мере при написании тематических статей человек и машина делают одни и те же шаги.

ИИ спешит на помощь

Если эти инструменты, пусть и несовершенные, уже давно существуют, то почему их редко используют при создании текстов? Одна из причин — сопротивление переменам, заложенное в нашей культуре. С одной стороны, многие авторы не видят необходимости в таких помощниках; с другой — разработчики не всегда задумываются о том, как люди будут использовать результаты их труда. Ани Ненкова считает, что развитие автоматического реферирования идет по пути повышения точности, а не создания удобных решений на основе имеющихся технологий.

Другой фактор — деньги: далеко не у каждого автора или СМИ есть возможность приобрести передовую технологию. «Серьезный прогресс [в обработке естественного языка] был достигнут, когда власти и аналитики в сфере безопасности заинтересовались возможностью отслеживать международные новости», — утверждает Ненкова, чья диссертация была защищена при поддержке Управления перспективных исследовательских проектов Минобороны США. Машинное обучение и обработка естественного языка получили развитие и в сфере финансов — во многом потому, что здесь такие разработки хорошо оплачивались.

Наконец, еще одна причина — тот факт, что имеющиеся инструменты недостаточно совершенны, чтобы предлагать тексты конечному читателю без участия редактора. Брайан Юлисны описывает автоматическую справку о легенде хоккея Марио Лемье. Система уловила ключевые подтемы, такие как «игры», «сезоны» и «Питтсбург Пингвинз». Но она добавила к ним еще и «лед» — он, конечно, важен, но ни один человек не стал бы отдельно описывать его в тексте о хоккеисте.

Сегодня все меняется. Технологии становятся совершеннее и при этом проще в использовании, все больше авторов и медиакомпаний признают, что умные машины могут упростить их работу. Для меня очевидно, что уже скоро ИИ будет играть важную роль в создании разных текстов, — однако едва ли сможет писать полноформатные статьи. А вот помогать журналистам грамотно структурировать тексты — вполне.

В наши дни множество людей трудится над созданием для этого специальных инструментов. Дэвид Хилл получил грант на разработку «искусственного референта» с открытым кодом. Бостонский стартап Frase пытается создать нечто подобное, но рассчитанное в первую очередь на контент-маркетологов. Аналогичный инструмент (правда, с ограниченными возможностями) уже есть и в Google Docs.

Vox использует бот Slack, который подсказывает авторам, в каких старых статьях стоит поискать цитаты для новых. IBM Watson работает над прототипом Watson Angles: он резюмирует новости, выстраивает хронологию событий и выделяет важные цитаты. Этот прототип, уже удаленный из интернета, включал в себя и ключевые метаданные — например, анализ тона высказываний пользователей Reddit по поводу той или иной новости.

Эти проекты — лишь начало. Представьте новостной репортаж о пожаре в столице Великобритании, в котором, среди прочего, будет указано, что ваша лондонская знакомая не пострадала. Или текст, автоматически адаптирующийся к уровню знаний читателя. Или текстовый редактор со встроенной проверкой фактов. Или тематические статьи по огромному количеству узких тем, аудитория которых слишком мала для большинства издателей. Или личного секретаря-референта, легко извлекающего из памяти нужную вам статью, написанную сто лет назад, и еще одну, только что опубликованную.

Да, алгоритмы до сих пор не научились создавать повествования, как люди: они не могут написать достойный киносценарий или пройти тест Шенка на распознавание сюжета «Ромео и Джульетты». Они все еще плохо разбираются в причинах и следствиях. В электрическом теле машины не родится трогательная проза или патетический призыв к властям отреагировать на важную проблему. И все же машины могут многое. Искусственный интеллект, может быть, и не поведает вам чудесную историю — но ему по силам помочь вам рассказать свою.

ТРИ КОНСПЕКТА: ЧЕЛОВЕЧЕСКИЙ, ЭКСТРАКТИВНЫЙ И АБСТРАКТИВНЫЙ

Ниже приведены три резюме статьи Эрика Бриньолфссона и Эндрю Макафи «Чем занять искусственный интеллект?».

Человеческий

«Технологии широкого применения», такие как двигатель внутреннего сгорания, вот уже 250 лет определяют экономический рост. Искусственный интеллект и, в частности, машинное обучение — важнейшая технология такого рода для нашего времени. В ближайшие десять лет практически каждая отрасль внедрит ИИ в основные процессы и бизнес-модели, чтобы воспользоваться его преимуществами. Однако не все ожидания, связываемые с ИИ, реалистичны. В данной статье авторы описывают его истинный потенциал, практику применения и препятствия, мешающие ему полноценно войти в нашу жизнь.

Исследователи выделяют три положительных момента, важных для организаций, которые хотят использовать машинное обучение. Во-первых, люди все активнее учатся работать с ИИ — как в университетах, так и на онлайн-курсах. Во-вторых, необходимые алгоритмы и устройства можно купить или взять в аренду. В-третьих, на первом этапе использования машинного обучения требуется довольно скромный объем данных.

Авторы указывают и на три фактора риска. Машины могут иметь «тайные пристрастия», связанные с особенностями данных, на которых они учились; нейросети опираются не на абсолютную, а на статистическую истину; диагностика и исправление системных ошибок зачастую затруднительны, поскольку структура технологии исключительно сложна.

Экстрактивный

Важнейшими из них становятся те, которые экономисты называют технологиями широкого применения, — в их числе паровая машина, электричество и двигатель внутреннего сгорания.

Такие разные компании, как Walmart, UPS и Uber, научились использовать технологии для создания новых прибыльных бизнес-моделей.

В наши дни важнейшей технологией широкого применения стал искусственный интеллект и, в частности, машинное обучение — то есть способность машины улучшать свои результаты без участия человека.

Искусственный интеллект способен вывести бизнес на качественно новый уровень. Хотя он уже используется в тысячах компаний по всему миру, его главные возможности пока не раскрыты.

На что способен ИИ сегодня? Термин искусственный интеллект был предложен в 1955 году Джоном Маккарти, профессором математики из Дартмута.

Годом позже Маккарти провел знаменитую конференцию, посвященную этой теме.

Ошибочное мнение, будто узкоспециальная информация, выдаваемая компьютером, говорит о его широких познаниях, — вероятно, главный источник ложных и завышенных ожиданий от ИИ.

— Fast Forward Labs

Абстрактивный

такие разные компании, как walmart, ups и uber, научились применять технологии для создания новых прибыльных бизнес-моделей. искусственный интеллект способен вывести бизнес на качественно новый уровень. за последние несколько лет машинное обучение стало намного эффективнее и доступнее.

— Александр Раш

Об авторе. Уолтер Фрик — старший ответственный редактор HBR. В 2016 году стал участником программы Knight Visiting Nieman Fellowship в Гарвардском университете, где изучал возможности применения машинного обучения в сфере аналитической журналистики.

Почему искусственный интеллект не смог бы (пока) написать эту статью

Тайные ученики умных машин

Парадокс прозрачности: чем опасен искусственный интеллект

Как Xiaomi стала IoT-гигантом

Что тянет российские стартапы на дно

Глобальные карлики

План не имеет значения