2018/09/07 15:56:17

Искусственный интеллект для написания текстов в СМИ и литературе

Когда журналистов, писателей и поэтов заменят роботы?

Содержание

Основная статья: Искусственный интеллект

2018: Система машинного перевода успешно прошла newstest2017

Группа ученых Microsoft Research 30 марта 2018 года сообщила о том, что созданная ими система машинного перевода успешно прошла тест newstest2017, который включает в себя 2 тыс. предложений, взятых из профессионально переведенных новостных статей. Такие стандартизированные тесты широко применяются при разработке систем искусственного интеллекта и помогают внести объективность в оценку их работы.

Внешние эксперты, владеющие обоими языками, оценили результаты работы искусственного интеллекта при переводе предложений из выборки, сравнивая их с двумя профессиональными переводами.

Достичь таких успехов помогли недавние открытия в области нейросетей. В распоряжении ученых с каждым годом оказывается все больший набор разнообразных техник, комбинирование которых позволяет улучшить результаты. Например, один из приемов работы с искусственным интеллектом — это «двойное обучение». Система переводит фразу с китайского на английский, а человек переводит результат обратно на китайский — примерно, как если бы учитель обратно переводил для ученика фразу, чтобы тот понял свою ошибку.

Впереди у ученых еще много работы: в частности, они планируют добавить новые языковые пары и добиться схожих результатов в переводе текстов на более широкие темы.

2017: Нейросеть научили писать стихи определенного жанра и на любую тему

Исследователи Facebook AI Research (подразделения Facebook, занимающегося разработкой программного обеспечения для искусственного интеллекта), в начале июля 2017 года представили новый подход к автоматическому написанию поэзии. Созданная система нейросетей умеет писать стихи определенного жанра и на любую тему, практически неотличимые от тех, которые мог бы написать человек. Однако главная цель поэзии — передача мыслей и чувств через образные средства языка — по-прежнему остается недоступной для искусственного интеллекта.[1]

У любого поэтического произведения есть два важных компонента: форма и содержание. Форма выражается в метрических характеристиках стиха: ритме и рифме; содержание отвечает за наполненность стихотворения — лексические и образные средства, используемые для того, чтобы передать определенную мысль.

Может ли компьютер сочинять настоящие стихи? До недавнего времени считалось, что нет, однако нейросеть, созданная в Facebook AI Research, практически научилась это делать
Может ли компьютер сочинять настоящие стихи? До недавнего времени считалось, что нет, однако нейросеть, созданная в Facebook AI Research, практически научилась это делать

Авторы нового исследования предложили две модели, которые основываются на уже существующих языковых нейросетях. Первая модель извлекает из обучающей выборки и форму, и содержание стихотворения, и дает на выходе произведение определенного стихотворного жанра. Такая модель была обучена на небольшой (300 тыс. слов) выборке сонетов и смогла создать произведение, написанное пятистопным ямбом (размером, традиционным для сонета на английском языке).

Однако у такой модели есть одно важное ограничение: она может создавать произведения только той поэтической формы, которая была представлена ей в выборке для обучения. Принимая это во внимание, исследователи предложили другой подход, который заключается в использовании порождающей состязательной сети, одна часть которой (генератор) отвечает за содержание, а другая (дискриминатор) — за форму.

Модель автоматического стихосложения обучили на большой выборке поэтических произведений (7,56 млн слов) самых разных жанров. Затем ученые поставили эксперимент: они взяли стихотворения, созданные нейросетью, смешали их с забавно-абсурдными стихами реальных поэтов и предложили семидесяти читателям определить, кто написал то или иное стихотворение — человек или компьютер. Респонденты правильно установили авторство людей в 51,4% случаев; в случае с компьютерной поэзией эта доля составила 53,8%.

Респондентам также необходимо было отметить по пятибалльной шкале «читабельность» стихов («Насколько представленный фрагмент легок для прочтения?»), их эмоциональность («Насколько данный фрагмент пробуждает в вас эмоции?») и красоту («Насколько данный фрагмент приятно читать?»). Оказалось, что самыми «человеческими», эмоциональными и красивыми стихотворениями респонденты посчитали именно те, которые были созданы компьютером.

Вот, например, одно из четверостиший, использованных в эксперименте:

How dreary to be somebody,
How public like a frog
To tell one’s name the livelong day
To an admiring bog.


Смысл стихотворения кажется темным. Словосочетание admiring bog («восхищающаяся трясина») выглядит абсурдно, и в чем именно выражается публичность лягушки? Однако написано оно не компьютером. Автор этого четверостишия — Эмили Дикинсон («I'm nobody! Who are you?»).

А вот другой пример, использованный при опросе респондентов:

The frozen waters that are dead are now
black as the rain to freeze a boundless sky,
and frozen ode of our terrors with
the grisly lady shall be free to cry.


В этом отрывке проглядывается понятная читателю метафора зимы как смерти и страха. Стихотворение мрачное, оно наполнено различными сравнительными средствами и кажется достаточно эмоциональным, однако написал его компьютер.

Несмотря на то, что работа новой нейросети приблизила искусственный интеллект к настоящему поэтическому творчеству, до настоящих поэтов ему пока что далеко.

Как отметил поэт Риши Дастидар (Rishi Dastidar) в беседе с интернет-издаем New Scientist, у компьютерных стихотворений нет никакого подтекста: нейросеть может ставить одно слово за другим так, чтобы результат соответствовал определенной поэтической модели, и подбирать их так, чтобы они относились к определенной теме, но никакой идеи и эстетической глубины такие стихи не имеют. Для того чтобы произведения компьютера выражали мысли и чувства (одна из главнейших задач поэзии в ее повседневном понимании), искусственный интеллект должен научиться мыслить и чувствовать сам.

Ознакомиться с работой нейросети и оценить ее можно на сайте neuralpoetry.getforge.io.

2016

Narrative Science: К 2025 году 90% всех текстов будут писать роботы

К 2016 использует роботов-журналистов и журнал Forbes, для которого компания Narrative Science создала соответствующую специализированную платформу. Статьи, написанные искусственным интеллектом, пока очень простые, однако соучредитель компании Narrative Science Кристиан Хэммонд верит в большие перспективы данного направления, полагая, что к 2025 году 90% всех текстов в мире будет писаться именно искусственным интеллектом. Предположение, безусловно смелое, однако некоторые эксперты с этим отчасти согласны.

«В будущем роботы журналисты вполне смогут быть конкурентоспособны на рынке труда, особенно по части создания простых новостных заметок. При этом они могут обладать рядом преимуществ: в машину можно заложить четко структурированный алгоритм, по которому будет писаться текст, например, какую информацию помещать в начало, какую – в середину, а какую – в конец. Это позволит повысить читабельность новостных заметок. Зачастую журналисты забывают об этом правиле, предоставляя всю актуальную информацию уже на первых строчках текста», - гендиректор «Комсомольской правды» Владимир Сунгоркин.

Все же большинство экспертов абсолютно уверены в неспособности искусственного интеллекта полностью заменить человека в такой сложной задаче, как написание интересных статей.

«Заменить человека полностью машина вряд ли сможет. Роботы не способны почувствовать интересную историю – они лишь способны отвечать на поставленные вопросы», - исполнительный директор Службы финансово-экономической информации «Интерфакса» Юрий Погорелый.

Книга, написанная роботом, прошла 4 этапа отбора литературной премии

Однако несмотря на столь значительный скептицизм, практика показывает, что перспективы искусственного интеллекта все же не так туманны. Весной 2016 года книга «День, когда компьютер напишет роман», созданная искусственным интеллектом, смогла выйти в финал литературной премии имени Хоси Синъити. Да, произведение не смогло в конце завоевать главный приз, однако сам факт того, что оно прошло четыре этапа отбора, говорит о многом.

Премия Хоси Синъити прежде всего известна тем, что в ней на конкурс можно выставить произведения, написанные машиной. В 2016 году, из 1450 книг около 11 были написаны искусственным интеллектом, однако в финал смогла пройти лишь одна. При этом жюри не было проинформировано, что рассматривает книгу, написанную ИИ.

«Меня удивила работа искусственного интеллекта, поскольку перед нами лежит действительно хорошо структурированный роман. Однако у него все же есть ряд проблем, которые не позволили ему выиграть главный приз. Например, не до конца раскрыты персонажи. Над решением подобной проблемы разработчиками еще предстоит провести ряд исследований», - заявил на пресс-конференции конкурса писатель-фантаст Хасэ Сатоси.

Разработчики из Университета будущего Хакодате, где был создан роман, до сих пор еще не раскрыли алгоритм работы искусственного интеллекта. Известно лишь, что для написания произведения были изначально заданы детали сюжета, характеристики героев и используемые слова и фразы.

Авто поэзия Google

В мае 2016 года искусственный интеллект Google, проанализировав 11 тысяч неизданных книг, начал писать свои первые литературные произведения. Однако пока они достаточно мрачноваты:

Он надолго замолчал.
Он смолк на мгновение.
На секунду стало тихо.
Было темно и холодно.
Возникла пауза.
Теперь мой черед.

2015: Роботы "Яндекса" начинают писать заметки о погоде и ситуации на дорогах

В ноябре 2015 года направление подготовки автоматических текстов открыла российская компания Яндекс. В это время искусственный интеллект Яндекса выпускает лишь короткие заметки о погоде и ситуации на дорогах, однако в дальнейшем представители компании обещают расширить список тематик для публикаций.

2014: Associated Press запускает автоматическую подготовку текстов по финотчетам компаний

В 2014 году компания Associated Press объявила, что отныне большая часть новостей, связанных с доходами компаний, будут создаваться с помощью роботов.

«На протяжении долгих лет у нас уходило много времени, чтобы разобраться с цифрами о доходах компаний при подготовке статей. Однако платформа Wordsmith от компании Automated Insights позволила нам не только автоматизировать этот процесс, но и значительно увеличить производительность», - рассказал шеф-редактор Associated Press Лу Феррара.

Применение автоматизированных технологий позволило Associated Press увеличить число ежеквартальных новостей о доходах компаний с 300 до 4400. Позднее аналогичным сервисом воспользовался новостной портал Yahoo News. В 2016 году роботы-репортеры Associated Press несколько расширили свою тематику. Им стали доверять небольшие новостные заметки, связанные с Малой бейсбольной лигой США.

2013: Запуск сервиса "Яндекс.Автопоэт"

Специалисты Яндекс и Google проводили активные исследования, направленные на обучение машины поэзии. Сервис «Яндекс.Автопоэт», который был создан в декабре 2013 года, уже на протяжении нескольких лет составляет стихотворные строки на основе запросов пользователей и новостных заголовков. Для этих целей робота специально научили определять стихотворные размеры и рифмовать строчки между собой. Ознакомиться с полным списком произведений Автопоэта можно здесь. Один из примеров его стихотворений (орфография и пунктуация сохранены):

Эхо самарской полиции,
евро теряет позиции,
Курску грозит затопление,
доллар продолжил падение

Робототехника



Примечания