2020/05/07 22:06:45

Юрий Визильтер, ФГУП «ГосНИИАС»: Российский рынок ИИ стимулируется сегодня, скорее, любопытством, нежели массовым спросом

С российским рынком систем искусственного интеллекта связано много ожиданий: от бурного роста отечественных инновационных технологий до мощной волны практических внедрений на базе самых передовых инновационных разработок. Как успехи технологий формируют эти ожидания, и как они потом «приземляются» на практическую почву реальных внедрений, TAdviser рассказал Юрий Визильтер, начальник подразделения интеллектуального анализа данных и технического зрения ГосНИИ Авиационных систем (ФГУП «ГосНИИАС»), д.ф.-м.н., профессор РАН

Юрий
Визильтер
Глубокое обучение теперь не только «про картинки», но про все области нашей жизни

Юрий Валентинович, на фоне мощного продвижения в прессе технологий глубокого обучения (Deep Learning, DL), кажется, все остальное ушло в тень. Но ведь предыдущий опыт развития логических систем искусственного интеллекта (ИИ) никуда не исчез? Научный поиск продолжается. В каких направлениях он обещает быть особенно плодотворным?

Юрий Визильтер: В области ИИ всегда присутствовало два основных направления. Первое назовем условно ИИ-1 – искусственный интеллект, основанный на знаниях, логическом выводе и имитации человеческих рассуждений. Второе – ИИ-2, машинное обучение, основанное на оптимизации целевых функций и обучении на примерах, а не на копировании человеческого мышления. Долгое время лидировал ИИ-1: экспертные системы, системы автоматического вывода в формальных теориях, онтологии, системы представления знаний. В настоящее время лидирует ИИ-2, достигший существенных результатов с появлением глубоких нейронных сетей (ГНС). Видимо, будущее за синтезом этих двух направлений.

Какой вид может иметь результат такого синтеза?

Юрий Визильтер: Синтез этот, как мне представляется, будет развиваться по следующим двум принципиальным путям. Во-первых, это выучивание при помощи ГНС различных эвристик, которые будут повышать эффективность систем логического вывода при решении конкретных классов задач. Во-вторых, это использование глубокими нейросетями, обрабатывающими символьную информацию (сегодня такие сети есть, и успешно работают, например, в сфере машинного перевода), предметных и общих онтологий, созданных в рамках систем представления и накопления знаний. Иными словами, на первом пути ГНС должны помогать логическим системам работать более эффективно и обучаться на примерах, а на втором пути экспертные (человеческие) знания должны помогать ГНС выполнять все более интеллектуальные операции, которые требуют не только обучения, но и понимания общего контекста, структурного и символьного моделирования реальности. В итоге должен возникнуть «прозрачный» ИИ, способный не только эффективно решать задачи, но и внятно объяснять пользователю-человеку, как они были решены.

Что в самом ходе развитии DL обусловливает такое активное расширение спектра решаемых задач, которое мы наблюдаем сегодня?

Юрий Визильтер: Наиболее серьезное расширение возможностей ГНС в последние годы связано, пожалуй, с несколькими технологиями. Во-первых, ГНС теперь могут работать (то есть принимать на вход и формировать на выходе) не только с регулярными структурами данных типа изображений или сигналов, но и с любым произвольными структурами и моделями, описываемыми как наборы элементов и связей между ними. В математике такие модели называются графами, поэтому нейронные сети на графах называют «графовыми ГНС».

Во-вторых, методы обучения ГНС с подкреплением (reinforcement learning) позволили решать, так называемые, задачи глубокого управления и глубокой оптимизации. Соединение графовых моделей и методов глубокой оптимизации представляется сегодня возможным путем решения практически любых возможных задач, с которыми мы сталкиваемся в самых различных прикладных областях: от физики и инженерии до медицины и экономики. Ведь прикладные задачи, как правило, формулируются в терминах поиска «наилучшего решения» (в некотором классе, при некоторых ограничениях и т.п.). А это и есть задачи оптимизации. Именно поэтому глубокое обучение теперь не только «про картинки», но про все области нашей жизни.Догнать и перегнать: Российские ВКС прирастают новыми функциями 7 т

Есть и конкретные революционные технологии внутри глубокого обучения, которые приводят к быстрым локальным продвижениям в тех или иных задачах. Изначально это была сама архитектура сверточных сетей, которая позволила давно известным персептронам превратиться в современные глубокие сети. Несколько лет назад резкий прогресс в области реалистичного синтеза данных был связан с появлением генеративно-состязательных сетей (GAN), которые снабдили ГНС неким аналогом воображения, позволив сетям создавать нечто, чего они ранее не видели.

В последние годы мы видим триумфальное развитие архитектур ГНС на основе так называемых «модулей внимания» (attention), превративших идею сверточной сети в нечто гораздо более сложное и неоднородное. Сети на основе внимания обусловили современный прогресс в области обработки текстов и знаний на естественных языках, а сейчас активно внедряются и в задачи компьютерного зрения, особенно там, где необходима совместная обработка данных и знаний. Наконец, особого интереса заслуживает развитие технологий автоматического формирования и обучения глубоких нейросетей: AutoML (автоматическое обучение нейросетей) и NAS (Neural Architecture Search, алгоритм, отвечающий за поиск оптимальной архитектуры). Потенциально, это, возможно, самая революционная из «внутренних» технологий машинного обучения.

Где сегодня проходит граница применимости механизмов глубокого обучения (Deep Lerning, DL) и обучения с подкреплением (Reinforcement Learning, RL)? Просматривается ли «потолок» развития?

Юрий Визильтер: Я не вижу сегодня никаких принципиальных ограничений, которые бы не позволили взяться за решение любой конкретной прикладной задачи на основе методов машинного обучения. Практические ограничения, прежде всего, связаны с наличием необходимых объемов обучающих выборок (для DL) или достаточно быстрых и качественных моделей процессов и объектов (для RL). Есть методы работы по небольшим выборкам (few-shot learning), но на практике они пока не очень эффективно работают, поэтому большие выборки нам еще долго будут нужны.

Обучение с подкреплением требует многократного проигрывания тех или иных действий, поэтому модели, с которыми RL работает, должны быть очень быстрыми и при этом точными (верифицированными), иначе в реальности выученное на моделях управление не будет работать.

Ну, и, разумеется, нужны большие вычислительные мощности, особенно для RL и AutoML (автоматического формирования и обучения нейросетей). Уровень серьезных практических решений в ближайшие годы во многом будет определяться объемом задействованных при разработке вычислительных ресурсов. И здесь мы пока очень сильно отстаем от наших зарубежных конкурентов.

Отсутствие или недостаток данных для обучения, моделей и вычислительных ресурсов – наши основные практические ограничения на сегодня.

Одно из ключевых приложений известного проекта IBM Watson – медицинская диагностика, реализовано с помощью нейросетевой классификации. Но, говорят, там что-то пошло не так… Обещанных результатов достичь не удалось. Как думаете, в чем причина?

Юрий Визильтер: С системой IBM Watson мы не работали, тем более, в медицине. Но, думаю, сама идея верна и вовсе не скомпрометирована текущей неудачей. Кроме того, должен заметить, что я не уверен в том, что данная система действительно «не работает» в том общем понимании, как это было подано в СМИ. Возможно, проблема в крайне болезненной реакции врачей на ошибки ИИ. Это напоминает аналогичную гипертрофированную реакцию на любую аварию автомобилей с ИИ-автопилотами. Между тем, люди-водители сегодня ошибаются и создают аварийные ситуации с жертвами гораздо чаще, чем ИИ, но это не вызывает такой обостренной реакции.

Насколько мне известно, конкретные прикладные медицинские диагностические системы на основе ГНС работают сегодня в среднем не хуже среднего врача. Но отдельные довольно нелепые и очевидные для человека ошибки, которые они совершают (почему нейронные сети иногда так резко ошибаются – предмет отдельного разговора), не позволяют пока рекомендовать их для массового использования в такой чувствительной области, как медицина, где от диагноза зависят жизнь и здоровье людей не в среднем, а в каждом конкретном персональном случае. Думаю, такая консервативность и осторожность врачебного сообщества оправданы.

Нечто подобное мы наблюдаем и в гражданской авиации, где ИИ пока не встречают с распростертыми объятиями, поскольку не доверяют его решениям, даже если в среднем его эффективность в каких-то операциях доказана. Вероятно, в таких критических областях как медицина и авиация время широкого внедрения ГНС наступит только после создания действительно «прозрачного» ИИ, объясняющего свои выводы и при этом не подверженного тем внутренним уязвимостям, которые характерны для нынешних ГНС (для этого нам, в том числе, придется решить тот самый вопрос, почему нейронные сети иногда так резко ошибаются, хотя в среднем работают хорошо). Но, судя по последним тенденциям в развитии ГНС, это время уже не за горами.

Сегодня становится популярным понятие когнитивной системы, то есть способной размышлять, делать умозаключения. Как Вы думаете, не будет ли полезнее отказаться от достаточно размытой классификации «сильный ИИ» - «слабый ИИ» и перейти к сравнению имеющихся систем с точки зрения их когнитивных возможностей?

Юрий Визильтер: Концепция когнитивной системы возникла в рамках такой интегральной дисциплины как cognitive science, которая объединила усилия самых разных специалистов – философов, психологов, нейрофизиологов, лингвистов, математиков и программистов (в том числе, разработчиков ИИ), занятых попытками понять, что такое интеллект, сознание и мышление. За последние десятилетия эти междисциплинарные исследования привели, на мой взгляд, к очень существенному изменению наших представлений о том, как мы на самом деле мыслим.

Одним из наиболее впечатляющих результатов когнитивистики является, как мне кажется, то, что очевидно данная нам в ощущениях концепция целостного человеческого «Я» оказалась иллюзией и уступила место сложной модели множества параллельно протекающих, взаимодействующих и конкурирующих процессов мышления, на основе которых затем принудительно выстраивается линейный нарратив (повествование) нашего существования. Все эти результаты, безусловно, следует учитывать при работе над системами ИИ, особенно, когда речь заходит о создании «сильного ИИ», то есть искусственной личности.

Однако в самой методической установке когнитивистики мне видится некое важное упущение. Как видно даже из названия, когнитивная наука сосредоточена на некоторой когнитивной функции, под которой понимается «способность связывания событий во времени, построение интерактивной пространственно-временной модели событий» (см. Википедию). Между тем, познание не самоценно. Как заметил однажды замечательный писатель-фантаст Владимир Савченко, человек отличается от обезьяны не исследованием, а изобретением дубины. Человек – не столько познающий, сколько действующий субъект.

Когнитивная функция – служанка функции управления, выработки поведения. Модель мира нужна не сама по себе, а для выработки стратегии и тактики наших действий, именно поэтому критерий состоятельности наших знаний – практика. Если на основе законов физики удается строить работающие машины, значит, это полезное знание, в отличие, например, от алхимии, которая к успешной практике не ведет. Общие знания, пространственно-временные модели, концепции и эмоции – все это выражается в итоге в «сенсорно-эффекторных» связях, то есть в том, как человек (или ИИ), опираясь на получаемую из внешнего мира информацию, действует в той или иной ситуации. Обычно я рассказываю это своим студентам на первой же вводной лекции, чтобы они не переоценивали «компьютерную обработку информации» в ущерб «автоматическому управлению».

Поэтому я и считаю, что понятие «функционального ИИ» как искусственной системы, выполняющей некоторую полезную работу, которую раньше могли выполнять только люди, гораздо содержательнее понятия «когнитивная система». Послезавтра, может быть, мы сможем шагнуть за пределы функционального ИИ, но и тогда важнее будет то, как и насколько сложно/целесообразно/адаптивно ИИ действует, нежели то, как он познает, и какие модели использует.

Вы прямо ставите крест на красивой идее проекта IBM Watson о полноценной интеллектуальной «познающей» машине…

Юрий Визильтер: Вовсе нет. Думаю, с точки зрения функций, когнитивная система там, несомненно, построена. Другой вопрос, каков уровень этой когнитивной системы?

Проблема оценки уровня интеллектуальности ИИ столь же сложна, как и проблема оценки уровня интеллектуальности человека. Самые известные оценки интеллектуальности – знаменитые тесты IQ, но даже вокруг них до сих пор ведутся бесконечные споры о том, что именно и насколько хорошо они измеряют. Поэтому вопрос о «полноценном познании» представляется мне не совсем корректным, это скорее из области мифов и неверных ожиданий в области ИИ. Ведь существует множество различных аспектов такой «полноценности».

Почему бы просто не воспользоваться тестом Тьюринга?

Юрий Визильтер: Конечно, им можно воспользоваться. Тест Тьюринга был придуман, чтобы проверить один из аспектов упомянутой «полноценности» ИИ, а именно: сопоставим ли уровень ИИ (например, IBM Watson) как функциональной когнитивной системы с уровнем человека? Чтобы ответить на этот вопрос, нужно, видимо, указать, о каком человеке идет речь: насколько этот конкретный человек умен, насколько эрудирован и т.п. Думаю, варьируя эти параметры, можно найти человека, например, ребенка, который систематически проиграет IBM Watson по большинству измеримых когнитивных параметров. Что это докажет? Разумеется, ничего. Дело в том, что интуитивно, задавая такой вопрос, мы хотели бы сравнить конкретный ИИ (в нашем примере, IBM Watson) не с конкретным человеком, а с Человеком, то есть со всем человечеством, что явно методически неверно.

Другой аспект вопроса о «полноте» познающего ИИ: можно ли достигнутый в нем уровень приобретения и использования знаний еще существенно повысить? Например, можно ли создать еще более мощную искусственную когнитивную систему, чем IBM Watson? Здесь ответ очевиден – конечно, можно, ведь процесс развития в данной области еще крайне далек от принципиально достижимых пределов. Что это значит для оценки IBM Watson? Также ничего… Современные сверхскоростные поезда намного быстрее паровоза Стефенсона. Означает ли это, что Стефенсон не достиг прорыва? Разумеется, нет. Последующие достижения не обесценивают предыдущие. Каждый шаг на дороге развития технологии важен. Проект IBM Watson – несомненно, шаг вперед. Насколько большой – мы сможем оценить, вероятно, несколько позже, в ретроспективе, в сравнении с другими результатами ближайших лет.

Есть ли сегодня какие-то ИИ-системы, которые Вы могли бы привести в качестве примера наиболее продвинутых и действительно «думающих» решений?

Юрий Визильтер: Сам вопрос предполагает более высокую «интеллектуальность» технологий ИИ-1, работающих с символьным представлением данных, языком и структурными моделями, по сравнению с технологиями ИИ-2, основанными на обучении и работе с первичными сенсорными данными. На самом деле это не так. Выше я уже отмечал, что обе способности нужны для интеллекта (и человеческого, и искусственного), и только их серьезный синтез позволит выйти на новый уровень. Исторически ИИ-1 первым вышел на уровень практических внедрений. Еще в 90-х годах прошлого века были созданы реально работающие экспертные системы, которые до сих пор используются, например, в той же медицине. Также еще в 1997 г. без всяких нейронных сетей компьютер Deep Blue обыграл чемпиона мира по шахматам, а сегодня в любом телефоне можно установить шахматное приложение, которое будет играть на уровне мастера спорта по шахматам. Разве это не ИИ в действии? Просто мы перестали этому удивляться, потому что это давно не новость.

В последние годы на авансцену выдвинулся ИИ-2, в развитии которого можно выделить две фазы (две волны), связанных с современной нейросетевой революцией. К первой волне можно отнести собственно появление глубоких нейросетей и их применение в техническом зрении, анализе больших данных, предиктивном анализе. Это те технологии ИИ-2, практическое внедрение которых активно идет прямо сейчас. Очень серьезные практические результаты получены, например, с помощью технологий распознавания лиц, автоматического распознавания товаров и т.п. Все мы помним технологию FindFace российской компании NtechLab, которая позволяла в реальном времени вести поиск людей в соцсетях. Это было отличное приложение, которое могло качественно изменить наш обиход, если бы не политические соображения о защите персональных данных. Реально заработали только в последние два года автоматические проходные без пропусков с доступом по лицу, системы автоматической оплаты товаров и услуг на базе лицевой биометрии. Такие вещи делает, например Vision Labs. У нас (ГосНИИАС) также есть подобные биометрические технологии и успешные проекты по их внедрению в проходных и системах оплаты ряда российских компаний. Думаю, скоро такие вещи будут внедрены повсеместно, и мы просто перестанем их замечать. Также у всех на слуху безлюдный супермаркет Amazon Go, использующий нейросетевые технологии распознавания товаров. Насколько мне известно, сейчас целый ряд российских компаний разрабатывает подобные приложения, которые не будут уступать технологиям Amazon.

Вторая волна нейросетевой революции связана с такими технологиями как нейросети на графах, нейросети с памятью, обучение с подкреплением (RL), AutoML, работа с естественным языком (NLP), глубокая оптимизация и глубокое управление (в том числе, в робототехнике), «прозрачный» ИИ на основе совмещения глубокого обучения с базами знаний и системами логического вывода. Они позже стартовали, но сейчас также стремительно приближаются к тому уровню готовности, который необходим для реального применения.

Какие технологии этой второй волны, на Ваш взгляд, ближе всего к массовому внедрению?

Юрий Визильтер: Из второй волны ближе всего к практике, видимо, речевые технологии. Посмотрите, какой прогресс за последние год-полтора произошел, например, в системах автоматического перевода. Значительно поумнели и голосовые помощники, хотя над ними по привычке все еще больше принято смеяться. Также прямо на глазах совершенствуются и качественно улучшаются системы управления автономным транспортом. Глубокие нейросети в автомобильных автопилотах уже не только распознают окружающую обстановку, но и непосредственно формируют управление. Над практическими приложениями нейросетевых технологий начали всерьез работать крупные ритейлеры, озабоченные проблемами развития своих бизнес-процессов и, в первую очередь, минимизацией издержек. Наконец, очень серьезно выглядят успехи глубокого обучения с подкреплением в игровых задачах типа AlphaStar, правда за пределами виртуального мира они пока не используются.

Я думаю, действительно выдающиеся результаты на основе технологий второй волны, реализующих синтез ИИ-1 и ИИ-2, мы увидим лет через пять-семь. Примерно такой же временной лаг был между научными успехами распознающих ГНС в 2011 - 2015 годах и их нынешним широким внедрением в прикладных системах.

Что, на Ваш взгляд, является главной движущей силой, которая сегодня двигает реализацию самых передовых проектов ИИ на коммерческом рынке в нашей стране? Что ограничивает их широкое внедрение?

Юрий Визильтер: Движущей силой коммерческих проектов всегда является прибыль. Когда заказчики убедятся, что технологии ИИ приносят им существенную прибыль, тогда и возникнет настоящий рынок в области ИИ. Пока такого рынка фактически нет, точнее, он очень невелик. Российский рынок ИИ стимулируется сегодня, скорее, любопытством и надеждами крупных игроков, нежели массовым спросом. Единственной массовой широко внедренной технологией являются рекомендательные сервисы в Интернете, но даже их монетизация не вполне ясна. Биометрия, о которой я говорил выше, - это тоже реально существующий, но очень нишевый рынок. Нам также ясны сегодня задачи и перспективы внедрения ИИ в области обороны и безопасности, но это во всем мире не вопрос рыночного спроса, а предмет плановой работы, организуемой и направляемой государством.

Не густо получается, если спуститься с небес маркетинга на землю практических проектов...

Юрий Визильтер: С точки зрения бизнеса, это очень неустойчивое состояние, чреватое крахом рынка в любой момент, как только у нескольких ключевых игроков возникнет субъективное ощущение разочарования. Представьте себе, что мы обсуждаем состояние автомобильного рынка вскоре после изобретения автомобиля, но задолго до того, как Форд превратил автомобиль из нишевого и премиального продукта в массовый товар, а по всему миру были созданы автомобильные дороги и сети заправок. Примерно в таком же состоянии сейчас находится рынок ИИ. Перспективы очевидны, но необходимо еще резкое удешевление и упрощение технологии, в том числе, на аппаратном уровне, а также создание всей сопутствующей, прежде всего, вычислительной и информационной инфраструктуры, которая была бы доступна всем пользователям.

Широкое внедрение технологий ИИ второй волны сдерживается тем, что они, действительно, пока еще не готовы к внедрению. Для их развития и практического внедрения нужны данные и модели, а также вычислительные ресурсы. И самое главное – заказчики и партнеры в сфере бизнеса должны руководствоваться не мифами об ИИ, а четким и современным пониманием возможностей и ограничений реально доступных технологий на основе ГНС. Завышенные ожидания здесь вредны, но не следует так же слишком долго ждать и осторожничать. Многое в области ИИ на практике работает уже сегодня, и тот, кто сумеет воспользоваться этим, получит несомненные бизнес-преимущества.