2024/01/16 11:20:56

Нейросети
Нейронные сети
Нейротехнологии

Нейросети – одно из направлений искусственного интеллекта, цель которого – смоделировать аналитические механизмы, осуществляемые человеческим мозгом. Задачи, которые решает типичная нейросеть – классификация, предсказание и распознавание.

Содержание

Безопасность нейросетей
- 2022: ИИ может ошибаться даже при незаметных модификациях данных
Нейронные сети и байесовские модели
Нейросети для создания картинок
Как использовать нейросети
- Нейросети в радиологии
- Нейросети в СМИ
  - 2023: Какие нейросети уже сегодня можно использовать в СМИ
Нейросети в России
Нейросети в мире
Как строение нейронных связей в мозге легло в основу алгоритмов нейронных сетей
Homo ex machina: переносим сознание в компьютер
Графовые нейросети: мимолетный тренд или за ними будущее
Робототехника
Примечания

Основная статья: Машинное обучение (Machine Learning)

Нейросети способны самостоятельно обучаться и развиваться, строя свой опыт на совершенных ошибках. Анализируя и обрабатывая информацию из какого-то конкретного источника, либо из сети Интернет в целом, самоорганизующаяся система способна создавать новые продукты, не только воспроизводя и структурируя вводные данные, но и формируя качественно иной результат, ранее недоступный искусственному интеллекту.

Нейронет (NeuroNet) – один из предполагаемых и наиболее вероятных этапов развития Интернета. На новом этапе развития всемирной паутины взаимодействие участников будет осуществляться на принципах нейрокоммуникаций, т.е. на основе передачи информации об активности головного мозга. Ученые прогнозируют формирование рынка Нейронета к 2030-2040 г. Причем, ожидается, что в это время на рынке уже будут функционировать не менее 10 российских компаний с общей капитализацией около 700 млрд рублей.

Безопасность нейросетей

2022: ИИ может ошибаться даже при незаметных модификациях данных

Специалисты компании «Криптонит» провели масштабное исследование безопасности искусственных нейросетей, повсеместно применяемых в системах компьютерного зрения, распознавания речи и глубокого анализа различных данных, включая финансовые и медицинские. Об этом компания сообщила 29 ноября 2022 года.

Эксперты сравнили описанные в научных статьях атаки на модели машинного обучения (ML), построенные на основе искусственных нейронных сетей (ИНС), воспроизвели разные реализации атак и рассказали про 10 самых наглядных.

Догнать и перегнать: Российские ВКС прирастают новыми функциями 8.5 т

В своём исследовании авторы использовали три общепринятых в информационной безопасности сценария:

атака типа white-box предполагает наличие полного доступа к ресурсам сети и наборам данных: знание архитектуры сети, знание всего набора параметров сети, полного доступа к обучающим и тестовым данным;
атака типа gray-box характеризуется наличием у атакующего информации об архитектуре сети. Дополнительно он может обладать ограниченным доступом к данным. Именно атаки по типу «серого ящика» чаще всего встречаются на практике.
атака типа black-box характеризуется полным отсутствием информации об устройстве сети или наборе обучающих данных. При этом, как правило, неявно предполагается наличие неограниченного доступа к модели, то есть имеется доступ к неограниченному количеству пар «исследуемая модель» + «произвольный набор входных данных».

Были протестированы различные библиотеки для создания вредоносных примеров. Изначально были отобраны AdvBox, ART, Foolbox, DeepRobust. Производительность AdvBox оказалась очень низкой, а DeepRobust на момент исследования была очень сырой, поэтому в сухом остатке оказались ART и Foolbox. Эксперименты проводились на различных типах моделей ML. В своем отчете «Криптонит» поделился самыми наглядными результатами, полученными с использованием одной фиксированной модели на основе свёрточной нейронной сети и пяти различных атак. Их реализации взяты из двух библиотек.

Для демонстрации использовалась база данных MNIST, которая содержит 60 000 образцов рукописных цифр, и отобрали самые наглядные вредоносные примеры.

Число сверху – абсолютная величина максимального отклонения возмущения от оригинала. Под изображением три числа: максимальное отклонение, минимальное и среднее. В нижней строке – метка и вероятность.

Исследование показало, что проблема с безопасностью моделей ML, основанных на нейросетях, действительно есть. Нейросеть может «с уверенностью» выдать некорректный результат при совсем небольших изменениях в картинке или других входных данных — настолько незначительных, что человек их вряд ли заметит.

Так, картинка слева — исходный пример, в котором нейросеть уверенно распознаёт цифру «4». Посередине — неудачный вредоносный пример. Изображение заметно искажено, однако нейросеть всё равно распознаёт четвёрку. Справа — работающий вредоносный пример. Он визуально неотличим от предыдущего, но здесь уже преодолён порог возмущений, за которым нейросеть теряется и выдаёт неверный результат распознавания. В данном случае вместо «4» она распознаёт «7». В примере выше человек уверенно различает цифру «4» на любой из трёх картинок, но исходные изображения не всегда бывают достаточно чёткими.

Например, на следующей картинке недописанный ноль может зрительно восприниматься как цифра «6» — вопрос в том, куда мысленно продолжить линию. Нейросеть тоже не уверена: она показывает низкую вероятность, но правильно распознаёт ноль на изображении. Чтобы заставить ИНС ошибиться, нужно изменить всего несколько пикселей. При этом величина вносимого возмущения будет порядка 1/256, что соответствует величине цветового разрешения.

Нейросеть далеко не всегда удаётся обмануть так просто. В случае уверенного распознавания объекта придётся сгенерировать и проверить множество вредоносных примеров, прежде чем удастся найти рабочий. При этом он может быть практически бесполезным, так как вносит слишком сильные возмущения, заметные невооружённым глазом.

Для иллюстрации в «Криптонит» взали наиболее легко распознаваемую цифру «9» из тестового набора и показали некоторые получившиеся вредоносные примеры. На иллюстрации видно, что в 8 случаях из 12 построить вредоносные примеры не удалось. В остальных четырёх случаях исследователи обманули нейросеть, но эти примеры получились слишком зашумлёнными. Такой результат связан с уверенностью модели в классификации исходного примера и со значениями параметров различных методов.

В целом эксперимент показал ожидаемые результаты^[1]: чем проще изменения, которые вносятся в изображение, тем меньше они влияют на работу ИНС. Следует подчеркнуть, что «простота» вносимых изменений относительна: это может быть и десяток пикселей, но вот догадаться, каких именно, и как их нужно изменить — сложная задача. Нет такого гвоздя, на котором полностью держится результат классификации CNN: в общем случае нельзя изменить один пиксель так, чтобы ИНС ошиблась.

Методы PGD, BIM, FGSM, CW, DeepFool оказались самыми эффективными для сценария «белый ящик». Вне зависимости от реализации, они позволяют провести удачную атаку с вероятностью 100%, однако их применение подразумевает наличие полной информации о модели ML.

Методы Square Attack, HopSkipJump, Few-Pixel, Spatial Transformation предполагают наличие информации об архитектуре модели. Были получены единичные удачные примеры атак, но практическое использование этих методов не представляется возможным. Возможно, ситуация изменится в будущем, если появятся достаточно эффективные реализации, стимулирующие интерес исследователей к этим методам.

Все рассмотренные методы «чёрного ящика» используют уровень достоверности, возвращаемый нейронной сетью. Если хотя бы немного понизить точность возвращаемого уровня достоверности, то (и без того невысокая) эффективность методов упадёт многократно.

Нейронные сети и байесовские модели

Две популярные парадигмы в области машинного обучения. Первые совершили настоящую революцию в области обработки больших объемов данных, дав начало новому направлению, получившему название глубинное обучение. Вторые традиционно применялись для обработки малых данных. Математический аппарат, разработанный в 2010 годы, позволяет конструировать масштабируемые байесовские модели. Это дает возможность применить механизмы байесовского вывода в современных нейронных сетях. Даже первые попытки построения гибридных нейробайесовских моделей приводят к неожиданным и интересным результатам. Например, благодаря использованию байесовского вывода в нейронных сетях удается сжать сеть приблизительно в 100 раз без потери точности ее работы.

Нейробайесовский подход потенциально может решить ряд открытых проблем в глубинном обучении: возможность катастрофического переобучения на шумы в данных, самоуверенность нейронной сети даже в ошибочных предсказаниях, неинтерпретируемость процесса принятия решения, уязвимость к враждебным атакам (adversarial attacks). Все эти проблемы осознаются научным сообществом, над их решением работают многие коллективы по всей планете, но готовых ответов пока нет.

Нейросети для создания картинок

Основная статья: Нейросети для создания картинок

Как использовать нейросети

В мире созданы нейронные сети, способные рисовать картины в любом существующем художественном стиле, уверенно обыгрывать чемпиона мира в самую сложную логическую игру на планете, записывать музыкальные альбомы и подражать поведению человека в электронной переписке. Всё перечисленное – пока лишь демонстрация части возможностей технологии, реальное применение которой как в бизнесе, так и в быту, мы увидим в ближайшем будущем.

Другими словами, нейронные сети позволят не только и не столько заменить человеческий труд в более сложных трудовых активностях, сколько стать полезным инструментом для специалистов и управленцев множества областей.

Влад Шершульский, Директор по перспективным технологиям, Microsoft Rus комментирует: «Эта область окончательно стала в 2016 году «горячей»: примерно с 2009 года наблюдается быстрый прогресс в создании все более сложных, и при этом все более эффективных, глубоких нейронных сетей, а в самое последнее время мы увидели впечатляю щие приложения и стали свидетелями создания целого ряда успешных стартапов. Порог входа на рынок нейросетевых сервисов существенно снизился, а проекты, построенные вокруг идеи одного интересного приложения, реализуются за считаные месяцы. Все это породило бум нейросетевых стартапов, вызвало интерес крупных корпораций и способствовало росту спроса на специалистов в этой области, в том числе и в России. Приятно отметить, что важнейший вклад в создание нового поколения технологий работы с естественными языками внесли специалисты компании Microsoft. В известном телевизионном сериале «Звездный путь» создание онлайнового перевод чика устной речи прогнозировали в XXII веке, а он у нас уже есть сегодня. Конечно, другие применения – от прогнозирования поломок автомобилей и банкротства контрагентов до новых средств кибербезопасности – тоже развиваются весьма успешно».

Нейросети в радиологии

Основная статья: Искусственный интеллект в медицине

Нейросети в СМИ

2023: Какие нейросети уже сегодня можно использовать в СМИ

Сегодня все больше людей понимают, что за нейросетями будущее, и что на них можно делать вещи, которые раньше были невозможны. Как и любой инновационный продукт - широкой аудитории нейросети кажутся чем-то малоприменимым, но любопытным. Они умеют писать музыку, обрабатывать и генерировать изображения, выделять главное, озвучивать текст, поддерживать несложный диалог. Но после первого восторга все наиграются, и новинка станет рабочей обыденностью во всех сферах. Например, специально для СМИ было отобрано несколько способов потенциального применения нейросетей для решения реальных задач.

В статье «Медиа будущего: какие нейросети уже сегодня можно использовать в СМИ» представлены результаты исследования экспертов, которые, опираясь на свой многолетний опыт работы в онлайн-СМИ, проанализировали: что могло бы упростить журналистам работу, улучшить качество материалов и повысить эффективность бизнеса. Подробнее здесь.

Нейросети в России

В России разработками в области нейросетевого программирования занимаются крупнейшие интернет-холдинги, в частности, VK (ранее Mail.ru Group) и Яндекс, используя нейросети для анализа изображений и обработки текстов в поисковике. Самыми знаменитыми примерами стали технологии компаний Microsoft, Google, IBM и Facebook, а также стартапы MSQRD, Prisma^[2].

2024

Российские ученые улучшили модель диффузионной нейросети

Ученые Центра искусственного интеллекта и факультета компьютерных наук НИУ ВШЭ, а также Института искусственного интеллекта AIRI и Sber AI разработали структуру диффузионной модели, для которой возможно задать восемь видов распределения шума. Вместо классической структуры модели в виде цепи Маркова и применения нормального распределения ученые предложили звездообразную модель, где возможно выбирать тип распределения. Это поможет решать задачи в разных геометрических пространствах с помощью диффузионных моделей. Об этом 15 февраля 2024 года сообщили представители НИУ ВШЭ. Подробнее здесь.

Российские ученые нашли способ ускорить обучение нейросетей ориентироваться в пространстве

Исследователи из НИУ ВШЭ, НИТУ МИСИС и AIRI нашли способ эффективнее проводить обучение с подкреплением для нейросетей, заточенных на ориентацию в пространстве. С помощью механизма внимания эффективность работы графовой нейросети увеличилась на 15%. Результаты исследования опубликованы в журнале IEEE Access. Об этом 23 января 2024 года сообщили представители НИУ ВШЭ. Подробнее здесь.

Российские ученые научили нейросети распознавать юмор по-человечески

Группа ученых факультета компьютерных наук НИУ ВШЭ провела исследование способности нейросетей распознавать юмор. Выяснилось, что для более надежного распознавания следует изменить подход к созданию наборов данных, на которых обучаются нейросети. Такой информацией с TAdviser поделились представители НИУ ВШЭ 11 января 2024 года.

Freepik

Как известно, голосовые помощники могут только рассказать готовый анекдот, придумать же свой или распознать шутливый тон они не в состоянии. При этом пользователи голосовых помощников, созданных на основе технологии искусственного интеллекта, хотят от них большей человечности — способности распознать шутку и пошутить.

С середины 2000-х годов ученые занимаются распознаванием юмора как задачей классификации «смешно — не смешно», в этой же рамке собираются и размечаются датасеты (набор данных). Группа ученых из ВШЭ предложила изменить подходы к формированию таких датасетов — сделать их более разнообразными, причем наборы данных не обязательно должны быть очень большими.

Как пояснили представители НИУ ВШЭ, задача распознавания юмора сложна еще и потому, что отсутствуют формальные критерии для определения того, что смешно, а что нет. Большинство существующих датасетов для обучения и оценки моделей распознавания юмора содержат каламбуры (puns). Сарказм и ирония еще более сложны, как и ситуативный юмор, требующий знания контекста или культурного кода.

«Мы хотели оценить переносимость и устойчивость моделей, обученных на разных датасетах. Переносимость — это то, насколько обученная на датасете с одним типом юмора модель хорошо определяет другой тип юмора. Было совсем не очевидно, как будет работать обучение, потому что юмор бывает разным», — поделился Павел Браславский, доцент факультета компьютерных наук НИУ ВШЭ.

Устойчивость же ученые проверяли «состязательными атаками» — попытками заставить нейросеть увидеть юмор там, где его нет. Нейросеть получала несмешной, но формально похожий на юмористический текст — вместо каламбура в диалоге использовалось «неправильное» созвучное слово. Чем меньше сеть попадается в такие ловушки, тем она более устойчива.

Исследователи обучали модели на стандартных датасетах для распознавания юмора и на их смесях. Кроме того, модели проходили проверку диалогами из «Алисы в Стране чудес» Льюиса Кэрролла, «Лавки древностей» Чарльза Диккенса, «Троих в лодке, не считая собаки» Джерома К. Джерома, сериалов «Ходячие мертвецы», «Друзья» и коллекцией ироничных твитов.

Оказалось, что некоторые модели переобучаются и считают все смешным.

«Мы показали разным моделям `Лавку древностей` Диккенса, а это очень грустная история, и попросили оценить происходящее. Выяснилось, что некоторые модели считают, что все диалоги из литературы XIX века смешные. И даже больше — все, что слишком непохоже на новости XXI века, принимается как юмор», — рассказал Александр Баранов, аспирант факультета компьютерных наук НИУ ВШЭ.

Модели, натренированные на каламбурах, чаще ошибаются, если в несмешном тексте одно слово заменено на созвучное. Также выяснилось, что нейросети, натренированные на небольших частях разных датасетов, распознают юмор лучше, чем обученные на большом объеме однотипных данных. Авторы делают вывод, что существующие датасеты слишком узкие, юмор в каждом из них сильно ограничен, и это снижает качество распознавания шуток.

Исследователи предложили изменить подход к обучению и оценке моделей распознавания юмора. Нужны новые датасеты, более разнообразные и близкие к обычным разговорам, естественному общению. Большие языковые модели, например ChatGPT, обученные на огромных массивах данных разных типов, в среднем хорошо справляются с распознаванием юмора, и ученые предполагают, что дело именно в разнообразии данных, на которых они учились.

«Мы сейчас говорим только о бинарном распознавании юмора: смешно или не смешно. До определения оттенков юмора, различения сарказма и иронии, распознавания ситуативного, контекстуального юмора очень далеко. У наших голосовых помощников шутки пока `гвоздями приколочены` и обложены фильтрами, определяющими, какую шутку выдать в зависимости от слов пользователя. Такая запрограммированность ответов ощущается как неестественная. Запрос на большую человечность искусственного интеллекта абсолютно понятен, но удовлетворить его будет непросто», — подчеркнул Владимир Князевский, один из авторов исследования, студент факультета компьютерных наук НИУ ВШЭ.

Исследование выполнено в рамках проекта Научно-учебной лаборатории моделей и методов вычислительной прагматики.^[3]

2022: Российские ученые представили метод классификации фотографий на базе квантовой нейросети

Российские физики лаборатории Квантовых информационных технологий Университета МИСИС, Российского квантового центра и МГУ имени М.В. Ломоносова впервые представили метод классификации фотографий с высокой точностью для 4-х классов изображений, основанный на архитектуре квантовой сверточной нейронной сети (QCNN). Об этом TAdviser сообщили представители НИТУ МИСИС 24 ноября 2022 года. Подробнее здесь.

2021

В России создали нейросеть, генерирующую картинки по описанию на русском языке

Сбер 2 ноября 2021 года сообщил TAdviser о создании нейронной сети ruDALL-E, которая способна создавать изображения на основе текстового описания на русском языке. Подробнее здесь.

26% предпринимателей доверили бы искусственному интеллекту общение с клиентами

13 октября 2021 года аналитики Platforma («Платформа больших данных») подклились результатами изучения отношения малого и среднего бизнеса к искусственному интеллекту (ИИ) и большим данным. Больше трети респондентов (36,8%) считают, что работа ИИ требует контроля и проверки результатов. Но каждый пятый (22,1%) предприниматель уже на октябрь 2021 года готов заменить личного ассистента на умную программу для выполнения персональных поручений. Подробнее здесь.

2020: Российские учёные научили искусственный интеллект «видеть» квантовые преимущества

Российские ученые из МФТИ, ФТИАН и ИТМО создали нейросеть, которая научилась предсказывать поведение квантовой системы, «взглянув» на схему этой системы. Об этом 16 января 2020 года МФТИ сообщил TAdviser.

Такая нейросеть самостоятельно находит те решения, которые хорошо подходят для демонстрации квантовых преимуществ. Это поможет исследователям разрабатывать эффективные квантовые компьютеры.

Большой круг задач современной науки решается на основе квантово-механических расчетов. Например, химические и биологические: исследования химических реакций или поиск устойчивых молекулярных структур для промышленности, медицины, фармацевтики и других областей.

Для точного решения такого рода «квантовых» задач хорошо подходят квантовые вычисления, в отличие от классических, на основе которых квантовые задачи решаются в большинстве случаев лишь громоздко и приближенно.

Процесс создания квантовых вычислительных схем — трудоемкое и дорогостоящее занятие. Не всегда получившиеся устройства показывают «квантовое превосходство» — демонстрируют скорость обработки информации быстрее обычного классического компьютера. Поэтому ученым хотелось бы иметь инструмент для прогнозирования того, будет ли какая-то схема обладать квантовым преимуществом или нет.

Одной из реализаций квантовых вычислений являются квантовые блуждания. Упрощенно можно представить этот метод как перемещение частицы по определенной сети, составленной из точек-узлов и соединений между этими узлами. Такие сети и образуют схему квантовой системы.

Если квантовое перемещение частицы — блуждание — из одного узла сети в другой оказывается быстрее классического, то можно говорить, что устройство на основе такой схемы показывает квантовое преимущество. Поиск сетей, обладающих квантовым преимуществом, является важной задачей, над которой работают эксперты в области квантовых блужданий.

Идеей Алексея Мельникова, Леонида Федичкина и Александра Алоджанца было заменить эксперта машинным интеллектом: научить компьютер различать сети и давать ответ на вопрос, в каких сетях квантовые блуждания будут давать преимущество. То есть обнаружить сети на основе которых имеет смысл строить квантовый компьютер.

Исследователи взяли нейросеть, которая «специализировалась» на распознавании изображений. На вход программе подавалась матрица смежности сети и номер входного и выходного узла. На выходе нейросеть давала ответ, будет ли квантовое блуждание между этими узлами быстрее классического.

Было неочевидно, что этот подход сработает, Но он работает, и мы очень успешно научили компьютер самостоятельно предсказывать квантовое преимущество в сетях сложной структуры,

говорит Леонид Федичкин, доцент кафедры теоретической физики МФТИ

Грань между квантовым и классическим поведением систем зачастую размыта. Изюминкой нашей работы стало создание особого компьютерного зрения, с помощью которого удалось увидеть эту грань в пространстве сетей,

поясняет Алексей Мельников, научный сотрудник ИТМО

Исследователи создали инструмент, позволяющий упростить разработку вычислительных схем на основе квантовых алгоритмов, основными приложениями которых должны стать биофотоника и материаловедение.

Например, с помощью квантовых блужданий легко описывается возбуждение фоточувствительных белков, таких как родопсин или хлорофилл. Белок — это в каком-то смысле сложная молекула, похожая на сеть. Задача понять, что произойдет с электроном, попавшим в какую-то точку в молекуле, как он будет двигаться и какое возбуждение вызывает, в переводе на формальный язык и есть поиск времени блуждания из одного узла сети в другой.

Ожидается, что расчет естественных природных процессов на квантовых блужданиях реализовать проще, чем на архитектуре из кубитов и гейтов, так как сами блуждания — это естественный физический процесс.

2019: Promt представила решения для переводов с использованием нейронных сетей

В сентябре 2019 года компания Promt представила готовые решения для переводов, использующие технологии нейронных сетей и больших данных, - Promt Neural. Их в компании называют новым этапом эволюции машинного перевода. Подробнее здесь.

2017

В Москве создадут нейросеть для распознавания показаний счетчиков воды по фото

Департамент информационных технологий (ДИТ) Москвы приступил к созданию системы на базе нейросети, предназначенной для считывания показаний счетчиков воды непосредственно с их фотографий. Научить нейронную сеть распознавать показания счетчиков на фото планируется к концу 2017 года. В целях обучения ей предстоит обработать порядка 10 тыс. таких изображений.^[4]

Создаваемая в Москве нейросеть сможет считывать показания расхода воды по фотографиям счетчиков. Фото: VistaNews.ru

Мэрия Москвы на своем сайте попросила помочь жителей города с обучением нейронной сети. Для этого им потребуется просто загрузить снимки на сайт, подтвердив затем корректность распознанных цифр. Москвичи смогут загружать неограниченное количество фото, однако должны будут следовать ряду правил при фотографировании показаний: камера должна находиться на расстоянии не более 15 см от счетчика; не менее половины снимка должно быть занято изображением счетчика; на одном фото не должно быть два счетчика и более; разрешается сделать несколько снимков одного счетчика с разных ракурсов.

Чтобы сообщить показания счетчика, жителям столицы пока приходится вводить данные вручную. Распознавание показаний по фото, как ожидается, будет занимать считанные секунды и, как результат, позволит сэкономить москвичам время.

После запуска в работу натренированной нейросети фотографии нужно будет загружать в приложения «ЖКХ Москвы», «Госуслуги Москвы» или в личный кабинет на сайте mos.ru. Предполагается, что сеть сможет распознавать цифры на фотографиях счетчиков независимо от освещения, угла съемки, возможностей камеры и качества снимков.

Создание противораковых лекарств Mail.Ru Group, Insilico Medicine и МФТИ

8 февраля 2017 года Mail.Ru Group, Insilico Medicine и МФТИ сообщили об использовании нейронной сети для создания новых лекарств. Предполагается, что эта технология поможет искать препараты в самых разных областях — от онкологии до сердечно-сосудистых заболеваний.

Российские ученые взяли за основу архитектуру состязательных автокодировщиков. Для обучения использовались молекулы с известными лечебными свойствами и эффективной концентрацией. Информацию о такой молекуле подавали на вход сети. Сеть настраивали так, чтобы на выходе получить точно такие же данные. Она была составлена из трёх структурных элементов — кодировщика, декодера и дискриминатора, — каждый из которых выполнял свою специфическую роль, «сотрудничая» с двумя другими.

Кодировщик совместно с декодером обучался сжимать и затем восстанавливать информацию об исходной молекуле, а дискриминатор помогал сделать сжатое представление более подходящим для последующего восстановления. После того как сеть обучалась на множестве известных молекул, кодировщик вместе с дискриминатором «выключались», и сеть, используя декодер, генерировала описание молекул уже сама.

Архитектура нейронной сети

По словам специалистов, эффективность обучения нейронных сетей зависит от числа входных данных и размера самой сети. В среднем хорошая нейронная сеть может обучаться за неделю. Однако поиск оптимального решения архитектуры сети может потребовать нескольких месяцев.

Мы сделали нейронную сеть генеративного типа, то есть умеющую создавать схожие вещи, на которых она обучалась. Мы обучили модель сети, которая способна создавать новые фингерпринты с заданными свойствами, — рассказал один из авторов проекта аспирант МФТИ Андрей Казеннов.

В эксперименте, проведенном Mail.Ru Group, Insilico Medicine и МФТИ, сначала сеть обучалась на множестве известных молекул, потом она генерировала описание молекул сама. Для проверки сети использовали базу патентов в области противораковых лекарств. Задачей было предсказание уже известных форм, но таких, которых не было в обучающей выборке. На большую часть предсказанных нейросетью веществ уже есть патенты.

Нейросети в мире

2024: Создана нейросеть, которая имитирует почерк человека

В конце декабря 2023 года специалисты из Университета искусственного интеллекта имени Мохамеда бен Заида в ОАЭ (MBZUAI) сообщили о создании нейросети, способной имитировать почерк человека. Разработчики зарегистрировали свою технологию в Управлении по патентам и товарным знакам США (USPTO). Подробнее здесь.

2023: Оказалось, что нейросети не способны учиться подобно человеческому мозгу из-за отсутствия сна

В конце ноября 2023 года американские специалисты из Массачусетского технологического института (MIT) обнародовали результаты исследования, в ходе которого изучались возможности глубоких нейронных сетей в плане имитации человеческого мозга. Ученые пришли к выводу, что нейросети не способны обучаться подобно людям из-за отсутствия сна.

Основная задача глубоких нейронных сетей заключается в имитации когнитивных способностей человека. Однако из-за беспрецедентной сложности человеческого мозга возникают многочисленные трудности. В частности, искусственный интеллект использует заранее определенные параметры, из-за чего наблюдаются ограничения при обработке незнакомых или неблагоприятных сценариев.

Нейросети не способны обучаться подобно людям из-за отсутствия сна

Исследования показывают, что, хотя глубокие нейронные сети достигли значительного прогресса, им не удается в полной мере имитировать человеческий мозг. Кроме того, такие системы имеют тенденцию перезаписывать существующие данные — явление, известное как катастрофическое забывание. Этот эффект оказывает негативное влияние на скорость обучения ИИ. С другой стороны, человеческий мозг, получив новую информацию, включает ее в уже существующие знания. Мозг развивает рациональную память во время отдыха: сон позволяет формировать ассоциации между объектами и информацией, которые на первый взгляд выглядят несвязанными друг с другом.

Американские исследователи предлагают включить искусственные циклы сна в глубокие нейронные сети. Предполагается, что такой подход поможет смягчить влияние катастрофического забывания и повысит эффективность обучения ИИ-моделей. Вместе с тем, признают ученые, несмотря на прогресс, для достижения паритета с человеческими когнитивными способностями нейросетям предстоит пройти долгий путь.^[5]

2017: Рекурсивной нейросети удалось взломать капчу

Ученые из американской компании Vicarious создали алгоритм, расшифровывающий капчу — самый распространенный способ отличить человека от робота. Такой алгоритм работает на основе компьютерного зрения и рекурсивной кортикальной нейросети и, по утверждению разработчиков, может расшифровать капчу на многих популярных интернет-платформах, включая PayPal и Yahoo. Работа опубликована в журнале Science.^[6]

CAPTCHA

Капча (CAPTCHA, расшифровывается как Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга, позволяющий отличить человека от робота) используется для того, чтобы выяснить, кто пытается воспользоваться каким-либо сервисом: человек или какая-нибудь программа для автоматизации действий в интернете. В основе капчи обычно лежит задание, например, различить «плавающие» буквы, выделить слово на фоне или отметить фотографии, которые содержат определенный объект. Для его решения человеку достаточно имеющихся у него знаний об окружающем мире и базовых навыков (например, чтения). Компьютеру, однако, для выполнения подобного теста требуется огромное количество данных. Он может распознать любые стандартные символы, но, например, «плывущие» буквы, которые встречаются ему впервые — с трудом. С другой стороны, для человека подобная задача не представляет большой проблемы; искусственный интеллект, соответственно, должен быть максимально развит (по сравнению с настоящим, человеческим интеллектом) для ее решения.

Рекурсивная нейросеть

Ученым из Vicarious удалось разработать нейросеть для расшифровки капчи, получившую название «рекурсивная кортикальная нейросеть» (англ. recursive cortical network, сокращенно RCN). Для ее создания использовались знания об обработке визуальной информации человеком, а именно — об эффективном разделении объекта и фона, даже в том случае, когда они имеют очень похожую структуру. Созданная нейросеть способна выделять на общем фоне контур объекта (например, буквы) даже в том случае, если часть объекта скрыта за другим.

Для обучение нейросети было задействовано всего около 26 тыс. изображений. Для сравнения, алгоритму распознавания капч на основе сверточной нейросети (англ. convolutional neural network, CNN) их требуется несколько миллионов.

Для проверки работы нейросети использовались данные из открытого генератора капч Google — reCAPTCHA, особенность которых, по словам разработчиков, состоит в их сравнительной легкости распознавания для людей и сложности для компьютеров. Кроме того, для проверки были использованы капчи Yahoo, PayPal и Botdetect.

Итоги тестирования нейросети

Капча считается решенной, если компьютеру удалось распознать ее в одном проценте случаев. Нейросеть, созданная Vicarious, смогла расшифровать примеры из reCAPTCHA с точностью до 66,6%. Для сравнения, человек может распознать те же самые комбинации с точностью 87%.

George et al. / Science 2017

Примеры использованных для тренировки капч и эффективность работы нейросети на уровне слов (третий столбец) и букв (четвертый столбец)

Алгоритм также показал лучшую (по сравнению с другими алгоритмами, работа которых основана на сверточных нейросетях) эффективность в распознавании отдельных символов: до 94,3%. Для сравнения, эффективность работы сверточной нейросети существенно падает с увеличением визуальных различий между обучающей и тренировочной выборками.

George et al. / Science 2017

Эффективность распознавания отдельных символов рекурсивной нейросетью, или RCN, и сверточной нейросетью, или CNN. По оси y — доля различия данных из обучающей и тренировочной выборок

В целом эффективная работа представленного алгоритма поднимает вопрос о необходимости улучшения существующих решений по кибербезопасности и разработки средств для защиты данных пользователей от искусственного интеллекта.

Как строение нейронных связей в мозге легло в основу алгоритмов нейронных сетей

Чтобы разобраться в деталях, что такое нейронная сеть, вместе с математиком Евгением Путиным вспомним, что такое нейроны и синапсы, и как работает их система в живых организмах. Узнаем, как строение нейронных связей в мозге легло в основу алгоритмов нейронных сетей, и какие технологические задачи нейронные сети позволяют нам решать. О плюсах и минусах работы с нейронными сетями; о том, как происходит их обучение, и на что сети будут способны в недалеком будущем.

Евгений Путин — аспирант кафедры «Компьютерные Технологии» университета ИТМО, исследует проблемы интеграции концепции выбора признаков в математический аппарат искусственных нейронных сетей.

Homo ex machina: переносим сознание в компьютер

Если говорить о том, насколько реализуема идея перенесения сознания человека в машину, то можно отметить, что технологии, которые в будущем могут лечь в основу решения этой задачи, развиваются уже сегодня. Саму же задачу можно разделить на две: создание машины, которая могла бы вместить человеческое сознание, и создание технологии, которая могла бы это сознание скопировать и в эту машину перенести. Какой должна быть машина для того, чтобы она была способна эмулировать человеческое сознание? Как работает мозг, и что может быть подтверждением того, что решение задачи переноса сознания возможно в принципе? Как работают механизмы передачи информации в мозг? Чего достигли ученые в этом направлении за последние десятилетия, и что мы сможем делать в этой области в недалеком будущем?

Сергей Марков — специалист по методам машинного обучения, основатель портала «XX2 ВЕК», автор одной из сильнейших российских шахматных программ^[7].

Графовые нейросети: мимолетный тренд или за ними будущее

Основная статья: Графовые нейронные сети

Графовые нейронные сети активно применяются в машинном обучении на графах для решения локальных (классификация вершин, предсказание связей) и глобальных (схожесть графов, классификация графов) задач. Локальные методы имеют много примеров применения в обработке текстов, компьютерном зрении и рекомендательных системах. Глобальные методы, в свою очередь, применяются в аппроксимации задач, эффективно не решаемых на современных компьютерах (за исключением квантового компьютера будущего), и используются на стыке компьютерных и естественных наук для предсказания новых свойств и веществ (это актуально, например, при создании новых лекарственных препаратов).

Пика популярности графовые нейросети достигли в 2018 году, когда они стали использоваться и показали высокую эффективность в различных приложениях. Самый известный пример – модель PinSage в рекомендательной системе сервиса Pinterest. С тех пор находится все больше новых применений технологии в областях, где раньше существующие методы были не способны эффективно учитывать в моделях связи между объектами. Подробнее здесь.