【Крестный отец GAN: человек, который даровал машинам воображение 】 * Технологии для людей

Генеративно-состязательная сеть (англ. Generative adversarial network, сокращённо GAN) — алгоритм машинного обучения без учителя, построенный на комбинации из двух нейронных сетей, одна из которых (сеть G) генерирует образцы (см. Генеративная модель[en])，а другая (сеть D) старается отличить правильные («подлинные») образцы от неправильных (см. Дискриминативная модель[en]). Так как сети G и D имеют противоположные цели — создать образцы и отбраковать образцы — между ними возникает Антагонистическая игра. Генеративно-состязательную сеть описал Ян Гудфеллоу из компании Google в 2014 году.[1]

Направляя работу одних нейронных сетей против других, Иан Гудфеллоу создал мощный инструмент для искусственного интеллекта. Теперь он, как и мы все, столкнемся с последствиями.
Автор Мартин Гилс 21 февраля 2018

Как создавался GAN

Одним вечером в 2014 году Иан Гудфеллоу со своими друзьями по аспирантуре отправились отмечать их выпускной. Они пошли в свое любимое место в Монреале “Les 3 Brasseurs” (Три пивовара),как раз там друзья попросили Иана помочь со сложным проектом, над которым они работали — создание компьютера, который мог бы самостоятельно создавать фотографии.

Ученые уже использовали нейронные сети, алгоритмы построенные по принципу работы нейронов в головном мозге человека, для того, чтобы позволить машинам самим генерировать новые данные. Но чаще всего результаты были плохими: изображение лица, смоделированное компьютером, могло быть размытым, или содержать значительные ошибки — например, отсутствие ушей. План, который предлагали друзья Гудфеллоу, заключался в использовании комплексного статистического анализа элементов, из которых будут складываться изображения, это должно было помочь компьютеру справиться с задачей. Но это потребовало бы огромного количества вычислений. Гудфеллоу сказал друзьям, что их план не сработает.

Но посидев с пивом и поразмыслив, он пришел к одной мысли. А что если заставить две нейронные сети работать друг против друга? Его друзья отнеслись к этому скептически. Но приехав домой и увидев, что его девушка уже спит, Гудфеллоу решил попробовать. Он программировал до самого утра, после чего протестировал свое программное обеспечение. С первой же попытки оно заработало.

То, что он разработал той ночью, теперь называется генеративно-состязательными сетями (ГСС). Эта технология вызвала восторг людей, которые работают в области машинного обучения, и сделала своего создателя звездой.

За последние несколько лет, разработчики в области искусственного интеллекта добились огромного прогресса, используя технологию глубинного обучения. Просто снабдите систему достаточным количеством изображений, и она научится с легкостью распознавать, например, пешехода, который начинает переходить дорогу. Этот подход сделал возможным появление машин на автопилоте и работу таких систем, как Alexa, Siri, и других виртуальных помощников.

Однако, искусственный интеллект глубинного обучения хорош в распознавании вещей, но не в их создании. Цель ГСС — дать машинам нечто похожее на воображение.

Это бы позволило им не просто рисовать прелестные картины или сочинять музыку, это помогло бы им меньше зависеть от человека в вопросах познания мира. Сейчас программистам, работающим с ИИ, приходится самим обозначать, что нужно найти в искомых данных, например, где именно изображение с пешеходом, переходящим дорогу, а где его нет. Это не только дорого и трудоемко, но и ограничивает систему в работе если вдруг данные будут отличаться от тех, на которых происходило обучение. В будущем компьютеры будут гораздо лучше работать с входными данными и черпать всю необходимую для этого информацию из них, без дополнительных подсказок.

Это станет огромным скачком в развитии того, что сейчас называют “спонтанным обучением”. Автомобили с автопилотом могли бы изучать различные ситуации на дорогах, не покидая гаража. Робот бы мог предугадывать наличие препятствий на загруженном складе, не проезжая по нему предварительно.

Наша способность пользоваться воображением и прокручивать в голове различные сценарии — одна из вещей, которые делают нас людьми. И когда ученые будут изучать историю технологий, то они будут расценивать появление генеративно-состязательных сетей, как огромный шаг в сторону создания машин с сознанием похожим на человеческое. Янн ЛеКун, главный научный сотрудник Facebook, назвал ГСС «самой крутой идеей глубокого обучения за последние 20 лет». Еще один лидер в области ИИ, Эндрю Энг, в прошлом главный научный сотрудник Baidu, говорит, что ГСС принесут «значительный и фундаментальный прогресс», они вдохновляют исследователей по всему миру.

Крестный отец ГСС, часть 2: Бойцовский клуб искусственного интеллекта

Сейчас Гудфеллоу является научным сотрудником в команде Google Brain, в штаб квартире компании в Маунтин Вью, Калифорния. Когда недавно у нас состоялась встреча, он выглядел так, будто, его удивляет статус суперзвезды, он говорит, что для него “это все как-то нереально”. Возможно, не менее удивительно то, что, сделав

свое открытие, Гудфеллоу проводит большую часть своего времени, работая против тех, кто хочет использовать ГСС для злых целей.

Магия генеративно-состязательных сетей рождается из соперничества между двумя нейронными сетями. Они будто повторяют поведение хитроумного мошенника и блестящего сыщика, которые водят друг друга за нос. Обе нейронные сети начинают обучение с одинакового набора данных. Первая сеть, называемая генератором, создает изображения или примеры почерка, настолько реалистичные насколько это возможно. Вторая сеть, называемая дискриминатором, должна сравнивать изображения созданные генератором и изображения из оригинальной выборки, и определить, какое из них настоящее, а какое создано искусственно. На основе этих результатов генератор настраивает свои параметры для создания новых изображений. Эти действия повторяются до тех пор, пока дискриминатор уже не может определить где какое изображение.

Крестный отец GAN: человек, который даровал машинам воображение

За основу при обучении ГСС были взяты изображения знаменитостей. В итоге сети создали свой набор изображений, которые выглядят вполне правдоподобно.

Один из самых ярких примеров, исследования компании Nvidia, проведенные в прошлом году. Nvidia вкладывают крупные деньги в изучение ИИ. Их разработчики обучали нейронные сети генерировать изображения “своих” знаменитостей на примерах изображений реальных звезд. Конечно, не все изображения на выходе получились идеальными, но некоторые были крайне реалистичны. В отличии от других сетей, которым нужен огромный массив данных для обучения, ГСС достаточно лишь несколько сотен примеров.

Однако, их воображение все еще ограничено. Например, изучив большое количество изображений собак, ГСС могут создать своего пса, но с другим окрасом шерсти или расположением пятен. Создать изображение нового животного они не могут. Качество исходных данных также оказывает большое влияние на результаты. Приведем пример. Однажды ГСС начала генерировать изображения кошек со случайными буквами, встроенными в изображения. Это произошло потому что среди исходных данных были мемы с изображением котов, компьютер воспринял слова, как часть того, что мы называем кошками.

По словам Педро Домингоса, научного сотрудника в области машинного обучения университета Вашингтона, у ГСС может появиться свой характер. Если дискриминатор слишком легко обмануть, то выходные изображения, полученные в процессе обучения, будут выглядеть нереалистично. Калибровка двух состязательных нейронных сетей порой бывает затруднена, именно поэтому на выходе мы получаем различные причудливые изображения, например, животных с двумя головами.

Но сложности не останавливают ученых. С тех пор как Гудфеллоу в 2014 году опубликовали результаты первых исследований, уже были написаны сотни работ посвященных работе ГСС. Один из фанатов технологии создал сайт “GAN zoo”, где он отслеживает разрабатываемые версии этой технологии.

Заставить ГСС работать корректно порой бывает трудно. Если есть какие-то искажения в исходных изображениях, то результат может оказаться странным.Фото Алек Рэдфорд

Одним из самых очевидных применений этой технологии являются области, в которых воображение просто необходимо, такие как создание видеоигр или индустрия моды. Например, благодаря ГСС, мы могли бы получить внешний вид персонажа, который идет под дождем. Но Гудфеллоу считает, что ГСС могут помочь в гораздо более серьезных вопросах. “Существует большое количество областей науки и инженерии, где просто необходима оптимизация”. Например, медицина, где просто необходима эффективная обработка данных, или создание более энергоемких батарей. “Это станет следующим большим прорывом”.

В физике высоких энергий ученые используют мощные компьютеры для моделирования вероятных взаимодействий сотен субатомных частиц в устройствах, таких как Большой адронный коллайдер. Эти симуляции требуют большой вычислительной мощности и много времени. Исследователи из Йельского университета и Национальной лаборатории Лоуренса Беркли разработали ГСС, которая в процессе обучения на основе существующих данных о симуляциях генерирует довольно точные прогнозы о том, как будет вести себя конкретная частица, и вычисления происходят намного быстрее.

Разработку Гудфэллоу можно использовать для решения огромного количества задач, например, для создания дизайна интерьера.Фото Иан гудфелл

Еще одной перспективной областью применения являются медицинские исследования. Из-за политики конфиденциальности исследователи зачастую не могут получить достаточное количество данных, чтобы понять, почему лекарство не работает. ГСС же могут генерировать определенное количество медицинских записей, которые практически ничем не будут отличаться от реальных, говорит Кэйси Грин из университета Пенсильвании. Эти данные можно было бы распространять свободнее в отличие от реальных, которые защищены законом.

Крестный отец ГСС, часть 2: Плохие парни

Но существует и обратная сторона. Машина, создающая реалистичные подделки — идеальное оружие в руках людей, которые по средствам фейковых новостей хотят влиять на многие области жизни, начиная от цен на акции, и заканчивая выборами. ИИ уже используют, чтобы присоединять лица людей к телам порно-звезд и создавать видимость того, что политики произносят определенные вещи. ГСС не являются источником этих проблем, но они усугубляют ситуацию.

Хани Фарид, который изучает цифровую криминалистику в Дартмутском колледже, работает над улучшением технологий обнаружения поддельных видеороликов, например, обнаруживая небольшие изменения цвета лиц, вызванные производимым вдохом и выдохом. Для ГСС такие вещи все еще сложно имитировать. Но Фарид предупреждает, что ГСС будут адаптироваться. «Мы находимся в заведомо слабой позиции”, — говорит он.

Эта игра в кошки-мышки ведется и в области кибербезопасности. Ученые уже обозначили риск аттак с использованием “черного ящика”, в которых работа ГСС будет направлена на определение модели машинного обучения, используемого для обнаружения вредоносного ПО. Определив, как работает защита, нападающий сможет ее обойти и внедрить свой код. Этот же алгоритм можно использовать, чтобы обходить фильтр спама и другую защиту.

Гудфеллоу хорошо известно об опасностях. Теперь возглавляя команду в Google, которая работает над защитой в процессе машинного обучения, он предупреждает, что люди, работающие в области искусственного интеллекта, должны сделать вывод из ошибок и не забывать про безопасность и конфиденциальность. К тому времени, когда мы осознали все риски, плохие парни уже значительно нас опережали. «Понятно, что мы уже опоздали, — говорит он, — но, надеюсь, мы сможем добиться значительных успехов в области безопасности, прежде чем все зайдет слишком далеко».

«Понятно, что мы уже опоздали, — говорит он, — но, надеюсь, мы сможем добиться значительных успехов в области безопасности, прежде чем все зайдет слишком далеко».

Тем не менее, он не считает, что решение проблемы “фейков” будет чисто технологическим. Он верит, что нужно полагаться на социальные инструменты, например, учить детей критическому мышлению, подталкивая их посещать клубы дебатов. «В дебатах вы конкурируете с другим учеником, — говорит он, — и вы думаете о том, какие ложные заявления можно придумать или как правильно сформулировать правдивые утверждения, чтобы убедить окружающих». Вполне возможно, Гудфеллоу прав, и эту проблему не исправить технологически, но многие будут огорчены это услышать.