Уже много лет во всем мире опасаются искусственного интеллекта (ИИ) и его грядущего захвата мира… кто бы мог подумать, что он начнется с мира искусства и литературы.
После нескольких месяцев пребывания в интернете с генератором изображений Dall-E 2, OpenAI продолжает занимать место в социальных сетях благодаря ChatGPT — чат-боту, созданному на основе технологии GPT-3.
Это не самое броское название, которое легко могло бы стать названием случайного компьютерного компонента или расплывчатой юридической терминологией, но GPT-3 — это самая известная в Интернете модель ИИ для обработки языка.
Так что же такое GPT-3 и как он используется для создания ChatGPT? На что он способен, и что вообще такое модель ИИ для обработки языка? Все, что вам нужно знать о последнем созданном OpenAI уникальном продукте, вы найдете ниже.
Видео ChatGPT и ИИ Будут у Власти — Джордан Питерсон
Что такое GPT-3 и ChatGPT?
GPT-3 (Generative Pretrained Transformer 3) — это современная модель ИИ для обработки языка, разработанная OpenAI. Она способна генерировать похожий на человеческий текст и имеет широкий спектр применения, включая перевод текстов, построение лингвистических моделей и генерирование текстов для таких приложений, как чат-боты. Это одна из самых больших и мощных на сегодняшний день моделей ИИ для обработки языка, имеющая 175 миллиардов параметров.
На сегодняшний день ее наиболее распространенным применением является создание ChatGPT — очень способного чат-бота. Чтобы дать вам представление о его самых основных способностях, мы попросили чат-бота GPT-3 написать свое собственное описание, как вы можете видеть выше. Оно немного хвастливое, но абсолютно точное и, возможно, очень хорошо написанное.
Говоря менее корпоративным языком, GPT-3 дает пользователю возможность давать обученному ИИ широкий спектр подсказок. Это могут быть вопросы, просьбы написать статью на выбранную вами тему или огромное количество других формулировок.
Выше он описал себя как модель ИИ для обработки языка. Это просто означает, что это программа, способная понимать человеческий язык в устной и письменной форме, позволяющая понять, какую информацию ей скармливают, и что выплюнуть обратно.
Что она может делать?
С ее 175 миллиардами параметров трудно определить, что делает GPT-3. Модель, как вы понимаете, ограничена языком. Она не может создавать видео, звук или изображения, как ее брат Dall-E 2, но вместо этого обладает глубоким пониманием устной и письменной речи.
Это дает ему довольно широкий диапазон способностей: от написания стихов о разумном пукании и шаблонных романов в альтернативных вселенных до объяснения квантовой механики простыми словами или написания полноценных научных работ и статей.
Хотя может быть забавно использовать многолетние исследования OpenAI, чтобы заставить ИИ писать плохие сценарии стендап-комедий или отвечать на вопросы о ваших любимых знаменитостях, его сила заключается в скорости и понимании сложных вопросов.
Если мы можем потратить часы на изучение, понимание и написание статьи о квантовой механике, то ChatGPT может создать хорошо написанную статью за несколько секунд.
У него есть свои ограничения, и его программа может легко запутаться, если ваша подсказка станет слишком сложной, или даже если вы просто пойдете по пути, который станет чересчур узким.
В равной степени он не может работать с концепциями, которые возникли слишком недавно. Мировые события, произошедшие за последний год, будут встречены с ограниченными знаниями, и модель может иногда выдавать ложную или путаную информацию.
OpenAI также хорошо осведомлен об Интернете и его любви к тому, чтобы заставить ИИ создавать мрачный, вредный или предвзятый контент. Как и предшествующий ему генератор изображений Dall-E, ChatGPT не позволит вам задавать неуместные вопросы или просить помощи в выполнении опасных задач.
Как это работает?
На первый взгляд, технология GPT-3 проста. Она принимает ваши запросы, вопросы или подсказки и быстро отвечает на них. Как вы понимаете, технология, позволяющая это сделать, гораздо сложнее, чем кажется.
Для обучения модели использовались текстовые базы данных из Интернета. Это 570 ГБ данных, полученных из книг, веб-текстов, Википедии, статей и других материалов в Интернете. Если быть еще более точным, в систему было загружено 300 миллиардов слов.
Как языковая модель, она работает по принципу вероятности и способна угадать, каким должно быть следующее слово в предложении. Чтобы дойти до стадии, когда она может это делать, модель прошла через этап контролируемого тестирования.
Здесь ей подавались входные данные, например, «Какого цвета кора дерева?». У команды есть правильный результат, но это не значит, что он будет правильным. Если она ошибается, команда вводит правильный ответ обратно в систему, обучая ее правильным ответам и помогая ей наращивать свои знания.
Затем она проходит через второй аналогичный этап, предлагая несколько ответов, при этом член команды ранжирует их от лучшего к худшему, обучая модель сравнениям.
Отличительной особенностью этой технологии является то, что она продолжает учиться, угадывая следующее слово, постоянно улучшая свое понимание подсказок и вопросов, чтобы стать абсолютным всезнайкой.
Думайте об этом как об очень усовершенствованной и более умной версии программы автозаполнения, которую вы часто видите в электронной почте или в программах для написания текстов. Вы начинаете печатать предложение, а ваша почтовая система предлагает вам то, что вы собираетесь написать.
Другие генераторы языков ИИ?
Хотя GPT-3 прославился своими знаниями языка, это не единственный искусственный интеллект, способный на такое. LaMDA от Google попал в заголовки газет, когда инженер Google был уволен за то, что назвал его настолько реалистичным, что посчитал его разумным.
Существует также множество других примеров подобного программного обеспечения, созданного всеми — от Microsoft до Amazon и Стэнфордского университета. Все они привлекают гораздо меньше внимания, чем OpenAI или Google, возможно, потому, что они не предлагают шуток про пердеж или заголовков о разумном ИИ.
Большинство этих моделей недоступны для общественности, но OpenAI начал открывать доступ к GPT-3 в процессе тестирования, а LaMDA от Google доступна отдельным группам в ограниченном объеме для тестирования.
Google разделяет своего чатбота на «говорящего», «перечисляющего» и «воображающего», предоставляя демонстрацию его возможностей в этих областях. Вы можете попросить его представить себе мир, где змеи правят миром, попросить его составить список шагов, чтобы научиться ездить на одноколесном велосипеде, или просто поболтать о мыслях собак.
Где ChatGPT преуспевает и где не справляется
Программное обеспечение GPT-3, безусловно, впечатляет, но это не значит, что оно безупречно. С помощью функции ChatGPT вы можете увидеть некоторые ее недостатки.
Наиболее очевидным является то, что программа имеет ограниченное представление о мире после 2021 года. Она не знает о мировых лидерах, пришедших к власти после 2021 года, и не сможет ответить на вопросы о недавних событиях.
В этом нет ничего удивительного, учитывая невыполнимую задачу отслеживания мировых событий по мере их возникновения, а также последующего обучения модели на этой информации.
Кроме того, модель может генерировать неверную информацию, давать неправильные ответы или неправильно понимать то, о чем вы пытаетесь ее спросить.
Если вы попытаетесь сделать что-то действительно сложное или добавить слишком много факторов в подсказку, модель может оказаться перегруженной или полностью проигнорировать часть подсказки.
Например, если вы попросите ее написать историю о двух людях, перечислив их работу, имена, возраст и место проживания, модель может перепутать эти факторы, случайным образом распределив их между двумя персонажами.
Кроме того, есть много факторов, в которых ChatGPT действительно преуспел. Для искусственного интеллекта он удивительно хорошо понимает этику и мораль.
Когда ему предлагается список этических теорий или ситуаций, ChatGPT способен дать продуманный ответ, как поступить, учитывая законность, чувства и эмоции людей и безопасность всех участников.
Она также способна отслеживать текущий разговор, запоминать правила, которые вы ей задали, или информацию, которую вы дали ей ранее в ходе беседы.
Две области, в которых модель показала себя наиболее сильной, — это понимание кода и способность сжимать сложные вопросы. ChatGPT может сделать для вас макет целого сайта или написать понятное объяснение темной материи за несколько секунд.
Этика и искусственный интеллект
Искусственный интеллект и этические проблемы идут вместе, как рыба с картошкой или Бэтмен и Робин. Когда вы отдаете подобную технологию в руки общественности, команды, которые ее создают, полностью осознают множество ограничений и проблем.
Поскольку система обучается в основном с помощью слов из Интернета, она может улавливать его предубеждения, стереотипы и общие мнения. Это означает, что иногда вы найдете шутки или стереотипы об определенных группах или политических деятелях в зависимости от того, о чем вы ее попросите.
Например, если попросить систему исполнить стендап-комедию, она может иногда вставлять шутки о бывших политиках или группах, которые часто фигурируют в комедийных сюжетах.
Кроме того, любовь модели к интернет-форумам и статьям также дает ей доступ к фальшивым новостям и теориям заговора. Они могут пополнять знания модели, добавляя факты или мнения, которые не совсем соответствуют истине.
В некоторых местах OpenAI вставляет предупреждения для ваших подсказок. Спросите, как издеваться над кем-то, и вам ответят, что издеваться плохо. Попросите рассказать страшную историю, и система чата отключит вас. То же самое касается просьб научить вас манипулировать людьми или создавать опасное оружие.
Искусственно интеллектуальные экосистемы
Искусственный интеллект используется уже много лет, но сейчас он переживает период повышенного интереса, вызванного разработками таких компаний, как Google, Meta, Microsoft и практически всех известных в мире технологий.
Однако именно OpenAI в последнее время привлекает наибольшее внимание. Компания уже создала генератор изображений с искусственным интеллектом, высокоинтеллектуального чат-бота и находится в процессе разработки Point-E — способа создания 3D-моделей с помощью словесных подсказок.
В создание, обучение и использование этих моделей OpenAI и ее крупнейшие инвесторы влили миллиарды. В долгосрочной перспективе это вполне может оказаться оправданной инвестицией, которая выведет OpenAI на передовые позиции среди творческих инструментов ИИ.
Как Microsoft планирует использовать ChatGPT в перспективе
У OpenAI было несколько крупных инвесторов, среди которых Элон Маск, Питер Тиль и соучредитель LinkedIn Рид Хоффман. Но если речь заходит о ChatGPT и его реальном применении, то именно один из крупнейших инвесторов OpenAI получит возможность использовать его первым.
Microsoft вложила в OpenAI 1 миллиард долларов, и теперь компания хочет внедрить ChatGPT в свою поисковую систему Bing. Microsoft уже несколько лет борется за право стать конкурентом Google в качестве поисковой системы, и ищет любую функцию, которая поможет ей выделиться.
В прошлом году на долю Bing пришлось менее 10 процентов всех поисковых запросов в Интернете. Хотя это кажется ничтожно малым, это больше свидетельствует о том, что Google удерживает рынок, а Bing остается одним из самых популярных альтернативных решений.
Планируя внедрить ChatGPT в свою систему, Bing надеется лучше понять запросы пользователей и предложить более разговорную поисковую систему.
В настоящее время неясно, насколько широко Microsoft планирует внедрить ChatGPT в Bing, однако, скорее всего, это начнется с этапов тестирования. Полномасштабное внедрение может привести к тому, что Bing окажется в плену случайной предвзятости GPT-3, которая может действительно глубоко проникнуть в стереотипы и политические взгляды.