Знаете ли вы, что за последние полгода огромной популярностью стали пользоваться чат-боты вроде ChatGPT и генераторы картинок типа Midjourney.
Однако эволюция искусственного интеллекта (AI или ИИ) и машинного обучения идет уже далеко не первый год.
В этом руководстве для начинающих мы познакомим вас не только с чат-ботами, но и с другими видами AI. Мы расскажем о том, какую роль в нашей жизни уже сейчас играют алгоритмы.
Как происходит обучение AI?
В основе работы любой умной машины лежит процесс, известный как обучение алгоритма, когда в компьютерную программу вкладывают для анализа огромный объем данных (иногда с поясняющей разметкой) и набор инструкций.
Инструкции могут выглядеть примерно так: «Отбери из этих фотографий те, на которых есть лица» или «Отсортируй эти звуки по заданным категориям».
Программа начинает «прочесывать» (анализировать) имеющуюся в ее распоряжении информацию в поисках закономерностей — в соответствии с поставленной задачей.
Получаемые в процессе обработки результаты необходимо постоянно корректировать, помечая ошибки программы — например, «это не лицо» или эти два звука относятся к разным категориям». Однако на выходе, по итогам анализа всех имеющихся данных, мы получаем «умную» или, скорее, «натренированную» модель, неплохо справляющуюся с поставленной задачей. То есть алгоритм.
Чтобы лучше понять, как в результате такого обучения получаются различные виды AI, можно сравнить их с разными видами животных.
Как у животных под влиянием окружающей среды за миллионы лет эволюции развились те или иные характерные особенности, так и AI, миллионы раз проанализировавший одну и ту же базу данных, приобретает необходимые навыки, все лучше и лучше справляясь с поставленной задачей.
Давайте рассмотрим несколько видов AI, приспособленных для решения разного рода задач.
Что такое чат-боты?
Чат-бот напоминает попугая, который может повторять услышанные слова и даже до некоторой степени соотносить их с контекстом, но значение этих слов (если допустить, что он вообще различает отдельные слова) попугаю известно лишь очень приблизительно.
Чат-боты делают примерно то же самое, только на значительно более сложном уровне — и, кажется, вскоре могут полностью изменить наши отношения с письменной речью.
Но как чат-боты научились писать?
Чат-боты относятся к подвиду AI, известному как «большие языковые модели» (LLM), и их обучают на колоссальных объемах текста, совершенно немыслимых для человека.
LLM может сравнивать не только отдельные слова, но и целые предложения, а также анализировать, в каком контексте использованы те или иные слова и выражения в различных отрывках, находя их поиском по всей имеющейся в распоряжении алгоритма базе данных.
Используя эти миллиарды сравнений между словами и фразами, он может прочитать вопрос и сгенерировать ответ — вроде того, какой вы можете получить при обычном обмене текстовыми сообщениями на вашем телефоне.
Удивительная особенность больших языковых моделей заключается в том, что они могут изучать правила грамматики и определять значение слов из контекста самостоятельно, без помощи человека.
Сэм Олтман — генеральный директор OpenAI, создатель ChatGP рассказал о будущем чат-ботов: «Думаю, что лет через 10 у нас будут чат-боты, которые станут экспертами в любой необходимой области знания. То есть с их помощью вы сможете задать свой вопрос опытному «врачу», «опытному», «учителю» и опытному «юристу» — и получить от них квалифицированный ответ».
Можно ли поговорить с AI?
Если вы когда-либо пользовались Alexa, Siri, Алисой или любым другим голосовым помощником, значит, вы уже разговаривали с AI.
Представьте себе кролика, длинные уши которого специально приспособлены для того, чтобы различать малейшие изменения звука.
Когда вы говорите с голосовым помощником, AI записывает вашу речь, фильтрует фоновый шум, раскладывает фразу на отдельные звуки и слоги — а затем сопоставляет каждый из них их с огромной базой данных — библиотекой звуков того или иного языка.
На их основе AI воссоздает произнесенную фразу в текстовом виде, причем любые допущенные на этом этапе ошибки прослушивания можно скорректировать до того, как будет дан ответ.
Такой тип AI называют обработкой естественного языка (NLP).
Именно этот принцип лежит в основе технологий, которая позволяет вам подтвердить голосом по телефону банковскую транзакцию, просто сказав «да», или попросить мобильный телефон показать вам прогноз погоды на ближайшие несколько дней в городе, куда вы собираетесь поехать.
Как AI создает новые изображения?
Не так давно появились модели AI, способные не только распознавать изображения, но и изменять на них линии и цвета, подобно хамелеону.
Такие алгоритмы, генерирующие изображения, обладают способностью на основе анализа миллионов изображений идентифицировать их отдельные элементы и даже сложные узоры, собирая из этих деталей новые картинки.
Например, вы можете попросить AI создать «фотографию» вымышленного события — вроде фото человека, идущего по поверхности Марса.
Вы можете задать изображению творческое направление: например, «Нарисуй портрет английского футбольного менеджера в стиле Пикассо».
AI-алгоритмы последнего поколения начинают процесс создания нового изображения с набора случайно окрашенных пикселей.
В этих случайных точках алгоритм ищет любой намек на известный ему шаблон (то есть узор или закономерность построения линий), идентифицированный программой в ходе обучения — на основе таких шаблонов AI и создает новые изображения.
Постепенно шаблоны становятся все лучше. На полученное изображение накладываются все новые и новые слои, в каждом из которых алгоритм сохраняет точки, которые укладываются в искомый шаблон, и отбрасывает все остальные — пока, наконец, изображение не начнет отвечать поставленной задаче.
Получив все необходимые элементы изображения — «поверхность Марса», «астронавт» и «прогулка», — AI складывает их вместе, получая на выходе новую картинку.
Поскольку новое изображение построено из слоев случайных пикселей, в результате получается то, чего раньше никогда не было, но оно по-прежнему основано на миллиардах паттернов, полученных из исходных обучающих изображений.
Сейчас общество начинает задумываться о том, какие последствия это будет иметь для охраны авторских прав и насколько этично создавать новые произведений искусства на основе кропотливого труда настоящих художников, дизайнеров и фотографов.
Что еще может делать искусственный интеллект (AI или ИИ) расскажем в нашем следующем материале
Свежие комментарии