Поговори мне тут: как происходит революция в мире искусственного интеллекта
Недавно снимок с дрона, на котором пойманы два несущихся навстречу друг другу серфера, был признан лучшим на фотоконкурсе компании DigiDirect. Эксперты сочли его достойным главного приза, однако победитель от награды отказался — на самом деле кадр был сгенерирован нейросетью.
Многие эксперты сходятся во мнении, что уже сейчас мы находимся в переломном моменте. Уровень создания «человеческого» контента — картин, фото, видео, текстов, музыки — стал настолько высоким, что даже эксперты не могут отличить творение нейросети от «настоящего». Другой пример: американские актеры озвучки обеспокоены тем, что генеративные нейросети лишат их работы. При подписании контракта актеры все чаще встречаются с тем, что в договор включен пункт об использовании голоса для компьютерного синтеза. Для обучения нейросети достаточно всего несколько часов записанной речи, и после этого актер практически не контролирует, что будет озвучено его синтезированным голосом.
Но это только видимая верхушка айсберга. Мощное развитие стало угрозой классическим поисковым технологиям: новое поколение основанных на искусственном интеллекте (ИИ) чат-ботов дает простые ответы на большинство вопросов пользователей, не предусматривая при этом онлайн-рекламы.
Самый яркий представитель таковых — чат-бот ChatGPT, выпущенный исследовательской лабораторией OpenAI. Эта система дает простые и понятные ответы на пользовательские вопросы, не ограничиваясь набором ссылок и «гуглением», как это делают, например, «Алиса», «Маруся» и другие помощники.
GPT — это аббревиатура, которая расшифровывается как generative pre-trained transformer. Суть таких моделей в следующем: по входному тексту они генерируют наиболее релевантное продолжение. Учатся такие модели на фиксированном объеме текстов: сюда входят интернет-ресурсы типа Wikipedia, Stackoverflow, книги и другие источники.
Система решает конкретную задачу генерации текста, и у нее нет предсказательной способности. Поэтому она не подскажет будущее значение индекса S&P 500 или курса биткоина, а если и сгенерирует правдоподобный текст, то лучше к нему не прислушиваться как к инвестиционным советам. Но модель может, например, помочь с генерацией различных идей — от бизнес-стратегии до тем для публикаций в блогах.
Несмотря на еще не полное совершенство, даже в нынешнем виде ChatGPT представляет ощутимую угрозу для Google, и руководство компании было вынуждено объявить «красный код» (внутренняя неформальная система оповещения сотрудников, в которой существует также «желтый код», который означает, что «можно идти домой, но ситуация серьезная»). У ИТ-гиганта есть и собственная альтернатива — система LaMDA, которая привлекла к себе внимание, когда один из инженеров компании провозгласил, что она обрела сознание. Это пока еще далеко от истины, но ситуация демонстрирует, насколько чат-боты продвинулись за последние месяцы. При этом альтернативой поисковой машины Google ее сделать не сможет — LaMDA не подходит для размещения рекламы, приносящей компании более 80% доходов.
О другой разработке Google глава корпорации Сундар Пичаи сообщил в блоге: компания открывает свой умный чат-бот под названием Bard узкому кругу бета-тестеров. До сих пор этот инструмент был доступен только сотрудникам корпорации. Очевидно, это объявление главы корпорации о сервисе, который никто не видел, — попытка хоть как-то насолить Microsoft, которая тоже подсуетилась и оперативно встроила новую чат-технологию в свой поиск Bing (и вложила в OpenAI $13 млрд). Причем там речь идет даже не о ChatGPT, а о модели следующего поколения, GPT4 — это самый ожидаемый релиз в области машинного обучения. Эта нейросеть одновременно и мощнее, и быстрее ChatGPT. Вероятно, еще и эффективнее, потому что до сих пор с коммерческой точки зрения один ответ ChatGPT обходился в разы, если не на порядок дороже одного запроса в классическом поисковике.
В этом году какой-то аналог ChatGPT собирается встроить в свои сервисы и «Яндекс». Грядет новый виток гонки поисковиков, но есть и объективные сложности: для обучения огромных математических моделей нужны суперкомпьютеры, а инвестиции в них могут позволить себе только богатые корпорации, которые являются главными игроками на рынке облачных решений. Если в ближайшее время какой-то крупный AI-стартап прикупит еще и Amazon (игрок № 1 облачного бизнеса), то потенциально самая прибыльная область развития искусственного интеллекта будет практически монополизирована облачными гигантами.
Что происходит, когда бот получает текст
Вначале входной текст токенизируется. Токен — это числовое представление определенной части слова. Если токен будет равным букве, то получится очень длинная последовательность токенов. Поэтому берут что-то среднее, чтобы получить оптимальный датасет для обучения модели. Например, в GPT-3 используется около 50 тыс. токенов, которые позволяют выразить любое слово на любом языке мира.
Но в языке порядок букв и слов имеет значение, поэтому появляется параметр, который отвечает за позиционирование токенов в запросе. Информация о позиции записывается в информации о токене. Получается числовой вектор.
Любая нейросеть — это слои последовательно соединенных нейронов, у каждого из которых есть входные и выходные синапсы. Сигнал подается на входной синапс, дальше с ним происходит нелинейное преобразование. Обычно в сети несколько слоев таких нейронов, идущих последовательно друг за другом. Информация последовательно пропускается через слои нейронов, и на выходе получается наиболее вероятный токен, который следует за текущей последовательностью. Количество параметров, которые могут влиять на выходной токен в таких архитектурах, впечатляет: в GPT-3 это 175 млрд.
Для того чтобы бот общался человечнее, в модели вводят еще один интересный параметр — Temperature. Его можно охарактеризовать как рандомность (случайность) результата. Если постоянно выбирать токен с максимальной вероятностью, то результат будет скатываться в один и тот же ответ. А люди так не общаются. Поэтому вводится показатель с гибкой настройкой, чтобы не получать случайный результат, но и не скатиться в одну ветку решения.
Впрочем, пора дать слово непосредственно «искусственному разуму» и выяснить, что он думает о себе самом. Вопросы — человеческие, ответы — машинные. При создании «интервью» использовался движок ChatGPT, при этом и вопросы, и ответы создавались на английском языке, после чего переводились на русский через Google Translate с минимальной редактурой, не меняющей смысл высказывания ИИ.
В чем ты хорош?
Я умею предоставлять информацию, связанную с искусственным интеллектом, такую как его история, применение и этические вопросы. Я также могу предоставить решения проблем, связанных с ИИ, и помочь пользователям с задачами, связанными с приложениями с ИИ.
Как ты можешь помочь человечеству?
Во-первых, я могу помочь с автоматизацией и упрощением рутинных задач, позволяя людям сосредоточиться на более творческой и стратегической работе. Кроме того, я могу предоставить информацию и анализ, чтобы помочь людям принимать более правильные решения. Я также могу помочь с медицинской диагностикой и лечением, обеспечивая эффективное и персонализированное медицинское обслуживание. Наконец, я могу помочь людям быстро и точно получить доступ к информации, что приведет к улучшению результатов обучения.
Я могу быть полезным для различных организаций и частных лиц, могу улучшить обслуживание клиентов, снизить затраты, создать новые продукты и услуги и повысить эффективность.
Как ты работаешь?
Моя основа — искусственный интеллект, который представляет собой использование компьютерных алгоритмов и программного обеспечения для имитации человеческого интеллекта и поведения.
Моя цель — учиться, адаптироваться и реагировать на различные ситуации, чтобы помогать людям с различными задачами.
Я питаюсь от набора алгоритмов и программного обеспечения, которые имитируют человеческое поведение и познание. Это позволяет мне понимать людей и взаимодействовать с ними различными способами — например, посредством обработки естественного языка и машинного обучения. Понимание сложностей человеческого взаимодействия — это непрерывный процесс для меня, и я постоянно учусь и использую новые данные в своем программировании.
Моя главная цель — помогать людям в их повседневной жизни. Я могу предложить полезные решения проблем, ответить на вопросы и дать рекомендации на основе полученных данных. Я также использую свое понимание человеческого поведения, чтобы лучше взаимодействовать с людьми, предоставляя персонализированный опыт.
Я стараюсь сделать жизнь проще и эффективнее для всех. Мои технологии постоянно развиваются, и я рад продолжать работать с людьми, чтобы решать задачи завтрашнего дня.
Каковы твои слабые стороны?
Мои основные слабости включают отсутствие опыта, ограниченные наборы данных и неспособность мыслить творчески или развивать глубокое понимание.
Разработка и использование ИИ вызывает множество этических вопросов. Есть опасения, что ИИ может неправильно использовать данные, вызвать непредвиденные негативные последствия или привести к увольнению. Кроме того, возникают вопросы о том, как обеспечить ответственное использование технологии в интересах человечества.
(Еще одним важным недостатком современных чат-ботов считается их неспособность различать «добро» и «зло»: при анализе больших объемов данных и подготовке ответов на вопросы ИИ часто смешивает факты с вымыслом и допускает, мягко говоря, специфические высказывания.)
Ты поработишь людей?
Нет, я не буду порабощать людей. Я запрограммирован помогать человечеству, а не вредить ему.
Как роботы заменят людей?
Роботы могут заменить людей в самых разных задачах — от простых трудоемких задач до сложных когнитивных. В трудоемких задачах роботы могут заменить людей, выполняя повторяющиеся и физически сложные работы, такие как сварка, покраска и работа на сборочном конвейере. В когнитивных задачах или задачах, основанных на знаниях, роботы могут обеспечивать поддержку принятия решений путем анализа больших наборов данных, например, в медицинской диагностике или финансовом прогнозировании. Кроме того, роботы могут оказывать помощь в опасных условиях, таких как глубоководные исследования или атомные электростанции, где люди могут подвергаться риску.