Как обществу найти общий язык с языковой моделью

23.05.2024

Мы уже привыкли к тому, что интернет превратился в Большого брата, который следит за нами. Набирающие популярность языковые модели будут делать это не хуже поисковиков, считает Анна Щеткина, выпускница Совместного бакалавриата ВШЭ и РЭШ и аспирантка департамента маркетинга Уортонской школы бизнеса. Она разбирает несколько серьезных проблем, которые возникают с массовым распространением искусственного интеллекта, – от использования персональных данных до манипулирования нашим выбором. Впереди возможен и следующий шаг – появление рекламы в набирающих популярность языковых моделях.

Представьте, что на ближайших выходных вы решили отправиться на природу. Вы заходите в поисковик, вбиваете «лучшие места для пикника недалеко от меня» и читаете статьи с рекомендациями. Краем глаза вы замечаете, что между подходящими вам результатами поиска спрятались сайты, которые продают покрывала и корзины для пикника. И вы понимаете, что весь следующий месяц реклама мангалов будет преследовать вас, куда бы вы ни зашли.

Поисковики и реклама переплетены настолько тесно, что бывает сложно представить одно без другого. Но что произойдет с этой связью теперь, когда в игру вступают большие языковые модели, такие как ChatGPT? Что если спросить, куда отправиться на пикник, не у поисковика, а у искусственного интеллекта? Может показаться, что тогда поисковик останется без важной информации о ваших предпочтениях и надоедливая реклама мангалов от нас наконец отстанет. 

К сожалению (или к счастью), персонализированная реклама едва ли погибнет даже с полным исчезновением поисковиков. Любые наши действия оставляют в интернете отчетливый цифровой след, в особенности в социальных сетях, которые не конкурируют с большими языковыми моделями. Возможности, которые эти данные предоставляют для определения наших вкусов, интересов и даже характера, тяжело вообразить. Достаточно даже маленьких деталей, например музыкальных предпочтений. Авторы одного исследования показали, что по реакции человека на 15-секундные отрывки незнакомых песен можно с большой точностью определить его черты по личностной модели Большой пятерки (экстраверсия, доброжелательность, сознательность, невротизм, открытость опыту). В другом исследовании было обнаружено, что частота, с которой человек переключает треки в музыкальном приложении, может рассказать о его эмоциональной стабильности. Иными словами, интернет и рекламодатели едва ли будут знать о нас меньше, даже если мы полностью перейдем с поисковиков на языковые модели.

Они и соберут информацию о нас. Устройство языковых моделей позволяет им подстроиться под каждого конкретного пользователя – уже сейчас можно создать свой кастомный GPT, настроенный под определенные задачи, например для поиска по базе научных статей или работы над логотипами. Несложно представить, что в недалеком будущем нас ждут языковые модели, идеально подстроенные под наши личные вкусы и предпочтения. И чем больше мы будем использовать эти модели, тем больше ультраперсонализированных данных они смогут о нас получить, а значит, тем более релевантными будут их ответы и рекомендации.

Но у сбора ультраперсонализированных данных для обучения языковых моделей есть и обратная сторона: мы не знаем, как эти данные будут распространяться по моделям и для чего они в дальнейшем будут использованы, и нет этической и легальной парадигмы, в которой мы могли бы это оценивать. Она только начинает зарождаться: появляются первые иски против генеративных моделей искусственного интеллекта. The New York Times подала иск против OpenAI и Microsoft за использование материалов издания, защищенных авторским правом, для обучения моделей. The New York Times утверждает, что через языковые модели пользователи могут получить доступ к эксклюзивному контенту без подписки на газету и, более того, что языковые модели иногда приписывают The New York Times ложные факты, вредя ее репутации. В другом иске художники обвиняют несколько разработчиков генеративных моделей изображений в нарушении авторских прав: они утверждают, что их работы были использованы для обучения моделей и теперь у пользователей есть возможность сгенерировать картины в их стиле, за что художники не получат никакой компенсации. Все современные модели искусственного интеллекта – черные ящики с огромным количеством параметров (по собственному заявлению GPT-4, например, у нее 1,76 триллиона параметров), и поэтому напрямую отследить распространение информации по модели фактически невозможно.

Я попросила MidJourney 6.0 сгенерировать изображение искусственного интеллекта в стиле Ван Гога

Однако, даже если разработчики гарантируют, что наши персональные данные не утекают никуда дальше локальной версии языковой модели, мы столкнемся с еще одной потенциальной проблемой: чаты могут влиять на наши потребительские решения. К сожалению, вопрос о том, может ли языковая модель убедить нас купить что-то более эффективно, чем стандартный поисковик, еще недостаточно изучен. Существующие исследования показывают, что люди не доверяют сгенерированным искусственным интеллектом заголовкам новостей, но сохраняется ли это недоверие по отношению к рекомендациям о покупках? И, что более важно, как наше восприятие изменится в будущем, когда языковые модели станут все более похожи на людей? Совсем недавно OpenAI выпустила GPT-4o с расширенными языковыми возможностями и поддержкой голосового общения, а, как показали исследования, люди склонны тратить больше и совершать более импульсивные покупки при общении с голосовым помощником по сравнению с текстовым чатом.

Наконец, можно с высокой степенью уверенности ожидать, что однажды реклама придет в языковые модели. Сейчас большинство моделей искусственного интеллекта доступны по подписке без всякой рекламы (в России ChatGPT официально недоступен – GURU), но, как показывает опыт стриминговых сервисов, эта модель может задержаться ненадолго. Netflix, Disney+ и Amazon Prime один за другим ввели планы, в которых подписка объединена с рекламой, и вполне вероятно, что это ждет и языковые модели. Нам нужно быть готовыми к этому моменту – прояснить влияние искусственного интеллекта на потребителей и в особенности разработать законы о защите приватности и авторских прав в условиях полной непрозрачности языковых моделей.

Что почитать и послушать на эту тему

– Выпуск «Экономики на слух» с Анной Щеткиной о том, как большие данные меняют маркетинг и способы влияния на потребителей
– Статью про то, как GURU вместе с профессором РЭШ Ольгой Кузьминой устроили ChatGPT экзамен по экономике. 
– Тезисы дискуссии на Просветительских днях РЭШ о том, чем технологии искусственного интеллекта могут помочь бизнесу и науке.
– Выпуск «Экономики на слух» о том, насколько автоматизация угрожает рабочим местам на российском рынке труда.
– Обзорную статью GURU о влиянии искусственного интеллекта на экономику.