Рефлексивные игры: я думаю, что ты подумал, что она подумала…

Начну со стихотворения английского поэта XIX века Ковентри Патмора «О поцелуе» (перевод С. Я. Маршака).

— Он целовал вас, кажется?
— Боюсь, что это так.
— Но как же вы позволили?
— Ах, он такой чудак.
Он думал, что уснула я
И всё во сне стерплю,
Иль думал, что я думала,
Что думал он: я сплю!

Рассуждения типа «я думаю, что ты думаешь, что она думает…» (и т. д.) в теории игр называются рефлексивными, или рекурсивными, «вложенными». Более строго: рефлексивные игры «описывают взаимодействие субъектов (агентов), принимающих решения на основании иерархии представлений о существенных параметрах, представлений о представлениях и т. д.» [1, с. 2].

Такие «вложенные» рассуждения уникальны для человека, хотя некоторый потенциал есть и у наиболее интеллектуальных животных. На английском можно посмотреть хорошую научно-популярную статью М. Корбаллиса [2].

Обыгрывание рекурсивных рассуждений встречается у Шекспира, в комедийной пьесе Питера Устинова «Романов и Жюльетта» (опубликована в 1956 году, поставлена на Бродвее, экранизирована в 1961-м) и в других текстах. Феномен поп-культуры — песня Максима Леонидова с припевом: «Я оглянулся посмотреть, не оглянулась ли она, чтоб посмотреть, не оглянулся ли я».

Рекурсивные рассуждения активно исследуются в психологии, логике, конфликтологии.

Рефлексивные игры: я думаю, что ты подумал, что она подумала…

Обложки книги В. А. Лефевра [3], в которой «особое внимание уделяется рефлексивным процессам, протекающим в условиях конфликта», упомянутой книги Д. А. Новикова, А. Г. Чхартишвили и книги М. Корбаллиса «Рекурсивный разум: происхождение человеческого языка, мышления и цивилизации» [4]

‌

Существуют психологические тесты для диагностики рекурсивного мышления и логические задачи на этот тип рассуждений. Это, например, многочисленные задачи о мудрецах с надетыми на них колпаками, соревнующихся, кто первым определит, какого цвета колпак на нем самом, — на основе знания об исходном наборе колпаков, учете того, что на головах у других, и анализа их реакций с рекурсивным пониманием, что они пытаются делать то же самое. Интересный критический анализ этой задачи дал А. В. Смирнов [5].

Хотя к увеличению ранга рефлексии способны лишь сильные игроки, в теории игр установлено, что при росте этого ранга, т. е. при удлинении цепочки рассуждений «я думаю, что ты думаешь, что я думаю…» есть опасность «перемудрить». Сильный игрок с высоким рангом рефлексии переоценивает противника, предполагая, что у него ранг рефлексии тоже высокий. Но если ранг соперника на самом деле низкий, это приводит к проигрышу данному более слабому противнику [6].

Некоторые рефлексивные игры создаются для формальных или неформальных психологических практикумов. Это:

игра «Однажды в созвездии Лебедя» И. В. Вачкова на принятие решений при инопланетной встрече — стрелять ли в участников, решающих, стрелять ли в вас, «способствует развитию у участников умения понимать друг друга и эффективно взаимодействовать, вызывает сильные эмоциональные реакции у членов группы, и психологу следует быть к этому готовым» [7];
настольная игра «Телепат» С. О. Раевского: «каждый игрок тайно отвечает на вопрос; его сосед должен угадать, что он ответил; сосед соседа угадывает, что тот подумал про него, и так по кругу» [8] — и никакой стрельбы;
основанный на идее В. А. Лефевра «Эксперимент для изучения переговоров» [9] и др.

Триады участников со сложными отношениями

Особый интерес представляют стратегии рассуждений и поведения при сложных конкурентно-кооперативных отношениях, возникающих, когда участников не меньше трех. Такие ситуации значительно усложняют рассуждения. Здесь надо думать не «просто» о том, что думает другой (хотя и это непросто), а и о том, что думают несколько других — в том числе о том, как они будут на основе своих размышлений и возможных переговоров взаимодействовать друг с другом в отношении меня, что мне делать, и как они будут реагировать на мои действия.

Приведу пример конкурентно-кооперативных отношений в триаде участников. В одном из рассказов охотника-натуралиста описан драматический случай, когда в местности, где водятся медведи и тигры (и время от времени схватываются друг с другом), его стала манить за собой медведица: вышла, показалась, потом медленно пошла, оглядываясь на человека. Так она вывела охотника — врага медведя — на точку, с которой открывался вид на площадку, где тигр — другой враг — играл с останками убитых им медвежат. Посыл, с точки зрения автора рассказа, был ясен — отомстить, — что он и сделал. Медведица поняла, что один враг убьет другого, увидев его, — и не ошиблась. Не обсуждая здесь степень истинности-вымышленности конкретно этого рассказа, укажем, что легко вообразить другие, вполне реальные ситуации с той же структурой.

Моделируя ситуации такого типа, примерно десять лет назад я разработал соответствующую методику, которую использовал в психологических практикумах и на семинарах для студентов. Я представляю ее ниже. (Более подробное описание с инструкцией участникам, раздаточными листами и результатами дано в [10].)

Игра «Морской бой втроем»

Участники играют в модифицированный «Морской бой», исходная версия которого общеизвестна. Модификация состоит в следующем. Участников (индивидуальных участников или команд) больше — их трое, но игра ведется на меньшем игровом поле с меньшим числом кораблей (иначе тяжело). В практикуме целесообразно провести не менее трех раундов, чтобы участники освоились в новых правилах. Кроме того, важно, что «если рефлексивная игра в нормальной форме повторяется несколько раз, то некоторые (или даже все) агенты могут наблюдать результаты (действия оппонентов, значения целевых функций и др.), отличные от ожидаемых, и структура информированности игры меняется» [11].

В соответствии с правилами модифицированной мною игры отношения между участниками организованы по принципу игры «камень, ножницы, бумага» (один участник может нанести ущерб второму, второй — третьему, третий — первому). В игре имеется две таких нетранзитивных триады, и связи в одной триаде противоположно направлены по отношению к связям в другой.

1. Одна триада отношений — непосредственного нанесения урона. Она задана следующим правилом:

- участник А (индивидуальный или команда) может «стрелять» по участнику В (и не может по С),
- участник В может «стрелять» по участнику С (и не может по А),
- участник С может «стрелять» по участнику А (и не может по В).

2. Более сложная триада отношений противоположной направленности — это отношения «разведки», или «информационного взлома». Я как игрок могу узнать важную информацию о стреляющем по мне участнике (информацию о расположении его кораблей). Сама по себе эта информация для меня бесполезна — но я могу поделиться ею с третьим участником, который стреляет по этому стрелку (поделиться информацией с врагом моего врага).

Реализуется эта триада следующим образом:

- участник С может «сходить в разведку» на сторону стреляющего по нему В, посмотреть расположение его кораблей, сфотографировать и, если сочтет нужным, на том или ином ходу подсказывать игроку А клетку того или иного корабля В, чтобы А точнее «стрелял» по «супостату» В, наносящему С непосредственный урон;
- В может «сходить в разведку» на сторону стреляющего по нему А и, если сочтет нужным, на том или ином ходу подсказывать игроку C клетку того или иного корабля A, чтобы C точнее «стрелял» по A, наносящему В непосредственный урон;
- А может «сходить в разведку» на сторону стреляющего по нему С и, если сочтет нужным, на том или ином ходу подсказывать игроку B клетку того или иного корабля C, чтобы В точнее «стрелял» по С, наносящему А непосредственный урон.

Препятствовать «разведке» и фотографированию нельзя.

Схема отношений между участниками А, В, С, задаваемых правилами игры

Стрелками обозначены направления «стрельбы» и дачи подсказок (А стреляет по В и информирует его о С, В стреляет по С и информирует его об А, С стреляет по А и информирует его о В);

Пунктирные стрелки — направление «разведки», или «информационного взлома» (А «разведывает» информацию о стреляющем по нему С и может передать ее В для корректировки стрельбы по С; С «разведывает» информацию о стреляющем по нему В и может передать ее А; В «разведывает» информацию о стреляющем по нему А и может передать ее С).

Итак, я как игрок имею и «любезного советчика», сообщающего мне координаты стрельбы, и потенциально «убийцу» моего флота в лице одного и того же участника — он объединяет эти две роли. В лице другого участника я одновременно имею и объект моей непосредственной атаки (стрельбы по его флоту), и союзника, способного нанести непосредственный ущерб стрелку по моему флоту (а этот стрелок, напомним, одновременно и советчик для меня).

Такая схема существенно затрудняет участникам просчет ситуаций с точки зрения возможных действий других игроков, которые также пытаются сделать свои расчеты — и это должно быть учтено участником, делающим свой расчет. Таким образом, игра относится к классу рефлексивных. На разных этапах игры от участников требуется выстраивать сложные стратегии кооперации и конкуренции.

Так, с одной стороны, игроку выгодно воспользоваться предоставленной ему информацией, чтобы точнее стрелять по противнику, по которому он только и может стрелять. Значит, нужно кооперироваться с третьим игроком, который дает эту информацию. А у того свои цели, в том числе — «чужими руками» избавиться от того, кто по нему стреляет.

С другой стороны, тот, кто использует информацию, должен понимать, что если он, будучи хорошо проинформированным третьей стороной, полностью ликвидирует флот другого участника (по которому он может стрелять), то произойдет следующее. Третий участник (бывший советчик), по которому теперь стрелять станет некому (по нему стрелял ликвидированный второй), теперь имеет возможность ничего больше не советуя и без какого-либо возможного сопротивления ликвидировать первого, которому до этого сообщал информацию и который поторопился ею воспользоваться. Значит, хотя бы один корабль из флота, по которому я стреляю, надо оставить — пока есть противник, стреляющий по мне. (Здесь работает правило, сформулированное для конкурирующих биологических сообществ и выходящее на философский уровень обобщения: «Не уничтожай полностью своего противника — возможно, он кормится кем-то, кто после его гибели плотно займется тобой».)

Это означает, что если у противника, по которому я стреляю, радикально уменьшилось число кораблей, надо перестать кооперироваться с третьим игроком — «советчиком». Надо попытаться вступить в альянс с участником, по которому я стреляю. Например, надо начать стрелять мимо при атаке его поля и убедить его, сделать для него выгодным использование предоставляемой мною информации о третьем участнике. Цель — чтобы бывший объект моих атак стал временным союзником и точнее стрелял по участнику, стреляющему по мне (чьи функции советчика отходят здесь на задний план). Эта изменение воспринимаемой роли другого может происходить многократно по ходу игры у каждого из участников.

В результате по ходу игры участники нередко прибегают к сложному маневрированию и меняют стратегии: начинают сообщать информацию определенного типа (например, не о том, какие клетки заняты, а о том, какие пусты), давать ложную информацию, намеренно стрелять мимо, вступать во временные альянсы и разрушать их и т. д. (Правилами допускаются любые переговоры и обсуждения, и все участники могут их слышать.)

Проигравшей в раунде считается команда, у которой выбиты все корабли, после этого раунд прекращается. Первое и второе место в раунде делятся между двумя оставшимися командами на основе подсчета оставшихся у них кораблей. Общий итог по всем раундам определяется по числу побед в них: команда, у которой побед больше, получает I место; у которой меньше — II; у которой еще меньше — III; при равенстве — ничья.

Вместо заключения

Позвольте мне завершить эту статью причудливым диалогом, процитированным Мартином Гарднером [12]. Гарднер приводит фрагмент упомянутой выше комедийной пьесы Устинова, в котором глава вымышленного европейского государства (Генерал) маневрирует между послами двух других стран (назовем их П1 и П2).

В первом посольстве.

Генерал (обращается к П1). Кстати, вы знаете, что они знают ваш шифр?

П1. Мы знаем, что они знают наш шифр, но сообщаем им только то, что хотим, чтобы они знали.

Генерал отправляется во второе посольство.

Генерал (обращается к П2). Кстати, они знают ваш шифр.

П2. Меня это ничуть не удивляет. Мы уже в течение некоторого времени знаем, что они знают наш шифр, и ведем себя соответствующим образом — делаем вид, будто им удалось нас одурачить.

Генерал возвращается в первое посольство.

Генерал (обращается к П1). Кстати, вы знаете, что они знают, что вы знаете, что они знают, что вы знаете…

П1 (искренне встревожен). Что? Вы уверены?

Генерал. Абсолютно.

П1. Благодарю вас! Благодарю! Я никогда не забуду об услуге, которую вы мне оказали.

Генерал (поражен). Вы хотите сказать, что ничего не знали?

П1. Нет!

Александр Поддьяков, докт. психол. наук

1. Новиков Д. А., Чхартишвили А. Г. Рефлексивные игры. — М.: СИНТЕГ, 2003.

2. Corballis M. C. The uniqueness of human recursive thinking // American scientist. 2007. № 3.

3. Лефевр В. А. Конфликтующие структуры. — М.: Советское радио, 1973.

4. Corballis M. C. The recursive mind: the origins of human language, thought, and civilization. — Princeton University Press, 2014.

5. Смирнов А. В. Задача о мудрецах и колпаках.

6. Поспелов Д. А. Моделирование рассуждений. Опыт анализа мыслительных актов. — М.: Радио и связь, 1989.

7. Вачков И. В. Однажды в созвездии Лебедя // Школьный психолог. 2002. № 15. С. 16.

8. labirint.ru/games/671239

9. Хасан Б. И., Сергоманов П. А. Разрешение конфликтов и ведение переговоров. — Красноярск, Москва, 2001.

10. Поддьяков А. Н. Рефлексивная игра с циклами конкурентно-кооперативных взаимодействий как часть психологического практикума // Вопросы психологии. 2019. № 5.

11. Чхартишвили А. Г. Рефлексивные игры: трансформация структур информированности // Проблемы управления. 2008. № 5. С. 43–48.

12. Гарднер М. От мозаик Пенроуза к надежным шифрам. — М.: Мир, 1993.

Триады участников со сложными отношениями

Игра «Морской бой втроем»

Вместо заключения

См. также:

ТрВ № 13 (432) за 2025 г.: Обсерватория имени Веры Рубин: первые снимки

Обсерватория имени Веры Рубин: первые снимки

Астроновости: прямое детектирование экзопланеты, вспышка новой, искусственные затмения на орбите…

Воспоминания Стивена Вайнберга: краткий очерк великой жизни

Фабрика подлога. Как работает московский конвейер лженаучных статей

Прощальный жест. Григорий Ефимович Крейдлин (22.05.1946–22.06.2025)

«Мы радуемся друг другу бесконечно». Людмила Георгиевна Сергеева (1935–2025)

Страх: инструкция по применению

Свет в «Море Эйнштейна»: живая книга о живом гении

Сквозь тернии…