Моделирование рассуждений. Опыт анализа мыслительных актов
Шрифт:
X и я знаем, что А
Здесь ХA и YA обозначают соответственно то, что X и Y выбирают движение по коридору А. Но для X такая ситуация никуда не годится. Не слишком умный, но быстроногий Y его догонит
Y думает, что А
Но верно ли это предположение? Ведь X мог и просчитаться, не подозревать, что У сам обладает первым рангом рефлексии. В этом случае Y не бросается сразу в коридор А потому, что А
X думает, что А
В этом случае X проиграет.
А что будет, если X обладает вторым рангом рефлексии? В этом случае он предполагает, что Y способен к рефлексивным рассуждениям первого ранга. В этих условиях рассуждение X может выглядеть следующим образом:
Y думает, что X думает, что A
И если X правильно оценил возможности Y, то он ушел от погони. Но если X провел рефлексивное рассуждение на уровне второго ранга рефлексии, а Y обладал лишь нулевым рангом, то X попался. Он «перемудрил сам себя», посчитав, что Y обладает способностями рассуждать, которые тому и не снились.
Ситуация, очень похожая на этот последний случай, послужила основанием для рассказа «Ограбление произойдет в полночь», принадлежащего известному советскому писателю-фантасту И. Варшавскому. В нем описана следующая забавная ситуация. Полицейское управление получает в свое распоряжение мощный компьютер с пакетом программ, позволяющих прогнозировать возможные преступления. Проанализировав все случаи ограбления банков за последние пятьдесят лет, ЭВМ выдает прогноз, что сегодня произойдет ограбление Национального банка и сделает это известная банда папаши Сколетти. Машина даже рассчитывает оптимальный
вариант ограбления, сулящий банде наибольший успех.Все было бы хорошо, но у банды Сколетти тоже есть ЭВМ – родная сестра машины, стоящей в полицейском управлении, а программисты, работающие у бандитов, конечно, знают об ЭВМ, приобретенной полицией. И, конечно, они легко могут просчитать действия полиции при оптимальном варианте ограбления. Поэтому если их уровень рефлексии выше нулевого, то бандиты воспользуются не оптимальным вариантом, а тем, который наименее от него отличается.
Так начинается дуэль двух ЭВМ, которые постепенно наращивают ранги рефлексии своих рассуждений. Процесс этот, как мы уже говорили, бесконечен. ЭВМ рассчитывают и отвергают один вариант за другим, не останавливаясь окончательно ни на одном из них, предполагая, что противники уже рассчитали эти варианты. Дуэль кончается неожиданно. Шефу полиции сообщают, что десять минут назад Национальный банк ограблен. На испуганный вопрос программиста полицейского управления: «Неужели Сколетти?..», – шеф полиции яростно отвечает: «Думаю, что Сколетти целиком доверился такому же болвану, как вы. Нет, судя по всему, это дело рук Вонючки Симса. Я знаю его манеру действовать в одиночку, угрожая кольтом образца 1912 года и консервной банкой, насаженной на ручку от мясорубки».
Вонючка Симс не был способен к рефлексивным рассуждениям и выиграл на этом.
Рефлексивные рассуждения тесно связаны с некоторым классом игр, в которых игроки при выборе своих действий могут опираться на соображения о поведении других игроков. Простейшей из таких игр является игра, получившая название «Дилемма заключенного». Эта игра задается матрицей с определенными отношениями между выигрышами игроков при выборе ими одной из двух доступных им альтернатив. Например, матрица может иметь следующий вид:
В этой матрице А1 и А2 обозначают два действия, которые может выбрать первый игрок, a B1 и B2 – действия второго игрока. На пересечении строк и столбцов написаны пары чисел, которые определяют выигрыши и проигрыши соответственно первого и второго игроков, когда они произведут одновременно свои альтернативные выборы.
Обычно для интерпретации этих выборов рассказывают следующую криминальную историю. Полиция задержала двух человек, которые полицейским показались подозрительными. Во всяком случае, они явно смахивали на бродяг, а в стране, где это происходит, за бродяжничество полагается наказание – год тюремного заключения. Но у полицейского комиссара есть основания подозревать в них не просто бродяг. Похоже, что они – давно разыскиваемые преступники, на совести которых немало краж. Но как установить истину?
Комиссар выбирает следующую тактику. Он сажает подозреваемых в разные камеры и не дает им общаться между собой. При допросе каждому из них он объясняет, что если допрашиваемый сознается в совершении краж, то все наказание (шесть лет тюрьмы) понесет нераскаявшийся преступник, а сознавшийся будет полностью освобожден от наказания. Если же оба преступника сознаются одновременно, то каждому из них придется отсидеть по три года.
Перед подозреваемыми возникает дилемма: сознаваться или не сознаваться? Если бы они могли договориться между собой, то, конечно, надо было бы упорно отрицать свое участие в кражах. Год тюрьмы не такой уж большой срок, и они вскоре были бы на свободе. Но договориться им не дают. И все время каждого мучает мысль: что если сообщник сознается? Тогда придется сидеть шесть лет, а он будет гулять на свободе.
Итак, перед каждым из игроков две стратегии: сознаться (в матрице игры этому соответствуют альтернативы А1 и В1) или не сознаваться (альтернативы A2 и В2). Как поведут себя люди в такой ситуации? Как они должны рассуждать?
Если у наших бродяг нулевой ранг рефлексии, то каждый из них способен рассуждать только на основе тех чисел, которые находятся в матрице игры. А это значит, что каждый из них руководствуется лишь собственными интересами. В таких условиях они мгновенно «раскалываются», признаются в совершенных кражах и получают по три года тюрьмы.