Не рычите на собаку! (О дрессировке животных и людей)
Шрифт:
Подкрепление в спорте
Судя по моим случайным наблюдениям, тренировки в большинстве командных видов спорта — например, профессиональный футбол, — продолжают старую добрую неандертальскую традицию: множество лишений, наказание, фаворитизм, оскорбление на словах и в мыслях. Однако в тренировочном мире в индивидуальных видах спорта по-видимому происходят радикальные изменения. Фактически именно один из симптомов этого переворота побудил к написанию этой книги. На обеде в округе Весчестер штат Нью-Йорк, я сидела рядом с теннисистом-профессионалом, тренировавшем хозяйку дома, приятным молодым человеком из Австралии. Он сказал мне: — Я слышал, что вы тренируете дельфинов. Вы знаете о Скиннере и всех этих штуках? Да. — Тогда скажите мне, где достать книгу о Скиннере, которая помогла бы мне усовершенствоваться в качестве тренера. Я знала, что такой книги нет. Почему ее не было, до сих пор остается для меня загадкой, и я решила написать ее. И вот она перед вами. Между тем я раздумывала над удивительным фактом о том, что этот человек и, возможно, многие другие ему подобные точно знали, что им было нужно.
Это означало, что существовали люди, которые уже ухватились за обучение с подкреплением и хотят знать о нем побольше. В то время я жила в Нью-Йорке. Частично в качестве разнообразия в ограниченной рамками дома сидячей городской жизни, а частично из-за любопытства дрессировщика я начала посещать занятия по нескольким видам
Сейчас я посетила несколько занятий в теперешней школе фигурного катания в Нью-Йорке, которая организована одним из олимпийских тренеров. Работающие там инструкторы используют одни и те же методы обучения и для взрослых и для детей — никаких упреков и ругани, а лишь немедленное подкрепление за каждое свершение, а таких маленьких успехов предостаточно. Каждое из простейших движений, которыми должен овладеть фигурист, разбивается на легко выполнимые промежуточные элементы, начиная с того, как упасть и снова подняться. Скольжение на одной ноге? Все просто: оттолкнитесь от стенки, ноги держите параллельно, скользите на двух ногах; на очень короткое время поднимаете одну ногу, опустив ее, поднимаете другую, затем повторяете то же самое, но держите ногу поднятой чуть подольше, и так далее. Через десять минут класс, начавший с нуля, включая толстых, слабых, нетвердо стоящих на ногах, очень маленьких и очень старых скользит на одной ноге, а на всех лицах написано крайнее изумление и чуть ли не восторг. Я даже не заметила, как выработанный на втором занятии «перекрестный» шаг разрешил мои детские проблемы с равновесием, пока во время свободного катания после занятий не обнаружила, что весело огибаю углы, скользя на внешней стороне конька. И более того! К третьему занятию я могла делать вращение, настоящее вращение, как фигуристы на экране телевизора, и частые прыжки с поворотом, о которых я не смела мечтать в детстве (им начинают обучать совсем без затей вдоль стенки). Какое замечательное открытие! Трудность обучения таким навыкам проистекала не из-за требований к физическим качествам начинающих спортсменов, а из-за отсутствия хороших методик обучения. Другой пример — катание на горных лыжах. Появление пластиковых лыж и лыжных ботинок сделало лыжи доступными для масс, а не только для выдающихся спортсменов. Но на склоны гор эти массы были приведены новыми методами обучения, при которых на первых порах используются короткие лыжи и формируется каждый тип необходимого поведения (наклон, поворот, остановка и, конечно, падение и вставание на ноги) с помощью серии маленьких, легко выполнимых элементов, отмечаемых положительным подкреплением.
Я поехала в Аспен, взяла три урока катания на лыжах и скатилась с ровной горы. Наиболее сильные ученики нашего начинающего класса к концу недели одолевали и промежуточные склоны. Отдельные учителя, которые добивались быстрых результатов, существовали всегда. Что, по-моему, изменилось за последние одно-два десятилетия, так это то, что принципы достижения быстрых результатов стали как бы сами собой разумеющимися в стандартных приемах обучения. «Вот способ быстрого обучения катанию на лыжах: не кричите на начинающих, постепенно переходите от первого к десятому этапам, хвалите и подкрепляйте успехи на каждом из этапов, и большинство из них через три дня будут на склонах». Когда большинство инструкторов стали пользоваться выработкой и подкреплением и соответственно достигать быстрых результатов, остальные поняли, что и они должны перейти к новым методам — хотя бы просто для того, чтобы, оказаться конкурентоспособными. Это происходит во всех видах индивидуального спорта, что свидетельствует об увлечении тренеров прагматизмом (дословно: полезностью). Обучение двигательным навыкам становится приятным и радостным занятием.
Подкрепление в бизнесе
В нашей стране труд и управление традиционно стояли на противоположных позициях. Мысль о том, что все принимают участие в общей игре, никогда не была особенно популярна в американском бизнесе. Практика бизнеса исходила из того, что каждая из сторон старается получить от другой как можно больше, а дать как можно меньше. Конечно, на самом деле это молчаливо подразумевалось исходными позициями обучения, но некоторые администрации склонялись к другим подходам. В шестидесятые годы получили популярность «бережное обучение» и другие социально-психологические подходы, ставившие целью просветить администрацию по вопросам нужд и чувств сотрудников и служащих. Но можно быть сколь угодно хорошо осведомленным, но не знать при этом, как же решать каждую конкретную проблему. Положение в бизнесе таково, что одни занимают более высокое, другие более низкое положение, одни получают распоряжение, другие их отдают. В США ситуация в большинстве случаев не напоминает семейную и не должна быть таковой. Поэтому семейственный тип разрешения межличностных конфликтов на работе не проходит. Среди последних публикаций о бизнесе меня в последнее время заинтересовали несколько сообщений, где описаны наиболее эффективные подходы, где используется подкрепление — от наиболее простых до совершенно блестящих.
Например, один из консультантов по менеджменту советует в случае, если необходимо временно освободить от работы часть персонала, определить 10 % худших и 20 % лучших работников. Вы освобождаете самых слабых работников, но вы так же должны обязательно обеспечить 20 % лучших, при этом они должны знать, что их оставляют потому, что они прекрасно работают. Очень здравая мысль. Помимо того, что вы убережете своих лучших работников от нескольких бессонных ночей и очень существенно положительно их подкрепите при вызывающих тревогу обстоятельствах, вы к тому же побуждаете средних работников либо стремиться к подкреплению, которое, как они видят, получено лучшими, либо хотя бы не попасть в низшую группу — кандидатов на вылет. Подкреплением для менеджеров среднего уровня и среднего возраста может быть более интересная работа на их теперешнем месте, вместо перспективы повышения — с более высокой ответственностью они могут и не справиться (а могут и не желать занять более высокий пост, особенно если это связано с переездом). Одна компания, занимающаяся компьютерной техникой, выплачивает денежные премии некурящим и тем, кто бросил курить,
и в этом есть большой смысл: продукция, которую они выпускают, может быть испорчена частицами дыма.Другие способы подкрепления, находящие все большее применение, включают свободный выбор часов работы, так называемую «гибкую систему» (к ней особенно стремятся работающие матери), работу в самоуправляемых коллективах и вознаграждение за проделанную работу, а не за потраченное на нее время. Все эти приемы управления делают упор на то, что работник действительно считает подкрепляющим — то, что нужно людям, а не только дает прибыль. Программы, нацеленные на снижение себестоимости и повышение темпа работы — программы, которые по существу пытаются заставить работников работать лучше — куда менее эффективны, чем проекты, которые помогают работникам выполнять дело лучше и получать за вознаграждение. Корпорации, пользующиеся положительным подкреплением, часто видят результаты, когда оказываются в критической ситуации. Великолепный пример — авиакомпания Дельта, которая всегда славилась заботой о своих служащих. Во время спада 1981 года несмотря на значительные убытки, Дельта отказалась сократить кого-либо из своих 37000 служащих. Фактически это привело к тому, что в целом по компании зарплата повысилась на 8 %. В прочно установившемся климате положительного подкрепления работники привыкли мыслить в том же духе; они поменялись местами с администрацией и подкрепили компанию, создав фонд и купив новый самолет, Боинг-767 стоимостью 30 млн. долларов.
Подкрепление в мире животных
На протяжении всей книги я рассказывала о том, как теория подкрепления позволяет профессиональным дрессировщикам формировать поведение у тех существ, к которым просто не может быть применена сила: кошек, пум, цыплят, птиц в воздухе, слонов в посудной лавке. Обучение с подкреплением открыло новые горизонты, которые, как мне кажется, мы только начинаем исследовать с целью создания полезного действенного партнерства с новыми неодомашненными видами животных. Оно даст возможность животным продемонстрировать нам такие свои возможности, о которых в других условиях мы, возможно, никогда и не узнали бы. Военно-морские силы США занимают передовые позиции в деле развития новых способов использования диких животных, начиная от охраны портов дельфинами до спасения гриндами локаторов. На учебном полигоне в Калифорнии, где вода слишком глубока, мутна и холодна для пловцов-людей, ВМС США обычно используют для обнаружения и обратной транспортировки отстрелянных ракет группу дрессированных морских львов. Ученый Джим Симмонс, работающий в ВМС, проводил эксперименты с голубями, выступавшими в роли корректировщиков в спасательных операциях вода — воздух. Голубей, перевозимых на легких самолетах, обучали клевать кнопку, если они видели желтый, оранжевый или красный предмет (цвета спасательных жилетов и плотов). Поскольку острота зрения и работоспособность голубей значительно превышают таковую у людей — спасателей, особенно при бурном море, то и береговая охрана и Военно-воздушные силы США в настоящее время проводят полевые испытания «Проекта Морского Поиска» с участием голубей. Единственное но, как сказал один из командиров береговой охраны:
— Где же мне взять опытных, высококвалифицированных исследователей, которые будут педантично кормить цыплят? Доктор М. Вильярд, ученик Скиннера, разработал систему дрессировки небольших обезьян в качестве помощников для людей с параличами конечностей. Обученные при помощи положительного и отрицательного подкрепления, обезьяны по словесной команде научились включать и выключать свет, переключать каналы на телевизоре, переворачивать страницы, приносить некоторые предметы, ставить и вынимать кассеты в плейере и даже кормить с ложки больного. Они берут в доме все, что угодно, весь день активны и могут сами улечься спать ночью. Услужливость обезьян, в отличие, скажем, от собак-поводырей, связана не с длительным разведением, направленным на отбор служебных качеств, а с действенностью обучения с подкреплением. (При этом между инвалидом и обезьяной-нянькой могут возникнуть истинная привязанность и доверие). В данный момент мы, как мне кажется, даже не можем предугадать, какие еще животные могут начать взаимодействовать с нами в следующих десятилетиях и какие у них могут быть выработаны полезные навыки. Одно из преимуществ подкрепляемого обучения состоит в том, что вам не надо выдумывать какое-либо действие за животное, а потом обучать его выполнению; вы можете подкреплять все, что животное случайно продемонстрирует, и посмотреть, что при этом выйдет. Никто и в мыслях не имел, что обыкновенные тюлени могут «разговаривать», но в аквариуме Новой Англии дрессировщики заметили, что спасенный людьми тюлень Гувер как будто бы подражает звукам. Подражание звукам человеческой речи было сформировано с помощью подкрепления, и вскоре Гувер уже «говорил» не сколько фраз.
— Поздоровайся с дамой, Гувер.
Гувер (гортанным басом, но очень отчетливо):
— Привет, дорогая, как поживаешь?
Это забавно слушать, и, кроме того, представляет неподдельный научный интерес для зоологов и биоакустиков.
Для меня как биолога, занимающегося поведением, наиболее ценными удивительным аспектом подкрепляемого обучения является то окно, которое оно приоткрывает в разум животного. Десятилетиями было модно отрицать наличие у животных разума и чувств, и в этом, возможно, был некоторый смысл: это позволило нам избавиться от множества суеверий, переоценок («Моя собака понимает каждое мое слово») и неверных истолкований. Но затем появились этологи во главе с Конрадом Лоренцем, которые показали, что у животных есть внутренний мир — они испытывают гнев, страх и т. д. — и что он проявляется в очень четких позах, выражениях и движениях, которые можно узнать и истолковать.
Когда вы с животным можете видеть друг друга, а каждый из вас защищен от неожиданного физического столкновения и травм (допустим — животное находится в клетке или загоне, а вы снаружи), то животное вольно проявлять любые внутренние состояния, вызываемые дрессировочным взаимодействием. Часто животные начинают проявлять по отношению к дрессировщику социальное поведение — от знаков приветствия до вспышек раздражения. Ничего не зная о данном виде, но зная, как любое из животных склонно реагировать на различные дрессировочные ситуации, можно за полчаса тренировки узнать о природе социальных сигналов данного вида больше, чем за месяц наблюдения за тем, как животное взаимодействует со своими собратьями. Например, если я вижу, что дельфин выпрыгивает из воды и со страшными брызгами плюхается обратно в группу других дельфинов, я могу только спекулятивно рассуждать на тему о том, почему он это делает; но если на одном из занятий я забуду подкрепить то, что ранее всегда подкрепляла, и дельфин выпрыгивает из воды и плюхается так, что вымочит меня с ног до головы, я могу говорить с достаточной определенностью, что хотя бы в некоторых случаях прыжки с брызгами, по-видимому, являются проявлением агрессивности… и вдобавок очень эффективным. Можно сказать даже больше. Вовлекая дикое животное в некоторую несложную процедуру обучения, можно получить беглое, но поразительное впечатление о том, что может быть названо видовым темпераментом — о том как не только данный индивид, но и все представители данного вида склонны реагировать на вызовы, бросаемые им окружающими условиями. Преподавая дрессировку смотрителям Национального Зоопарка, я демонстрировала приемы на многих различных видах. Я стояла по одну сторону загородки, используя в качестве условного сигнала свисток я перебрасывая пищу через ограду; животные на своей стороне передвигались почти свободно. Белые медведи оказались невероятно настойчивыми и упорными.