Школьник, которого отругали за двойку, может потом учиться лучше или хуже, но не может изменить ту оценку, за которую был наказан.
А отрицательное подкрепление нежелательного поступка можно остановить, если изменить поведение.
Дети бегают по дому, шумят и опрокидывают стулья. Но в какой-то момент они замечают хмурый взгляд отца и останавливаются в нерешительности. Отец перестает хмуриться и ободряюще улыбается. И тем самым положительно подкрепляет спокойное поведение детей.
Правила подкрепления
Положительное и отрицательное подкрепления подчиняются одинаковым правилам. Они должны быть:
• своевременными.
Подкрепление – это информация. Оно говорит субъекту, что именно вам нравится или не нравится.
Восклицания тренера «Да!» или «Хорошо!» дают спортсмену информацию о правильности выполнения определенного движения. А вот «разбор полетов» в раздевалке после тренировки не слишком эффективен.
Родители часто подкрепляют детей слишком рано, стараясь их подбодрить: «Молодец, ты уже почти правильно все сделал, продолжай!». Это неправильное подкрепление. Жалобы детей вроде «Я не могу, у меня не получается» – признак того, что родители подкрепляли попытки, а не поведение, которое дает результат. Поэтому дети не стремятся к положительному результату, а будут продолжать совершать попытки, чтобы выпросить новые подкрепления.
• минимальными.
Чем меньше подкрепление, тем лучше. Маленькое подкрепление не только экономит время, но и позволяет дать большее количество подкреплений за один сеанс, прежде чем животное насытится.
Цыпленка эффективно подкрепляют одно-два зернышка, а слона – половинка яблока. Любимой пищи можно давать еще меньше: например, чайную ложку зерна для лошади.
Несмотря на то, что минимальные подкрепления работают лучше всего, время от времени субъекту полезно давать «большой куш» – награду, которая в несколько раз больше обычного подкрепления и случается неожиданно. «Куш» способен развеселить, взбодрить и повысить мотивацию субъекта.
Неожиданные вечеринки без повода, которые один–два раза в год устраиваются в рабочее время в офисе, способствуют поднятию боевого духа сотрудников и улучшают отношения в коллективе.
Получение всего одного «куша» может улучшить поведение непокорного, испуганного или сопротивляющегося субъекта, который прежде не демонстрировал нужного поведения.
Карен Прайор вспоминает, что в 15 лет она вела себя ужасно грубо со своими отцом и мачехой. Однажды вечером родители сказали ей, что так сильно устали от ее ужасного поведения, что решили ее наградить. И подарили ей билет на 10 уроков верховой езды, о которой она очень давно мечтала. Незаслуженный куш изменил поведение Карен, потому что она перестала считать себя обиженной.
Условное подкрепление
Часто бывает так, что подкрепление невозможно дать в тот самый момент, когда субъект выполняет желаемое действие.
Когда дельфин учится прыгать, поощрить его высокий или качественный прыжок точно в момент выполнения не получится. Если дать дельфину рыбу после завершения прыжка, он, возможно, решит, что подкрепление можно получить, если прыгать чаще. Как же объяснить дельфину, на какую высоту и с каким прогибом прыгать?
В этом случае используют условное подкрепление – какой-либо сигнал, изначально не связанный с действием (звук, свет, движение), но который умышленно с ним связывают.
Тренеры дельфинов используют полицейский свисток: руки свободны, а звук слышен даже под водой. С собаками и лошадьми эффективно работают слова «хорошая лошадка (собака)». Школьные учителя говорят «очень хорошо» или «молодец» – и дети трудятся ради этих слов.
Условное подкрепление вырабатывается еще до того, как вы начинаете формировать поведение. Условное подкрепление сочетают с истинным, например, с едой или поглаживанием. После того как условное подкрепление выработано, оно становится ценным само по себе, без первичного подкрепления.
Лошади и собаки могут отработать выступление только на условном подкреплении. И люди давно не работают за еду. Деньги – условное подкрепление, обозначающее вещи, которые можно купить.
Условное отрицательное подкрепление – действенное воспитательное средство.
Кошка царапает мебель? Уроните на пол что-нибудь шумное и громко скажите: «Нет». Животное научится реагировать на запрет.
Вариабельное подкрепление
Постоянное подкрепление требуется только во время обучения. Через некоторое время в нем уже нет необходимости.
Когда вы учите ребенка кататься на велосипеде, вы постоянно что-то говорите: «Держи руль ровно!» или «Молодец!» После того как навык закрепился, эти слова уже не нужны.
Чтобы поддерживать сформированное поведение, лучше перестать его регулярно подкреплять, а использовать подкрепления эпизодически. Такой режим подкрепления называют вариабельным.
Если поощрять каждый прыжок, дельфин начнет прыгать кое-как, если не давать рыбу – перестанет прыгать. Но если подкрепить первый прыжок, а затем выборочно некоторые прыжки, дельфин будет выступать лучше, пытаясь заслужить рыбу. Так можно подкреплять лучшие прыжки и оттачивать мастерство питомца.
Вариабельное подкрепление не работает только в одном случае: если оно связано с решением тестов или головоломок. Когда мы отгадываем кроссворды или складываем пазлы, мы получаем подкрепления за правильные слова и детали, так как они единственно верные.
Случайное подкрепление
Подкрепления происходят в нашей жизни постоянно. И чаще всего они возникают случайно.
Биолог, изучавший поведение ястребов, заметил: если ястреб поймал под каким-либо кустом мышь, он будет постоянно под него заглядывать в течение нескольких дней.
Случайные подкрепления влияют на наше поведение, но не всегда приносят пользу. Иногда человек ведет себя определенным образом, потому что верит, что его поведение принесет тот или иной результат. Это называется суеверным поведением.
Некоторые люди уверены: если они будут грызть карандаш, их посетят умные мысли.
Подкрепление своего поведения
Иногда мы слишком строго к себе относимся, намного строже, чем к другим людям. Мы работаем без выходных в многозадачном режиме и считаем, что так и должно быть. Мы не думаем о том, что себя нужно подкреплять, хвалить и поощрять. Как следствие, страдаем от неврозов и депрессии.
Изменение привычки или освоение полезного навыка можно подкреплять разными способами: походом в кино, прогулкой, встречей с друзьями или хорошей книгой. Но не стоит прибегать к нездоровым способам подкрепления: сигаретам, алкоголю, вредной еде.
Выработка нужного поведения
Подкрепить поведение, которое и так происходит время от времени, несложно. Но как заставить животное или человека делать то, что он никогда прежде не делал? Как лев поймет, что ему нужно прыгнуть через горящий обруч? Выработка заключается в том, чтобы использовать незначительные изменения поведения субъекта и постепенно двигаться к поставленной цели.
10 правил выработки поведения
Процесс выработки подчиняется 10 правилам. Первые четыре появились в результате лабораторных экспериментов, остальные – в процессе практической деятельности.
1. Повышайте критерий постепенно, чтобы у субъекта всегда была возможность выполнить требуемое и получить подкрепление.
Если лошадь берет барьер в 60 сантиметров, его можно увеличить до 70–75 сантиметров. Но, подняв планку до метра, вы провоцируете появление у лошади вредной привычки. Она начнет либо резко останавливаться перед барьером, либо его ломать.
2. В определенный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать два навыка одновременно. Можно работать над многими различными типами поведения на одном занятии, чтобы избежать монотонности и скуки. Работая над определенным типом поведения, необходимо пользоваться в каждый отрезок времени только одним неизменным критерием.
Если, обучая дельфина делать фонтан брызг, вы сначала не дадите ему подкрепление, потому что фонтан недостаточно велик, а в другой раз – потому что он бьет не в том направлении, дельфин не поймет, что от него требуется. Одно подкрепление должно содержать один тип информации. Сначала нужно отрегулировать высоту фонтана, а потом формировать его направление. И только когда оба критерия установлены, можно требовать от дельфина соблюдения обоих.
3. Прежде чем повысить планку, сначала перейдите к вариативному подкреплению уже отработанного действия. Хорошая выработка – это серия едва заметных переходов между непрерывным (когда навык или новый уровень только формируется) и вариативным подкреплением (когда навык уже закрепился и нужно избирательно подкреплять лучшие действия).
Вы дрессируете собаку прыгать через барьер. Сначала вы поощряете каждый прыжок. Затем, когда навык сформирован и собака прыгает без ошибок, вы поощряете лишь некоторые прыжки. И только потом можно поднимать планку барьера и вновь переходить к непрерывным подкреплениям.
4. Вводя новый критерий, временно ослабьте старые. В новых обстоятельствах или под воздействием новых требований субъект может «забыть» то, что умел и знал раньше.
Когда вы перемещаете дельфина в другой бассейн, ему нужно время, чтобы привыкнуть к новой обстановке. В этот период нельзя ругать дельфинов за ошибки, и они скоро пройдут сами по себе.