Марафон по социальным подкреплениям
Неделя 2
Друзья, приветствую вас на второй неделе марафона!

Я знаю, что часть участников не участвует в обсуждении в чате, но тем не менее смотрит нас и делает задания. И у некоторых из вас робкие собаки. Я не могу дать вам обратную связь по заданиям, но все же решила выложить это небольшое видео в начале второй недели. Может быть, оно наведет вас на важные/полезные размышления.

А теперь поговорим о маркерах.
На прошлой неделе мы начали заряжать трюки, которые можем использовать как элемент социального подкрепления. А еще мы теперь неплохо представляем, что из социальных подкреплений работает для наших собак. На этой неделе мы будем сами учиться осознанно использовать разные маркеры, а также встраивать больше социальных подкреплений как подкреплений в наши взаимодействия - и особенно игры! - с собаками.

Маркеры (видео 1)
Маркеры (видео 2)
Дополнительные комментарии

Обучение по шагам

Помните, что чтобы собака училась быстро, нам важно отрабатывать критерии по одному и только потом собирать их вместе: сперва соединять критерии по два, потом по три и так далее.

На этой неделе мы по сути вводим несколько критериев:

- работа за новый маркер, который а) подразумевает вариабельность последующих подкреплений (и еда, и игрушка, и подкрепление из среды, и социальное подкрепление (причем, разные СП); б) вариабельный режим подкреплений (иногда подкрепление следует за маркером, иногда нет.

- когда мы отрабатываем разные по типу подкрепления, мы сперва чаще даем подкрепления с которыми собака знакома и которых ожидает (более высокой ценности и более привычные), и реже непривычные подкрепления.

- когда мы отрабатываем вариабельный режим подкрепления, мы сперва чаще даем лакомство и изредка пропускаем кусочек, потом постепенно начинаем пропускать кусочки все чаще. Следим за состоянием собаки! Если собака фрустрируется/теряет мотивацию, значит, поторопились и быстро усложнили задачу.

- отрабатываем упражнения в разных условиях (и дома, и на улице, и так далее): начинаем с простых условий, постепенно вводим более сложные.

Чтобы у нас все получилось, мы смотрим на собаку, и действуем в ее темпе. Если нужно, разделяем критерии и каждый отрабатываем дольше - столько, сколько нужно собаке.

Как усложнять задачу

Когда мы говорим о том, что мы постепенно вводим больше подходов, когда за маркером не следует лакомство, логика следующая.

Представьте, что на каждые 10 подходов, вы даете собаке подкрепление 8 раз, а два (по одному то тут, то там, пропускаете). Когда это становится легко, можете пропускать два подкрепления подряд. Когда это становится легко (состояние не меняется), можете пропускать то одно, то два подкрепления в сумме 3-4 раза из 10. Дальше - по обстоятельствам и исходя из особенностей вашей собаки.

Помните, что вариабельный режим подкрепления не означает, что вы в конечном итоге лишаете собаку подкреплений в принципе. Частота подкреплений должна быть достаточно высокой, чтобы собака верила, что она получит СТОЯЩЕЕ подкрепление, просто они никогда не знает, когда именно и за задачу какой сложности.

Когда мы говорим о том, что мы постепенно вводим больше подходов, когда за маркером следует непривычное подкрепление, логика следующая.

Представьте, что сперва на каждые 10 подходов, вы даете собаке 8 привычных подкреплений 1-2-3 раза менее привычное подкрепление. Вводите новые подкрепления по одному: каждое новое социальное подкрепление (или другое непривычное подкрепление) - это отдельный критерий. Мы их отрабатываем отдельно.

Когда вы видите, что состояние собаки стабильно, вы можете постепенно повышать сложность и вводить менее привычное подкрепление почаще.

Следите за собой: мы склонны впадать в повторяющиеся паттерны, в то время как собака никогда не должна знать, когда она получит привычное подкрепление (еду, например), а когда другое.

Помните, что условия упражнения здесь для собаки простые: изученные навыки, нет сильных раздражителей. Вы отрабатываете привычку работать за разные подкрепления, а не новый навык или навык в более сложных условиях.

Когда вы отработали упражнение с двумя подкреплениями (например, привычным была еда, а менее привычным - предложение попрыгать с активной похвалой), можете вводить третье менее привычное подкрепление.При этом исходите из условного следующего правила: на каждые 10 подходов к упражнению, у вас 1-3 подхода очень простые для собаки (подкрепление едой), 5-6 подходов средней сложности (например, уже знакомое подкрепление прыжками-интенсивной-похвалой) и еще 1-2 подхода сложных (новое непривычное подкрепление). Если это для собаки сложно, вместо 1-3 подходов за еду, сделайте 3-5 подходов за еду, 3-4 за уже знакомое второе подкрепление и оставьте 1-2 сложных подхода за новое малознакомое подкрепление.

Маркер правильного поведения, который подразумевает вариабельный режим подкрепления и разные типы подкреплений

В рамках марафона не создавайте отдельный новый маркер только для социального подкрепления.

Ваша задача: отделить основной маркер правильного поведения, за которым следует пищевое подкрепление и с помощью которого вы обучаете новому поведению, от второго маркера, который вы используете с вариабельным подкреплением.

Собака будет учиться за него работать, а вы - его использовать.

Постарайтесь начать приучать себя разделять контексты и сознательно использовать разные маркеры в разных условиях: например, кликер при обучении новому навыку, а "молодец" (или другой, к которому привыкли) в работе на закреплении/повторении уже выученного поведения.

И при этом НЕ использовать второй маркер тогда, когда вы знаете, что маркер отравится.

Например, если знаете, что сейчас собака сделала что-то ОЧЕНЬ трудное и рассчитывает получить еду, которой у вас нет; если собака в этой конкретной ситуации рассчитывает на получение подкрепления другого типа и/или ценности, чем то, что у вас есть; если собака рассчитывает на подкрепление в принципе, а у вас ничего нет и просто маркер без подкрепления сейчас разочарует собаку.

Здесь вы действуете также как и с закреплением новой команды: на этапе обучения мы не даем команду тогда, когда собака не сможет ее выполнить (слишком трудно). Также на этапе обучения маркеру, мы не даем маркер тогда, когда он не сработает и только потеряет привлекательность для собаки.

Постепенно это станет возможным, но в - все темпе собаки.

Помните также, что вербальный маркер-похвала и похвала как социальное подкрепление - это разные вещи ;)
Практическое задание 4

Делаете три коротких упражнения в день. В сумме у вас получится 10-15 минут

Сессия 1. Начинаем активнее играть с собакой

Отпускаем внутреннего ребенка порезвиться. Если стесняемся, закрываемся в комнате, выгоняем домочадцев и позволяем себе весело сходить с ума вместе с собакой. Собака оценит. Уверена, вы - тоже. Это отлично снимает стресс, нам всем это нужно ;)

Давайте на этой неделе играть с нашими собаками так, чтобы удивились даже соседи ;)

В этой игре продолжаем заряжать наш трюк.

Хотите - берите игрушку, хотите, играйте в игры, которые любит собака. Не нужно выводить собаку из равновесия - балансируйте моменты, когда просите собаку выполнить команду (трюк) и когда веселитесь. Регулируйте время игры в соотвествии с возбуждением собаки.

Поиграйте, остановите игру, попросите выполнить трюк. Маркируйте и подкрепите кусочком. После кусочка дайте любое другое подкрепление, которое подходит ситуации - продолжайте игру, нахвалите эмоционально или что-то еще.

Попросите собаку время от времени выполнить простую цепочку из знакомых навыков - сидеть/лежать/подзовите с небольшого расстояния, предложите принести игрушку, после чего скомандуйте выполнить трюк, маркируйте, подкрепите едой и снова прервитесь на игру или отпустите собаку получить подкрепление из среды.

Смысл упражнения - делать примерно то же, что и в конце прошедшей неделе марафона, но теперь мы вводим трюк в процесс разнообразного активного взаимодействия, где смешиваются периоды игры (с игрушкой или без - главное, чтобы вам и собаке было весело) и простые короткие цепочки знакомых поведений, которые заканчиваются трюком (чтобы собака привыкала, что он завершает кусочек работы, а также чтобы за трюком следовало, венчая цепочку, безусловное подкрепление высокой ценности (еда) и еще какое-то дополнительное подкрепление (продолжение игры, подкрепление из среды и прочее). Здесь будет работать и принцип Примака, и разнообразие подкреплений, и то, как работают подкрепления в цепочках поведения, и так далее.

Принцип Примака и цепочки поведений мы еще разберем, но ничто не мешает нам использовать их подкрепляющую силу уже сейчас.

Заодно поднимем драйв собаки в процессе веселого и неформального взаимодействия с нами - без высоких требований и сложных задач дадим собаке отличный положительный опыт взаимодействия с нами. Шумим, дурачимся, получаем удовольствие и чувствуем полное отсутствие мук совести за свое детское поведение. В ответ на удивление других людей всю вину сваливаем на меня и марафон, так что вы не при делах. Можете смело отрываться ;)

Сессия 2

Короткая сессия в любом формате и количестве повторений, приемлемом для вашей собаки, где вы отрабатываете новый маркер и следующие за ним разные подкрепления. Лучше еду и социальное подкрепление (или микс из СП), который лучше всего работает по вашим наблюдениям из задания 2 на марафоне.

Берете любые простые навыки, которые собака уже хорошо знает и просто по несколько раз в легком темпе повторяете. Не изучаем с собакой ничего нового. Помните, критерий: вы учитесь пользоваться маркером осознанно, собака учится работать за разные подкрепления и за новый маркер. Для нее на самом деле это уже два критерия, и это сложно.

Длительность сессии 1-5 минут - чтобы собаке не было скучно.

Как выбрать социальное подкрепление, которое будете использовать для домашнего задания.

На основе вашего опыта после Задания 3 (оценка ценности подкреплений) выберите одно или смесь из наиболее хорошо работающих социальных подкреплений. Например, активная многократная похвала и прыжки. Или трюк и активная похвала.

Берите то, что уже работает! Если трюк пока еще не ценный, здесь вы его не включаете.

Если любое социальное подкрепление пока работает слабо, поступайте так. После маркера правильного поведения, выдайте социальное подкрепление, после чего еще раз эмоционально похвалите и дайте еще одно подкрепление, которое в данной ситуации было бы для собаки наиболее ценным - это может быть подкрепление из среды, игра в игрушку, кусочек еды или даже целый джек пот. Получится, что технически вы вроде и социальное подкрепление дали, а вроде бы получилась цепочка поведения, которая подкрепляется другим подкреплением высокой ценности (едой, например).

Сессия 3

Короткая сессия в любом формате и количестве повторений, приемлемом для вашей собаки, где вы отрабатываете новый маркер и вариабельный режим подкреплений. Здесь используете еду или другое подкрепление исключительно высокой ценности, за которое собака привыкла работать и работает долго и охотно на выученных навыках - обычно, это игрушка, если собака хорошо работает за игрушку. Если собаке сложно, оставьте только еду, не берите другие подкрепления. Здесь мы пока не используем социальные подкрепления. Собака пока так не умеет, и мы не смешиваем критерии.

Берете любые простые навыки, которые собака уже хорошо знает и просто по несколько раз в легком темпе повторяете. Не изучаем с собакой ничего нового. Главный критерий - вариабельный режим подкрепления.

Если собаке тяжело отрабатывать на разных поведениях и не надоедает (хоть и знакомых), упростите и берите одно поведение, делайте сессии короткими.

Домашнее задание выполняем до вечера среды

Здесь я попрошу вас прислать короткое видео с записями каждой из трех сессий ПОСЛЕДНЕГО дня (то есть среды).

Общая длительность видео - не больше двух минут.

Дополнительное видео:

От изучения принципов обучения до реальных результатов
От простого к сложному
Запись онлайн встречи