¿Cuáles son los horarios de refuerzo diferencial en el entrenamiento del perro?

¿Qué son exactamente los horarios de refuerzo diferencial? Como mencioné en mi artículo sobre los cuatro cuadrantes del entrenamiento del perro, el refuerzo positivo es lo que, en mi opinión, funciona mejor cuando se trata del entrenamiento del perro. En ese artículo, vimos un video de cómo el refuerzo positivo infunde entusiasmo en el perro en comparación con el refuerzo negativo. Hoy, me gustaría abordar la variedad de tipos de refuerzo a su disposición para entrenar a su perro.

La belleza de estos métodos de entrenamiento es que el refuerzo impulsa el comportamiento, y usted, como entrenador, hace que todas estas grandes cosas sucedan para su perro. Es inevitable que el vínculo entre el dueño y el perro se fortalezca mientras trabajan juntos como un equipo. Cuando comienzo las clases, muchas veces el perro y el dueño son solo dos entidades separadas que llevan sus propias vidas, en realidad no sucede mucho allí. Al final de la clase, la mayor satisfacción es ver el comienzo de un bono.

Es este vínculo lo que hace que el entrenamiento a través del refuerzo positivo valga la pena, y lo que realmente me hace sentir que he hecho un buen trabajo ayudando a los perros y a sus dueños. Los siguientes son diferentes tipos de programas de refuerzo diferencial que puede usar al entrenar a su perro.

4 tipos de refuerzo diferencial

En los horarios de refuerzo diferencial, a menudo llevas la capacitación al siguiente nivel. Es posible que haya enseñado a su perro a sentarse usando refuerzo positivo, pero el entrenamiento no se detiene allí. Inicialmente, para ayudar a su perro, es posible que le haya dado un regalo cada vez que se sentaba. Ahora que su perro comienza a comprender por completo lo que quiere, puede pasar a darle golosinas de vez en cuando, y esto es cuando comienza a ser exigente. Necesita probar el comportamiento y hacerlo más confiable.

Cuando está utilizando estos métodos, básicamente está eligiendo qué comportamientos reforzar y cuáles no. Esto significa que proporcionará un refuerzo positivo para los comportamientos que le gustan (le da un premio para que el comportamiento se repita) y proporcionará un castigo negativo por los comportamientos que no le gustan (no le da el trato, por lo que el el comportamiento termina).

Esto se ajusta al nuevo término de Skinner en la Ley de Efecto de Thorndike que establece que: "El comportamiento reforzado tiende a repetirse (es decir, fortalecerse); el comportamiento no reforzado tiende a extinguirse (o debilitarse)". Echemos un vistazo a estos horarios de refuerzo diferencial.

1. Refuerzo diferencial de comportamientos incompatibles (DRI)

Este método de entrenamiento es útil en la modificación del comportamiento del perro sin fuerza. Lo uso mucho cuando trato con casos de agresión. Básicamente, en este programa, reforzará solo los comportamientos que sean incompatibles con el comportamiento no deseado. Lo que esto significa es que un perro que salta no puede saltar si está sentado bien con las cuatro patas en el piso. En el caso de un perro que muerde, el perro no puede morder si se le pide que lleve un juguete en la boca. En un comportamiento agresivo, un perro no puede embestir si se le pide que se lance bien y se le recompensa generosamente por eso.

En este cronograma, por lo tanto, encontraremos un comportamiento incompatible, lo entrenaremos sistemáticamente en un entorno controlado y lo recompensaremos generosamente, para que el perro se sienta más obligado a realizar el comportamiento incompatible y tome buenas decisiones.

2. Refuerzo diferencial de comportamientos alternativos (DRA)

A veces, no es tan fácil encontrar un comportamiento incompatible; en este caso, un comportamiento alternativo servirá. En este caso, reforzará el comportamiento alternativo deseado e ignorará el no deseado. Esto debería dar como resultado la teoría de Skinner en la que "el comportamiento reforzado tiende a repetirse (es decir, fortalecerse); el comportamiento no reforzado tiende a desaparecer o extinguirse".

Por supuesto, es mejor minimizar las posibilidades de que el perro ensaye el comportamiento no deseado. Por lo tanto, es mejor trabajar con el perro por debajo del umbral. El comportamiento alternativo en este caso le da al perro algo en lo que concentrarse para que, con suerte, no participe en el comportamiento no deseado.

3. Refuerzo diferencial de otros comportamientos (DRO)

En este caso, cualquier otro comportamiento que no sea el comportamiento no deseado se refuerza. En otras palabras, no tienes en mente un comportamiento objetivo específico, como cuando estás dando forma libre en el entrenamiento de clicker. Digamos que tu perro salta, recompensarías cualquier otro comportamiento que no sea el de saltar. ¡Esto te deja con una gran variedad! Considero que esta técnica es útil para los casos en que el perro necesita ese estímulo adicional para comenzar. Es útil para perros de crianza o perros que no tienen un historial de entrenamiento y el entrenamiento es muy nuevo para ellos.

4. Refuerzo diferencial de comportamiento excelente (DRE)

Aquí es donde comienzas a ser exigente cuando estás entrenando. Básicamente, una vez que tu perro aprende bien un nuevo comando, comienzas a reforzar solo esos excelentes comportamientos que más te impresionan. Por ejemplo, supongamos que su perro sabe bien cómo sentarse, pero lo hace muy lentamente, en este caso, comenzará a reforzar solo las sentadas que son un poco más rápidas que otras. Esto lleva su entrenamiento a un nivel completamente nuevo y es un gran método si está en el entrenamiento de precisión requerido para competir en obediencia.

Un ejemplo de DRI (Kaiser y Petra no pueden salir corriendo si se sientan y se quedan)

Referencias

  • McLeod, SA (2007). BF Skinner. Condicionamiento operante. Recuperado de http://www.simplypsychology.org/operant-conditioning.html
  • El libro de trabajo de agresión canina; James O'Heare Dip.CB
Etiquetas:  Solicitar Fauna silvestre Peces y acuarios