clickertraining.org

Clickertraining


Navigation
News
Grundlagen
Geschichte
Praxis
Streitpunkte
Bücher
Crash-Kurs
Clickerkurs
Links
Über diese Seite
Clicker-Crash-Kurs

Clicker-Crash-Kurs

C&B = Click & Bestärkung   coffpup.gif (1080 Byte)

Zusammenfassung M. Pietralla

Tugend will ermuntert sein, Bosheit kann man von allein W. Busch

bullet

Basis ist die operante Konditionierung in konsequenter Anwendung.

bullet

Hilfsmittel ist ein Knackfrosch (Clicker) als konditionierter Bestärker.

ball

Mittel ist die positive Bestärkung.

 Die verblüffende Gesetzmäßigkeit operanten Verhaltens ist in der Natur gegeben.
Die operante Verhaltensanalyse hat sie uns lediglich verständlich und zugänglich gemacht
. (W.F.Angermeier)

Ein Signal kündigt die Folgen eines Verhaltens an.
Das ist die Kernaussage der operanten Konditionierung.

   Das Kreuz der Umweltantworten:
kreuzv.gif (24021 Byte)

Ein neutraler Reiz vor der Ausführung des Verhaltens erhält Bedeutung, wenn mit dem Verhalten immer eine bestimmte Antwort der Umwelt, die Folgen, verbunden sind.



Die Wissenchaftler haben die Umweltreize, die eine Verhaltensänderung bewirken, in genau vier Kategorien eingeteilt. Die entsprechenden Fachbegriffe und Abkürzungen sind:

R + (positive reinforcement):   

B+ ADDITIVE BESTÄRKUNG

R - (negative reinforcement):   

B- SUBTRAKTIVE BESTÄRKUNG

P+      (positive punishment) :  

S+ ADDITIVE STRAFE

P -   (negative punishment ) :  

S- SUBTRAKTIVE STRAFE

Ich habe die eigentlichen Fachausdrücke durch solche ersetzt, die ich für etwas verständlicher halte. Die + und -Zeichen bedeuten Hinzufügen und Wegnehmen eines Reizes.

Zentral ist die ADDITIVE BESTÄRKUNG wirksam. Sie ist die Grundlage des Lernens am Erfolg. ADDITIV heißt, wir geben dem Hund etwas, ein Leckerle, einen Ball, einmal schnuppern lassen, einmal kraulen, einmal mit einem anderen Hund spielen lassen. Die Situation des Tieres ändert sich von neutral zu angenehm.  

Eine BESTÄRKUNG liegt vor, wenn der Hund das Verhalten, das er gerade zuvor gezeigt hat, bald wiederholt.

Die gleiche Wirkung hat auch eine SUBTRAKTIVE BESTÄRKUNG: Wir nehmen dem Hund etwas fort, was ihm unangenehm ist. Er fühlt sich erleichtert, seine Situation ist angenehmer geworden. Sie hat sich von unangenehm nach neutral verändert.

Wenn wir die subtraktive Bestärkung anwenden wollen, müssen wir dem Hund zunächst etwas zufügen, was ihm unangenehm ist. Bekannt ist der Ohr-Pinch, das Kneifen in das Hundeohr bis der Hund etwas ausgibt bzw. hält.

Wie man sich schnell klar macht, fallen alle Foltermethoden unter diesen Begriff: Gestehst Du, drehe ich die Daumenschraube locker. Das ist kein besonders gutes Verfahren, Vertrauen zu fördern.

Wenn wir dem Hund einen Stachel aus der Pfote entfernen, dann wird das eine Bestärkung für sein vertrauensvolles Akzeptieren unserer Manipulationen. Es ist eine negative Bestärkung, die sich ergeben hat. Dabei wollen wir es belassen.

Da ist die ADDITIVE STRAFE (eigentlich eine Entmutigung, denn Strafe setzt ja die Kenntnis moralischer Normen voraus) ehrlicher. Sie ist eine kurze, heftige und unangenehme Einwirkung auf den Hund. Er wird das, was der Strafe unmittelbar vorausging, zukünftig meiden. Ist das nach wenigen Wiederholungen (2-4) nicht der Fall, ist die Einwirkung für den Hund keine Strafe. Man kann sie sich schenken. Ein Hund, den man ständig an der Leine "korrigieren" muß, empfindet den Leinenruck nicht als Entmutigung sondern allenfalls als Belästigung.

Natürlich gibt es auch eine SUBTRAKTIVE STRAFE: Wir nehmen etwas angenehmes weg, z.B. das Spielzeug, mit dem der Hund gerade spielt (Kindern schaltet man den Fernseher aus.) oder aber wir entfernen uns, entziehen ihm unsere Nähe! Auch das plötzliche Beenden eines Spieles kann so wirken.

Wenn wir den Hund irgendwo anbinden und allein lassen, ist das eine solche Strafe. Gehen wir wieder hin, ist unser Näherkommen eine ADDITIVE BESTÄRKUNG. Und so kann man seinen Hund unbewußt sehr gut dazu erziehen, aus dem Platz aufzustehen, indem man hingeht, um ihn zu "korrigieren".


bullet

Die grüne Schiene: additive Bestärkung B+ und subtraktive Strafe S- fördert und erhält die Motivation und das Vertrauen des Hundes.

bullet

Die rote Schiene: subtraktive Bestärkung B- und additive Strafe S+ sät Mißtrauen und fördert Flucht- und Meideverhalten

Das Gesetz der Auswirkung:

(E. Thorndike 1932 endgültige Fassung des "law of effect")

Die Ergebnisse aller, unter verschiedenen Bedingungen zustande gekommenen Vergleiche besagen ausnahmslos, daß belohnte Verbindung immer beträchtlich verstärkt wird, daß dagegen bei Bestrafung nur geringe oder keine Schwächung eintritt.

Eine ironische dichterische Formulierung gibt G.B. Shaw:

Die Menschen lassen sich lieber durch Lob ruinieren als durch Kritik verbessern.

Zurück zum Hund

bullet

Der Hund muß ein Verhalten ausführen.

bullet

Diesem Verhalten schicken wir ein bestimmtes Signal voraus, das sonst fehlt.

bullet

Dieses Verhalten bewirkt stets eine bestimmte Umweltantwort, die Folgen.

Der Hund muß ein erwünschtes Verhalten richtig ausführen können. Sonst können wir kein Signal "vorausschicken". Die richtige und zuverlässige Ausführung erreichen wir durch Shaping. Mit dem Clicker führen wir den Hund in die gewünschte Richtung.

Das Signal verknüpfen wir erst dann, wenn der Hund das Verhalten von sich aus sicher ausführt und wir es vorhersagen können.

Die Umweltantwort bestimmen wir durch Bestärken oder Ignorieren. Dies geschieht bereits während der Shaping-Phase.

Ein Bestärker veranlaßt ein Tier dazu, ein Verhalten zu wiederholen. Er gehört zum momentanen Motivationsbereich des Tieres.

Jetzt verstehen wir den Unterschied Bestärken - Belohnen.

Wenn wir belohnen, möchten wir, daß der Hund sich bestärkt fühlt. Liegt unsere Gabe nicht im Motivations (Appetenz)-Bereich, ist sie kein Bestärker. Der Hund ignoriert sie. Das kommt vor allem in Streß-Situationen vor.

Bestärkend wirken Handlungen, nicht Zustände. Das ist die Aussage des Premack-Prinzips. Trinken bei Durst bestärkt die Handlung zuvor, nicht das Gefühl keinen Durst zu verspüren. Der erste Schluck ist der schönste, nicht der letzte.

Daher kann man gut Handlungen (Spielen, Schnüffeln, Sozialkontakt) als Bestärker verwenden, wenn die Motivation gegeben ist. Futter ist deswegen ein so universeller Bestärker, weil jedes Lebewesen regelmäßig Hunger verspürt.

Der Bestärker

kann additiv (positiv) sein, wenn dem Hund etwas Gutes widerfährt.

kann subtraktiv (negativ) sein, wenn der Hund von Unangenehmem befreit wird.

Schon die erkennbare Gegenwart eines Bestärkers veranlaßt den Hund zu Aktivität.
Das Verhalten rufen wir hervor, indem wir zunächst kleinste Ansätze bestärken.

Um genau und eindeutig genug zu sein, benutzen wir einen sekundären Bestärker, den Clicker.

Ein sekundärer (konditionierter) Bestärker kündigt einen primäre Bestärker (Futter, ....) an.

Die zeitliche Reihenfolge Reiz -> Futter läßt den Reiz zu einem sekundären Bestärker werden.

Der Clicker wird durch Paarung mit Futter oder auch Spiel zu einem sekundären Bestärker. Das geht sehr schnell. 2 - 5 gepaarte Ereignisse genügen.

Click+Futter, Click+Futter, ....... Click+Futter,.............Click+Futter  jetzt hat er es!

Vorteil des Clickers:

 
bullet

Bestärkung mit optimalem Timing möglich

bullet

Brücke in Raum und Zeit

bullet

Unverwechselbar im Geräusch

bullet

Übertragbar auf Helfer

clicker.gif (1812 Byte)

 

Das ist die Stelle, wo endlos diskutiert wird, weil man "überzeugt werden" will. Wer es einmal gesehen oder probiert hat, verliert darüber kein Wort mehr.

Aber: Der Clicker bleibt - bis auf Ausnahmen - mit einem primären Bestärker gepaart. Dieser wird baldmöglichst dem Hund gegeben.

Der erste Schritt umfaßt das

Shaping, das Formen eines Verhaltens - die eigentliche Domäne des Clickers.

 

bullet

Wir rufen zunächst ein Ansatzverhalten hervor. Dazu können wir alle Tricks verwenden.

bullet

Die Kunst besteht darin, das gewünschte Verhalten in Form von kleinen Veränderungen (Erweiterungen, Verlängerungen, Umformungen) in die Richtung des gewünschen Verhaltens zu lenken.

bullet

Das Formen ist ein Rückkopplungsprozess (feed back) zwischen Hund und Mensch.

bullet

Wir reden nicht. Der Hund redet auch nicht.

bullet

Wir teilen dem Hund mit dem Clicker mit, ob er auf dem richtigen Weg ist. Da gibt es keine Mißverständnisse und Unklarheiten.

Oberste Regel

Nach dem Click folgt die Belohnung - Leckerle, Spiel mit Mensch oder Hund, Schnuffeln, wo es interessant ist.

Ausnahmen gibt es nur für Fortgeschrittene, die verstanden haben, was "Premack" bedeutet.

Futter oder Spielzeug sind nicht sichtbar.

Unsere Hände können alles mögliche tun, nur eines nicht, sie halten kein Futter oder Spielzeug in der Hand. Sie suchen auch nicht danach. Erst, nachdem es click gemacht hat, werden sie aktiv.

Wie wollen, daß der Hund sich auf seine Handlungen konzentriert, nicht auf unsere Hände und ihren Futterinhalt.

Wir konzentríeren uns auf unser Ziel, das wir vorher gefaßt haben.

Dieses schrittweise Hinführen zum Ziel nennt man Shaping.

Der Hund hört immer dann das erfreuliche Click, wenn er etwa von selbst tut, was mehr in die Richtung kommt, die wir uns wünschen. Es ist das Prinzip der Annäherung in kleinen Schritten. Im Zerlegen einer Handlung in viele kleine Fort-Schritte, die bestärkt werden, zeigt sich die Kunst des Shapens.

Wir achten auf Verbesserungen. Sie bilden den Kern des Shaping.

Haben wir die Fertigkeit erreicht, die wir uns vorstellen, dann dünnen wir den Click und die Belohnung aus. Das sollte langsam gehen. Es ist der notwendige Übergang zu variabler Bestärkung.

Beim Belohnungsabbau führen wir am besten Buch. Es besteht sonst die Gefahr, auf einer bestimmten Stufe hängen zu bleiben. Die Buchführung dient der Selbstkontrolle.

Nicht das Ergebnis wird bestärkt, sondern die richtigen Handlungsschritte auf dem Wege dahin. Sie werden während der Ausführung bestärkt, nicht nach Beendigung der Ausführung..

Der primäre Bestärker muß der Appetenz des Hundes, seinen momentanen Motivationen entsprechen.

Das formbare Verhalten beschränkt sich nicht auf Sitz-Platz-Fuss. Auch Sozialverhalten ist gut beeinflußbar.

 . 

Fehler zeigen keine negativen Folgen. Sie lassen sich leicht löschen.

Die emotionale Situation ist für Hund und Halter durchgehend positiv.

Das Training fordert Konzentration ist dafür frei von sozialem Streß.

Der Lernerfolg ist weitgehend unabhängig vom Alter.

Als Rückwirkung wird der Hundehalter zu ruhigem überlegtem Verhalten geführt.

bullet

Das Signal FALSCH kennzeichnet nicht bestärktes Verhalten, wenn weiterhin Aussicht auf Belohnung besteht, die Aktivität erhalten werden soll.

bullet

Dieses Signal erfolgt in neutralem informativen Ton im Gegensatz zum NEIN, das Aktivität stoppen soll.

Es wird entweder formal gelernt oder nebenher konsequent (Bestärkungspause einhalten) etabliert.

Fehlverhalten wird zumeist ignoriert. Ignorieren heißt kein Click, kein Leckerle, keine weitere Reaktion.

Selbstbelohnungen müssen jedoch verhindert werden.

Eine Auszeit kennzeichnet und bestraft unbotmäßiges Verhalten

Als aversiver Reiz ist lediglich ein NEIN erforderlich (konditionierte Strafe).

Er genügt, um den Hund vor ein Wahlverhalten zu stellen, dessen positiver Ausgang durch Sicherheit immer bestärkt wird.

Worauf es ankommt ...

nochmals 

 

bullet

Nicht der Hund wird belohnt, sondern sein Verhalten bestärkt.

bullet Wir sind keine Hunde - Hunde keine Menschen.
bullet Wir beobachten das Verhalten - wir interpretieren nicht.
bullet Soll der Hund sein bisheriges Verhalten ändern, müssen wir zunächst das unsrige ändern.
bullet Hände weg vom Hund! Berührungen lenken ab. Sie sind zuweilen aversive Reize. Der Hund mag nicht berührt werden außer bei Begrüßungen.
bullet Wir zeigen Begeisterung, aber halten den Mund.
bullet Wir beginnen mit Neuem unter optimalen Umständen. (s.Wann der Hund nicht lernen kann.)
bullet Wir müssen uns ganz klar darüber sein, was wir bestärken wollen.
bullet Nur das - und nichts anderes haben wir im Blick unserer Argusaugen.
bullet Durch Bestärkung im richtigen Moment kennzeichnen wir richtiges Ansatz-Verhalten.
bullet Das exakte Timing ist der Knackpunkt!
bullet Der Clicker ist für das Timing zuständig - Die Qualität (Geruch, nicht Menge) des Futters oder die Art des Spiels entscheiden über die Stärke der Belohnung.
bullet Mit Shaping bei Immerbestärkung formen wir das Verhalten in die gewünschte Richtung.
bullet Große Fortschritte können mit Jackpot bestärkt werden.
bullet Ob Jackpot oder nicht - allein die Häufigkeit einer Bestärkung entscheidet über das zuverlässige Auftreten des Verhaltens.
bullet Variable Bestärkung schützt vor Löschung des Verhaltens.

Alles, was ablenkt, kann auch Belohnung werden (Gerüche, Spielpartner ).

Ist das Verhalten bei gelegentlicher Bestärkung gefestigt, konditionieren wir das Signal.

        Wir signalisieren, wenn wir wetten würden, daß der Hund sowieso gleich das richtige Verhalten zeigt.

Ab sofort wird spontanes Auftreten des Verhaltens nicht mehr belohnt.

Wir achten darauf, daß keine unerwünschten Signale verknüpft werden.

Kontrolle des eigenen Verhaltens: Wir vermeiden Überschatten und Blocken

Wir generalisieren/differenzieren die Ausführung des Verhaltens. Unter jeden neuen Umständen gehen wir soweit zurück in den Kindergarten wie nötig.

Wir mischen Signale. Geläufigkeit unter allen Umständen ist das Ziel.

Verkettung:

Wir üben zusammengesetzte Handlungen von hinten nach vorn: Alles was kommt, kann der Hund schon. Das bestärkt. (Premack-Prinzip)

Auch ein Hund braucht Entspannung und Konzentrationspausen.

Wir hören mit viel Lob auf, solange alles gut läuft.

Vor allem, wir haben Geduld und lassen uns Zeit.

Geduld, vor allem am Anfang, zahlt sich auf dem langen Weg doppelt und dreifach aus.

 

Die Grundschritte zusammengefaßt:

Ausbildung eines Verhaltens und Ausführung auf Kommando.

Das Vorgehen ist nahezu schematisch immer gleich. Die Details beliebig variabel:

Herbeiführen eines Ansatzverhaltens bei Immerbestärkung
Umformen -Shaping -des Ansatzverhaltens bis hin zur erwünschten Verhaltensausführung.
Übergang auf variable Bestärkung.
Festigung des Verhaltens: Erweitern der Topographie.
Einführen eines auslösenden Signals.
Erweitern der Topographie eines Signals.
Geläufigkeit: Mischen mit anderen Signalen.

 

Fehlersuche

Clicker-Fehler Abhilfe
Mißbrauch des Clickers (Aufmerksamkeit erregen) Click heißt "das machst du fein!" Wollten Sie das wirklich sagen?
unkontrolliertes Clicken "Warum habe ich eben geklickt?"
zu spätes Click - schlechtes Timing Kontrolle durch Helfer oder Video
zu große Lernschritte (zu selten) Daumenkino, Salamidenken
zwei oder mehr verschiedene Kriterien "Warum habe ich eben geklickt?" kein "und" !
Mangelnder Übergang zu variabler Bestärkung Vorgeben und Zählen
Zu schneller Übergang zu variabler Bestärkung ("Verlieren" des Verhaltens) Zurück in den Kindergarten. Bestärkungsplan & Zählen
Aushungern des Clickers Regelmäßig Futter / Spiel folgen lassen
Mischen von Clicker und Korrekturmethoden Entscheiden & Selbstdisziplin

 

Konditionierungs-Fehler Abhilfe
unbewußtes Belohnen - andere Bestärker Keine Worte, keine Gesten Selbstkontrolle, nichts ohne Gegenleistung
Zu frühe Signalverknüpfung Testen - was kann der Hund wirklich? Ziel definieren und daraufhin arbeiten.
Überschatten / Blockieren Selbstkontrolle: Was soll Signal sein? Helfer / Video-Kontrolle
ungewollte Signalverknüpfung Selbstkontrolle: Worte, Gesten,

Umstände. Variabilität, Umgebung

Aufstecken im Lernloch Ausdauer, Ruhe, Pause + weiter
mangelnde Verallgemeinerung Umstände + Umgebung variieren

Sie haben den Crash hinter sich. Es tat gar nicht weh!
Das Umsetzen in die Praxis erfordert aber Übung, Selbstbeherrschung und Ideenreichtum.

 


 


 



 





impressum Besucher: © copyright 2005 clickertraining.org