Verstärkung (Psychologie)


Verstärkung ist ein Begriff aus der Verhaltensbiologie und der Psychologie, speziell aus dem Behaviorismus. Die Verstärkung beschreibt ein Ereignis, welches die Wahrscheinlichkeit erhöht, dass ein bestimmtes Verhalten gezeigt wird. Unterschieden wird zwischen „positiver“ und „negativer“ Verstärkung. Beide bewirken, dass ein Verhalten häufiger gezeigt wird, mit dem Unterschied, dass bei dem positiven Verstärker - auch Belohnung genannt - ein angenehmer Reiz auf ein gewünschtes Verhalten zugefügt wird (z. B. Schokolade, Zuwendung, Geld, etc.) und bei dem negativen Verstärker ein unangenehmer Reiz entfernt wird (z. B. Die Entfernung von Angst, Lärm, einer unangenehmen Tätigkeit, etc.). Ein negativer Verstärker darf also nicht (wie es oft passiert) mit einer Bestrafung verwechselt werden. Als Bestrafung bezeichnet man ein Ereignis, bei dem die Auftretenswahrscheinlichkeit eines Verhaltens gesenkt wird. Unterschieden wird dabei zwischen Bestrafungstyp I, der Zufügung eines unangenehmen, also aversiven Reizes (z. B. Schläge, Beschimpfungen, Hausarrest, etc.) und dem Bestrafungstyp II, der Entfernung eines angenehmen Reizes bzw. Entzug eines Privilegs (z. B. Fernsehverbot, Wegnehmen eines Spielzeugs, Ignorieren, etc.), auch Deprivation genannt.

Der Fachbegriff für diese Formen des Lernens, bei denen der Organismus durch Reaktionen der Umwelt auf sein Verhalten lernt, lautet instrumentelle oder operante Konditionierung. Die Konsequenzen eines Verhaltens wirken also auf das Verhalten zurück. Nach Skinner ist allein das zeitliche Aufeinanderfolgen entscheidend (“conditioning takes place presumably because of the temporary relation only”, S. 168[1]). Die Verhaltensanalyse definiert Verstärkung und Verstärker rein formal, über den Effekt auf die Rate des Verhaltens. Bezüglich der Theorien, warum ein Verstärker als Verstärker wirkt, siehe den Artikel Verstärker (Psychologie).

Positive Verstärkung

Man spricht von positiver Verstärkung, wenn auf ein Verhalten ein Ereignis in der Umwelt des Organismus folgt und die Auftretenswahrscheinlichkeit dieses Verhaltens daraufhin ansteigt. Das Ereignis in der Umwelt des Organismus wird als positiver Verstärker bezeichnet. Was ein positiver Verstärker ist, kann nur an den Folgen, die er für die Auftretenswahrscheinlichkeit des Verhaltens hat, erkannt werden. Positive Verstärker sind somit nur formal definiert, nicht inhaltlich. Man kann strenggenommen nicht im Voraus sagen, ob ein bestimmtes Ereignis ein positiver Verstärker, ein negativer Verstärker oder irrelevant ist. Dennoch kann man begründete Vorannahmen machen: Ob ein Ereignis (z. B. eine Futtergabe) ein positiver Verstärker ist, hängt u. a. davon ab, ob der Organismus davon depriviert ist, d. h. das Ereignis (z. B. der Futtergabe) längere Zeit nicht mehr eingetreten ist. Verstärker können primär (artspezifisch angeboren, z. B. Nahrung, angemessene Temperatur, Gelegenheit zu sexueller Aktivität) oder sekundär sein (konditioniert bzw. erlernt; bei Menschen z. B. Erfolg, Geld). Als umgangssprachliches Äquivalent zu „positiver Verstärker“ wird oft „Belohnung“ oder „angenehme Konsequenz“ verwendet. Dies widerspricht jedoch der rein formalen Definition von „positiver Verstärker“ nach Skinner, da diese Begriffe Mutmaßungen über vermeintliche mentale Zustände des Organismus enthalten.

  • Beispiel: Eine 24 Stunden ohne Futter gehaltene Ratte sitzt in einem Käfig mit einheitlich glatten Wänden, in dem sich als einziges abweichend gestaltetes Objekt ein kleiner beweglicher Hebel befindet und in dessen Nähe ein Ausgabeschacht für Futter angebracht ist. Wenn die Ratte diesen Hebel drückt, fallen automatisch einige Futterkörner in den Ausgabeschacht: Das Verhalten (= zufälliges Hebeldrücken) der hungrigen Ratte hat also (in Form der Futterausgabe) eine (für die Ratte) positive Konsequenz. Dies hat mittelfristig zur Folge, dass die Ratte sich häufiger als zuvor in der Nähe des Ausgabeschachts aufhalten wird und sich so auch die Wahrscheinlichkeit erhöht, dass die Ratte erneut den Hebel drückt. Nach zwei oder drei Dutzend Hebeldrücken hat der Beobachter den Eindruck, dass die Ratte gezielt den Hebel drückt, um Futter zu bekommen. – Das Verhalten des Hebeldrückens wurde verstärkt, oder umgangssprachlich formuliert: Die Ratte hat „gelernt“, wie sie sich Futter beschaffen kann. Der Verstärker war dabei das Ereignis der Futtergabe.

Diese kontingente Verstärkung wird auch als Dreifachkontingenz bezeichnet, da wie folgt gelernt wird: Bei Vorhandensein von Stimulus A folgt auf Reaktion B der Verstärker C. Die Organismen lernen somit, dass bei Vorliegen des Reizes A, nicht aber eines anderen Reizes, ihre Reaktion (ihr Verhalten) mit großer Wahrscheinlichkeit eine bestimmte – angenehme – Konsequenz seitens der Umwelt haben wird.

Negative Verstärkung

Von negativer Verstärkung wird gesprochen, wenn ein unangenehmer Reiz entfernt wird. Die negative Verstärkung führt – wie die positive Verstärkung – zu einer Erhöhung der Auftretenswahrscheinlichkeit von Verhalten. (In vielen Fällen ist sie sogar noch wirkungsvoller als positive Verstärkung.) Eine Verstärkung kann auch darin bestehen, dass ein (z. B. angstauslösendes) Ereignis in der Umwelt des Organismus vermieden wird und die Rate des Verhaltens daraufhin ansteigt.

Achtung: Negative Verstärkung darf nicht mit Bestrafung verwechselt werden, die die Auftretenshäufigkeit von Verhalten reduzieren (!) soll! Die Negative Verstärkung wird nicht deshalb als „negativ“ bezeichnet, weil etwas „Negatives“ (z. B. ein Stromstoß oder die Anwesenheit eines angstauslösenden Objekts) beendet wurde. Vielmehr leitet sich der Begriff von der gewissermaßen inversen Anwendung (etwas wird weggenommen) der Verstärkungsprozedur her.

  • Beispiel: Eine Ratte sitzt im Käfig, der Eisenboden steht unter Strom. Die Ratte zeigt nun verschiedene Verhaltensweisen, u. a. drückt sie den Hebel. Als Konsequenz auf das Verhalten „Hebel drücken“, wird der Strom abgeschaltet. Wird in späteren Durchgängen wieder der Boden unter Strom gesetzt, drückt die Ratte den Hebel früher als zuvor (und beendet damit den Stromstoß). Schließlich drückt die Ratte den Hebel noch bevor Strom fließt, der aversive Reiz (der Stromstoß) wird somit vermieden.

Aus verhaltenstherapeutischer Sicht kann auch die Aufrechterhaltung von Phobien als ein Fall von negativer Verstärkung angesehen werden. Ein Hundephobiker wechselt z. B. die Straßenseite, wenn ihm ein Hund entgegenkommt. Durch das Wechseln der Straßenseite beendet oder vermeidet er den angstauslösenden Kontakt mit dem Hund. Das phobische Verhalten „Wechseln der Straßenseite“ wird dadurch jedoch verstärkt, d. h. hier: aufrechterhalten.

Bestrafung

Direkte Bestrafung - Strafe Typ I liegt vor, wenn das operante Verhalten ein Ereignis herbeiführt, das zur Abnahme der Verhaltensrate in dieser Situation führt. Als Bestrafung (im verhaltenswissenschaftlichen Sinn) kann beispielsweise der Stromschlag bezeichnet werden, den ein Weidetier erhält, wenn es den Draht des elektrischen Weidezauns berührt (sofern das Tier das Verhalten „Berühren des Weidezauns“ in Zukunft seltener zeigt; man spricht dann von einer „Bestrafung“, wenn aufgrund einer Verhaltenskonsequenz die Rate dieses Verhaltens sinkt). Ein anderes Beispiel für Bestrafung ist das laute „Pfui!“, wenn ein Hund etwas Unerlaubtes tut (sofern das Pfui ein konditionierter Strafreiz für den Hund ist).

Indirekte Bestrafung - Strafe Typ II liegt vor, wenn aufgrund des operanten Verhaltens ein zuvor vorliegendes Ereignis beendet wird und damit die Verhaltensrate abnimmt. In der "Skinner-Box" bekommt die Ratte auf Hebeldruck kein Futter mehr, wie noch zuvor. Die Ratte wird langsam aufhören den Hebel zu drücken. Oder Eltern verbieten ihrem Kind fernzusehen (sofern das Fernsehen für das Kind einen angenehmen Reiz darstellt), wenn es sich nicht an bestimmte Familienregeln gehalten hat.

Das Kontingenzschema

Holland und Skinner[2] veranschaulichen die genannten Begriffe im sogenannten Kontingenzschema:

Darbietung Beseitigung
positiver Verstärker positive Verstärkung Bestrafung (Typ II)
negativer Verstärker Bestrafung (Typ I) negative Verstärkung

Umgangssprachlich könnte man diese Begriffe so umschreiben:

  • Positive Verstärkung heißt: Man tut etwas häufiger, weil man etwas Angenehmes dafür bekommt (Bsp: Ein Schüler meldet sich und wird gelobt; er meldet sich in Zukunft häufiger).
  • Negative Verstärkung heißt: Man tut etwas häufiger, weil etwas Unangenehmes dadurch beendet oder vermieden wird (Bsp: Ein Schüler macht seine Hausaufgaben vollständig und ein zuvor bestehendes Fernsehverbot wird aufgehoben; er macht seine Hausaufgaben in Zukunft häufiger vollständig).
  • Bestrafung (Typ I, auch „direkte Bestrafung“) heißt: Man tut etwas seltener oder gar nicht mehr, weil einem dann etwas Unangenehmes widerfahren würde und bereits einmal widerfahren ist (Beispiel: Ein Kind lügt, wird dafür geschimpft und lügt in Zukunft seltener; oder: ein Kind berührt eine heiße Herdplatte und verbrennt sich die Finger, das Kind berührt in Zukunft die heiße Herdplatte nicht mehr).
  • Bestrafung durch Verlust (Typ II, auch „indirekte Bestrafung“) heißt: Man tut etwas seltener, weil man ansonsten etwas Angenehmes verlieren würde (Bsp: Ein Kind lügt und bekommt dafür Taschengeldentzug und lügt in Folge seltener).

Verhaltenswissenschaftliche und laienpsychologische Terminologie

Die genannten umgangssprachlichen Umschreibungen dienen lediglich der Verdeutlichung und vereinfachen die Dinge notwendigerweise. Sie ersetzen nicht die korrekten Definitionen (siehe oben) und können auch nicht synonym zu diesen verwendet werden[3][4].

Das (umgangssprachliche) „Belohnen“ führt nicht immer zu einem Anstieg der Rate eines Verhaltens. Nicht jede (als solche gemeinte) Belohnung ist also ein Verstärker. Zudem wird eine Person belohnt, verstärkt werden kann nur ein Verhalten[5]. Ebenso verhält es sich mit dem (umgangssprachlichen) Bestrafen: Nicht jede als solche gemeinte Bestrafung hat den Effekt, dass die Rate des Verhaltens sinkt. Zudem sind (umgangssprachliches) Belohnen und Bestrafen immer aktive Handlungen einer Person an einer anderen: die Mutter belohnt das Kind mit einer Tafel Schokolade, der Lehrer bestraft den Schüler mit einer Strafarbeit. Verstärkung findet aber auch in der Natur, ohne das Zutun eines Menschen statt. Das Umdrehen des Zündschlüssels durch den Autofahrer wird durch das Anspringen des Motors positiv verstärkt: Niemand muss neben dem Autofahrer sitzen und ihn dafür loben o. Ä. Dass dies ein Fall von positiver Verstärkung ist, kann man erkennen, wenn der gewohnte Verstärker „Motor springt an“ ausbleibt: Der Autofahrer wird nun das Verhalten „Zündschlüsselumdrehen“ nicht mehr zeigen, das Verhalten wird extingiert (nicht ohne dass zuvor der übliche Extinktionsausbruch gezeigt wurde, d. h. der Autofahrer versucht es zunächst noch eine Weile wiederholt, ehe er den Versuch, das Auto zu starten, aufgibt).

Quellen

  1. B. F. Skinner: Superstition in the pigeon. In: Journal of Experimental Psychology. Princeton NJ 38.1948, S. 168–172 ISSN 0022-1015
  2. J. G. Holland, B. F. Skinner: Analyse des Verhaltens. Urban & Schwarzenberg, München 1974, S. 218.
  3. A. Charles Catania: Learning. Interim (4th) Edition. Sloan Publishing, Cornwall-on-Hudson, NY 2007, ISBN 1-59738-007-5.
  4. Paul Chance: Learning and Behavior. Brooks / Cole Publishing Company, Pacific Grove 1999, ISBN 0-534-34691-X.
  5. "People are rewarded, but behavior is reinforced", B. F. Skinner: What is wrong with daily life in the western world? In: American Psychologist. Washington DC 41.1986, H.5, S.568-574 ISSN 0003-066X(S. 569).