Was ist operante Konditionierung? Definition und Beispiele

Kaninchen, das Karotte auf einem Stock betrachtet

Mikrozoa / Getty Images.





Operante Konditionierung tritt auf, wenn eine Assoziation zwischen einem bestimmten Verhalten und einer Konsequenz für dieses Verhalten hergestellt wird. Diese Assoziation basiert auf der Verwendung von Verstärkung und/oder Bestrafung, um Verhalten zu fördern oder zu entmutigen. Die operante Konditionierung wurde erstmals vom Verhaltenspsychologen B. F. Skinner definiert und untersucht, der mehrere bekannte Experimente zur operanten Konditionierung mit Versuchstieren durchführte.

SCHLUSSELERKENNTNISSE: Operante Konditionierung

  • Operante Konditionierung ist der Prozess des Lernens durch Verstärkung und Bestrafung.
  • Bei der operanten Konditionierung werden Verhaltensweisen basierend auf den Folgen dieses Verhaltens verstärkt oder geschwächt.
  • Die operante Konditionierung wurde vom Verhaltenspsychologen B. F. Skinner definiert und untersucht.

Ursprünge

B. F. Skinner war ein Behaviorist , was bedeutet, dass er glaubte, dass die Psychologie auf das Studium beobachtbarer Verhaltensweisen beschränkt sein sollte. Während sich andere Behavioristen wie John B. Watson auf die klassische Konditionierung konzentrierten, interessierte sich Skinner mehr für das Lernen, das durch operante Konditionierung geschah.



Er beobachtete das in klassische Konditionierungsreaktionen werden in der Regel durch angeborene Reflexe ausgelöst, die automatisch ablaufen. Er nannte diese Art von Verhalten Befragter . Er zeichnete sich aus antwortendes Verhalten von operantem Verhalten . Operantes Verhalten war der Begriff, den Skinner verwendete, um ein Verhalten zu beschreiben, das durch die darauf folgenden Konsequenzen verstärkt wird. Diese Konsequenzen spielen eine wichtige Rolle dabei, ob ein Verhalten erneut ausgeführt wird oder nicht.

Skinners Ideen basierten darauf Das Wirkungsgesetz von Edward Thorndike besagt, dass Verhalten, das positive Folgen hervorruft, wahrscheinlich wiederholt wird, während Verhalten, das negative Folgen hervorruft, wahrscheinlich nicht wiederholt wird. Skinner führte das Konzept der Verstärkung in Thorndikes Ideen ein und präzisierte, dass verstärktes Verhalten wahrscheinlich wiederholt (oder verstärkt) wird.



Um die operante Konditionierung zu untersuchen, Skinner führte Experimente mit einer Skinner Box durch, eine kleine Kiste mit einem Hebel an einem Ende, der beim Drücken Nahrung oder Wasser lieferte. Ein Tier, wie eine Taube oder Ratte, wurde in die Box gesetzt, wo es sich frei bewegen konnte. Schließlich würde das Tier den Hebel drücken und belohnt werden. Skinner stellte fest, dass dieser Vorgang dazu führte, dass das Tier den Hebel häufiger drückte. Skinner würde das Lernen messen, indem er die Rate der Reaktionen des Tieres verfolgte, wenn diese Reaktionen verstärkt wurden.

Verstärkung und Bestrafung

Durch seine Experimente identifizierte Skinner die verschiedenen Arten von Verstärkung und Bestrafung, die Verhalten fördern oder entmutigen.

Verstärkung

Verstärkung, die einem Verhalten genau folgt, wird dieses Verhalten fördern und verstärken. Es gibt zwei Arten der Verstärkung:

    Positive Verstärkungtritt auf, wenn ein Verhalten zu einem günstigen Ergebnis führt, z. ein Hund, der ein Leckerli erhält, nachdem er einem Befehl gehorcht hat, oder ein Schüler, der ein Kompliment vom Lehrer erhält, nachdem er sich im Unterricht gut benommen hat. Diese Techniken erhöhen die Wahrscheinlichkeit, dass die Person das gewünschte Verhalten wiederholt, um die Belohnung erneut zu erhalten.Negative Verstärkungtritt auf, wenn ein Verhalten zur Beseitigung einer ungünstigen Erfahrung führt, z. ein Experimentator, der aufhört, einem Affen Elektroschocks zu geben, wenn der Affe einen bestimmten Hebel drückt. In diesem Fall wird das Hebeldrückverhalten verstärkt, weil der Affe die ungünstigen Elektroschocks wieder entfernen möchte.

Darüber hinaus identifizierte Skinner zwei verschiedene Arten von Verstärkern.



    Primäre Verstärkernatürlich verstärken Verhalten, weil sie von Natur aus wünschenswert sind, z. Lebensmittel.Konditionierte VerstärkerVerhalten verstärken, nicht weil es von Natur aus wünschenswert ist, sondern weil wir es tun lernen sie mit primären Verstärkern zu assoziieren. Zum Beispiel ist Papiergeld nicht von Natur aus wünschenswert, aber es kann verwendet werden, um von Natur aus wünschenswerte Güter wie Nahrung und Unterkunft zu erwerben.

Bestrafung

Bestrafung ist das Gegenteil von Verstärkung. Wenn eine Bestrafung auf ein Verhalten folgt, entmutigt und schwächt sie dieses Verhalten. Es gibt zwei Arten von Bestrafung.

    Positive Bestrafung(oder Bestrafung durch Anwendung) tritt auf, wenn auf ein Verhalten ein ungünstiger Ausgang folgt, z. Ein Elternteil verprügelt ein Kind, nachdem das Kind ein Schimpfwort verwendet hat.Negative Bestrafung(oder Bestrafung durch Entfernung) tritt auf, wenn ein Verhalten zur Entfernung von etwas Positivem führt, z. ein Elternteil, der einem Kind das Wochengeld verweigert, weil das Kind sich schlecht benommen hat.

Obwohl Bestrafung immer noch weit verbreitet ist, fanden Skinner und viele andere Forscher heraus, dass Bestrafung nicht immer effektiv ist. Bestrafung kann ein Verhalten eine Zeit lang unterdrücken, aber das unerwünschte Verhalten neigt dazu, auf lange Sicht wiederzukommen. Bestrafung kann auch unerwünschte Nebenwirkungen haben. Zum Beispiel kann ein Kind, das von einem Lehrer bestraft wird, unsicher und ängstlich werden, weil es nicht genau weiß, was es tun soll, um zukünftige Strafen zu vermeiden.



Anstelle von Bestrafung schlugen Skinner und andere vor, gewünschte Verhaltensweisen zu verstärken und unerwünschte Verhaltensweisen zu ignorieren. Verstärkung erzählt eine Person welches Verhalten erwünscht ist, während die Bestrafung dem Individuum nur mitteilt, welches Verhalten nicht erwünscht ist.

Verhaltensgestaltung

Operante Konditionierung kann zu immer komplexeren Verhaltensweisen führen Gestaltung , auch Näherungsverfahren genannt. Das Formen geschieht Schritt für Schritt, während jeder Teil eines komplizierteren Verhaltens verstärkt wird. Das Formen beginnt mit der Verstärkung des ersten Teils des Verhaltens. Sobald dieser Teil des Verhaltens gemeistert ist, erfolgt die Verstärkung nur, wenn der zweite Teil des Verhaltens auftritt. Dieses Verstärkungsmuster wird fortgesetzt, bis das gesamte Verhalten beherrscht wird.



Wenn einem Kind beispielsweise das Schwimmen beigebracht wird, wird es vielleicht zunächst nur dafür gelobt, dass es ins Wasser gegangen ist. Sie wird erneut gelobt, wenn sie das Treten lernt, und erneut, wenn sie bestimmte Armbewegungen lernt. Schließlich wird sie dafür gelobt, dass sie sich durch das Wasser vorantreibt, indem sie einen bestimmten Schlag ausführt und gleichzeitig tritt. Durch diesen Prozess wurde ein ganzes Verhalten geformt.

Zeitpläne der Verstärkung

In der realen Welt wird das Verhalten nicht ständig verstärkt. Skinner fand heraus, dass die Häufigkeit der Verstärkung Einfluss darauf haben kann, wie schnell und erfolgreich man ein neues Verhalten lernt. Er legte mehrere Verstärkungspläne fest, jeder mit unterschiedlichem Timing und unterschiedlicher Häufigkeit.



    Kontinuierliche Verstärkungtritt auf, wenn auf jede Ausführung eines bestimmten Verhaltens eine bestimmte Reaktion folgt. Lernen geschieht schnell mit kontinuierlicher Verstärkung. Wenn die Verstärkung jedoch gestoppt wird, wird das Verhalten schnell nachlassen und schließlich ganz aufhören, was als Extinktion bezeichnet wird.Zeitpläne mit festem VerhältnisBelohnungsverhalten nach einer bestimmten Anzahl von Antworten. Beispielsweise kann ein Kind nach jeder fünften Aufgabe, die es erledigt, einen Stern bekommen. Bei diesem Zeitplan verlangsamt sich die Antwortrate direkt nach der Zustellung der Belohnung.Zeitpläne mit variablem VerhältnisVariieren Sie die Anzahl der Verhaltensweisen, die erforderlich sind, um eine Belohnung zu erhalten. Dieser Zeitplan führt zu einer hohen Antwortrate und ist auch schwer zu löschen, da seine Variabilität das Verhalten aufrechterhält. Spielautomaten verwenden diese Art von Verstärkungsplan.Zeitpläne mit festen Intervallennach Ablauf einer bestimmten Zeit eine Belohnung ausgeben. Stundenweise bezahlt zu werden, ist ein Beispiel für diese Art von Verstärkungsplan. Ähnlich wie beim Zeitplan mit festem Verhältnis steigt die Antwortrate, wenn sich die Belohnung nähert, verlangsamt sich jedoch direkt nach Erhalt der Belohnung.Zeitpläne mit variablen IntervallenVariieren Sie die Zeitspanne zwischen den Belohnungen. Ein Kind, das zum Beispiel zu verschiedenen Zeiten während der Woche eine Zulage erhält, solange es einige positive Verhaltensweisen gezeigt hat, befindet sich in einem variablen Intervallplan. Das Kind wird weiterhin positives Verhalten in Erwartung zeigen, schließlich seine Beihilfe zu erhalten.

Beispiele für operante Konditionierung

Wenn Sie jemals ein Haustier trainiert oder ein Kind unterrichtet haben, haben Sie wahrscheinlich in Ihrem eigenen Leben operante Konditionierung angewendet. Operante Konditionierung wird immer noch häufig in verschiedenen Situationen der realen Welt eingesetzt, einschließlich im Klassenzimmer und in therapeutischen Umgebungen.

Zum Beispiel könnte ein Lehrer die Schüler bei der regelmäßigen Hausaufgabenarbeit unterstützen, indem er regelmäßig Pop-Quiz gibt, die Fragen stellen, die denen der letzten Hausaufgaben ähneln. Wenn ein Kind einen Wutanfall bekommt, um Aufmerksamkeit zu erregen, können die Eltern das Verhalten ignorieren und das Kind dann wieder anerkennen, sobald der Wutanfall beendet ist.

Operante Konditionierung wird auch in verwendet Verhaltensänderung , ein Ansatz zur Behandlung zahlreicher Probleme bei Erwachsenen und Kindern, darunter Phobien, Angstzustände, Bettnässen und viele andere. Eine Art und Weise, wie eine Verhaltensmodifikation implementiert werden kann, ist durch a Token-Ökonomie , bei dem gewünschte Verhaltensweisen durch Tokens in Form von digitalen Abzeichen, Buttons, Chips, Aufklebern oder anderen Objekten verstärkt werden. Schließlich können diese Token gegen echte Belohnungen eingetauscht werden.

Kritik

Obwohl die operante Konditionierung viele Verhaltensweisen erklären kann und immer noch weit verbreitet ist, gibt es mehrere Kritikpunkte an dem Prozess. Erstens wird der operanten Konditionierung vorgeworfen, eine zu sein unvollständige Erklärung für das Lernen, weil es die Rolle biologischer und kognitiver Elemente vernachlässigt.

Darüber hinaus ist die operante Konditionierung auf an angewiesen Autoritätsperson Verhalten zu verstärken und ignoriert die Rolle der Neugier und die Fähigkeit eines Individuums, seine oder ihre eigenen Entdeckungen zu machen. Kritiker wenden sich gegen die Betonung der operanten Konditionierung auf die Kontrolle und Manipulation des Verhaltens und argumentieren, dass dies zu autoritären Praktiken führen kann. Skinner glaubte jedoch, dass Umgebungen das Verhalten auf natürliche Weise steuern und dass Menschen wählen können, ob sie dieses Wissen zum Guten oder zum Bösen nutzen möchten.

Weil sich Skinners Beobachtungen zur operanten Konditionierung schließlich auf Tierversuche stützten, wird er dafür kritisiert extrapolieren aus seinen Tierstudien, um Vorhersagen über das menschliche Verhalten zu treffen. Einige Psychologen glauben, dass diese Art der Verallgemeinerung fehlerhaft ist, weil Menschen und nichtmenschliche Tiere körperlich und kognitiv unterschiedlich sind.

Quellen