Operantne konditsioneerimine – määratlus, tugevdamine, karistus ja näited

Operantne konditsioneerimine — kuidas tugevdamine, karistus ja väljasuremine kujundavad käitumist; selgitused, tüübid ja praktilised näited.

Autor: Leandro Alegsa

07-11-2025 17:34

Operantne konditsioneerimine on õppimise vorm, kus indiviid muudab oma käitumist selle tagajärgede tõttu. Kui konkreetse käitumise järel ilmneb mingi mõju, õpitakse selle mõju kaudu, kas käitumist korrata või vältida. Operantne konditsioneerimine kehtib nii inimestele kui loomadele ja seda kasutatakse mõistmiseks ja käitumise kujundamiseks paljudes valdkondades.

Üldiselt võib käitumise tagajärgi liigendada kolme põhikategooriasse:

Tugevdamine: positiivne või rahuldust pakkuv sündmus, mis suurendab käitumise esinemissagedust (nt preemia, tähelepanu, toidutükk).
Karistus: negatiivne või karistav sündmus, mis vähendab käitumise esinemissagedust (nt ebameeldiv kogemus, sõna või karistusmeetmed).
Väljasurumine: sündmus jäetakse ära ehk käitumisel ei ole edaspidi tagajärgi; kui käitumisele ei järgne mõju, kipub see harvemini toimuma.

Tugevdamise ja karistuse tüübid

Operantses konditsioneerimises eristatakse sageli nelja spetsiifilist olukorda. Siin ei viita sõnad "positiivne" ja "negatiivne" moraalsete hinnangutega — positiivne tähendab, et midagi lisatakse, ja negatiivne tähendab, et midagi eemaldatakse:

Positiivne tugevdamine (sageli lihtsalt "tugevdamine") toimub siis, kui mingi käitumise eest antakse tasu, mis suurendab selle käitumise esinemist. Skinneri kasti eksperimendis oli tasu toidu kujul, kui rott vajutas hooba.
Negatiivne tugevdamine (mõnikord nimetatakse ka "põgenemiseks" või "vabastuseks") toimub siis, kui vastumeelne stiimul eemaldatakse pärast soovitud käitumist. See eemaldamine suurendab käitumise tõenäosust — näiteks kui valju müra lõpeb pärast kangile vajutamist, õpib loom käitumist korrata.
Positiivne karistus tekib siis, kui lisatakse ebameeldiv stiimul, mille tagajärjel käitumine väheneb (näiteks valju müra, ebameeldiv kokkupuude või muu karistav tagajärg).
Negatiivne karistus tekib siis, kui võetakse ära meeldiv stiimul (näiteks mänguasi või tähelepanu), mis vähendab soovimatut käitumist.

Õppimise mehhanismid ja lisakontseptsioonid

Mõned olulisemad mõisted, mis operantse konditsioneerimise puhul esile tõusevad:

Kujundamine (shaping): soovitud keerukamate käitumiste õpetamine samm-sammult, tugevdades järk-järgult lähenemist lõplikule käitumisele.
Väljasurumine (extinction): kui tugevdamine lõpetatakse, langeb vastav käitumine järk-järgult ära. Mõnikord ilmneb esmalt käitumise ajutine suurenemine (extinction burst) enne pöördumist alla.
Üldistamine ja diskrimineerimine: õppija võib laiendada tugevdaja mõju sarnastele stiimulitele (üldistamine) või õppida reageerima ainult teatud stiimulitele (diskrimineerimine).
Tugevdamise skeemid: see, kui sageli ja millistel tingimustel käitumist tugevdada, mõjutab õppimise kiirust ja püsivust. Peamised skeemid on:
- fikseeritud suhe (fixed ratio) — tugevdamine pärast fikseeritud arvu vastuseid;
- muutuv suhe (variable ratio) — tugevdamine pärast keskmiselt teatud arvu vastuseid (näiteks hasartmängudel väga püsiv käitumine);
- fikseeritud intervall (fixed interval) — tugevdamine pärast fikseeritud ajavahemikku esimese vastuse puhul;
- muutuv intervall (variable interval) — tugevdamine pärast muutuvat ajavahemikku.

Näited ja rakendused

Operantset konditsioneerimist kasutatakse laialdaselt igapäevaelus ja professionaalselt:

Lemmikloomade koolitus — positiivne tugevdamine (maiused, kiitus) õpetab trikke ja soodsat käitumist.
Haridus ja klassiruum — punktisüsteemid, preemiad ja tagasiside toetavad õpilaste soovitud tegevust.
Teraapia ja käitumise juhtimine — käitumisteraapiates (nt ABA autismis) kasutatakse tugevdajaid, et suurendada sobivat käitumist ja vähendada ohtlikku või sobimatut käitumist.
Töö ja motivatsioon — tööpreemiad, boonusstruktuurid ja tagasiside suurendavad produktiivsust.
Sõltuvusuuringud — positiivsete ja negatiivsete tugevdajate tundmine aitab mõista sõltuvuskäitumisi ning neid mõjutada.

Ajalugu ja võrdlus klassikalise konditsioneerimisega

Operantse konditsioneerimise idee juured on Edward Thorndike'i töös (nn efektiseadus) ning seda süvitsi analüüsis ja populariseeris B. F. Skinner, kes töötas välja eksperimendid ja kontseptsioonid nagu Skinneri kast. Operantne konditsioneerimine erineb Pavlovi klassikalisest konditsioneerimisest: operantne konditsioneerimine keskendub vabatahtlike käitumiste muutmisele ja nende tagajärgedele, klassikaline konditsioneerimine aga tingitud refleksi tekitamisele, kus neutraalne stiimul omandab reaktsiooni seoses teise, loomuliku stiimuliga.

Eetilised kaalutlused

Operantse konditsioneerimise rakendamisel tuleb arvestada eetikat ja heaolu. Karistuse kasutamine võib tekitada hirmu, stressi ja soovimatuid kõrvalmõjusid; sageli on soovitatav eelistada positiivset tugevdamist ja vältida füüsilisi või liigseid aversiivseid meetmeid. Inimeste puhul tuleb arvestada õiguste, informeeritud nõusoleku ja turvalisuse põhimõtteid.

Kokkuvõttes on operantne konditsioneerimine võimas ja praktiline teooria käitumise mõistmiseks ja kujundamiseks — õigesti kasutatuna aitab see arendada oskusi, ennetada probleeme ja toetada muutusi nii hariduses, töös kui teraapias.

Thorndike'i efekti seadus

Operantset konditsioneerimist, mida mõnikord nimetatakse instrumentaalseks õppimiseks, uuris esimesena Edward L. Thorndike (1874-1949). Ta jälgis kasside käitumist, kes püüdsid põgeneda kodus valmistatud mõistatuskastidest. Kui kassid esimest korda kastidesse pandi, võttis neil põgenemine kaua aega. Kogemuse kasvades esinesid edukad reaktsioonid sagedamini, mis võimaldas kassidel põgeneda lühema ajaga. Thorndike teoretiseeris oma mõju seaduses, et käitumist, millele järgnevad rahuldavad tagajärjed, kiputakse kordama, ja neid, mis tekitavad ebameeldivaid tagajärgi, kordatakse harvemini. Lühidalt öeldes tugevdasid mõned tagajärjed käitumist ja mõned tagajärjed nõrgestasid käitumist. Thorndike koostas selle protseduuri abil esimesed teadaolevad õpikõverad.

B.F. Skinner (1904-1990) töötas välja üksikasjalikuma analüüsi operantsest konditsioneerimisest. Skinner leiutas operantse konditsioneerimise kambri, mis võimaldas tal mõõta reaktsioonikiirust kui peamist sõltuvat muutujat. Ta kasutas hoova vajutuste või klahvivajutuste registreerimist.

Operantse konditsioneerimise põhimõtted:

Diskrimineerimine, üldistamine ja konteksti tähtsus.

Õppimine toimub kontekstides.
Enamik käitumist on stiimulite kontrolli all: konkreetne reaktsioon tekib ainult siis, kui on olemas sobiv stiimul.
Stiimulite kontroll on tõhus isegi siis, kui stiimulil ei ole vastaja jaoks mingit tähendust.

Väljajätmine: operantne käitumine hääbub, kui tugevdamine lõpeb.

Tugevdamine toimub alles siis, kui on tehtud õige vastus, ja isegi siis ei pruugi seda toimuda. Käitumine ei nõrgene ega kustu seetõttu.
Tulemused sõltuvad osaliselt sellest, kui tihti tugevdust saadakse.

Tugevdamise ajakava: Tugevdamise ajastus on otsustava tähtsusega.

Fikseeritud intervallkava: tugevdajaid esitatakse kindlaksmääratud ajavahemike järel, tingimusel, et reageeritakse asjakohaselt.
Muutuva intervalliga ajakava: käitumist tugevdatakse vastavalt keskmisele ajale, mis on möödunud viimasest tugevdamisest. Suhteline ajakava: põhineb vastuste ja tugevduste suhtel.
Fikseeritud intervallkava: tugevdus antakse pärast kindla arvu reageeringute sooritamist. Erijuhtumit, kus tugevdus antakse pärast iga reaktsiooni, nimetatakse pidevaks tugevduseks.
Muutuva intervalliga ajakava: tarnekinnitus põhineb konkreetsel keskmisel vastuste arvul.

Küsimused ja vastused

K: Mis on operantne konditsioneerimine?

V: Operantne konditsioneerimine on õppimise vorm, mille puhul indiviid muudab oma käitumist käitumise tagajärgede (tulemuste) tõttu.

K: Millised on operantse konditsioneerimise neli konteksti?

V: Operantse konditsioneerimise neli konteksti on positiivne tugevdamine, negatiivne tugevdamine, positiivne karistus ja negatiivne karistus.

K: Kuidas toimib positiivne tugevdamine?

V: Positiivne tugevdamine toimub siis, kui mingi käitumisviisi eest antakse tasu, mis suurendab käitumise esinemissagedust.

K: Kuidas toimib negatiivne tugevdamine?

V: Negatiivne tugevdamine toimub siis, kui eemaldatakse vastumeelne stiimul, mis suurendab käitumise esinemissagedust.

K: Kuidas toimib positiivne karistus?

V: Positiivne karistamine toimub siis, kui lisatakse stiimul, mille tulemusel käitumine esineb harvemini.
K: Kuidas toimib negatiivne karistus? V: Negatiivne karistus toimub siis, kui stiimul võetakse ära, mille tulemusel käitumine toimub harvemini.

K: Kes avastas esimesena operantse konditsioneerimise?

V: Edward Thorndike avastas esimesena operantse konditsioneerimise ja hiljem analüüsis seda B. F. Skinner.

Otsige