オペラント条件づけ

お役立ち情報
この記事は約7分で読めます。

報酬を与えることでオペラント行動を強化させ、オペラント行動を定着させる一連の手続きのことをオペラント条件づけといいます。

オペラント条件づけ(Operand conditioning)は道具的条件づけ(Instrumental conditioning)とも呼ばれます。

オペラント条件づけは、普段の生活で無意識に使っています。

例えば、望ましい行動をしたときにおやつを与えて褒める。望ましくない行動をしたときは叱ることがオペラント条件づけです。

脳波フィードバックトレーニングは、オペラント条件づけ(正の強化)を利用しています。

また、オペラント条件づけは人間だけではなくペットや家畜などの動物にも使うことができます

オペラント行動

生体が随意的に制御できる行動が、オペラント行動です。

自発的な行動といっても良いでしょう。

オペラント行動は、反射や条件反応による行動ではありません。

オペラント行動の例

ゲーム好きな人が歩いていて、ゲームセンターを見かけたから、ゲームセンターに入ってしまった。

ゲームセンターに入った行動がオペラント行動です。

ケーキ好きな人が、ショーケースの中にある美味しそうなケーキを見て、つい買ってしまった。

ケーキをつい買ってしまった行動がオペラント行動です。

三項随伴性(Three-term contingency)

三項随伴性

弁別刺激→行動→結果の3つが、連続して起こることを三項随伴性といいます。

また、3つの対応関係の把握のことを、頭文字からABC分析といいます。

随伴性とは、前者に伴って後者が起こること

強化と罰

オペラント条件づけには、強化と罰があります。

強化は行動の出現率を上昇させること、罰は行動の出現率を減少させることです。

罰は弱化と呼ばれることもあります。

正の強化と負の強化

行動の出現率を上昇させる強化には、正の強化と負の強化があります。

正の強化とは強化する刺激を与えて、行動の出現率をアップさせること、負の強化とは刺激を取り除くことで、行動の出現率をアップさせることです。

正の罰と負の罰

行動の出現率を減少させる罰にも、正の罰と負の罰があります。

正の罰とは罰になる刺激を与えて、行動の出現率をダウンさせること、負の罰とは刺激を少なくすることで、行動の出現率をダウンさせることです。

正の強化・負の強化・正の罰・負の罰のまとめ

強化行動の出現率を増大正の強化強化する刺激を与える
負の強化刺激を取り除く
行動の出現率を減少正の罰罰になる刺激を与える
負の罰報酬を引き下げる(例:減給)
強化子の操作
提示除去(減少)
好子(報酬刺激)正の強化
(行動の出現上昇)
負の罰
(行動の出現減少)
嫌子(嫌悪刺激)正の罰
(行動の出現減少)
負の強化
(行動の出現上昇)
正の強化
負の強化
正の罰
負の罰

罰を用いる問題点

しつけなどで罰を使用する場合は、慎重な配慮が必要です。

  1. 罰は倫理的に問題がある場合が多い。
  2. 罰は望ましくない行動をさせないようにするには有効ですが、望ましい行動をするようにするには有効ではない。
  3. 罰の効果は一時的なものになりやすい。
  4. 罰の効果は繰り返すと弱くなる。同じ効果を持たせるには罰の強度を上げていく必要がある。
  5. 罰の出現する場面で、親の存在など明確な弁別刺激が付帯している場合が多い。結果、親の存在がないと行動が減少しない。隠れて悪事をしてしまう。
  6. 学習者に嫌悪的な反応を引き起こすため、別の望ましくない行動を引き起こすことがある。
  7. 罰を回避するため、学習者が罰の仕掛けを破壊したり、訓練者を攻撃したりすることがある。

正の強化の例

A:先行条件 デートで食事に行く

B:行動 おいしいと言って食べる

C:結果 彼女が喜ぶ

変化:デートでおいしい食事に行く機会が増える

負の強化の例

A:先行条件 嫌いな騒がしいところに行く

B:行動 外に出る

C:結果 嫌いな場所にいるのを避けられた

変化:嫌いな騒がしいところに行く機会が減る

正の罰の例

A:先行条件 食事に行く

B:行動 自分の体に合わない食べ物を食べた

C:結果 お腹を下す

変化:自分の体に合わない食べ物を食べなくなる

負の罰の例

A:先行条件 食事に行く

B:行動 飲み過ぎて、お店から出禁になった

C:結果 お店に入れなくなる

変化:飲む量が減る。食事に行くことを自粛する

弁別と般化

弁別とは、刺激に応じて異なる反応をするように学習することです。

般化とは、類似したものに同じ反応を示すことです。

弁別の例

2種類の笛を用意し、笛Aのときは「おすわり」、笛Bのときは「伏せ」を犬に学習させます。

弁別の原理

般化の例

2種類の笛を用意し、笛Aで「おすわり」の学習をさせます(オペラント条件づけ)。

次に、笛Bを鳴らしてみます。

笛Aよりは遅くなりますが、「おすわり」をします。

行動形成

段階的に行動を形成していくのが行動形成です。

オペラント条件づけは学習に極めて有効ですが、弱点もあります。

オペラント条件づけの弱点は、「結果による反応は、学習者が自発するものなので、確実に反応を得られる保証がない」ことです。

反応が無ければ、強化することはできません。

そこで、段階的に行動を形成していきます。

即時強化

反応直後に強化を与える方法が即時強化です。

例えば、お手伝いをしたら、すぐに褒めることが重要です。

強化が遅れる(お手伝いをした後、しばらくしてから褒める)と、思わぬ行為を学習してしまうことがあります。

スモールステップ

目標達成のコーチングや予備校などで用いられている方法です。

現状と目標に差が大きいときに有効です。

スモールステップ

強化スケジュール

連続強化(Continuous Reinforcement : CRF)

反応を毎回強化するスケジュールを連続強化といいます。

正の強化であれば、毎回報酬を与えます。

部分強化(Partial Reinforcement)

部分強化は間欠強化(Intermittent Reinforcement)とも呼ばれます。

連続強化よりも、消去されにくい(消去抵抗が高い)のが部分強化です。

消去とは、反応に強化が随伴しなくなることです。

消去抵抗とは、強化子が与えられなくなっても反応が強くことです。

例)依存症の消去抵抗は高い。

部分強化の方法は無限に考えられます。

代表的なものに、固定間隔強化(Fixed interval : FI)、変動間隔強化(Variable interval : VI)、固定比率強化(Fixed ratio : FR)、変動比率強化(Variable ratio : VR)があります。

強化スケジュール強化の与え方実例消去抵抗
連続強化反応ごと自販機最も低い
部分強化固定間隔強化
(FI)
一定の時間間隔月給低い
変動間隔強化
(VI)
異なる時間間隔魚釣り高い
固定比率強化
(FR)
一定の反応数出来高払い低い
変動比率強化
(VR)
不定の反応数ギャンブル非常に高い

オペラント条件づけがベースとなる心理療法

シェイピング法

スキナーが提唱した方法で、目指す行動(適応的行動)をスモールステップで段階的に形成(シェイピング)する方法です。

刺激を提示(プロンプティング)することで、適応的行動を定着させます。

定着したら、刺激を除去(フェーディング)し、刺激がなくても適応的行動が持続するような手続きがあります。

授業中に離席をしてしまう子供の着席行動を定着させる方法に用いられます。

トークンエコノミー法

プリントを10枚できたときにシールを与え、シールが30枚たまったら、子供が設定したご褒美(強化子)を与える方法です。

トークンを一定数集めると、クライエントが望む強化子(報酬)を得られるようにすることで、適応的な行動の形成を行う方法です。

トークンとは、報酬につながるもので、シールやハンコなどが用いられます。

自己主張訓練(アサーション・トレーニング)

対人関係で過緊張や不安を感じる場面などで用いられます。

心理的安全性を確保したうえで、クライエントに実際に人前で繰り返し自己主張してもらいます。

緊張や不安を感じても、自己主張可能であることをクライエントが学びます。

社会的技能訓練{ソーシャルスキルトレーニング(SST)}

リバーマンによって提唱されたもので、社会的スキルの獲得を目指す方法です。

ニューロフィードバック

関連記事(レスポンデント条件づけ)

タイトルとURLをコピーしました