人間の行動を統御するメカニズムとしての快楽原則と学習理論

スポンサーリンク

旧ブログの記事一覧

『古典的条件付け理論(レスポンデント条件付け)』を生理学的実験によって証明したロシアのパヴロフ、パヴロフの生理的な条件刺激に対する条件反射を人間の行動一般に応用して『S-R理論(S:stimulus,R:response)』を提示した行動主義のワトソンが、行動科学(行動主義心理学)の黎明期を築きました。

更に、ワトソンの刺激(S)に対する反応(R)の結合で行動を説明しようとするS-R理論に基づく行動主義を発展させ、ソーンダイクの“効果の法則”を前提とした試行錯誤理論で人間の自発的(オペラント)な行動を条件付けようとする『道具的条件付け理論(オペラント条件付け)』が、新行動主義のスキナーやハルによって提示されました。

ソーンダイクの効果の法則というのは、フロイトの快楽原則(一次過程)にも類似した行動の説明法則です。さまざまな行動を試行する中で失敗や間違いを犯しながら、快の効果につながる有効な行動の頻度が増加し、不快の効果に頻度が下がっていくという学習の法則です。

スポンサーリンク

つまり、試行錯誤する行動の結果として得られる刺激の効果(快と不快)によって行動の生起が制御されてくるというのが効果の法則であり、オペラント条件付けもこの効果の法則によって自発的な行動を統制する条件付けを行おうとするものです。

古典的条件付けによる行動は、外部からの刺激に対する自動的で受動的な反応ですが、オペラント条件付けによる行動は自発的で主体的な行動であり、“報酬(快の効果)”を獲得し、“罰(不快の効果)”を回避しようとする学習活動の中で条件付けられていきます。

オペラント条件付けは道具的条件付けとも呼ばれますが、それは自発的な行動が、報酬(強化子)を獲得するための道具(手段)としての機能を果たしている為です。オペラント条件付けにおいて、行動の生起の頻度や回数を変容させる報酬や罰としての効果を持つ外部の刺激・条件を“強化子”といいます。

楽天AD

強化子には、報酬としての効果を持つ“正の強化子”と罰としての効果を持つ“負の強化子”があります。

正の強化子には、以下の二種類があります。

一次性強化子……本能的欲求の充足につながる食物・セックス・安全な環境などの強化子。

二次性強化子……社会的欲求や承認欲求の充足につながる肯定・賞賛・貨幣(エコノミー・トークン)・承認・評価・微笑み・抱擁・知識などの条件性強化子。

エコノミー・トークン……種々の不適応行動や問題行動の改善、強迫観念や強迫行為などの強迫性障害の症状の軽減、アルコール依存症、薬物依存症、買い物依存症、ギャンブル依存症などの嗜癖行為の減少などを目的にして行う行動療法では、症状や問題の改善につながる望ましい行動をクライアント(患者)がとった場合には、正の強化子としてエコノミー・トークンと呼ばれる代理貨幣を与える場合があります。

効果的な行動の強化……C.L.ハルの強化理論に依拠すれば、ある行動を長期間持続させたり、ある行動の強度を強めたり、生起頻度を高める為には、その行動が発生した時に、時間感覚を空けずに出来るだけ素早く、報酬の効果を与える正の強化子を出来るだけ多く与える必要があります。このオペラント条件付けを、目標行動の要素を正確に選択して絞り込むシェイピングをして、反復的に強化子を与え続ければ、望ましい行動の生起頻度は高くなっていきます。

スポンサーリンク

不快な刺激を与えて罰の効果を発揮する負の強化子には、その行動を抑制して生起頻度を減少させる働きがあり、一般的に幼児教育における躾の方法として負の強化子(怒る・叱る・否定する・反対する・間違いを指摘する・おやつやお小遣いを取り上げるなど)はよく用いられますが、負の強化子を用いて行動を抑制しようとする場合には、以下のような基本的理解と注意が必要となるでしょう。

罰の効果を与える負の強化子は、必ずしも『望ましくない行動の減少』という本来の教育的効果につながらない場合があります。

負の強化子を与えられて、その不快な刺激や苦痛な刺激を回避しようとする学習が起き、望ましくない行動の頻度が減少すれば良いのですが、負の強化子を与えた場合の副作用としての強い恐怖感や病的な不安感だけを学習してしまう場合があります。

この場合には、教育的効果は殆ど望めず、負の強化子を与えた相手である親や教師などの上位者に対する不満や不安が高じて、神経症的な不安症状や抑うつ感・無気力といった心理機能の抑制が起こったりします。

また、負の強化子を与えられると、一般的に怒りや反発の感情反応が起き攻撃行動につながる可能性もありますし、その場面や状況に対する回避行動や逃避行動が生じて不登校やひきこもり、就業拒否などの非社会的問題行動へと発展する危険性も内包しています。

受動的な攻撃行動として、怠惰な生活行動、社会的義務からの逃避、仕事や学業のサボタージュ、物事に対する無関心や無感動などの問題が引き起こされる場合もあります。

上述した負の強化子の好ましくない副作用的な結果を回避する為には、負の強化子を相手に与える場合に、以下の事柄に注意する必要があります。

スポンサーリンク

1.何故、罰(負の強化子)の効果を与えられたのか、相手が納得できるような形で負の強化子を与え、相手が理解できないようであれば適切な形で何が悪かったのかを説明するようにする。つまり、“理不尽で無意味な罰”を与えられたという不満や反発を残さないようにしなければならない。

2.罰の効果は、望ましくない行動をとった直後に素早く与えなければならない。

3.罰を与える時間が長くなり過ぎると、本来の教育的意義を失い、単なる虐待や憂さ晴らしになってしまうので、罰を与える時間は適切な長さでなければならない。

4.罰を与える目的は、望ましくない行動をとらない学習活動を促進する為であり、望ましくない行動をとった人間を懲罰したり痛めつけたりするわけではない。必要以上の強度や時間の罰を、個人的感情である怒りや憤慨に基づいて与える事は、抵抗や反発を生むばかりで逆効果となる場合が多い。

5.可能であれば、負の強化子よりも正の強化子を用いるほうが、望ましい方向に行動を変容させられる確率が高くなる。

楽天AD

行動主義心理学(行動科学)において、人間の行動を変容させるものは“学習(learning)”であり、後天的な学習行動によって人間の行動やパーソナリティ(人格)の全てを説明しようとします。

学習心理学(学習理論)

学習とは、後天的・経験的な“行動の変容”と“知識の獲得”であり、その結果が比較的長く継続する特徴を持っている。

行動の変容……新しい行動の獲得であり、今までの行動の消失である。

知識の獲得……学習活動によって、世界と人間に関する未知の知識を得ることによって、理解を深め行動の変容へとつながっていくものである。

学習理論におけるパーソナリティ……後天的に獲得された膨大な習慣から構成されたものと定義する。習慣(habit)とは、経験的に学習されたその人や文化に特徴的な行動パターンであり、刺激と反応の連合である。学習理論では、習慣は、各種条件付けや学習活動、社会的学習によって形成され消去される。

スポンサーリンク

また、学習行為は、個人のみで行われるわけではなく、社会的環境の中で他者の行動から学び取ることも多くみられる。社会的場面において、他者の行動を通して学習することを『社会的学習』という。

社会的学習には、他人(モデル)の行動の真似をして強化を受ける事によって成立する『模倣学習』とただ他人(モデル)の行動を観察するだけで成立する『観察学習』があります。

社会的学習理論の研究者のアルバート・バンデューラは、『モデリング理論』を提唱して、人間の学習行動は、『他者(モデル)の行動の事例や成功・失敗の経験を観察するだけでも成り立ち、時に、そのモデリングの学習効果は実際に自分が行動する以上のものであること』を実験的に実証しました。

元記事の執筆日:2005/04/26

スポンサーリンク
関連するコンテンツ
Copyright(C) 2020- Es Discovery All Rights Reserved