心理統計学の研究法と記述的指標(標準偏差)


心理統計学とは何か?

心理統計学とは心理学分野の量的研究に応用される統計学の一分野であり、確度(確からしさ)が明らかではない仮説(hypothesis)を数量的に検証するという役割を果たしています。最もシンプルな仮説検証の研究モデルでは、実験・観察で測定できた客観データの比較・増減・比率などによってその仮説の妥当性を評価することができます。

仮説をもとに現実の対象・現象の変化(特徴)を推測することができますが、統計学的研究では原則的に『相関関係』を調べることはできても『因果関係』を調べることは困難とされています。仮説の妥当性(正しさ)が心理統計学で検証された時には、統計学的推測(statistical reference)によって統計調査の対象となった母集団の特徴・傾向を推測することができますが、統計学は確率論的な根拠(証拠)なので、統計学的推測によって未来の事象の変化を確実に予測することはできません。

実験・観察・統計などで妥当性が検証された仮説理論をもとにして個別的な対象の特徴・傾向を予測していく論理的方法を『仮説演繹法(演繹法)』といい、それとは反対に、個別的な客観データをもとにしてそのデータ間に共通する一定の法則・理論を考案していく論理的方法を『帰納推測法(帰納法)』といいます。私たちが一般にある理論が“科学的”であると判断する時には、演繹法か帰納法の論理的な思考プロセスに基づいてその理論が考えられているということになります。演繹法あるいは帰納法によって考案された科学的理論には、『事象の再現可能性・未来の確率論的な予測性・反証可能性』などの特徴があり、科学的理論が支持される理由を客観的なデータや条件が統制された実験結果によって示すことが可能でなければなりません。

統計学は、あらゆる科学分野において計量的な根拠を提示する学問であり、経験的に得られたデータを数量化して集団全体の性質・特徴・傾向を予測するものですが、時間軸の違いを重視する心理統計学では横断的研究(cross-sectional study)だけではなく縦断的研究(longitudinal study)が行われています。横断的研究とは、同一時点における二つ以上の集団を比較する共時的研究であり、縦断的研究とは、同一集団のデータを異なる時点でとって比較する通時的研究ですが、心理療法を適用した場合の精神障害の経過・予後などを調査する場合には縦断的研究を行う必要があります。心理統計学の知識と技術は、エビデンスベースドな基礎心理学・応用心理学に欠かせないものとなっており、量的研究(統計学的研究)と質的研究(ケーススタディ・フィールドワーク)を組み合わせることでより実証的で効果的な一般理論(知見)を形成することができます。

コスト面(時間・経費・人員)に制約のある統計学的研究では、一般に母集団のすべてからデータを取ることは出来ませんから、母集団から如何にして偏りの少ない標準的特徴を示すサンプル(標本)を抽出するのかが重要になってきます。この母集団から標本を抽出する作業のことをサンプリングといい、最も理想的なサンプリングは無作為(ランダム)に標本を抽出する無作為抽出法である。しかし、実際の標本調査(統計調査)では完全にランダムな方法で標本を抽出するという作業は非常に困難であり、系統抽出や機械的抽出といった便宜的なサンプリングが行われることも多い。サンプリングにはさまざまな方法がありますが、母集団からどのようにして調査目的に適ったサンプル(標本)を的確に抽出できるのかというのが、統計学的研究の大きな課題の一つとなっています。

心理統計学による調査は、サンプリングと統計学的操作を通して母集団の性質を推測するものですが、統計学のメリットは『部分のデータ』から『全体の母集団の性質』を推測できることにあり、統計データによって分布(ばらつき)や比率、時間経過による変化などを理解することができます。統計学で用いる可変的な数値のことを『変数(variable)』といい、質問紙における質問項目のような数量化のツールを『尺度(scale)』といいますが、統計学的な測定は尺度と変数に基づく計算によって行われます。統計学には、客観的データを集積・分析して集団の特徴を記述していく『記述統計学(descriptive statistics)』と記述された客観的データから母集団の性質(特徴)を推測する『推測統計学(inferential statistics)』がありますが、記述統計学という基礎の上に応用的な推測統計学が成立していると考えることができます。

心理統計学の記述的指標(代表値・平均偏差・分散・標準偏差)

サンプリングした母集団の分布(広がり・ばらつき・平均)を表す指標のことを『記述的指標(記述統計量)』といい、記述的指標には代表値散布度があります。代表値というのは、統計データ全体の分布を“1つの数値”で代表させたもので、『平均値(mean)・中央値(median, 中間値)・最大値(maximum)・最小値(minimum)・最頻値(mode)』などの種類があります。平均値というのはデータの合計を個数で割ったものであり、中央値(中央値)はデータを大きいものから小さいものへと順番に並べた場合にちょうど真ん中の順位に当たる数値のことです。最頻値というのは、統計データの中で最も出現する頻度の多い数値のことであり、度数分布において最大の度数を示すデータのことを指します。

平均値と中央値のどちらがより優れた記述的指標であるのかは研究の目的や性質によって変わってきますが、一般的に平均値のほうが中央値よりも『極端にデータ分布から外れた値=外れ値(outlier)』の影響を受けやすくなります。20人の集団の中に、年収200~400万円代の人が19人、年収3億円の人が1人いる場合に、平均値の場合は年収3億円(データ分布から極端に外れた値)の方向に大きく引っ張られますが、年収の高い人から順番に並べて中央値(中間値)を取った場合には集団の分布の真ん中に近い数値になるということです。統計学的研究では、平均値と中央値の間に大きな差が出ることも少なくないので、両方の数値を出しておいたほうが適切であると言えます。

代表値と並んでサンプルの分布(広がり・ばらつき)の特徴を表す記述的指標として『散布度』があり、散布度は統計データの分布のばらつきの度合いを示します。人によって得点の差(ばらつき)が小さい場合には散布度は小さくなり、人によって得点の差が大きい場合には散布度が大きくなりますが、散布度の指標になる数値には『平均偏差・分散・標準偏差・不偏分散』などがあります。

平均偏差(mean deviation)とは、測定値と平均値(中央値)の間のずれの程度を示す指標であり、「測定値-平均値(中間値)の絶対値」のΣ(総和)をデータの数で割った数値で表されます。例えば、「4・8・6・10・2(合計すると30)」という5つのデータがある場合の平均値は「6」ですが、平均偏差は( |4-6| + |8-6| + |6-6| + |10-6| + |2-6| )÷5=2.4となります。測定値から平均値(あるいは中間値)を引いて、その合計をデータの数で割った数値が平均偏差となりますが、平均値を利用した場合には『平均からの平均偏差』、中間値を利用した場合には『中間値からの平均偏差』と呼ばれることがあります。平均偏差は、│x-平均値(中間値)│のΣ(総和)をN(データ数)で除するという形で数式化することができます。

分散(variance)もデータの散布度を示す指標ですが、分散は平均偏差で用いる│x-平均値│を2乗してΣ(総和)を求め、その総和をN(データ数)で割ったものです。例えば、「4・8・6・10・2(合計すると30)」という5つのデータがある場合の平均値は「6」ですが、分散は( |4-6|^2 + |8-6|^2 + |6-6|^2 + |10-6|^2 + |2-6|^2 )÷5=8となります。分散とは、測定値と平均値の間の差(距離)の二乗の平均を示す値であり、分散の平方根のことを標準偏差(standard deviation:SD)といいます。

標準偏差(SD)とは、二乗すれば分散の値になる数値のことであり、上記の例であれば分散=8の標準偏差は√8=2.82……となります。一般的な心理学研究において『散布度の指標』という場合には、分散の平方根によって導かれるこの標準偏差が用いられることになります。標準偏差が大きいほど各サンプルデータの平均値からのばらつきが大きいということになりますが、平均偏差と比較するとその数値の持つ意味の解釈はやや複雑になります。なぜ、計算が簡単な平均偏差ではなく計算が面倒な分散・標準偏差が用いられるかというと、統計的推測をより正確に行うことができ、共分散や相関係数などへの応用も容易であるからです。

統計学的データのばらつきを示す散布度には、『平均偏差・分散・標準偏差』以外にも不偏分散(unbiased variance)というものがあり、不偏分散は分散のNを「N-1」の値に置き換えたものです。つまり、上記の例でいえば、( |4-6|^2 + |8-6|^2 + |6-6|^2 + |10-6|^2 + |2-6|^2 )÷4=10が不偏分散になり、不偏分散の10から標準偏差の3.16……を計算することもできます。数式から見ても当然のことですが、不偏分散(標準偏差)の値は分散(標準偏差)の値よりも必ず大きくなり、分散の値は平均偏差の値よりも必ず大きくなります。

Copyright(C) 2004- Es Discovery All Rights Reserved