統計の基礎13 ノンパラメトリック

統計の基礎13ではパラメトリックではないデータに適用する検定手法である、ノンパラメトリックについて説明します。ノンパラメトリックな手法は、統計結果が平均値や標準偏差などのパラメータに依存しないという特徴を持ちます。このため、正規分布しない、平均値や標準偏差がデータを代表しないような結果に対して適用されることが一般的となっています。ノンパラメトリックな手法はパラメトリックな手法と比較して検出力が低く(p値を大きめに見積もる)、精度がデータの分布に依存しない傾向(頑強性)を持ちます。しかし、t検定のようなパラメトリックな手法もそこそこ頑強性が高いため、カテゴリカル・データを解析する場合などの、パラメトリックを明らかに適用すべきでないデータを除くと、現代的にはほぼ使用されない手法となります。最近の教科書では通常の数値データは(変換などを挟んで)パラメトリックな方法で扱うのがよいとされていると思います。

ノンパラメトリックな手法はたくさんあります。代表的なものは、t検定のノンパラメトリック版であるウィルコクソンの順位和検定、一元分散分析のノンパラメトリック版であるクラスカル・ウォリスの順位検定、相関係数のノンパラメトリック版であるスピアマンの順位相関係数などがあります。これらの手法では、データそのものではなく、データをすべて並べたときの順位を用いて検定を行うことに特徴があります。順位はサンプルが十分大きければ正規分布すると仮定できるため、この順位を利用した統計手法となっています。