統計の基礎9 二元分散分析

統計の基礎9では、要因が2つ以上ある時の平均値の差の検定である、二元分散分析について説明します。二元分散分析では、データの差を生み出すような要因が2つある場合を想定しています。血圧に対する医薬品と年齢の関係を調べる場合や、成績に対する学校と性別の影響を調べる場合などが二元分散分析の対象となります。

二元分散分析では、データの並行性が重要な要因となります。2群間でデータが平行している場合には、どちらが高くてどちらが低いか、比較的かんたんに明らかにすることができます。一方、データが平行ではなく、一つの因子が大きくなったときに関係が逆転するような場合には、差があることを説明するのは難しくなります。このような、平行性の問題を交互作用と呼びます。二元分散分析で差があることを説明できるのは、交互作用がなく、p値が設定した第一の過誤(通常は0.05)と比較して十分に小さいことを示すことができた場合になります。

二元分散分析は一元分散分析と同様に分散分析表を用いて分析します。計算は一元分散分析と比較して複雑になりますが、偏差平方和、自由度、平均平方和からF値を求めることは一元分散分析と同じです。結果のうち、交互作用のp値が0.05より小さくないことをまず確認します(p値が高くても帰無仮説を棄却できないだけで、帰無仮説を肯定しているわけではないのでやや変な感じがしますが、お作法としてこの手順が選ばれています)。その上で、2つの要因のp値を調べ、2つの要因1つづつに対して帰無仮説が棄却できる(差がある)かどうかを検討します。