Rと統計

統計の基礎14 正規性、等分散性、外れ値の検定

統計の基礎14では正規性、等分散性、外れ値の検定について説明します。正規性と等分散性は多くのパラメトリックな手法の前提条件となっているため、検定で確かめてからパラメトリックな手法を使用し、正規性と等分散性を持たなければノンパラメトリックのよ…

統計の基礎13 ノンパラメトリック

統計の基礎13ではパラメトリックではないデータに適用する検定手法である、ノンパラメトリックについて説明します。ノンパラメトリックな手法は、統計結果が平均値や標準偏差などのパラメータに依存しないという特徴を持ちます。このため、正規分布しない、…

統計の基礎12 重回帰

統計の基礎12では、1つの従属変数を多数の説明変数で説明する場合の線形回帰の方法である、重回帰について説明します。線形回帰では、1つの説明変数に対して1つの従属変数の関係を調べます。式で書くと、y=ax+bで、aとbを求める問題となります。正確には誤差…

統計の基礎11 多重比較

統計の基礎11では、3群以上を比較する場合における平均値の差の検定である、多重比較検定について説明します。分散分析も同様の平均値の差の検定ですが、分散分析ではどの群とどの群の間に差があるのかよくわからないが、全体を見渡すと差がある、といった漠…

統計の基礎10 共分散分析

統計の基礎10では、要因が2つ以上あり、1つの要因が連続値である場合の平均値の差の検定である、共分散分析について説明します。共分散分析は通常、2個以上の要因で検証した散布図において、直線性の傾きや切片が統計的に有意に異なっていることをしめすため…

統計の基礎9 二元分散分析

統計の基礎9では、要因が2つ以上ある時の平均値の差の検定である、二元分散分析について説明します。二元分散分析では、データの差を生み出すような要因が2つある場合を想定しています。血圧に対する医薬品と年齢の関係を調べる場合や、成績に対する学校と性…

統計の基礎8 対応のある一元分散分析

統計の基礎8では、3群以上の平均値の差の検定である、一元分散分析において、同一の対象から各群のデータを取得した場合(対応のある場合)の分析方法について説明します。対応のある、というのは例えば同じ人から3群すべてのデータを1回ずつ取得する場合な…

統計の基礎7 一元分散分析

統計の基礎7では、3群以上の平均値の差の検定である、一元分散分析について説明します。一元分散分析では、3群以上の平均値に差があるかどうかを示す検定方法で、3群のどの群の間に差があるかどうかを示す検定ではありません。群間の差を比較する場合には、…

統計の基礎6 カイ2乗分布とカイ二乗検定

統計の基礎6では、クロス集計表やカテゴリカル・データに用いられるカイ2乗検定について説明します。カイ二乗検定はカテゴリカル・データの比を調べるための検定で、比がある値と同じであることを確かめる適合度の検定と比がある値と同じであることを確かめ…

統計の基礎5 t検定

統計の基礎5では、平均値の差の検定である、t検定について説明します。t検定はどの統計の入門書にも載っている、基本的な検定の一つです。検定の基本的な要素が詰まっているので、検定を理解するためにt検定はよい教材となっているのだと思います。t検定は、…

統計の基礎4 仮説検定の基礎

統計の基礎4では、統計でよく用いられる、仮説検定の基本的なことについて説明します。仮説検定は科学論文でも、臨床データでもどこにでも顔を出すのですが、いまいち意味がわかりにくいものです。私もはっきりとはわかっていませんが、現在わかることについ…

統計の基礎3 分布と範囲

統計の基礎3では、データの分布とその範囲について説明します。一般的に数値の集合(データ)は様々な分布を取ります。分布を取るため、データには範囲(幅)が必ず存在します。データの範囲を示す方法について、ココでは説明します。データの範囲を示すパラ…

統計の基礎2 基礎統計量

統計の基礎2では、基礎統計量について説明します。基礎統計量に関してはよくわからないなりに使用されている場合が多いように思います(私も長年よく分からずに使用していました)。統計的なデータの取り扱いでは必ず出てくるものとなりますので、最低限理解…

統計の基礎 1

統計の基礎1では、確率論と統計の関係、データの分布、回帰について説明します。統計学は確率論として整備されたものを基にして、多数のデータの取り扱いに関する方法をまとめた学問です。統計学は優生学を起源としていて、優生学とそれに伴う遺伝学を研究し…

Rの基礎9 基本的な統計と検定

Rの基礎9では、Rでの統計や検定の基礎について説明します。Rは統計を主な対象としたプログラミング言語ですので、統計に関する機能は充実しています。基本統計量(平均値や標準偏差、4分位値など)の計算に用いる関数は全て揃っており、個々の関数を忘れてい…

Rの基礎8 作図

Rの基礎8は、Rでの作図(グラフ作成)について説明します。Rはパッケージなしでも多彩な作図機能を持ち、データを簡単にグラフとして表示することができます。代表的な作図関数として、plot関数やpairs関数、hist関数、boxplot関数などがあり、それぞれ散布…

Rの基礎7 パッケージ/ライブラリ

Rの基礎7は、Rでのライブラリ(パッケージ)の使い方と代表的なパッケージについて説明します。パッケージとは、Rにない機能をあとから足すためのもので、Rにインストールして用います。基本的にはCRANがパッケージの管理を行っており、20000個以上のパッケ…

Rの基礎 6 ディレクトリとファイルの操作

Rの基礎6では、Rでのディレクトリとファイルの操作について説明します。Rでは他の言語やコマンドプロンプトと同様に、ファイルを操作したり、ディレクトリをいじったりすることができます。とはいえ、Rでフォルダを作成する、特定の形式のファイルを作成する…

Rの基礎 5 データフレーム

Rの基礎5では、Rでのデータ取り扱いの重要要素の一つである、データフレームについて説明します。データフレームはExcelで扱う表のようなもので、行と列を持つデータのかたまりです。Rでデータを扱う場合には多用します。データフレームを作成する際には、da…

Rの基礎 4 比較演算子と条件分岐、繰り返し

Rの基礎4では、比較演算子、論理演算子、条件分岐(if文)、繰り返し文(For文)について説明します。比較演算子とはその名の通り、2つの値を比較し、論理型(Boolean)を返す演算子を指します。同値であるかどうかを調べる==と異なる値であることを示す!=が…

Rの基礎 3 ベクターの操作

Rの基礎3では、Rでデータを取り扱う場合の基礎となる、ベクター(Vector)の作り方や使用方法を説明します。Rにおけるベクター(ベクトルと呼ばれることの方が多いような気はします)とは、数値、文字列など、もしくはその集合を指します。数字1つでもベクタ…

Rの基礎2 変数と関数

Rの基礎2では、変数と関数について、作り方や使用方法を説明します。変数は数字や文字を一時的に格納しておくもの、関数は数字や文字を利用して、計算した結果を吐き出してくれるものになります。変数に数字や文字を格納することを代入と呼びます。関数に必…

Rの基礎 1

ICH E9で統計の内容に触れましたので、少し脇道に逸れて統計、の前にRについて説明します。Rを理解することで統計計算をRに肩代わりしてもらうことができます。統計の説明は後ほど行いますが、統計の説明にもRを使用します。Rを使えるようになることが目的と…