ICH E9 臨床研究における統計解析の原則 3

ICH E9は臨床研究における統計解析の原則に関するガイドラインです。3では結果の比較とサンプルサイズについてまとめています。

結果の比較方法として、優越性と同等性/非劣性、用量応答性が挙げられています。優越性(Superiority)はプラセボや同効能の有効成分と比較して試験製剤の効能などが優れていることを示す方法です。一般的にはプラセボとの比較を行いますが、深刻な病状の患者を対象とする臨床研究ではプラセボ投与に倫理的問題があるため、有効な治療(同効能有効成分など)を用いるとされています。同等性/非劣性(Equivalence/Non-inferiority)は同効能の有効成分と同等、もしくは効果が劣っていないことを示す方法です。同等性試験は一般的に同じ有効成分で、非劣性試験は別の有効成分を用いるのが一般的だと思われます。同等性試験は通常同有効成分のジェネリック医薬品で実施されます。多回投与などの試験に負いても、非劣性試験での検証が行われることがあるようです。非劣性試験では、有効成分、同効能医薬品だけでなく、プラセボを含めて検証することで、効果の絶対値を求める場合もあります。同等性/非劣性試験では、優越性試験と比較して被験者の除外などによるバイアスの影響を受けやすいとされています。同等性/非劣性ともに同等/非劣性とみなすことができる信頼区間を両側(同等性)、片側(非劣性)に設定し、信頼区間内に収まることをもって同等・非劣性とします。用量応答性研究はICH E4に従い実施します。

Group Sequential Designsは中間解析を行う研究デザインを指します。治験開始前には中間解析の統計計画・方法を定めておき、中間解析は独立データモニタリング委員会などを設置して、治験の盲検を維持した上で実施します。

治験の目的を達成するために、必要十分な被験者数を評価項目、統計手法、帰無仮説、第一/第二の過誤を基に設定します。イベントの発生率(AEの発生率などを指していると思います)が評価項目である場合には、検証のための十分な発生数があることが重要となります。被験者数(サンプルサイズ、例数)の計算法と計算結果は計画書に記載し、根拠となるばらつきの情報は文献や予備研究から得ます。被験者数は第一の過誤を5%、第二の過誤を10-20%(検出力は80-90%)となるように設定します。同等性/非劣性試験では、信頼区間を基に被験者数を決定します。中間解析の場合には初期に被験者数を固定できない場合があるようです。このような場合には、最大の被験者数を固定しておき、完了手順として定めるようです。