臨床試験における統計解析:仮説検定とは何ですか?

翻訳の学習記録

私は治験の勉強を始めてから統計解析という手法があることを知りました。初めて統計解析の章を和訳したときは用語も概念もほぼ知識がない状態で、必死に調べながら何とか文章の形にしたという記憶があります。

翻訳者として適切な表現で訳すためには統計の基礎を知り、臨床試験に統計解析がどのように用いられるのかを理解する必要があると感じています。

今回は仮説検定について考えてみます。

仮説検定とは?

臨床試験で得られたデータは、統計解析を行って初めて意味を持つようになります。データは偶然得られたものではなく、新薬の効果によるものであることをエビデンスに基づいて判断する必要があります。

得られたデータから新薬の効果を判断するには仮説検定という方法が使われます。

臨床試験に参加する患者さんの背景(重症度や合併症など)はさまざまであるため、比較検討するグループが偏らないように設定して新薬の効果を調べます。

設定した2つのグループのうち1つのグループでは新薬Aを使い、もう1つのグループではプラセボBを使うとします。 AはBより治療効果が優れている、つまりA>Bとなるような差があることを証明したいとき、差がないことを否定することによって差があることを証明しようとします。

このように、「差がある」という仮説と「差がない」という仮説の2つの仮説を立てて解析し、仮説が正しいか正しくないかを推測することを仮説検定(hypothesis testing)と言います。

統計用語では、「差がない」という仮説のことを帰無仮説(null hypothesis)と呼びます。 「差がある」という仮説のことを対立仮説(alternative hypothesis)と呼びます。

帰無仮説を否定して対立仮説を証明する

帰無仮説とは?

帰無仮説とは最終的に否定したい仮説です。ここでは、「差がない」、つまり「AとBでは治療効果は同じ」という仮説のこと。

対立仮説とは?

対立仮説とは本当に証明したい仮説です。ここでは、「差がある」、つまり「AはBより治療効果が優れている」仮説のこと。

帰無仮説に対して仮説検定を行った結果、帰無仮説が正しい可能性は非常に低いことが証明された場合に、帰無仮説を否定して「AとBでは治療効果は同じではない」と結論付けます。

P値と有意水準

それではどうやって帰無仮説が正しくないことを証明するのでしょうか。

ここで登場するのがP値(p value)と有意水準(level of significance)です。

P値とは、臨床試験で得られたデータについて検定を行い、帰無仮説が正しいときにそのデータが現れる確率のこと。算出されたP値が十分に小さければ、帰無仮説は正しくないと判断することができます。

P値がある値より小さければ帰無仮説は棄却できるとあらかじめ決めておきます。このとき判断基準となるのが有意水準であり、その値をα値(alpha value)と呼びます。算出されたP値がα値より小さいことを示したうえで、帰無仮説を棄却し、対立仮説を採択するのです。

臨床試験ではα値を0.05または0.01とすることが多いようです。 P値が有意水準(α値)を下回るとき、「(統計学的)有意差(significant difference)が認められた」と判断します。

有意差が認められなかったときの結論は?

帰無仮説を棄却できると、対立仮説が正しいということが言えます。

では、帰無仮説が棄却できない場合はどう判断するのでしょうか。

実は私はこの点を勘違いしていました。帰無仮説が棄却できない場合は帰無仮説を採用して「AとBでは治療効果は同じ」と判断するものと思っていました。ですがこれは間違いでした。

「帰無仮説を棄却しない」=「帰無仮説を採択する」とはなりません。 帰無仮説を棄却できないとき、つまり有意差が認められなかったときは、対立仮説が正しいとは言えないという結論になります。

帰無仮説を棄却できるほど十分なエビデンスが得られなかったということに過ぎないのです。

「AとBで差がない⇒同じ」と結論付けることはできないので要注意です。

まとめ

  • 臨床試験で仮説検定を行うには「帰無仮説」と「対立仮説」を立てる必要がある。
  • 帰無仮説は否定したい仮説、対立仮説は採択したい仮説である。
  • 帰無仮説を否定できない場合であっても、帰無仮説が正しいとは言えない。

臨床試験における仮説検定の手順とP値の意味、仮説検定の結果の解釈について理解が進みました。

次回は、優越性・非劣性・同等性試験について考えていきます。

コメント