多変量解析プログラム まるば

「注」上記の表題をクリックすると本文に戻ります

[質問室]ここには皆さんのご質問と答えを掲載します。ホームページ本文に戻るにはマウスを右クリックして一番上の「前に戻る(B)」をクリックしてください。

[質問1] 二項分布の信頼限界の計算法に関して (ポアソン分布の信頼限界の計算法にも言及)

私は助産学の研究者です。臨床検査に関するある論文を読んでいて、掲載されている信頼区間と私の計算した信頼区間が一致せず、悩んでいます。御忙しいところ恐縮ですが、教えてくださいませんか。

その論文は妊婦のGBSと言う細菌を検出する方法として、培養、従来のPCR、新PCRの3つの方法について評価し新PCRの評価をしています。

培養と比べて従来のPCRのsensitivityは97%(32/33)95%信頼区間82.5−99.8、specificityは100%(79/79)同94.2−100、positive predictive value は32/32同86.9−100、negative predictive valueは98.8(79/80)同92.3−99.9、となっています。

検体数は112検体、対象人数は57人です。
事前確率は29.5%です。

私は、統計学の公式を利用して、p=0.97、n=33、α=0.05、Z(α)=1.96を代入し計算すると、0.912<p<1.028となりました。つまり、信頼区間は91.2〜102.8となりました。

ここで、計算で出てきた信頼区間は100%を超えています。また、分布は正規分布にはなっていません。このようなときにはどうしたら良いのでしょうか。


[お答え]

ご質問者も可笑しいと御考えのように、確かに、この問題での比率pは正規分布をしません。正確には二項分布です。二項分布での正確な計算は出来ますが、面倒なので、普通は正規分布で近似して計算しますので、答えには誤差があります。そして、この例のように信頼区間の限界の推定が100%を超えてしまうとか、または、場合によるとマイナスになつてゼロより小さくなります。そのときには比率はゼロより大きく100%より小さいという理屈で、この場合には上限は100%とします。しかし、これは近似的方法なので、正確に求めたい方のためにはF−分布を使って正確な信頼区間を求める方法があります。

拙著:応用統計学(共立出版刊、絶版、現在は著者自身により刊行、当ホームページに説明あり)の21頁から25頁までに厳密法の解説があります。また、パソコンによって数値的に解く方法がプログラムとして記載してあります。また、この問題の解説は有名な統計学書の Advaced Theory of Statistics I,II,III にあります。余談ですが、この本は統計学の主要な公式が証明とともに載っています。統計学を良く使う学部の図書室では必要な本です。パソコンで解くためのプログラムは拙著に記載されていますが、これは、当時市販されていたシャープの携帯電卓用のプログラムなので、普通のパソコンの言語とは少し仕様が違いますが、行番号とプログラム本体の間にコロン : が入っているのを取り去れば、普通のパソコンのBASICという言語と同じですので、BASICをご存知の方はご理解がいただけるでしょう。

[参考]上述の例では二項分布の信頼区間を正確にもとめるにはF−分布を使うことが分かったのですが、ポアソン分布の区間推定などを厳密に行うにはχ二乗分布を使います。これも応用統計学(上記)にありますし、 Advanced Theory of Statistics にも解説があります。

[備考]ご質問に上記のように御答えしたところ、質問された方から、ご自分で精密計算をされて、納得されたとのご返事を頂きました。

トップに戻る