最近、統計的手法の妥当性がよく分からなくなってしまったので、統計学の礎を築いた学者たち(フィッシャー、ピアソン父子、ネイマン、コルモゴロフ、ケインズ、・・・)がそもそもどのように考えていたのか、にたいへん興味がある。
そこで、Salsburg著『統計学を拓いた異才たち』(日経ビジネス文庫)を読んでみた。
研究者によって、検定のp値の解釈、確率分布の実在性、標本空間と日常との関係、といった根本問題について、見解がかなり違う。
それよりも愕然としたのは、理論家達が挌闘した問題そのものが、今では忘れ去られてしまっていることだ。
統計学があまりに科学に深く根ざしてしまったため、これらの根本問題は未解決のまま、至る所に潜んでいる。
事態はかなり深刻なようだ。
「これは科学史やSTSの格好の問題だ」と思った矢先、先行研究に戒めが書かれていた:
宗像・藤垣「専門家の主観的判断の妥当性検証と正当化に関するベイズ統計的研究」(『科学技術社会論研究』第3号、2004年)の注9:
「(ツヴァネンベルクらの)対象分野に関する徹底的な訓練を経て十分な専門知識を得て専門家と対等に議論する」とする立場は、レビューアーの意見それ自体が新たなエキスパート・ジャッジメントになる」
つまり、科学史家やSTS研究者が、統計的方法の根本問題がどのように科学を蝕んでいるかを探るべく、理論統計学の専門家と同じくらいの能力を身につけて、批判的吟味を行ったとしても、それは専門家の争いに加わっただけのことになってしまう危険がある。
それに比べると、宗像・藤垣両氏の、専門家を公共空間に引っ張り出すための統計的ツールをつくってしまおう、という戦略は大人である。
しかもここでいう公共空間には、(統計学という)expertiseを備えた非専門家がいる。
「専門家が駄目なら、市民に問おう」というのとは違う。
中道であり、王道である。
問題は、専門家が使用した論文やデータを充分に入手できるかという点だ。
それがクリアできれば、今回の原子炉事故においても、専門家の主観バイアスを定量的に表示して、オープンな場での議論に一定の基礎を与えることが可能となるであろう。
ちょっと楽観的過ぎるか?
(以上、Facebook過去記事から再掲した。)
【捕捉1】 フィッシャーのp値は、帰無仮説(間違っていて欲しい仮説)が正しいと仮定した場合について計算され、フィッシャーのもともとの使い方では、p値が充分小さければよし、大き過ぎれば実験計画をやり直せ、という意味合いで用いられた。
このp値を、対立仮説(正しくあって欲しい仮説)が正しい場合について計算したものは「検出力(検定力)」と呼ばれ、
1-第2種誤り確率
に等しい。(この値は、大きくて1に近い方がよい)。
帰無仮説に関するp値だけで検定の有効性を議論するのでは不十分で、対立仮説に関する検出力とセットで議論されなければならないというのが、イェジー・ネイマンとエゴン・ピアソンの基本的な考え方である。
「帰無仮説というのは架空の敵であり、比較検討の結果から棄却されるべきものなのである。だからネイマンによれば、得られたデータから架空の敵を倒・・・すためには、データの検出力が最大となるような比較検討をすべきだ、となるのである」(p.171)。
【捕捉2】
仮説検定に関する事態の深刻さが、第11章の174頁以降に書かれている:
「現在教えられている仮説検定の方法では・・・、ネイマンの重要な洞察 ― 架空の敵である帰無仮説を検定するためにはうまく定義された対立仮説が必要であるという洞察 ― を認識できなくなっている」。
【捕捉3】エゴン・ピアソンはイェジー・ネイマンの仮説検定理論の発端は、
分布が正規分布に従っているかどうかのχ二乗適合検定に関するものであった:
「一組のデータに対する適合度検定において、有意な結果が得られなかった場合、データが正規分布に従っていることをどうやって確信したらいいのだろうか?」
この問いが、
「検定で有意でない結果が得られたとき何が言えるのか」「ある仮説が間違いだと言えなかったとき、その仮説が正しいと結論付けることができるのか」
という問いへと一般化され、上述の検出力の理論の構築が始まるのである。
0 件のコメント:
コメントを投稿