『心理学におけるベイズ統計学の展開』 繁桝 算男先生(慶應義塾大学訪問教授)

 

 ベイズ統計学を、通常の統計学より進んだ高度な方法であると紹介している文章を読んだことがある。これは誤解であると思う。ベイズ統計学が人工知能や機械学習のきらびやかな発展を支える有力な方法論であるので、そういう印象を与えるのかもしれないが、実は、ベイズ統計学は素朴できわめてわかりやすい方法である。

 ベイズ統計学は、未知のパラメータ、将来の観測値、モデルや仮説の真偽などわからないことはすべて確率で表現しようとするアプローチである。もともと不確かなものは、その不確定性を精細に評価するしかすべがなく、不確実な事態をひとつに決めつけるのは意思決定を迫られている場合だけである。もともと不確かな仮説の真偽を、“統計的仮説”の採択と棄却の決定問題にすりかえているのが通常の統計学であるが、データの再現可能性についての議論に伴い、統計的仮説検定は最近評判が悪いようである。これに対し、ベイズ統計学は、自己矛盾のない合理的な方法である。この講演では最初になぜそういえるかを説明することから始める。

 ベイズ流の考え方をデータ分析に適用する方法の体系(すなわち、ベイズ統計学)において、データから学習するのはベイズの定理をとおしてである。得られるデータの発生メカニズムの統計モデルを作れば、ベイズの定理によってデータから常に有益な情報を得ることができる。ベイズ統計学では、ベイズの定理を適用した結果(事後分布などのこと)を解析的に解くのが難しい場合が多いが、近年のソフトウェアの発展により、容易に結果を得ることができるようになった。統計のユーザーの仕事は、関心対象のモデル作りであり、モデルを作れば後はコンピュータ任せであると言ってもよいくらいである。

 そのモデルづくりが肝心の部分であり、研究者が最も知恵を絞るべき研究のステップである。よいモデルを作るには関心対象のデータがどのように発生するかについての洞察が必要である。言い換えれば、データを説明するために、どのような構成概念(潜在変数)が必要か、その潜在変数とデータをつなぐパラメータをどのように設定するか、潜在変数の母集団の分布をどのようにとらえるかについて明確な理論的基礎を持つべきである。それが定まっていれば、観測データの発生モデル、潜在変数のモデル、パラメータの事前分布モデルというように階層的にモデルづくりを進めればよい。ベイズ統計学において、階層モデルは普通に考えればそうなるはずの一般的なモデルなのである。

 当日は、心理学のいくつかの領域(脳科学、知能、社会心理学、意思決定、法と裁判など)を念頭において、意味のあるモデル作りとベイズの定理による情報の取り出し方について具体的に説明する予定である。