ベイズ統計

以下は基本。

以下は、今日知りたかったことの周辺をグルグル回っている感じ。

2005年に書いた話(→http://d.hatena.ne.jp/ka-lei-do-scope/20051021#p1)とも関係ありそう。以下は、この辺も知らないといけないように思われること。

これは、知りたかったこと(というか、納得できずにいること)に近い気が。

以下、疑問。「確率空間」の項目には、以下のように書いてある。「確率空間とは、確率を議論しようとしている全ての事象について、それらがランダムに発生する要因をすべて集めてきて、個々の要因にたいして確率を与えたものである」。「ランダムさ」とは結局何か?「ランダム」という概念が先になければ、確率空間を定義できないのか? しかし確率空間という概念なしに、「ランダムさ」を定義できるのか?

おそらく、こういう記事を書くうえで、確率モデルで説明しようとする現象の性質と、確率モデルの性質を、区別する必要がある(が「確率空間」の記述では区別されていない)。「ランダム」とは前者の性質を語る用語であり、後者の性質としては測度空間であるとだけ言えば良い。

(ランダムさは、「現象の性質」というよりも、母集団から標本を採るときの性質であって、実験のプロセス、行為に関わる性質だと考えた方が良い?→wikipedia:母集団

という理解のもとで、「ベイズ主義」の項を読んでいたら、以下のところが理解できなくなった。「ベイズの定理を用いて、新しい証拠に照らして命題の尤もらしさを改訂していく方法がベイズ推定である。例えばラプラスはこの方法で土星の質量を見積もった。しかし頻度主義による確率の定義では、確率論はこの問題に適用できない。土星の質量はランダム変数ではないからである。「土星の質量とはどんな母集団から抽出されたものか?」という疑問に答えられなければ、これは頻度主義者の議論の対象にはならない。さらに極端な例を挙げると、「ランダムに振った2つのさいころの目の和が6のとき、さいころの目として2が出ていた確率」は、数学的には簡単に定義可能だが、頻度主義からは意味がない(「1回目のさいころの目が2のとき、2つの目の和が6になる確率」なら定義できる)。」

(互いに区別できるような)二つのサイコロを何度か振って、目の対を記録したものを母集団として、条件付き確率を与えればいいだけなのでは?なぜ「頻度主義からは意味がない」のか?(単に「ベイズ確率と頻度確率」の項目を書いた人の勘違い?)

疑問2。事前確率× 尤度関数 = 事後確率:
 P(B) \times P(A|B)/P(A) = P(B|A)
この計算のなかで「尤度関数を掛ける」ということと、「新たな情報(Aだと分かった)を得る」ということの対応をどう理解すればよいか?

  • 「事後確率」の項の「サイコロを使う例」
  • ベイズ推定」の項の「どちらのボウルにクッキーがあるか」