# 測度論的確率論の初歩で使う内容をPythonで

In [22]:
# べき集合を作る関数
def powerset(iterable):
    iterable = list(iterable)
    L = []
    n = len(iterable)
    counter = 2**n
    for i in range(counter):
        element_i = []
        bin_i = bin(i)[2:].zfill(n)
        mapping_index = list(bin_i)
        element_i = [iterable[j] for j in range(len(mapping_index)) if int(mapping_index[j]) == 1]
        L.append(element_i)
    temp = []
    for l in L:
        l = frozenset(l)
        temp.append(l)
    result = frozenset(temp)
    return result


In [23]:
# 適当な集合 Omega と、Omegaのべき集合を作成
Omega = frozenset(["a","b","c","d","e"])
F = powerset(Omega)
F

frozenset({frozenset(),
           frozenset({'b', 'e'}),
           frozenset({'d'}),
           frozenset({'a'}),
           frozenset({'a', 'd', 'e'}),
           frozenset({'c', 'd'}),
           frozenset({'a', 'c'}),
           frozenset({'a', 'c', 'd'}),
           frozenset({'a', 'c', 'd', 'e'}),
           frozenset({'b'}),
           frozenset({'b', 'c', 'e'}),
           frozenset({'a', 'b'}),
           frozenset({'a', 'b', 'c'}),
           frozenset({'b', 'd'}),
           frozenset({'b', 'c'}),
           frozenset({'b', 'c', 'd'}),
           frozenset({'a', 'b', 'c', 'd'}),
           frozenset({'e'}),
           frozenset({'d', 'e'}),
           frozenset({'a', 'b', 'd', 'e'}),
           frozenset({'c'}),
           frozenset({'a', 'e'}),
           frozenset({'a', 'b', 'e'}),
           frozenset({'c', 'e'}),
           frozenset({'a', 'c', 'e'}),
           frozenset({'a', 'b', 'c', 'e'}),
           frozenset({'c', 'd', 'e'}),
           frozenset({'b', 'd', 'e'})

In [24]:
# シグマ加法性をチェックする関数
def check_sigma_additivity(S, F):
    "Sは集合、FはSの部分集合族。Fがシグマ加法性を満たすかどうかをチェックする"
    if S not in F:
        print("NG")
    elif frozenset() not in F:
        print("NG")
    counter = 0
    for f1 in F:
        for f2 in F:
            if f1.union(f2) not in F:
                print("NG")
                break
        else:
            counter += 1
            continue
        break
    if counter == 2**len(S):
        print("OK")

In [25]:
# べき集合はシグマ加法性を満たす
check_sigma_additivity(Omega, powerset(Omega))

OK


In [26]:
# Omega の部分集合A を含む最小のシグマ加法族を作る関数
def mim_sigma(Omega,A):
    if not A.issubset(Omega):
        print("ERROR: {0} is not subset of {1}".format(A, Omega))
    else:
        return frozenset([frozenset([]), Omega, A, Omega.difference(A)])

In [27]:
S = frozenset(["a", "b","c", "d"])
A = frozenset(["a", "c"])
mim_sigma(S, A)


frozenset({frozenset(),
           frozenset({'b', 'd'}),
           frozenset({'a', 'c'}),
           frozenset({'a', 'b', 'c', 'd'})})

In [28]:
# F上の関数が可測空間(S, F)の確率測度になっているかチェックする関数
def check_prob(S, F, P):
    epsilon = 1e-10
    if abs(P(S) - 1) >= epsilon:
        return "NG"
    if abs(P(frozenset())) >= epsilon:
        return "NG"
    counter = 0
    for f1 in F:
        for f2 in F:
            if f1.intersection(f2):
                pass
            else:
                if P(f1.union(f2)) - (P(f1) + P(f2)) <= epsilon:
                    pass
                else:
                    return "NG"
                    break
        else:
            counter += 1
            continue
        break
    if counter == 2**len(S):
        return "OK"


In [29]:
# これまでの内容でコイントスをモデリングする
Omega_coin = frozenset(["表", "裏"])
F_coin = powerset(Omega_coin)
F_coin

frozenset({frozenset(),
           frozenset({'表'}),
           frozenset({'裏'}),
           frozenset({'表', '裏'})})

In [30]:
# コイントスの確率を決める関数を作る
def prob_of_coin_flip(f):
    if f == frozenset(["表"]):
        return 99/100
    elif f == frozenset(["裏"]):
        return 1/100
    result = 0
    for i in f:
        result += prob_of_coin_flip(frozenset([i]))
    return result

In [31]:
check_prob(Omega_coin, F_coin, prob_of_coin_flip)

'OK'

In [32]:
# サイコロ投げの例
Omega_dise = frozenset(["①", "②", "③", "④", "⑤", "⑥"])
F_dise = powerset(Omega_dise)
def prob_of_throwing_dise(f):
    if f == frozenset(["①"]):
        return 1/6
    elif f == frozenset(["②"]):
        return 1/6
    elif f== frozenset(["③"]):
        return 1/6
    elif f == frozenset(["④"]):
        return 1/6
    elif f == frozenset(["⑤"]):
        return 2/9
    elif f == frozenset(["⑥"]):
        return 1/9
    result = 0
    for i in f:
        result += prob_of_throwing_dise(frozenset([i]))
    return result


In [33]:
prob_of_throwing_dise(frozenset())

0

In [34]:
# 確率変数
Omega_dise = frozenset(["①", "②", "③", "④", "⑤", "⑥"])
def X_dise(w):
    if w == "①":
        return 1 
    if w == "②":
        return 2 
    if w == "③":
        return 3 
    if w == "④":
        return 4 
    if w == "⑤":
        return 5 
    if w == "⑥":
        return 6 
X_dise("②")

2

In [35]:
# 確率変数Xに誘導される確率分布
def prob_x(B):
    result = 0
    for i in B:
        
            

SyntaxError: unexpected EOF while parsing (<ipython-input-35-418f3ab47750>, line 6)

確率分布の正体は、可測空間(R, B(R))上の確率測度です。  
元の可測空間(S, F)上の確立Pを、確率変数Xを用いて（R, B(R))に"橋渡しした"というイメージで捉えることができると思います。  
確率変数を用いることで、元の確率空間(S, F, P)がどのような(扱いにくい)空間だったとしても、扱いやすい確率変数(例えば(R, B(R))値確率変数)を用いることで、性質がよく調べられた扱いやすい確率空間に引きずり出して議論することができます。   
とくに、ボレロ集合族B(R^d)は様々な性質が既に調べれていて扱いやすいので、実用上は(R^d, B(R^d)))値確率変数がよく利用されます。  
  
よく確率分布は、事象が取り得る確率の値の一覧であるというように書かれていることがあります。  
これが全くの間違いというわけではないと思うので、これでスッキリ腹落ちするという場合は問題ないと思います。  
しかし私の場合は、漠然と言いたいことはわかるけどずっとモヤモヤしてました。  
B(R)上の確率測度なので、転じて一覧

In [None]:
check_prob(Omega_dise, F_dise, prob_of_throwing_dise)

数学でいう"確率"という言葉は日常語におけるそれとは意味が異なるものと理解しています。  
数学でいう、"確率"とは、あくまで可測空間上で定められた(確率測度の条件を満たす)関数のことであり、その関数に事象Aを入力したときの出力の値を「事象Aが起こる確率」と呼んでいるにすぎない。  
個々の出力値が具体的にどうあるべきか、といったことは数学の世界の外の話になる。  
"コインを投げて表が出る確率"は具体的にどうあるべきか？という議論は、数学の枠内では扱わない(扱えない)。  
  
ではどうするかというと、それは人間が決めるのである。過去の経験や、取得したデータから類推して決めるのである。  
は？という感じになる人もいるかもしれないが、そうなのである。  
上の例でいうと、"コインを投げて表が出る確率"というのは数学が決めることではなく、人間が決めることである。  
"サイコロを投げて1の目が出る確率"というは、人間が決めることである。  
"今日日本で生まれた赤ん坊の身長が、将来180cmを超える確率"は、人間が決めることである。  
もう少しちゃんと言うと "いま考えている確率変数が従う確率分布は何なのか？"という問題は、数学によって決めることではなく、過去の経験を参考にしたり、データを集めてその振舞いを調査したりした上で、適切と信じられるもの考えて、人間が決めるのである。  
  
「いやそんなことはない、コイン投げで表が出る確率は1/2だと学校で習ったじゃないか！」という意見があるかもしれない。  
しかしあれは実は、「各事象の出方は一様分布に従う」という前提が勝手に設定された世界なのである。  
教科書のどこかに「ただし、各事象の出方は同様に確からしいとする」という文言があったことを覚えていないだろうか。  
あれは、裏表が出る確率はそれぞれ等しく1/2ということにしますよ！ということを宣言しているのである。なぜそうするか？とか、その妥当性については何も言っていない。  

しかし、ひとたびそれを前提として決めてしまえば、そこから先は数学の確率論の枠組みを利用して様々なことを知ることができる。  
例えば、"サイコロの各出目の確率"を決めれば、"偶数の目が出る確率"や"4以上の目が出る確率"などは、経験や勘などではなく、数学の力で知ることができる。  
"コインの裏表の確率"を決めれば、"10回連続で表が出る確率"を知ることができる。  
"日本の成人男性の身長は、平均170cm、分散33の正規分布に従う"と決めれば、"ある子供が将来180cm以上になる確率"を知ることができる。  
