In [1]:
##########################
# 配置运行环境
##########################

%matplotlib inline

import numpy as np
import pandas as pd
from IPython.display import Math, Latex
from matplotlib import pyplot
import seaborn as sns

# matplotlib 对中文的支持
from matplotlib import font_manager
cn_font = font_manager.FontProperties(fname='msyh.ttf', size=16)  # 网上支持中文

from matplotlib import rcParams
# rcParams['font.family'] = 'Microsoft YaHei'  # 本地支持中文

# 保存为 pdf 格式
rcParams['pdf.fonttype'] = 42
rcParams['figure.figsize'] = (8,5)

# Look pretty...
from matplotlib import style
style.use('ggplot')

# 设置 numpy 的输出精度, 并且阻止使用科学记数法
np.set_printoptions(precision=6, suppress=True)

# 排列组合复习


### 盒子模型

研究将 3 个球放到 3 个盒子里的所有情况，我们考虑三个维度：
- 维度 1：每个盒子中可放的球数。至多 1 个，或数量不限
- 维度 2：球是否可辨。球有编号，或完全一样
- 维度 3：盒子是否可辨。盒子有编号，或完全一样

这三个维度的组合将问题分成了 8 种情况

In [2]:
#############################################
# 情形 1：每盒至多放一个球。球可辨。盒可辨。
#############################################

import itertools

# 我们假定球上贴有 '♠️', '♥️', '♣️', '♦️'，盒子有编号 A, B, C。
boxes = [ 'A', 'B', 'C' ]
balls = [ '♣️', '♦️' ]

print( "情形 1 下，所有可能的放球方案如下" )
cases = [ dict( sorted( zip( permute_boxes, balls ) ) ) for permute_boxes in itertools.permutations( boxes ) ]

# 输出结果
[ print( item ) for item in cases ]
print( "总共有 {:d} 种不同的放法.".format{len(cases)} )
print()

SyntaxError: invalid syntax (<ipython-input-2-9d43841f1a76>, line 16)

我们一般认为上述样本空间中的样本点都是等可能的

In [None]:
#############################################
# 情形 2：每盒至多放一个球。球不可辨。盒可辨。
#############################################

# 我们假定球都是红色，盒子有编号 A, B, C。
boxes = [ 'A', 'B', 'C' ]
balls = [ '♣️', '♣️' ]

print( "情形 2 下，所有可能的放球方案如下" )
cases = [ dict( sorted( zip( permute_boxes, balls ) ) ) for permute_boxes in itertools.permutations( boxes ) ]

# 输出结果
[ print( item ) for item in cases ]
print()

print( "去掉其中重复的，剩下的放球方案如下" )
no_duplicate_cases = []
[ no_duplicate_cases.append( x ) for x in cases if x not in no_duplicate_cases ]

# 输出结果
[ print( item ) for item in no_duplicate_cases ]
print( "总共有 %d 种不同的放法." % len( no_duplicate_cases ) )
print()

In [None]:
#############################################
# 情形 3：每盒至多放一个球。球可辨。盒不可辨。
#############################################

# 我们假定球都是红色，盒子有编号 A, B, C。
boxes = [ 'A', 'A', 'A' ]
balls = [ '♣️', '♦️' ]

print( "情形 3 下，所有可能的放球方案如下" )
# 由于我们是以盒子作为字典的键，因此盒子不可辨时，不能使用字典结构，只能用元组.
cases = [ sorted( list( zip( permute_boxes, balls ) ) ) for permute_boxes in itertools.permutations( boxes ) ]

# 输出结果
[ print( item ) for item in cases ]
print()

print( "去掉其中重复的，剩下的放球方案如下" )
no_duplicate_cases = []
[ no_duplicate_cases.append( x ) for x in cases if x not in no_duplicate_cases ]

# 输出结果
[ print( item ) for item in no_duplicate_cases ]
print( "总共有 %d 种不同的放法." % len( no_duplicate_cases ) )
print()

In [None]:
#############################################
# 情形 4：每盒至多放一个球。球不可辨。盒不可辨。
#############################################

# 显然，只有一种。


print()


#############################################
# 情形 5：每盒球数不限。球可辨。盒可辨。
#############################################

boxes = [ 'A', 'B', 'C' ]
balls = [ '♣️', '♦️' ]

print( "对于情形 5，首先，我们以各个颜色的球在哪个盒子里的形式给出所有不同的放法" )

# 每个球有 3 种放法，所有可能的放法就是每个球放法的 outer product

cases = [ dict( sorted( zip( balls, permute_boxes ) ) ) for 
            permute_boxes in itertools.product( boxes, repeat=len( balls ) ) ]

# 输出结果
[ print( item ) for item in cases ]
print( "总共有 %d 种不同的放法." % len( cases ) )
print()


# 换一种表示形式

print( "我们也可以用每个盒子中都有哪些球的形式给出所有的可能放法" )

flip_cases = []

for case in cases:
    flip = {box: [] for box in boxes}   # 生成以盒子为键，空列表为值的字典

    # 向列表中添加放入相应盒子的球
    for key, value in case.items():
        flip[value].append( key )
    
    flip_cases.append( flip )

[ print( item ) for item in flip_cases ]
print( "总共有 %d 种不同的放法." % len( flip_cases ) )
print()

In [None]:
#############################################
# 情形 6：每盒球数不限。球不可辨。盒可辨。
#############################################

boxes = [ 'A', 'B', 'C' ]
balls = [ '♣️', '♣️' ]

print( "对于情形 6，首先，我们以各个颜色的球在哪个盒子里的形式给出所有不同的放法" )

cases = [ list( sorted( zip( balls, permute_boxes ) ) ) for 
            permute_boxes in itertools.product( boxes, repeat=len( balls ) ) ]

# 输出结果
[ print( item ) for item in cases ]
print()

print( "去掉其中重复的，剩下的放球方案如下" )
no_duplicate_cases = []
[ no_duplicate_cases.append( case ) for case in cases if case not in no_duplicate_cases ]

[ print( item ) for item in no_duplicate_cases ]
print( "总共有 %d 种不同的放法." % len( no_duplicate_cases ) )
print()

In [None]:
# 换一种表示形式

print( "我们也可以用每个盒子中都有哪些球的形式给出所有的可能放法" )

flip_cases = []

for case in cases:
    flip = {box: [] for box in boxes}   # 生成以盒子为键，空列表为值的字典

    # 向列表中添加放入相应盒子的球
    for item in case:
        flip[item[1]].append( item[0] )
    
    flip_cases.append( flip )

[ print( item ) for item in flip_cases ]
print()

print( "去掉其中重复的，剩下的放球方案如下" )
no_duplicate_cases = []
[ no_duplicate_cases.append( case ) for case in cases if case not in no_duplicate_cases ]

[ print( item ) for item in no_duplicate_cases ]
print( "总共有 %d 种不同的放法." % len( no_duplicate_cases ) )
print()

In [None]:
# 情形 7：每盒球数不限。球可辨。盒不可辨。

In [None]:
# 情形 8：每盒球数不限。球不可辨。盒子亦不可辨。

# 古典概型计算

### 例 生日问题

In [None]:
def sameBirthdayProbs(n):
    return 1 - np.exp(-(n * (n-1) / 730))

for i in range(5, 71, 10):
    print('人数为 {:d} 人的班级，有同学同一天过生日的概率为 {:.5f}'.format(i, sameBirthdayProbs(i)))

x = np.arange(2, 100)
pyplot.plot(x, sameBirthdayProbs(x))

下面我们模拟一下

In [None]:
import random
from collections import Counter

def simBirthdayProblem(m: int, n: int):
    """
    
    m: 班级数量
    n: 班级人数
    """
    for k in range(m):
        birthdays = [random.choice(range(1, 366)) for i in range(n)]
        
        # 统计有相同生日的日子的情况
        counting = [(day, num) for day, num in Counter(birthdays).most_common() if num > 1]
        
        print('{} 班同学的生日情况如下 {}，其中有 {} 天有一个以上的同学过生日，分别为 {}.'.format(k, birthdays, len(counting), counting))
        print()

In [None]:
simBirthdayProblem(10, 30)

# 概率模型下事件发生的概率

在 Python 中我们用字典存储一个样本空间及其各个样本点的概率，称为一个概率模型. 例如
```
{'hearts': 0, 'clubs': 0.4, 'diamonds': 0.7, 'spades': 0.2}
```
其中 key 是样本空间中的样本点，value 是样本点的概率.

In [None]:
# 掷一枚公平骰子的模型
fair_die_model = {i: 1/6 for i in range(1, 7)}

# 掷两枚公平骰子的模型
two_fair_dice_model = {(i, j) : 1/36 for i in range(1, 7) for j in range(1, 7)}

事件是样本空间的子集，求事件的概率只需将事件包含的样本点的概率相加即可

In [None]:
def probOfEvent(event: set, model: dict) -> float:
    """
    返回随机事件的概率
    
    event: 随机事件包含的样本点集合
    model: 随机模型，是一个字典对象，key 为样本点，value 为样本点的概率 
    """
    return sum([model[e] for e in event])

例如，我们在掷两枚骰子这一随机模型下，求事件 ''掷出的点数和为 7 点'' 的概率。

In [None]:
# 掷出的点数和为 7 点
event = {(x, y) for x, y in two_fair_dice_model.keys() if x + y == 7}

# 概率
print(probOfEvent(event, two_fair_dice_model))

再比如，我们在天气模型下，求明天下雨或下雪的概率。

In [None]:
weather_model = {'sunny': 1/2, 'rainy': 1/6, 'snowy': 1/3}

event = {'rainy', 'snowy'}

print(probOfEvent(event, weather_model))