## 示例：随机采样和排列

假设你想要从一个大数据集中随机抽取（进行替换或不替换）样本以进行蒙特卡罗模拟（Monte Carlo simulation）或其他分析工作。“抽取”的方式有很多，这里使用的方法是对Series使用sample方法：

In [1]:
import pandas as pd
import numpy as np

In [10]:
# Hearts, Spades, Clubs, Diamonds

suits = ['H', 'S', 'C', 'D']
card_val = (list(range(1, 11)) + [10] * 3) * 4
base_names = ['A'] + list(range(2, 11)) + ['J', 'K', 'Q']
cards = []


for suit in ['H', 'S', 'C', 'D']:
    cards.extend(str(num) + suit for num in base_names)

    
deck = pd.Series(card_val, index=cards)

现在我有了一个长度为52的Series，其索引包括牌名，值则是21点或其他游戏中用于计分的点数（为了简单起见，我当A的点数为1）：

In [4]:
deck[:13]

AH      1
2H      2
3H      3
4H      4
5H      5
6H      6
7H      7
8H      8
9H      9
10H    10
JH     10
KH     10
QH     10
dtype: int64

现在，根据我上面所讲的，从整副牌中抽出5张，代码如下：

In [5]:
def draw(deck, n=5):
    return deck.sample(n)

In [6]:
draw(deck)

6H     6
7S     7
QS    10
9H     9
JS    10
dtype: int64

假设你想要从每种花色中随机抽取两张牌。由于花色是牌名的最后一个字符，所以我们可以据此进行分组，并使用apply：

In [8]:
get_suit = lambda card: card[-1] # last letter is suit

deck.groupby(get_suit).apply(draw, n=2)

C  8C     8
   QC    10
D  3D     3
   JD    10
H  QH    10
   2H     2
S  7S     7
   QS    10
dtype: int64

或者，也可以这样写：

In [9]:
deck.groupby(get_suit, group_keys=False).apply(draw, n=2)

KC     10
10C    10
6D      6
4D      4
QH     10
AH      1
3S      3
7S      7
dtype: int64