# 2 分布

## 2.1 表示直方图

&emsp;&emsp;首先，创建一个类 `Hist`，用于表示直方图并提供操作方法。

``` python
class Hist(_DictWrapper):
    """
    用于表示直方图，即展示每个值到频数的图形

    参数可以是序列、字典、pandas 的 Series 对象，或者另一个 Hist 对象
    """
    def Freq(self, x):
        """
        获取与值x关联的频率

        Args:
            x: number value

        Returns:
            int frequency
        """
        return self.d.get(x, 0)

    def Freqs(self, xs):
        """
        获取一系列值的频率
        """
        return [self.Freq(x) for x in xs]

    def IsSubset(self, other):
        """
        检查此直方图中的值是否为其子集给定直方图中的值
        """
        for val, freq in self.Items():
            if freq > other.Freq(val):
                return False
        return True

    def Subtract(self, other):
        """
        从此直方图中减去给定直方图中的值
        """
        for val, freq in other.Items():
            self.Incr(val, -freq)
```

&emsp;&emsp;初始化一个 Hist 对象：

In [2]:
import thinkstats2

hist = thinkstats2.Hist([1, 2, 2, 3, 5])
hist

Hist({1: 1, 2: 2, 3: 1, 5: 1})

&emsp;&emsp;调用 `Hist` 对象的 `Freq` 方法，返回传入的参数值的频数。

In [3]:
hist.Freq(2)

2

&emsp;&emsp;使用方括号操作符的结果也是一样。

In [5]:
hist[2]

2

&emsp;&emsp;如果传入的参数值不存在，频数则是 0。

In [6]:
hist.Freq(4)

0

&emsp;&emsp;`Values` 方法返回 Hist 对象中值的未排序列表。

In [7]:
hist.Values()

dict_keys([1, 2, 3, 5])

&emsp;&emsp;若要按序遍历 `Hist` 中的值，可以使用内建函数 `sorted`。

In [9]:
for val in sorted(hist.Values()):
    print(val, hist.Freq(val))

1 1
2 2
3 1
5 1


## 2.2 绘制直方图