# 用 Matplotlib 绘制酒的类型和质量视图

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
% matplotlib inline
import seaborn as sns
sns.set_style('darkgrid')

wine_df = pd.read_csv('winequality_edited.csv')

### 为红葡萄酒条柱高度和白葡萄酒条柱高度创建数组
记住，颜色和质量等级的每个组合有一个条柱。每个条柱的高度基于这个颜色与这个质量等级的样本的比例。
1. 红葡萄酒条柱比例 = 每个质量等级的数量 / 红葡萄酒样本的总数
2. 白葡萄酒条柱比例 = 每个质量等级的数量 / 白葡萄酒样本的总数

In [None]:
# 获取每个等级和颜色的数量
color_counts = wine_df.groupby(['color', 'quality']).count()['pH']
color_counts

In [None]:
# 获取每个颜色的总数
color_totals = wine_df.groupby('color').count()['pH']
color_totals

In [None]:
# 将红葡萄酒等级数量除以红葡萄酒样本总数，获取比例
red_proportions = color_counts['red'] / color_totals['red']
red_proportions

In [None]:
# 将白葡萄酒等级数量除以白葡萄酒样本总数，获取比例
white_proportions = color_counts['white'] / color_totals['white']
white_proportions

### 在柱状图上绘制比例
设置每个等级组的 x 坐标位置和每个条柱的宽度。

In [None]:
ind = np.arange(len(red_proportions))  # 组的 x 坐标位置
width = 0.35       # 条柱的宽度

现在创建图表。

In [None]:
# 绘制条柱
red_bars = plt.bar(ind, red_proportions, width, color='r', alpha=.7, label='Red Wine')
white_bars = plt.bar(ind + width, white_proportions, width, color='w', alpha=.7, label='White Wine')

# 标题和标签
plt.ylabel('Proportion')
plt.xlabel('Quality')
plt.title('Proportion by Wine Color and Quality')
locations = ind + width / 2  # x 坐标刻度位置
labels = ['3', '4', '5', '6', '7', '8', '9']  # x 坐标刻度标签
plt.xticks(locations, labels)

# 图例
plt.legend()

操作没有成功，因为缺少第 9 等级的红葡萄酒值。虽然这个数字是 0，但是绘图时仍然需要写出。运行下面的框之后，再运行上面最后两个框。

In [None]:
red_proportions['9'] = 0
red_proportions