# Histogram | 直方图

[TOC | 目录](./TOC.md)

展示数据分布形状与中心位置\
对应数值维度: 分布形态, 集中趋势.

In [None]:
import numpy as np

# import matplotlib as mpl
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm


In [None]:

plt.rcParams["font.family"] = ['Microsoft YaHei']


In [None]:
# 设置参数
# plt.style.use('seaborn-white')
plt.figure(figsize=(12, 6))

# 模拟数据 - 收入区间(千美元)
income_bins = np.arange(0, 126, 5)  # 0-125千美元，每5千美元一个区间

# 模拟1973年和1987年的百分比数据
# 假设1987年低收入区间比例更高，高收入区间比例更低
percent_1973 = np.exp(-0.03 * income_bins[:-1]) * 5
percent_1987 = np.exp(-0.025 * income_bins[:-1]) * 6

# 调整使1987年低收入更高，高收入更低
percent_1987[:10] = percent_1973[:10] * 1.2  # 前10个区间(0-50k)增加20%
percent_1987[-5:] = percent_1973[-5:] * 0.8  # 后5个区间(100k+)减少20%

# 绘制直方图
width = 2  # 柱状图宽度
plt.bar(income_bins[:-1], percent_1973, width=width, alpha=0.7, 
        label='1973年', color='blue', edgecolor='black')
plt.bar(income_bins[:-1] + width, percent_1987, width=width, alpha=0.7, 
        label='1987年', color='red', edgecolor='black', linestyle='--')

# 添加标签和标题
plt.title('1973年与1987年美国家庭收入对比', fontsize=14)
plt.xlabel('收入(千美元)', fontsize=12)
plt.ylabel('每千美元的百分率', fontsize=12)
plt.legend(fontsize=12)

# 调整坐标轴
plt.xlim(0, 125)
plt.xticks(np.arange(0, 126, 10))
plt.grid(axis='y', alpha=0.3)

plt.tight_layout()
plt.show()