In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# MultiIndex
多级索引也称为层次化索引（hierarchical indexing），是指数据在一个轴上（行或者列）拥有多个（两个以上）索引级别。之所以引入多级索引，在于它可以使用户能以低维度形式处理高维度数据。这句话可能不太好理解，下面举个栗子：

### 多级columns的DataFrame(隐式MultiIndex)

In [24]:
df = pd.DataFrame(
    np.random.randint(0, 100, (4, 6)),
    index=["学生" + i for i in "ABCD"],
    columns=[
        ["数学", "数学", "语文", "语文", "英语", "英语"],
        ["期中", "期末", "期中", "期末", "期中", "期末"],
    ],
)
df

Unnamed: 0_level_0,数学,数学,语文,语文,英语,英语
Unnamed: 0_level_1,期中,期末,期中,期末,期中,期末
学生A,99,46,0,90,92,58
学生B,66,49,38,6,58,77
学生C,22,85,26,25,78,72
学生D,11,34,82,72,22,18


In [25]:
df["数学"]

Unnamed: 0,期中,期末
学生A,99,46
学生B,66,49
学生C,22,85
学生D,11,34


In [26]:
df["数学"]["期中"]

学生A    99
学生B    66
学生C    22
学生D    11
Name: 期中, dtype: int32

## pd.MultiIndex.from_arrays

A new MultiIndex is typically constructed using one of the helper methods MultiIndex.from_arrays(), MultiIndex.from_product() and MultiIndex.from_tuples().

In [16]:
array = [[1, 1, 2, 2], ["red", "blue", "pink", "green"], [2.0, 1.4, 0.5, 4.8]]
mi = pd.MultiIndex.from_arrays(arrays=array, names=("number", "color", "float"))
mi

MultiIndex([(1,   'red', 2.0),
            (1,  'blue', 1.4),
            (2,  'pink', 0.5),
            (2, 'green', 4.8)],
           names=['number', 'color', 'float'])

## 获取数据

In [17]:
mi[0]

(1, 'red', 2.0)

In [19]:
mi[0][:2]

(1, 'red')

In [20]:
mi[:2]

MultiIndex([(1,  'red', 2.0),
            (1, 'blue', 1.4)],
           names=['number', 'color', 'float'])

In [23]:
mi[1:3][:2]

MultiIndex([(1, 'blue', 1.4),
            (2, 'pink', 0.5)],
           names=['number', 'color', 'float'])

## 属性

In [3]:
mi.names

FrozenList(['number', 'color'])

In [4]:
mi.nlevels

2

In [5]:
mi.levshape

(2, 4)

In [6]:
mi.levels

FrozenList([[1, 2], ['blue', 'green', 'pink', 'red']])

In [7]:
mi.codes

FrozenList([[0, 0, 1, 1], [3, 0, 2, 1]])

# Panel 新版弃用了

class  pandas.Panel(data=None, items=None, major_axis=None, minor_axis=None)

- 作用: 存储3维数组的Panel结构
- 参数：
    - data: ndarray或者dataframe
    - items: 索引或类似数组的对象,axis=0
    - major_axis: 索引或类似数组的对象,axis=1
    - minor_axis: 索引或类似数组的对象,axis=2