# `DataFrame`数据对象使用

`DataFrame`可以被看做是既有灵活的行索引，又有灵活列索引的二维数组

`DataFrame`是有序排列的若干`Series`对象，而这些`Series`对象都有相同的索引

In [1]:
import pandas as pd

area_dict = {'California':423967,'Texas':695662,'New York':141297}
population_dict = {'California':1.3, 'Texas':0.98, 'New York':1.13}
area = pd.Series(area_dict)
population = pd.Series(population_dict)
print(area)
print(population)

California    423967
Texas         695662
New York      141297
dtype: int64
California    1.30
Texas         0.98
New York      1.13
dtype: float64


### `DataFrame`反映列索引到`Series`的映射
字典的值，即一组`Series`对象，共享了行索引`（index）`，而这个字典的一组键，则构成了这个`DataFrame`对象的列索引`（columns）`

In [2]:
states_df = pd.DataFrame({'area': area, 'population': population})
print(states_df)

              area  population
California  423967        1.30
Texas       695662        0.98
New York    141297        1.13


获取`DataFrame`对象的行、列索引值

In [3]:
print(states_df.index)
print(states_df.columns)

Index(['California', 'Texas', 'New York'], dtype='object')
Index(['area', 'population'], dtype='object')


### 常见创建方式
* 通过`Series`对象字典创建
* 因为`DataFrame`是特殊的字典，所以可以通过字典列表创建
* 因为字典是带有行列索引的二维数组结构，所以可以通过`Numpy`二维数组创建

In [4]:
# 通过字典列表创建
data = [{'a':13,'b':4},{'a':'CHN','b':'USA'}]
df = pd.DataFrame(data,index=['c','d'])
print(df)

     a    b
c   13    4
d  CHN  USA


In [6]:
# 通过Numpy二维数组创建
import numpy as np

df = pd.DataFrame(np.random.rand(3,2),
                  columns=['foo','bar'],
                  index=['a','b','c'])
print(df)

        foo       bar
a  0.686314  0.899928
b  0.941289  0.244236
c  0.117099  0.912696
