### pandas和NumPy的最大不同就是pandas是用来处理表格型或异质型数据的。而NumPy的代码的风格则相反，它更适合处理同质型的数值类数组数据。

In [13]:
import pandas as pd
from pandas import Series,DataFrame
import numpy as np

#### Series包含数据的索引

In [4]:
obj=pd.Series([4,7,-5,3])
obj

0    4
1    7
2   -5
3    3
dtype: int64

In [5]:
#可以通过value和index分别得到Series对象的值和索引
print(obj.values)
print(obj.index)

[ 4  7 -5  3]
RangeIndex(start=0, stop=4, step=1)


In [6]:
#索引值可以由自己设定
obj2=pd.Series([4,7,-5,3],index=['d','b','c','a'])
print(obj2)

d    4
b    7
c   -5
a    3
dtype: int64


In [9]:
#与NumPy相比，此处可以通过标签来进行索引
print(obj2['a'])
obj2['d']=6
print(obj2[['c','a','d']])  #字符串作为索引列表

3
c   -5
a    3
d    6
dtype: int64


#### 其四则运算符合数组的运算过程，依次计算且不改变索引位置

In [14]:
print(np.exp(obj2))

d     403.428793
b    1096.633158
c       0.006738
a      20.085537
dtype: float64


#### 如果有数据包含再python字典中，可以使用字典生成一个Series

In [16]:
#其索引为字典的键，可以给出键值，使其输出符合你想要的顺序
sdata={'Ohio':35000,'Texas':71000,'Oregon':16000,'Utah':5000}
obj3=pd.Series(sdata)
print(obj3)
states=['California','Ohio','Oregon','Texas']
obj4=pd.Series(sdata,index=states)
print(obj4)

Ohio      35000
Texas     71000
Oregon    16000
Utah       5000
dtype: int64
California        NaN
Ohio          35000.0
Oregon        16000.0
Texas         71000.0
dtype: float64


In [17]:
#我们用isnull和notnull检查数据是否缺失
print(pd.isnull(obj4))
print(pd.notnull(obj4))


California     True
Ohio          False
Oregon        False
Texas         False
dtype: bool
California    False
Ohio           True
Oregon         True
Texas          True
dtype: bool


In [18]:
#其中的+按照运算结果来看应该是求交运算
print(obj4+obj3)

California         NaN
Ohio           70000.0
Oregon         32000.0
Texas         142000.0
Utah               NaN
dtype: float64


#### Series对象自身和其索引都有name属性

In [19]:
obj4.name='population'
obj4.index.name='state'
print(obj4)

state
California        NaN
Ohio          35000.0
Oregon        16000.0
Texas         71000.0
Name: population, dtype: float64
