# `Series`数据对象使用

**构成`Pandas`的三大数据结构基石是：`Series`、`DataFrame`、`Index`。** `Pandas`对于数据的任何处理工作，都是由他们来实现

### `Series`是增强版的数组
`Series`对象是一个**带索引数据**的一维数组，可以视作是增强版的`NumPy`结构

In [1]:
import pandas as pd

data = pd.Series([0.25, 0.5, 0.75, 1])
print(data)

0    0.25
1    0.50
2    0.75
3    1.00
dtype: float64


**索引和数据**

通过`values`属性获取`Series`的数据部分，类型是`numpy`里的`ndarray`数组

通过`index`属性返回索引对象，索引对象是一类数组

In [2]:
print(data.values)
print(type(data.values))
print(data.index)
print(type(data.index))

[0.25 0.5  0.75 1.  ]
<class 'numpy.ndarray'>
RangeIndex(start=0, stop=4, step=1)
<class 'pandas.core.indexes.range.RangeIndex'>


In [3]:
# 通过索引访问指定元素
print(data[1])

0.5


`Series`对象用一种显式定义的索引与数值关联，他的索引可以是任意类型：整数（任意顺序）、字符串、日期类型等等。

In [4]:
# 用字符串作为Series的索引
data = pd.Series([0.25, 0.5, 0.75, 1], index=['aa', 'bb', 'cc', 'dd'])
print(data['dd'])

1.0


这里的分片操作和列表里介绍过的分片是有所区别的，即：**左右两端都包含**

分片操作返回的仍是一个`Series`对象

In [5]:
# 分片
print(data['bb':'dd'])
print(type(data['bb':'dd']))

bb    0.50
cc    0.75
dd    1.00
dtype: float64
<class 'pandas.core.series.Series'>


**使用乱序的整数数组来作为索引**

In [7]:
data = pd.Series([0.25,0.5,0.75,1], index=[3,6,1,4])

print(data[1])
print(data[6])

0.75
0.5


## 用字典生成`Series`
**`Series`也可以看做是一种特殊的字典类型，可以把索引看做是一组键，然后将其一一映射到后面的一组值上**，因此Series也可以用字典来生成

In [8]:
a_dict = {
    'AAA':23423,
    'BBB':43422,
    'CCC':3334
}

a_ser = pd.Series(a_dict)
print(a_ser)
print(a_ser['BBB'])

AAA    23423
BBB    43422
CCC     3334
dtype: int64
43422


在用字典生成`Series`的过程中，可以额外增加一个索引参数作为过滤条件，如果索引参数`index`中含有字典中不存在的键，则新生成的`Series`会含有一个对应值为空的项

In [9]:
a_ser = pd.Series(a_dict,index=['AAA','CCC'])
b_ser = pd.Series(a_dict,index=['BBB','DDD'])

print(a_ser)
print(b_ser)

AAA    23423
CCC     3334
dtype: int64
BBB    43422.0
DDD        NaN
dtype: float64
