# **2.9_Series**

**Pandas优势在于：由于它是构建在NumPy之上的，所以继承了NumPy高性能的数组计算功能，同时它还提供了更多复杂精细的数据处理功能**

### 一、安装与导入Pandas

1. 安装Pandas

在CMD或终端，输入pip install pandas

2. 导入Pandas

In [3]:
import pandas as pd

In [4]:
import numpy as np

### 二、Series

Series和NumPy的一维数组很相似

#### (一)、创建Series

创建Series对象，用Series类，参数传入一个列表

**Series第一个字母S要大写，说明调用的是Series类的构造函数，会返回给我们一个Series类的对象**

In [7]:
s1 = pd.Series([5, 17, 3, 26, 31])
a1 = np.array([5, 17, 3, 26, 31])
print(s1)
print()
print(a1)

0     5
1    17
2     3
3    26
4    31
dtype: int64

[ 5 17  3 26 31]


**Series和NumPy数组的区别在于:不止展示了有什么元素，元素左边还专门展示对应的index，最后一行的dtype还展示了Series里元素的类型**

#### (二)、获得Series的元素和索引

1. 如果想单独获得Series的所有元素值，可以用values属性

In [8]:
s1.values

array([ 5, 17,  3, 26, 31], dtype=int64)

2. 如果想单独获得Series的所有索引值，可以用index属性

In [9]:
s1.index

RangeIndex(start=0, stop=5, step=1)

**这里index属性返回的值表示说，index从0开始，到5结束且不包括5，范围内每个index增加1**

#### (三)、索引和切片操作

对Series同样可以进行索引、切片操作，这个和Python列表、NumPy一维数组都是非常相似的

In [11]:
s1[2]

3

In [12]:
s1[1: 3]

1    17
2     3
dtype: int64

### 三、Series的特别之处

数组的索引和Python列表一样，都是表示位置的整数，从0开始逐步加1

Series的索引，默认也是表示位置的整数，但是也可以自己指定。

创建带标签索引的Series对象，后面跟一个index参数，放入标签索引组成的列表。比如：

In [15]:
s1 = pd.Series([5, 17, 3, 26, 31],
              index=["a", "d", "b", "c", "e"])
s1

a     5
d    17
b     3
c    26
e    31
dtype: int64

元素对应的索引变成了a, d, b, c, e

***一般单独说索引，指标签索引***

#### (一)、用两种索引取值

这时对Series元素取值的时候，可以用位置索引，也可以用标签索引。相当于多了一种索引方法

In [17]:
print(s1[2])
print(s1["b"])

3
3


#### (二)、用两种索引切片

可以用位置索引切片，也可以用标签索引切片

**用标签索引切片的时候，结束值是包含的**

In [19]:
s1[1: 3]

d    17
b     3
dtype: int64

In [21]:
s1["d": "c"]

d    17
b     3
c    26
dtype: int64

#### (三)、用索引获得任意元素

要得到多个元素组成的Series，可以在方括号里放一个列表，里面包含想选出的元素的索引，这样顺序就不受限制了

In [23]:
s1[[2, 3, 1]]

b     3
c    26
d    17
dtype: int64

In [24]:
s1[["b", "c", "d"]]

b     3
c    26
d    17
dtype: int64

#### (四)、loc和iloc

***当用整数作为标签索引时，索引取值时按照标签索引，切片时按照位置索引***

In [26]:
s2 = pd.Series([5, 17, 3, 26 ,31], 
              index=[1, 3, 5, 7, 9])

In [27]:
s2[5]

3

In [29]:
s2[1: 3]

  s2[1: 3]


3    17
5     3
dtype: int64

***这种不一致让人困惑，也很容易造成错误，所以Pandas提供了两个更好的索引取值或切片方法，叫loc和iloc***

***但未来版本，切片时按照标签索引***

loc表示用标签索引去取值或切片，iloc表示用标位置索引去取值或切片

In [34]:
s2.iloc[1: 3]

3    17
5     3
dtype: int64

In [35]:
s2.loc[1: 3]

1     5
3    17
dtype: int64

#### (五)、创建自定义索引Series的另一种方式

除了可以通过index这个可选参数指定标签索引，另一种创建自定义索引Series的方法是：给Series这个构造函数直接传入一个字典

字典的键，就会自动变成值所对应的标签索引

In [32]:
s3 = pd.Series({"青菜": 4.1, "白萝卜": 2.2, "西红柿":5.3, "土豆":3.7, "黄瓜": 6.8})
s3

青菜     4.1
白萝卜    2.2
西红柿    5.3
土豆     3.7
黄瓜     6.8
dtype: float64

#### (六)、查看标签是否存在

要想知道某个标签是否在Series里，可以用in,它会返回一个布尔值，来告知我们是否存在

In [33]:
"青菜" in s3

True

#### (七)、修改Series里的值

如果你想更改某个标签对应的值，可以像字典那样，方括号里面放上标签去更新。

**如果标签也是整数，最好不要直接放方括号，因为可能一时区分不出来方括号里的整数指的是标签索引还是位置索引，更好的方法还是用loc和iloc**

**更好的习惯是，不管标签是不是整数，都用loc和iloc**

In [38]:
s3.loc["青菜"] = 4.5
s3.iloc[0] = 4.5

### 四、根据条件筛选Series元素

In [39]:
s3 > 5

青菜     False
白萝卜    False
西红柿     True
土豆     False
黄瓜      True
dtype: bool

1. 与NumPy数组类似

    比如: s3 > 5，会返回一个有标签索引和布尔值组成的Series

In [40]:
s3[s3 > 5]

西红柿    5.3
黄瓜     6.8
dtype: float64

    通过布尔值数组，可以筛选出符合这个条件的元素所组成的Series

2. 结合逻辑运算，让筛选逻辑更复杂

    要增加筛选条件复杂度，也可以利用&, |, ~这些逻辑符号，实现与、或、非运算

In [41]:
s3[(s3 > 5)|(s3 < 3)]

白萝卜    2.2
西红柿    5.3
黄瓜     6.8
dtype: float64