## Series 的索引

位置下标索引、标签索引、布尔索引

### 位置下标索引


In [1]:
import pandas as pd
data= [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]
Score=pd.Series(data)
print(Score[0])  
print(Score[[1,2]])

1
1    2
2    3
dtype: int64


### 标签索引

使用形式：Series[’index‘]或Series[[‘index1’,’index2’]]。




In [2]:
import pandas as pd
data={'张飞':93,'关羽':92,'赵云':79,'貂蝉':59}
Score=pd.Series(data)
print(Score['赵云'])  
print(Score[['关羽','貂蝉']]) # Serie是一维，只有一层索引

79
关羽    92
貂蝉    59
dtype: int64


### 布尔索引

形式：Series[布尔列表]


In [3]:
bool=Score>=60  
print(bool)  
print("--------")
print(Score[bool])

张飞     True
关羽     True
赵云     True
貂蝉    False
dtype: bool
--------
张飞    93
关羽    92
赵云    79
dtype: int64


## Series 的切片

位置下标切片 、标签切片




### 位置下标切片

位置下表切片即利用 Series 的元素位置下标进行切片，该方式与我们前面学习的 Numpy 数组的索引的逻辑是相同的。

形式：Series[start:end]，start 即切片的起始位置，end 结束位置。当 start 没有设置时，默认为从第一个元素开始；当 end 没有设置时，默认为最后一个元素位置的下一个位置。


In [4]:
print(Score[1:4])

关羽    92
赵云    79
貂蝉    59
dtype: int64


### 标签切片

标签切片即利用元素的 index 进行切片，该方法更加直观。

形式：Series[index_start：index_end]，index_start 为起始标签，index_end 为结束标签。

值得注意的一点，利用标签切片时，结束标签的数据也能获取到，我们可以简记为左闭右闭原则。该方法的优点就是直观，我们可以根据 index 的含义访问多个连续所需元素。在不知道元素位置的情况下，也能够进行访问所需元素

In [5]:
print(Score['关羽':'貂蝉'])


关羽    92
赵云    79
貂蝉    59
dtype: int64


### loc 和 iloc 索引和切片


Loc 是 series 中的一个方法，它跟标签索引和标签切片效果相同，都是通过寻找 index 来查找相对应的数据。

使用方法：series.loc[index]



In [6]:
print(Score.loc[['赵云','貂蝉']])

赵云    79
貂蝉    59
dtype: int64


In [7]:
score1 = pd.Series(data=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15])
# 位置索引
print(score1.iloc[0])
print(score1.iloc[1])

1
2


## Series 的基本操作


### head() 和 tail()


In [8]:
# 最高分２个
print(Score.head(2))  
# 最低分２个
print(Score.tail(2))

张飞    93
关羽    92
dtype: int64
赵云    79
貂蝉    59
dtype: int64


### 添加数据

In [9]:
Score['刘备']=100  
print(Score)

张飞     93
关羽     92
赵云     79
貂蝉     59
刘备    100
dtype: int64


### series 遍历


In [11]:
data=pd.Series({'曹操':90,'诸葛亮':88})  
for index, value in data.items():
    Score[index]=value
print(Score)

张飞      93
关羽      92
赵云      79
貂蝉      59
刘备     100
曹操      90
诸葛亮     88
dtype: int64


### 删除数据

In [12]:
Score=Score.drop(['关羽','张飞'])  
print(Score)

赵云      79
貂蝉      59
刘备     100
曹操      90
诸葛亮     88
dtype: int64


### 修改数据


In [13]:
Score['曹操']=80  
print(Score)

赵云      79
貂蝉      59
刘备     100
曹操      80
诸葛亮     88
dtype: int64


### 修改索引名

In [14]:
Score.rename(index={'貂蝉':'张辽'},inplace=True)  
print(Score)

赵云      79
张辽      59
刘备     100
曹操      80
诸葛亮     88
dtype: int64


## Series 的聚合函数


### max()/min()


In [15]:
print(Score.max()-Score.min())


41


### mean()

mean() 函数的作用便是求取一组数据的均值。



In [16]:
print(Score.mean())


81.2


### median()
 中位数
 
 median 的作用是求取一组数据的中位数，中位数是一组数据中排在中间位置的数值，即将数据按照大小排序后，中间位置上的数值就是中位数。如果数据中有偶数个数值，则中位数是中间两个数的平均值。中位数代表了一组数据的中间情况，当我们想了解一组数据的中间情况时便可以通过该函数求取中位数。

In [17]:
print(Score.median())


80.0


### var()  方差

var() 函数用于求一组数据的方差，方差用来描述一组数据的分散程度，即各数据与平均数的差的平方的平均值。它通常用来比较两个或多个样本的分散程度，如果方差越大，说明数据分散程度越大，反之则说明数据分散程度越小。

In [18]:
print(Score.var())


224.70000000000005
