In [None]:
'''
Series类型

   1、Series类型是由一组数据及与之相关的数据索引组成。(索引与数据之间一一对应)
   
   注意1：
      Series中若不指定索引参数index，则将会自动生成索引；反之也可以通过参数index指定索引
      
   2、Series类型可有以下类型创建
   
      Python列表、标量值(即单个值)、Python字典、ndarray、其他函数
   
   3、Series类型的基本操作（默认在axis = 0对应的轴进行操作）
      
      Series类型包括索引和值两部分，与Python字典类型类似，其操作也相似
      Series类型操作类似ndarray类型
'''

In [None]:
'''
一、创建Series类型
'''

In [1]:
# 使用列表创建Series类型
# 若不指定索引，则自动生成索引

import pandas as pd 

df = pd.Series([9, 8, 7, 6]) 
df

0    9
1    8
2    7
3    6
dtype: int64

In [2]:
# 手动添加指定索引值

df1 = pd.Series([9, 8, 7, 6], index = ['a', 'b', 'c', 'd']) # 可省略index，仅适用于索引列表即可
df1

a    9
b    8
c    7
d    6
dtype: int64

In [3]:
# 利用标量值创建Series类型

df2 = pd.Series(25, index = ['a', 'b', 'c']) # 不可省略index，必须指定
df2

a    25
b    25
c    25
dtype: int64

In [4]:
# 利用字典创建Series类型一

# 未指定index索引参数，则字典中的键-值分别对应索引和数据
df3 = pd.Series({'a': 0, 'b': 1, 'c': 2}) # Series中数据与索引一一对应，与字典中的键值对很类似
df3

a    0
b    1
c    2
dtype: int64

In [5]:
# 利用字典创建Series类型二

# 若指定index索引参数，则索引按照指定值生成，而不是字典中的键，另外多余字典键的指定索引(如："d")以NaN填充
df4 = pd.Series({'a': 0, 'b': 1, 'c': 2}, index = ['c', 'b', 'a', 'd'])
df4

c    2.0
b    1.0
a    0.0
d    NaN
dtype: float64

In [9]:
# 利用ndarray创建Series类型
import numpy as np

df5 = pd.Series(np.arange(10, 0, -1)) # 也可以通过index参数指定索引值
df5

0    10
1     9
2     8
3     7
4     6
5     5
6     4
7     3
8     2
9     1
dtype: int32

In [9]:
# 利用函数创建Series类型

df6 = pd.Series(range(5, 0, -1))
df6

0    5
1    4
2    3
3    2
4    1
dtype: int32

In [None]:
'''
二、Series类型的基本操作
'''

In [10]:
df7 = pd.Series([9, 8, 7, 6], index = ['a', 'b', 'c', 'd']) # 以列表类型生成Series类型
df7

a    9
b    8
c    7
d    6
dtype: int64

In [11]:
# 查看索引

df7.index

Index(['a', 'b', 'c', 'd'], dtype='object')

In [12]:
# 查看数据

df7.values

array([9, 8, 7, 6], dtype=int64)

In [13]:
# 利用索引获取对应的值

df7['b'] # 获取多个值df7[['b', 'c']]，以列表形式将多个索引包含起来

8

In [15]:
# 通过自动生成的索引获取对应的值
# 该处由于指定索引，故为显示自动索引

df7[0] # 获取多个df7[[1,2]]或者df7[1:3]

9

In [16]:
# 利用自动索引和自定义索引相结合获取对应值
# 使用混合方式获取数据则无法获得自动索引(如：0)对应的值，返回NaN，故二者只能单独使用。

df7[['b', 'c', 0]]

b    8.0
c    7.0
0    NaN
dtype: float64

In [10]:
# 与NumPy库的运算类似的操作：
# 缩阴方法相同，均采用“[]”
# NumPy运算和操作可用于Series
# 可通过自定义索引的列表进行切片

df8 = pd.Series([9, 8, 7, 6], ['a', 'b', 'c', 'd'])
print(df8[3], df8[:3], df8[df8 > df8.median()], np.exp(df8), sep = '\n----------\n')

6
----------
a    9
b    8
c    7
dtype: int64
----------
a    9
b    8
dtype: int64
----------
a    8103.083928
b    2980.957987
c    1096.633158
d     403.428793
dtype: float64


In [16]:
# 与Python字典类似的操作：
# 通过自定义索引访问
# 使用保留字“in”判断索引是否在Series的索引中（只能够判断自定义索引，而不会判断指定索引时未显示的自动索引）
# 使用“.get()”方法从Series中提取指定索引对应的值，若该索引不存在，则返回指定的值（如：100）；若该索引存在，则返回对应的值则

print(df8['b'], 'c' in df8, 0 in df8, df8.get('f', 100), sep = '\n------------\n')

8
------------
True
------------
False
------------
100


In [24]:
# Series的对齐操作 —— Series对象在运算中会自动对齐不同索引的数据

# 两个Series对象相加，则索引相同的值相加，索引不同则返回NaN，返回值为两个Series对象索引的并集
df9 = pd.Series([1, 2, 3, 4], ['c', 'b', 'a', 'e'])
df8 + df9

a    12.0
b    10.0
c     8.0
d     NaN
e     NaN
dtype: float64

In [29]:
# Series类型的name属性 —— Series对象和索引都可以有一个名字，存储在属性.name中

df8.name = 'Series 对象' # 可将其看作Series对象的名字，也可以将其看作值的名字（因为Series对象仅包含一维数据） 
df8.index.name = 'Series 索引'
df8

Series 索引
a    9
b    8
c    7
d    6
Name: Series 对象, dtype: int64

In [32]:
# Series类型的修改 —— Series对象可随时修改并即时生效

df8['a', 'b'] = 0 # 修改a、b索引对应的值
df8.name = 'Series' # 修改Series对象的名字
df8

Series 索引
a    0
b    0
c    7
d    6
Name: Series, dtype: int64

In [30]:
df8

Series 索引
a    9
b    8
c    7
d    6
Name: Series 对象, dtype: int64