# Pandas库的Series类型

## 创建Series的方法

In [1]:
import numpy as np
import pandas as pd

* 标量值 
> index表示Series类型的尺寸

In [2]:
print(pd.Series(3,index=list('ABC')))  #不能省略idex

A    3
B    3
C    3
dtype: int64


* Python列表
> index与列表元素个数一致

In [3]:
print(pd.Series(list('hello')))

0    h
1    e
2    l
3    l
4    o
dtype: object


* ndarray
> 索引和数据都可以通过ndarray类型创建

In [4]:
print(pd.Series(np.zeros(5)))

0    0.0
1    0.0
2    0.0
3    0.0
4    0.0
dtype: float64


In [5]:
print(pd.Series(np.arange(5)))

0    0
1    1
2    2
3    3
4    4
dtype: int32


In [6]:
print(pd.Series(np.arange(5),index=np.arange(9,4,-1)))

9    0
8    1
7    2
6    3
5    4
dtype: int32


* 其他
> range()函数等

In [7]:
print(pd.Series(tuple('hello')))

0    h
1    e
2    l
3    l
4    o
dtype: object


In [8]:
print(pd.Series(range(5)))

0    0
1    1
2    2
3    3
4    4
dtype: int64


* Python字典
> 键值对中的“键”是索引，index从字典中进行选择操作

In [9]:
print(pd.Series({'name':'diego','age':12}))

name    diego
age        12
dtype: object


In [10]:
print(pd.Series({'name':'diego','age':12},index=['age','name']))

age        12
name    diego
dtype: object


## Series类型的基本操作

* Series类型包括index和values两部分
* Series类型的操作类似ndarray类型
* Series类型的操作类似Python字典类型

##### Series数据结构对象

In [11]:
import pandas as pd
obj=pd.Series([6,2,-2,0],['a','b','c','d'])
print(obj,type(obj),'\n',obj.values,'\n',obj.index)

a    6
b    2
c   -2
d    0
dtype: int64 <class 'pandas.core.series.Series'> 
 [ 6  2 -2  0] 
 Index(['a', 'b', 'c', 'd'], dtype='object')


* 自动索引和自定义索引并存

In [12]:
print(obj['b'])         
print(obj[1])            

2
2


* 两套索引并存，但不能混用  

In [13]:
print(obj[['a','c',0]]) 
print(obj[['a','c','b']])

a    6.0
c   -2.0
0    NaN
dtype: float64
a    6
c   -2
b    2
dtype: int64


Passing list-likes to .loc or [] with any missing label will raise
KeyError in the future, you can use .reindex() as an alternative.

See the documentation here:
https://pandas.pydata.org/pandas-docs/stable/indexing.html#deprecate-loc-reindex-listlike
  return self.loc[key]


#### Series类型的操作类似ndarray类型：
* 索引方法相同，采用[]
* NumPy中运算和操作可用于Series类型
* 可以通过自定义索引的列表进行切片
* 可以通过自动索引进行切片，如果存在自定义索引，则一同被切片

In [14]:
#Series对象的numpy风格操作
'''与标量相乘
应用数学函数
索引值不会参与运算'''
obj=pd.Series([6,2,-2,0])
print(obj*2)
'''使用布尔值数组进行过滤'''
print(obj>0,obj[obj>0])
'''Series本质上是numpy的数组，numpy的数组处理函数可直接对Series进行处理'''
print(np.sign(obj))

0    12
1     4
2    -4
3     0
dtype: int64
0     True
1     True
2    False
3    False
dtype: bool 0    6
1    2
dtype: int64
0    1
1    1
2   -1
3    0
dtype: int64


In [15]:
print(obj)

0    6
1    2
2   -2
3    0
dtype: int64


In [16]:
print(obj[3])
print(obj[:3])

0
0    6
1    2
2   -2
dtype: int64


In [17]:
np[np>np.median()]

TypeError: median() missing 1 required positional argument: 'a'

In [None]:
np.exp(obj)     #e的*次方

#### Series类型的操作类似Python字典类型：
* 通过自定义索引访问
* 保留字in操作
* 使用.get()方法


In [None]:
print(obj)
print('c' in obj)
print(6 in obj)

In [None]:
obj.get('e',100)

#### Series类型对齐操作
* Series+Series
* Series类型在运算中会自动对齐不同索引的数据

In [None]:
a=pd.Series([1,2,3],['c','d','e'])
b=pd.Series([9,8,7,6],['a','b','c','d'])
a+b     

## Series类型的name属性
* Series对象和索引都可以有一个名字，存储在属性name中


In [None]:
print(obj)

In [None]:
print(obj.name)
print(obj.index.name)

In [None]:
obj.name='Series对象'
obj.index.name='索引列'
print(obj)

## Series类型的修改
* Series对象可以随时修改并即刻生效

In [None]:
obj['d']=5
obj.name='Series'
print(obj)

## Series类型
* Series是一维带“标签”数组   index_0-->data_a
* Series基本操作类似ndarray和字典，根据索引对齐

In [None]:
#Series与字典
'''没有数据的补NAN
没有索引的排除'''
obj=pd.Series({'e':5,'b':3,'f':4},index=['a','b','c'])
print(obj)