In [1]:
import numpy as np
import pandas as pd

## 创建一个pandas的series

### 通过python list去创建

In [2]:
s1 = pd.Series([1,2,3,4])

In [3]:
s1

0    1
1    2
2    3
3    4
dtype: int64

可以看到创建的Series中包含两部分数据一个是index，一个是数据

In [4]:
s1.values

array([1, 2, 3, 4], dtype=int64)

其实他的数据就是一个array

In [5]:
s1.index

RangeIndex(start=0, stop=4, step=1)

### 通过np.arange创建series

In [6]:
s2 = pd.Series(np.arange(10))

In [7]:
s2

0    0
1    1
2    2
3    3
4    4
5    5
6    6
7    7
8    8
9    9
dtype: int32

### 通过Python的字典创建Series

In [8]:
s3 = pd.Series({'a':1,'b':2,'c':3})

In [9]:
s3

a    1
b    2
c    3
dtype: int64

In [10]:
s3.values

array([1, 2, 3], dtype=int64)

In [11]:
s3.index

Index(['a', 'b', 'c'], dtype='object')

### 自行指定index创建Series

In [12]:
s4 = pd.Series([1,2,3,4], index=['a','b','c','d'])

In [13]:
s4

a    1
b    2
c    3
d    4
dtype: int64

In [14]:
s4.values

array([1, 2, 3, 4], dtype=int64)

In [15]:
s4.index

Index(['a', 'b', 'c', 'd'], dtype='object')

## 对于Series的简单操作

In [16]:
s4['a']

1

可以传入条件

In [17]:
s4[s4>2]

c    3
d    4
dtype: int64

Series和Python的字典联系紧密,我们可以通过python的字典创建我们的Series

同样我们也可以通过Series创建字典。

In [18]:
s4.to_dict()

{'a': 1, 'b': 2, 'c': 3, 'd': 4}

In [19]:
s5 = pd.Series(s4.to_dict())

In [20]:
s5

a    1
b    2
c    3
d    4
dtype: int64

In [21]:
index_1 = ['A','B','C','D']

我们可以改变我们的index值

In [22]:
s5.index = index_1

In [23]:
s5

A    1
B    2
C    3
D    4
dtype: int64

In [24]:
index_2 = ['A','B','C','D','E']
s6 = pd.Series(s5, index=index_2)

In [25]:
s6

A    1.0
B    2.0
C    3.0
D    4.0
E    NaN
dtype: float64

如果index数量大于了value数量，那么没有value的位置会变成NaN

我们可以通过isnull() 来查看。

In [26]:
pd.isnull(s6)

A    False
B    False
C    False
D    False
E     True
dtype: bool

In [27]:
s6.notnull()

A     True
B     True
C     True
D     True
E    False
dtype: bool

In [28]:
s6

A    1.0
B    2.0
C    3.0
D    4.0
E    NaN
dtype: float64

我们还可以给series起名字

In [29]:
s6.name = 'demo'

In [30]:
s6

A    1.0
B    2.0
C    3.0
D    4.0
E    NaN
Name: demo, dtype: float64

对于Series的index的name我们也可以起名字

In [31]:
s6.index.name = "demo index"

In [32]:
s6.index

Index(['A', 'B', 'C', 'D', 'E'], dtype='object', name='demo index')

In [33]:
s6.values

array([  1.,   2.,   3.,   4.,  nan])

values并不存在name属性