In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

▲预先执行的代码

In [2]:
height_list = [185,162,171,155,191,166]
height_series = pd.Series(height_list)
print(height_series)

0    185
1    162
2    171
3    155
4    191
5    166
dtype: int64


▲ 程序清单 2.1 使用列表创建 Series 对象

In [4]:
weight_arr = np.array([72,51,69,55,87,78])
print(weight_arr)
print(type(weight_arr))

[72 51 69 55 87 78]
<class 'numpy.ndarray'>


In [5]:
weight_series = pd.Series(weight_arr)
print(weight_series)

0    72
1    51
2    69
3    55
4    87
5    78
dtype: int32


▲ 程序清单 2.2 使用 NumPy 数组创建 Series 对象

In [6]:
ser = pd.Series([1,2,3], name='some series')
print(ser)

0    1
1    2
2    3
Name: some series, dtype: int64


▲ 程序清单 2.3 指定 Series 类的 name 属性

In [7]:
val = [1,2,3,4,5]
labels = ['a','a','c','d','f']
ser = pd.Series(val, index=labels)
print(ser)

a    1
a    2
c    3
d    4
f    5
dtype: int64


▲  程序清单 2.4 指定参数 index 创建 Series 对象

In [8]:
print(ser.index)

Index(['a', 'a', 'c', 'd', 'f'], dtype='object')


▲ 程序清单 2.5 通过 Series 对象的 index 属性查看索引标签

In [9]:
dic = {'T':185, 'H':162, 'B':171, 'R':155, 'M':191, 'S':166}
ser = pd.Series(dic)
print(ser)

T    185
H    162
B    171
R    155
M    191
S    166
dtype: int64


▲ 程序清单 2.6 使用字典创建 Series 对象

In [10]:
dic = {'a':0,'b':1,'c':2}
a = pd.Series(dic, index=['a','b','c','d'])
print(a)

a    0.0
b    1.0
c    2.0
d    NaN
dtype: float64


▲程序清单 2.7 字典与参数 index 的指定

In [11]:
pd.Series(10, index=['A','B','C'])

A    10
B    10
C    10
dtype: int64

▲程序清单 2.8 使用标量值创建 Series 对象

In [12]:
val = [1,2,3,4,5]


['一', '二', '三', '四', '五']


In [13]:
ser = pd.Series(val, index=list('一二三四五'))
ser

一    1
二    2
三    3
四    4
五    5
dtype: int64

▲ 程序清单 2.9 Series 对象的创建

In [14]:
ser['一']

1

▲ 程序清单 2.10 使用方括号（[ ]）进行索引引用

In [15]:
ser['一':'三']

一    1
二    2
三    3
dtype: int64

▲  程序清单 2.11 使用切片进行索引引用

In [16]:
print(ser['一'])
print(ser.iloc[0])

1
1


▲ 程序清单 2.12 索引标签与位置索引

In [14]:
ser>3

一    False
二    False
三    False
四     True
五     True
dtype: bool

In [17]:
ser[ser > 3]

四    4
五    5
dtype: int64

▲ 程序清单 2.13 对满足指定条件的进行索引引用

In [16]:
ser + 2

一    3
二    4
三    5
四    6
五    7
dtype: int64

▲ リスト 2.14 : シリーズと演算子`＋`

In [17]:
mylist = [1,2,3,4,5]
mylist + [2]

[1, 2, 3, 4, 5, 2]

▲  程序清单 2.15 列表与运算符“+”

In [18]:
for i in range(5):
    mylist[i] += 2
    
print(mylist)

[3, 4, 5, 6, 7]


▲ 程序清单 2.16 对列表的元素进行加法运算

In [19]:
ser * 2

一     2
二     4
三     6
四     8
五    10
dtype: int64

In [20]:
ser / 2

一    0.5
二    1.0
三    1.5
四    2.0
五    2.5
dtype: float64

▲ 程序清单 2.17 Series 对象中每个元素的乘法和除法运算

In [18]:
ser2 = pd.Series([6,7,8,9,10], index=list('一二三四五'))
ser3 = ser + ser2 
print(ser3)

一     7
二     9
三    11
四    13
五    15
dtype: int64


▲ 程序清单 2.18 Series 对象之间的运算

In [22]:
val = [1,2,3,4,5]
a = pd.Series(val)
b = pd.Series(val, index=[0,1,2,3,4])
c = pd.Series(val, index=list('abcde'))
print(a.index)
print(b.index)
print(c.index)

RangeIndex(start=0, stop=5, step=1)
Int64Index([0, 1, 2, 3, 4], dtype='int64')
Index(['a', 'b', 'c', 'd', 'e'], dtype='object')


▲  程序清单 2.19 Series 对象的 index 属性

In [23]:
a = pd.Series(['a','b','c'])
b = pd.Series([1,2,3])
c = pd.Series([1.0,2.0,3.0])
d = pd.Series([True,False,True])
e = pd.Series(['a',1,True])

print(a.dtype, b.dtype, c.dtype, d.dtype, e.dtype )

object int64 float64 bool object


▲ 程序清单 2.20 Series 对象的 dtype 属性

In [24]:
a = pd.Series([1,2,3], index=[1,2,3])
a

1    1
2    2
3    3
dtype: int64

In [25]:
b = pd.Series([1,2,3], index=list('abc'))
b

a    1
b    2
c    3
dtype: int64

▲程序清单 2.21 创建包含不同索引标签的 Series 对象

In [26]:
print(a.loc[1])
print(b.loc['a'])

1
1


▲ 程序清单 2.22 使用 Series 对象的 loc 属性进行索引引用

In [27]:
print(a.iloc[0])
print(b.iloc[0])

1
1


▲ 程序清单 2.23 使用 Series 对象的 iloc 属性进行索引引用

In [28]:
a.iloc[0:1]

1    1
dtype: int64

In [29]:
b.loc['a':'b']

a    1
b    2
dtype: int64

▲ 程序清单 2.24 loc 属性和 iloc 属性的切片

In [19]:
ser = pd.Series([1,1,3,4,'a'])
print(ser.size)

5


▲ 程序清单 2.25 Series 对象的 size 属性

In [20]:
a = pd.Series([1,2,3])
b = pd.Series([1,1,3])
print(a.is_unique)
print(b.is_unique)

True
False


▲ 程序清单 2.26 Series 对象的 is_unique 属性

In [21]:
a = pd.Series([1,2,3])
b = pd.Series(['a','b','c'])
c = pd.Series(['a','a','b'], dtype='category')

print(type(a.values), a.values)
print(type(b.values), b.values)
print(type(c.values), c.values)

<class 'numpy.ndarray'> [1 2 3]
<class 'numpy.ndarray'> ['a' 'b' 'c']
<class 'pandas.core.arrays.categorical.Categorical'> ['a', 'a', 'b']
Categories (2, object): ['a', 'b']


▲ 程序清单 2.27 Series 对象的 values 属性

In [23]:
ser = pd.Series([1,2,3,4,5], index=list('abcde'))
print(ser)

a    1
b    2
c    3
d    4
e    5
dtype: int64


▲程序清单 2.28 Series 对象的创建

In [25]:
ser['a'] = 6
ser['b':'d']
print(ser['b':'d'])
ser['b':'d'] = 7
print(ser)

b    2
c    3
d    4
dtype: int64
a    6
b    7
c    7
d    7
e    5
dtype: int64


▲ 程序清单 2.29 变更 Series 元素值

In [26]:
ser['あ'] = 4
print(ser)

a    6
b    7
c    7
d    7
e    5
あ    4
dtype: int64


▲ 程序清单 2.30 向 Series 对象中添加元素

In [27]:
ser2 = pd.Series([5, 6], index=['咦','唔'])
pd.concat([ser,ser2])

a    6
b    7
c    7
d    7
e    5
あ    4
咦    5
唔    6
dtype: int64

▲ 程序清单 2.31 使用 Series 对象的 append 方法连接对象

In [28]:
pd.concat([ser,ser2],ignore_index=True)

0    6
1    7
2    7
3    7
4    5
5    4
6    5
7    6
dtype: int64

▲程序清单 2.32 使用 append 方法的 ignore_index 参数重新分配索引标签

In [30]:
ser = pd.Series([1,2,3],index=list('abc'))
del ser['a']
ser

b    2
c    3
dtype: int64

▲ 程序清单 2.33 使用 del 语句删除 Series 对象中的元素

In [32]:
ser.drop(index='b', inplace=True)
print(ser)

c    3
dtype: int64


▲ 程序清单 2.34 使用 drop 方法删除 Series 对象的元素

In [33]:
ser = pd.Series([1,1,2,2,2,3], index=list('abcdef'))
ser

a    1
b    1
c    2
d    2
e    2
f    3
dtype: int64

In [41]:
ser.drop_duplicates(keep='first')

a    1
c    2
f    3
dtype: int64

▲ 程序清单 2.35 Series 对象的 drop_duplicates 方法

In [42]:
ser.drop_duplicates(keep=False)

f    3
dtype: int64

▲ 程序清单 2.36 drop_duplicates 方法的 keep 参数

In [43]:
ser = pd.Series([1,np.nan,3,4,np.nan], index=list('abcde'))
print(ser)

a    1.0
b    NaN
c    3.0
d    4.0
e    NaN
dtype: float64


▲ 程序清单 2.37 创建包含缺失数据的 Series 对象

In [44]:
ser.isna()

a    False
b     True
c    False
d    False
e     True
dtype: bool

▲ 程序清单 2.38 Series 对象的 isna 方法

In [45]:
ser[ser.isna()]

b   NaN
e   NaN
dtype: float64

▲ 程序清单 2.39 使用 isna 方法提取缺失值

In [46]:
ser.dropna()

a    1.0
c    3.0
d    4.0
dtype: float64

▲ 程序清单 2.40 Series 对象的 dropna 方法