In [1]:
import numpy as np
import pandas as pd

# Sereis对象的创建

Series类型可以由如下类型创建：
- 标量值，index表达Series类型的尺寸
- 列表，index与列表元素个数一致
- 字典，键值对中的键即索引，index从字典中进行选择操作
- ndarray，索引和数据都可以通过ndarray类型创建
- 其他函数，如range()函数等

In [2]:
# 从标量创建
s = pd.Series(1, index=['a', 'b', 'c', 'd'])
s

a    1
b    1
c    1
d    1
dtype: int64

In [3]:
# 从列表创建，可以省略index
s = pd.Series([1, 2, 3, 4], ['a', 'b', 'c', 'd'])
s

a    1
b    2
c    3
d    4
dtype: int64

In [4]:
# 从字典创建
s = pd.Series({'a':1, 'b':2, 'c':3, 'd':4})
s

a    1
b    2
c    3
d    4
dtype: int64

In [5]:
# 从ndarray创建
s = pd.Series(np.arange(1,5), index=np.arange(9, 5, -1))
s

9    1
8    2
7    3
6    4
dtype: int32

# Series的基本操作

Series类型包含index和values两部分

Series类型的操作类似ndarray类型
- 索引方法相同，采用[]
- Numpy中的运算和操作可用于Series类型
- 可以通过自定义索引的列表进行切片
- 可以通过自动索引进行切片，如果同时存在自定义索引，则一同被切片

Series类型的操作类似Python字典
- 通过自定义索引访问
- 保留字in操作
- 使用get()方法

In [6]:
# 获取索引和数据
s = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])

print('索引：', s.index)
print('数据：', s.values)
s.values

索引： Index(['a', 'b', 'c', 'd'], dtype='object')
数据： [1 2 3 4]


array([1, 2, 3, 4], dtype=int64)

In [7]:
# 自动和自定义两套索引可以并存，但不能混用
print(s[0])
print(s['a'])

1
1


In [8]:
# 切片
s[1:3]

b    2
c    3
dtype: int64

In [9]:
# 类似字典的操作
s = pd.Series([1, 2, 3, 4], ['a', 'b', 'c', 'd'])

print(s['a'])
print('b' in s)
print(3 in s)
print(s.get('d'))
print(s.get('f', 5))

1
True
False
4
5


# Series的对齐操作

Series在运算中会自动对齐不同索引的数据

In [10]:
a = pd.Series([1, 2, 3, 4], ['a', 'b', 'c', 'd'])
b = pd.Series([5, 6, 7], ['c', 'd', 'e'])

a + b

a     NaN
b     NaN
c     8.0
d    10.0
e     NaN
dtype: float64

# Series的name属性

- Series对象和索引都可以有一个名字，存储在name属性中
- Series对象可以随时修改并立即生效

In [11]:
s = pd.Series([1, 2, 3, 4], ['a', 'b', 'c', 'd'])

print(s.name)
print(s.index.name)

s.name = '系列'
s.index.name = '索引'

print(s.name)
print(s.index.name)

s

None
None
系列
索引


索引
a    1
b    2
c    3
d    4
Name: 系列, dtype: int64