In [2]:
# 环境
# python3

In [21]:
# pd.Series:一维数组，与ndarray的区别是可以自定义索引
# 可以使用位置或者自定义索引进行数据检索
# 一个一维数组由name、index、data组成
# data可以是一个array-like,iterable,dict,scalar value。
# index是一个array-like or index对象，默认的index是一个RangeIndex对象
# 可以在初始化时指定数据对象
import pandas as pd
import numpy as np

# array-like初始化
# 注意观察默认的Index
ser = pd.Series([1,2,3,4])
print(ser)
ser = pd.Series(np.array([1,2,3,4]))
print(ser)

# 指定data,name,index三个要素
ser = pd.Series(data = [1,2,3,4],index=['a','b','c','d'],name ='test')
print(ser)

# 访问三要素
print(ser.name)
print(ser.index)
print(ser.values)

#修改三要素
ser.name = 'xiugai_name'
ser.index = list('name')
# values不可以修改
# ser.values = [1,2,3,4]
print(ser.name)
print(ser.index)
print(ser.values)

# ser.index的修改方式只是改变了标签索引的名称
# reindex的修改方式是将标签和对应的值作为整体修改，新增标签填充为nan
print(ser.reindex(['n',1,2,3]))


# 使用dict初始化，使用字典的key作为index，value作为values。
# index赋值后是类似reindex的操作，新的index不包含在字典键值中的部分为nan
d = {'red':1,'blue':2,'yellow':3}
ser = pd.Series(d)
print(ser)
ser = pd.Series(d,index=['yellow'])
print(ser)

# 使用可迭代对象初始化
ser = pd.Series(range(5))
print(ser)

0    1
1    2
2    3
3    4
dtype: int64
0    1
1    2
2    3
3    4
dtype: int32
a    1
b    2
c    3
d    4
Name: test, dtype: int64
test
Index(['a', 'b', 'c', 'd'], dtype='object')
[1 2 3 4]
xiugai_name
Index(['n', 'a', 'm', 'e'], dtype='object')
[1 2 3 4]
n    1.0
1    NaN
2    NaN
3    NaN
Name: xiugai_name, dtype: float64
red       1
blue      2
yellow    3
dtype: int64
yellow    3
dtype: int64
0    0
1    1
2    2
3    3
4    4
dtype: int64


In [16]:
# 索引
ser = pd.Series([1,2,3,4],index = ['a','b','c','d'])

# 单数据索引，返回值为数值
# 位置索引
print(ser[0])
# 标签索引
print(ser['a'])

# 多数据索引（对一个可迭代数据的索引），返回值为series
print(ser[[1,2]])
print(ser[['b','c']])

# 切片索引
print(ser[1:3])#左闭右开
print(ser['a':'c'])#左右都包含

# 索引的本质：对index的匹配
print(ser[[True,False,True,False]])

1
1
b    2
c    3
dtype: int64
b    2
c    3
dtype: int64
b    2
c    3
dtype: int64
a    1
b    2
c    3
dtype: int64
a    1
c    3
dtype: int64


In [51]:
# 作为数据容器需要掌握的：增删改查
ser = pd.Series([1,2,3,4],index = ['a','b','c','d'])
print(ser)

# 增：增加Series，或者是Series的list和tuple
a = pd.Series([5,6,7])
b = pd.Series([8,9])
print(ser.append(a))
# 注意：与list不同的是，这里append不改变原数据，只是返回一个副本
print(ser)
# 增加Series的list,ignore_index表示忽略标签
print(ser.append([a,b],ignore_index=True))

# 删：
ser.index = list('abcd')
print(ser)
print(ser.drop('a'))
print(ser.drop(['a','b']))
#反向处理，提取不想删的数据==删除数据
print(ser[['c','d']])#其实是查


# 改：
print(ser)

# 单个位置改
# 通过标签索引改
ser['a'] = 555
print(ser)
# 标签索引的另一种写法
ser.loc['a'] = 666
print(ser)
# 位置索引改
ser.iloc[0]=8988
print(ser)

# 多个位置改
# 多个索引标签改
ser.loc[['a','b']] = [5555,6666]
print(ser)

# 多个索引位置改
ser.iloc[[1,0]] = [7777,8888]
print(ser)



#查
# isin查
# between查
# condition查：> < ==
# bool查
# filter


#where改
#mask改
#isin改
#apply改
#bool-array改
#clip改








a    1
b    2
c    3
d    4
dtype: int64
a    1
b    2
c    3
d    4
0    5
1    6
2    7
dtype: int64
a    1
b    2
c    3
d    4
dtype: int64
0    1
1    2
2    3
3    4
4    5
5    6
6    7
7    8
8    9
dtype: int64
a    1
b    2
c    3
d    4
dtype: int64
b    2
c    3
d    4
dtype: int64
c    3
d    4
dtype: int64
c    3
d    4
dtype: int64
a    1
b    2
c    3
d    4
dtype: int64
a    555
b      2
c      3
d      4
dtype: int64
a    666
b      2
c      3
d      4
dtype: int64
a    8988
b       2
c       3
d       4
dtype: int64
a    5555
b    6666
c       3
d       4
dtype: int64
a    8888
b    7777
c       3
d       4
dtype: int64


In [52]:
#数据容器的nan值处理、重复值处理
#dropna
#fillna
#标签重复duplicated
#数值重复unique


# pd.DataFrame:有索引的二维数组，由行索引index、列索引columns、值values三部分组成
# 

In [53]:
#Series的统计和计算

In [54]:
#Series的IO

In [55]:
#Series的运算