# Series的属性

In [1]:
import pandas as pd
import numpy as np

## Series.T

转置Series对象，转置后还是它自己，这个属性没什么用

In [2]:
s1 = pd.Series(['a', 'b', 'c'])
s1

0    a
1    b
2    c
dtype: object

In [3]:
s1.T

0    a
1    b
2    c
dtype: object

## Series.array

返回的是ExtensionArray对象，ExtensionArray是Pandas库中的一种数据类型，用于存储特殊类型的数据，如日期、字符串等。它扩展了pandas的数据结构，并且提供了比其他数据类型更高的性能和效率。这里其实就是pandas的一种特有数据类型，如果想把series对象完全转化为numpy数组，得用Series.numpy()

In [4]:
# 这里显示的就是PandasArray对象
s1.array

<PandasArray>
['a', 'b', 'c']
Length: 3, dtype: object

## Series.at

用于单个值的获取或者替换时速度比用iloc快，它也就只有这一个用处了，用处不大，只能针对单个的值，而且它接受的是索引标签，而不是索引位置，区别与Series.iat接受的是整数索引位置，类似于loc和iloc的区别

In [5]:
s1.at[1]

'b'

## Series.attrs

返回的是一个字典对象，"Series.attrs"是pandas中的一个属性，它允许用户为pandas Series对象附加元数据（键/值对）。

In [6]:
# 使用"attrs"属性附加元数据：
s1.attrs["duke"] = "forstdu"
# 现在已经附加了键值对信息
s1.attrs['duke']

'forstdu'

In [7]:
# 这时候再来查看附加的属性，返回的是一个字典对象
s1.attrs

{'duke': 'forstdu'}

## Series.axes

返回行标签的列表,这个列表里只有一个元素，元素对象是RangeIndex,与Series.index的区别的就是index属性返回的直接就是RangeIndex对象，而不是一个列表

In [8]:
s1.axes

[RangeIndex(start=0, stop=3, step=1)]

## Series.dtype

Series.dtype"是pandas中的一个属性，用于表示pandas的"Series"数据结构中数据的数据类型（如int64, float64, object等），这是老版本的用法，新版本已经用Series.dtypes代替

In [9]:
# "dtype('O')"是pandas中的数据类型，表示Python的"object"类型，通常用于存储任意类型的数据（例如字符串、列表、字典等）
s1.dtype

dtype('O')

## Series.dtypes

同上，这是新版的用法

In [10]:
s1.dtypes

dtype('O')

## Series.flags

"Series.flags"是pandas中的一个属性，用于描述pandas的"Series"数据结构的内存状态，返回一个"PandasBlockManager's Flags"对象，该对象包含有关数据结构的内存状态的信息，如数据是否可以被写入或是否共享内存等。

In [11]:
# "allows_duplicate_labels=True"是pandas中的一个参数，用于在创建pandas数据结构时允许标签重复。当该参数设置为"True"时，可以使用重复的标签，而当该参数设置为"False"时，不允许使用重复的标签。默认情况下，该参数的值为"False"，即不允许使用重复的标签。
s1.flags

<Flags(allows_duplicate_labels=True)>

## Series.hasnans

检查是否有缺失值，如果有，就返回Ture

In [12]:
# 创建一个包含空值的Series对象
s2 = pd.Series(['a', 'b', None, 'c'])
s2

0       a
1       b
2    None
3       c
dtype: object

In [13]:
# 检查是否有缺失值
s2.hasnans

True

## Series.iat

跟Series.at差不多，区别就是iloc和loc类似

In [14]:
s2.iat[0]

'a'

## Series.iloc

传入单个的整数值，返回的是单个元素对象，传入位置列表，切片，布尔数组，元组返回的是一个新的series对象，还可以传入一个可调用函数,注意:这里的整数指的是标签的顺序位置，而不是标签名，比如行标签是[1,3,5],所对应的位置是[0,1,2]

### 传入单个整数

In [15]:
s3 = pd.Series([None, 'b', 'c', 'd', 'e'])
s3.iloc[2]

'c'

In [16]:
# 此时返回的是一个字符串
type(s3.iloc[2])

str

In [17]:
# 这里可以看出输入的整数参数指的是行标签的位置，而不是指的行标签的数字
pd.Series(['a', 'b', 'c'], index=[1, 3, 5]).iloc[1]

'b'

### 传入整数列表或数组

In [18]:
# 传入一个列表[0, 2]
s3.iloc[[0, 2]]

0    None
2       c
dtype: object

In [19]:
# 此时返回的是一个新的Series对象
type(s3.iloc[[0, 2]])

pandas.core.series.Series

### 传入一个切片

In [20]:
s3.iloc[1:3]

1    b
2    c
dtype: object

### 传入一个布尔数组，注意：布尔数组的长度必须和Series长度一样

In [21]:
# 只返回为True的地方
s3.iloc[[True, True, False, True, False]]

0    None
1       b
3       d
dtype: object

### 传入一个元组

这里Series只能用(1,)类型的元组，因为是一维的，元组参数更深入的用法看后面DataFrame里的用法

In [22]:
s3.iloc[(3,)]

'd'

### 传入一个可调用函数

可调用函数可以用于对数据进行动态索引，比如对于满足特定条件的数据进行索引,比如下面的代码用于选出索引位置大于2的数据，记住这个动态的好处，有时候很有用

In [23]:
pd.Series([10, 22, 13, 5, 2, 88]).iloc[lambda s: s.index > 2]

3     5
4     2
5    88
dtype: int64

### IndexError报错

如果传入的整数索引参数超过了Series的长度，就会报IndexError错误，切片例外，传入的切片范围是可以超过Series的长度的

## Series.index

返回行标签对象RangeIndex

In [24]:
s3.index

RangeIndex(start=0, stop=5, step=1)

In [25]:
# 将Rangeindex对象转换为列表
list(s3.index)

[0, 1, 2, 3, 4]

## Series.is_monotonic_decreasing

返回布尔值，判断Series的值是否是单调递减

In [26]:
s4 = pd.Series(['c', 'b', 'a'])

In [27]:
# 字母降序也能判断
s4.is_monotonic_decreasing

True

In [28]:
# 试一试有相同字母或者数字时会怎样,可以看到也是可以的
pd.Series(['c', 'b', 'b', 'a']).is_monotonic_decreasing

True

## Series.is_monotonic_increasing

同上，只是这是单调递增

## Series.is_unique

返回布尔值，判断Series的值是否都是唯一的

In [29]:
pd.Series(['a', 'b', 'b']).is_unique

False

In [30]:
# 缺失值重复也会判断为False
pd.Series([None, None, 'a']).is_unique

False

## Series.loc

与Series.iloc类似,但是有细微区别，loc接受的是行标签的名，iloc是行标签的位置，而且loc切片时是首尾包含的，iloc和python语法一样，切片是不包含尾的

### 传入一个行标签名

In [31]:
pd.Series([1, 2, 3], index=['a', 'b', 'c']).loc['a']

1

In [32]:
# 这里就可以看出指的是行标签名
pd.Series(['a', 'b', 'c'], index=[1, 2, 4]).loc[4]

'c'

### 传入一个行标签名的列表或者数组

In [33]:
pd.Series([1, 2, 3], index=['a', 'b', 'c']).loc[['a', 'c']]

a    1
c    3
dtype: int64

### 传入一个切片

In [34]:
# 注意看这里的切片是包含尾部的
pd.Series([1, 2, 3, 4], index=['a', 'b', 'c' ,'d']).loc['b':'d']

b    2
c    3
d    4
dtype: int64

### 传入一个布尔数组，数组长度必须和Series长度一样

In [35]:
pd.Series([1, 2, 3, 4], index=['a', 'b', 'c' ,'d']).loc[[True, False, True, False]]

a    1
c    3
dtype: int64

### 传入一个索引相同的布尔值Series对象

传入的Series对象值必须是布尔类型，且索引要和原Series索引一一对应，一摸一样，这样就会筛选出传入Series对象里位置为True的位置

In [36]:
# 两个index必须一样
pd.Series([1, 3, 5], index=['a', 'b', 'c']).loc[pd.Series([True, False, True], index=['a', 'b', 'c'])]

a    1
c    5
dtype: int64

### 传入一个索引对象

传入的索引对象要在原Series的索引里才行

In [37]:
pd.Series([1, 3, 5], index=['a', 'b', 'c']).loc[pd.Index(['a', 'c'], name='index_name')]

index_name
a    1
c    5
dtype: int64

### 传入一个可调用函数

类似于iloc一样的使用

In [38]:
pd.Series([1, 3, 5], index=['a', 'b', 'c']).loc[lambda x: x.index=='b']

b    3
dtype: int64

## Series.name

返回series对象的名字，如果是从DataFrame里取出来的Series，名字就是对应的该列列名

In [39]:
# 可以在创建是添加名字，打印展示的时候就会显示出Name属性
s5 = pd.Series(['a', 'b', 'c'], name='my_series')
s5

0    a
1    b
2    c
Name: my_series, dtype: object

In [40]:
# 访问Series的名字属性
s5.name

'my_series'

In [41]:
# 从DataFrame里获取的Series，列名就是该Series的名字
df1 = pd.DataFrame([[1, 2], [3, 4], [5, 6]],columns=["Odd Numbers", "Even Numbers"])
df1['Odd Numbers']

0    1
1    3
2    5
Name: Odd Numbers, dtype: int64

In [42]:
# 访问name属性
df1['Odd Numbers'].name

'Odd Numbers'

## Series.nbytes

pandas的Series的nbytes属性用于检查Series的底层数据的内存使用情况。它以字节为单位返回数据的大小。这包括存储值所使用的内存和与在Series对象中存储数据相关的任何开销。当处理大型数据集时，nbytes属性可以帮助了解pandas Series的内存使用情况，从而帮助内存优化。

In [43]:
s5.nbytes

24

## Series.ndim

返回数据的维度，显然Series维度始终为1

In [44]:
s5.ndim

1

## Series.shape

以元组的形式返回数据的维度形状

In [45]:
s5.shape

(3,)

## Series.size

返回Series对象元素的个数

In [46]:
s5.size

3

## Series.values

将Series对象以numpy数组返回，与Series.to_numpy不同的是series.values 返回组成 Series 的底层 numpy 数组，没有进行复制。这意味着对返回的 numpy 数组的更改也将更改原始 Series。

另一方面，series.to_numpy() 始终会返回数据的新副本。这可能更耗费计算资源，但它也可以确保如果修改返回的 numpy 数组则不会更改原始 Series。

通常，如果您只想访问 Series 的值，并且不关心修改它们，使用 series.values 更高效。如果您要在不影响原始 Series 的情况下修改返回的数组，请使用 series.to_numpy()

In [47]:
s6 = pd.Series(['a', 'b', 'c'])
s6

0    a
1    b
2    c
dtype: object

In [48]:
# 返回s6的numpy数组，此时将返回的数组进行修改后，看看原s6会不会变
s6_values_array = s6.values
s6_values_array

array(['a', 'b', 'c'], dtype=object)

In [49]:
# 修改b为e
s6_values_array[1] = 'e'
# 再看看s6是否有改变,可以看到s6变了，但是如果用to_numpy就不会变
s6

0    a
1    e
2    c
dtype: object

# Series的方法

## Series.abs()

返回每个元素的绝对值，只能用于数字型的数据

In [50]:
pd.Series([1, -8, -10]).abs()

0     1
1     8
2    10
dtype: int64

## Series.add(other, level=None, fill_value=None, axis=0)

用于计算两个 Series 对象或者一个 Series 和一个标量之间的加法。返回两个 Series 相加的结果，结果的索引为两个输入的并集,当然两个Series直接用加号相加也是一样的效果，但是add方法提供能fill_value参数，可以对缺失值进行填充

> other: 另一个 Series 或标量，将其与原 Series 进行加法运算。<br>
> level：可选，用于在多级索引的情况下指定对齐的级别。<br>
> fill_value：可选，在未匹配的位置上的填充值。<br>
> axis：可选，指定将操作应用于的轴，默认为 0,这里这个参数对Series没用<br>

In [51]:
# 相加的原则是索引一一对应，如果没有对应的，则相加起来就是空值
s7 = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
s8 = pd.Series([3, 4, np.nan], index=['b', 'd', 'e'])
s7.add(s8)

a    NaN
b    5.0
c    NaN
d    NaN
e    NaN
dtype: float64

In [52]:
# 直接用加号也是一样的效果
s7+s8

a    NaN
b    5.0
c    NaN
d    NaN
e    NaN
dtype: float64

In [53]:
# 可以看到这里是对s8填充，原来s7的空值与s8相加，还是得到的空值
s7.add(s8,fill_value=1)

a    2.0
b    5.0
c    4.0
d    5.0
e    NaN
dtype: float64

In [54]:
# 如果是字符串，则相加后是字符串拼接
pd.Series(['a', 'b']) + pd.Series(['c', 'd'])

0    ac
1    bd
dtype: object

In [55]:
# level参数用于指定执行加法运算的层级。当两个Series相加时，它们可能具有不同的多级索引层级。level 参数指定在哪个层级上进行加法运算。如果没有指定 level 参数，则在最低层级进行加法运算
# 创建多层索引的Series对象，但是这里对series好像没什么用，以后在DataFrame再详细了解
pd.Series([1, 2, 3], index=[['a', 'b', 'c'], [1, 2, 3]])

a  1    1
b  2    2
c  3    3
dtype: int64

## Series.add_prefix(prefix)

给Series对象的行标签添加前缀,如果是DataFrame,用这个方法则是给列标签添加前缀
> prefix:要添加的前缀字符串

In [56]:
pd.Series([1, 2, 3], index=['a', 'b', 'c']).add_prefix('prefix_')

prefix_a    1
prefix_b    2
prefix_c    3
dtype: int64

## Series.add_suffix(suffix)

给Series对象的行标签添加前缀,如果是DataFrame,用这个方法则是给列标签添加前缀
> prefix:要添加的前缀字符串

In [57]:
pd.Series([1, 2, 3], index=['a', 'b', 'c']).add_suffix('_suffix')

a_suffix    1
b_suffix    2
c_suffix    3
dtype: int64

## Series.agg(func=None, axis=0, \*args, \**kwargs)

用于聚合 Series 中值的方法。它允许您在 Series 的数据上应用一个或多个聚合函数。该方法需要一个聚合函数列表作为输入，并返回一个 Series，其中包含对原始 Series 中的数据应用每个函数的结果,返回标量值或者新的Series对象
> func:可以传入自定义函数，聚合函数名的字符串，函数名列表，比如[np.sum, 'mean']<br>
> axis:只对DataFrame有用<br>
> \*args:使用 args 和 kwargs 传递参数给聚合函数，以便根据需要对聚合进行更多的控制,args 是一个位置参数的列表，表示您可以向函数传递任意数量的位置参数。它们将作为元组（tuple）传递给函数<br>
> \**kwargs:是一个关键字参数的字典，表示您可以向函数传递任意数量的关键字参数。它们将作为字典（dictionary）传递给函数

In [58]:
# 传入单个的聚合函数，返回一个标量值
pd.Series([1, 2, 3], index=['a', 'b', 'c']).agg('sum')

6

In [59]:
# 以列表形式传入多个聚合函数，返回一个新的Series对象
pd.Series([1, 2, 3], index=['a', 'b', 'c']).agg(['sum', 'min', 'max'])

sum    6
min    1
max    3
dtype: int64

In [60]:
# 传入自定义函数，自定义聚合函数必须是可调用对象，并且接受一个数组作为输入，并返回一个单个结果

# 先自定义一个函数
def custom_agg_function(data):
    return sum(data) / len(data)

# 将该自定义函数传入agg方法中，该函数接受数组 data 作为输入，并返回它们的平均值
pd.Series([1, 2, 3], index=['a', 'b', 'c']).agg(custom_agg_function)

2.0

In [61]:
# 在 agg 方法中，可以使用 args 和 kwargs 传递参数给聚合函数，以便根据需要对聚合进行更多的控制

def custom_agg_function_2(data, multiplier):
    return sum(data) / len(data) * multiplier

pd.Series([1, 2, 3], index=['a', 'b', 'c']).agg(custom_agg_function_2,multiplier=2)

4.0

## Series.aggregate

和agg方法一模一样

## Series.align()

Series.align(other, join='outer', axis=None, level=None, copy=True, fill_value=None, method=None, limit=None, fill_axis=0, broadcast_axis=None)

用于对齐两个Series对象或者两个DataFrame对象。它可以根据索引或列对齐两个对象，并返回一个元组，元组中包含两个对齐后的对象
> other：需要与调用该函数的对象对齐的另一个对象。<br>
join：对齐方式，可以是"left"、"right"、"inner"或"outer"。默认为"outer"。<br>
"left"：只保留调用该函数的对象的索引，并使用NaN填充其他对象的值。<br>
"right"：只保留其他对象的索引，并使用NaN填充调用该函数的对象的值。<br>
"inner"：只保留两个对象都有的索引。<br>
"outer"：保留两个对象的所有索引，并使用NaN填充缺失的值。<br>
axis：指定对齐的轴，可以是0（对齐行）或1（对齐列），仅适用于DataFrame。<br>
level：指定对齐的级别，仅适用于MultiIndex。<br>
copy：是否对对齐后的对象进行复制，默认为True。<br>
fill_value：用于填充缺失值的值。<br>
method：向丢失的值填充的方法，可以是"backfill"、"bfill"、"pad"或"ffill"。<br>
limit：限制填充的数量。<br>
fill_axis：指定填充的轴，可以是0（行）或1（列），仅适用于DataFrame。<br>
broadcast_axis：广播填充的轴，仅适用于DataFrame。<br>

In [62]:
# 默认全外连接，返回一个元组对象，可以看到根据行标签对其，全外连接后没有的行标签就是空值
s9 = pd.Series(['a', 'b', 'c'], index=[1, 2, 3])
s10 = pd.Series(['e', 'f', 'g', 'h'], index=[2, 3, 4, 5])
s9.align(s10)

(1      a
 2      b
 3      c
 4    NaN
 5    NaN
 dtype: object,
 1    NaN
 2      e
 3      f
 4      g
 5      h
 dtype: object)

In [63]:
# 左连接
s9.align(s10, join='left')

(1    a
 2    b
 3    c
 dtype: object,
 1    NaN
 2      e
 3      f
 dtype: object)

In [64]:
# 内连接
s9.align(s10, join='inner')

(2    b
 3    c
 dtype: object,
 2    e
 3    f
 dtype: object)

In [65]:
# 需要注意的是，如果使用fill_value参数，那么填充的值的数据类型需要与其他数据的数据类型一致
s9.align(s10, join='outer', fill_value='fill')

(1       a
 2       b
 3       c
 4    fill
 5    fill
 dtype: object,
 1    fill
 2       e
 3       f
 4       g
 5       h
 dtype: object)

In [66]:
# method参数是pandas.Series.align函数的一个重要参数，它决定了对齐的方式。它接受以下可选值：

# 'backfill'：使用后面的值对前面的缺失值进行填充。
# 'bfill'：同'backfill'。
# 'pad'：使用前面的值对后面的缺失值进行填充。
# 'ffill'：同'pad'。
# None：以上方法都不使用，缺失值会被丢弃

s9.align(s10, method='bfill')

(1      a
 2      b
 3      c
 4    NaN
 5    NaN
 dtype: object,
 1    e
 2    e
 3    f
 4    g
 5    h
 dtype: object)

In [67]:
# limit参数是pandas.Series.align函数的一个重要参数，它决定了在使用method参数进行填充时，向前/后填充的最大数量。
# 例如，如果将limit设为1，则在使用method='pad'时，只有第一个缺失值会被填充

s9.align(s10, method='pad', limit=1)  # 可以看到只有第四行被填充了，第五行还是空值

(1      a
 2      b
 3      c
 4      c
 5    NaN
 dtype: object,
 1    NaN
 2      e
 3      f
 4      g
 5      h
 dtype: object)

## Series.all()

Series.all(axis=0, bool_only=None, skipna=True, level=None, **kwargs)

用于判断 Series 对象中的所有元素是否都为真（True）
> axis：指定轴的方向，默认为 0,可以传入0或者index或者1或者columns或者None,如果是None,则判断整个DataFrame<br>
bool_only：指定只考虑布尔值。对Series无效<br>
skipna：是否跳过缺失值，默认为 True。pandas里空值实际上是被视为True的<br>
level：指定处理的级别，对于非层次化索引的数据不起作用。该参数在1.3.0版本已经被弃用，请用groupby代替<br>
\**kwargs: 针对numpy才有用

In [68]:
pd.Series([True, False, True]).all()

False

In [69]:
# 由于空值被视为True，这里默认是忽略空值的，所以返回True
pd.Series([True, True, np.NAN]).all()

True

In [70]:
# 由于空值被视为True，这里添加参数不忽略空值，返回的还是True
pd.Series([True, True, np.NAN]).all(skipna=False)

True

In [71]:
# 0被视为False
pd.Series([0, 0, 1]).all()

False

## Series.any()

Series.any(axis=0,bool_only=None,skipna=True,level=None,\*\*kwargs)

用于判断一个 pandas 序列中是否存在非零元素。如果存在一个非零元素，则该方法返回 True；否则返回 False
> axis：指定轴的方向，默认为 0,可以传入0或者index或者1或者columns或者None,如果是None,则判断整个DataFrame<br>
bool_only：指定只考虑布尔值。对Series无效<br>
skipna：是否跳过缺失值，默认为 True。pandas里空值实际上是被视为True的<br>
level：指定处理的级别，对于非层次化索引的数据不起作用。该参数在1.3.0版本已经被弃用，请用groupby代替<br>
\**kwargs: 针对numpy才有用

In [72]:
# 有一个1，返回True
pd.Series([1, 0, 0]).any()

True

In [73]:
# 全是0，返回False
pd.Series([0, 0, 0]).any()

False

In [74]:
# 由于空值被视为True，这里默认是忽略空值的，所以返回Fasle
pd.Series([np.NAN, False, False]).any()

False

In [75]:
# 由于空值被视为True，这里添加参数不忽略空值，此时返回的就是True
pd.Series([np.NAN, False, False]).any(skipna=False)

True

## Series.append()

Series.append(to_append, ignore_index=False, verify_integrity=False)<br>
从版本1.4.0开始就不推荐使用: 改为使用 concat ()

## Series.apply()

Series.apply(func, convert_dtype=True, args=(), \*\*kwargs)

对Series的每个值调用函数，可以是一个numpy函数或者是只有单个值参数的python函数，返回series后者datafrme对象，如果函数传入的是series，则返回dataframe
> func：要应用的函数。<br>
convert_dtype：可选参数，用于指示是否强制类型转换。默认值为 True。<br>
args：可选参数，以元组形式作为额外的参数传递给函数。<br>
\*\*kwargs：可选参数，以字典形式作为额外的参数传递给函数。<br>

In [76]:
# 传入numpy函数
pd.Series([1, 4, 9]).apply(np.sqrt)

0    1.0
1    2.0
2    3.0
dtype: float64

In [77]:
# 传入自定义函数
def custom_apply_series_1(x):
    return x**2

pd.Series([1, 4, 9]).apply(custom_apply_series_1)

0     1
1    16
2    81
dtype: int64

In [78]:
# 传入匿名函数
pd.Series([1, 4, 9]).apply(lambda x: x**2)

0     1
1    16
2    81
dtype: int64

In [79]:
# 以元组形式传入args参数
def custom_apply_series_2(x, a, b):
    return x + a + b

pd.Series([1, 4, 9]).apply(custom_apply_series_2, args=(10, 20))

0    31
1    34
2    39
dtype: int64

In [80]:
def custom_apply_series_2(x, a):
    return x + a

pd.Series([1, 4, 9]).apply(custom_apply_series_2, args=(10,))

0    11
1    14
2    19
dtype: int64

In [81]:
# **kwargs参数用法
def custom_apply_series_3(x, **kwargs):
    for key in kwargs:
        x += kwargs[key]
    return x

pd.Series([1, 4, 9]).apply(custom_apply_series_3, add_x=10, add_y=20)

0    31
1    34
2    39
dtype: int64

In [82]:
# 参数convert_dtype的用法，自定义函数将整数转换为了浮点数，返回的也是浮点数
def custom_apply_series_4(x):
    return float(x * 2)

pd.Series([1, 2, 3, 4, 5]).apply(custom_apply_series_4)

0     2.0
1     4.0
2     6.0
3     8.0
4    10.0
dtype: float64

In [83]:
# 此时将convert_dtype参数设为False，返回的数据类型就是object了，一般不改变这个参数，默认为True就行
pd.Series([1, 2, 3, 4, 5]).apply(custom_apply_series_4, convert_dtype=False)

0     2.0
1     4.0
2     6.0
3     8.0
4    10.0
dtype: object

## Series.argmax()

Series.argmax(axis=None, skipna=True, \*args, \*\*kwargs)

返回元素最大值的位置，如果有相同最大值，则返回最小位置那一个
> axis：沿着其进行操作的轴，可以是 0（行）或 1（列）。默认值为 0，即对整个系列进行操作。只对dataframe有用<br>
skipna：是否跳过缺失值，如果设置为 True，则忽略缺失值；如果设置为 False，则返回缺失值的索引。默认值为 True。<br>
args：可变的额外参数，用于传递额外的参数，只兼容numpy函数。<br>
kwargs：关键字参数，用于传递额外的关键字参数，只兼容numpy函数。

In [84]:
# 当有空值，且不跳过空值的时候,返回的永远都是-1
pd.Series([1, np.NAN, 3, 2]).argmax(skipna=False)

-1

## Series.argmin()

Series.argmin(axis=None, skipna=True, \*args, \*\*kwargs)

返回元素最小值的位置，如果有相同最小值，则返回最小位置那一个，用法同argmax一样

## Series.argsort()

Series.argsort(axis=0, kind='quicksort', order=None)

对Pandas Series数据结构中的数据进行排序，并返回排序后数据的索引，如果遇到空值，会将空值按原索引位置不变的展示出来，并显示-1
> axis：沿着其进行操作的轴，可以是 0（行）或 1（列）。默认值为 0，即对整个系列进行操作。只对dataframe有用<br>
kind：排序算法，不用太深究，用默认的就好<br>
order：已经不用了。

In [85]:
# 可以看到返回的新series对象的索引没有任何变化，而里面的元素就是原series元素从小到大排序后，对应的原索引位置
pd.Series([1, 3, 2, 4], index=['a', 'b', 'c', 'd']).argsort()

a    0
b    2
c    1
d    3
dtype: int64

In [86]:
# 存在空值时，可以看到空值对应的值为-1，且位置没有变化
pd.Series([1, 3, 2, None, 4], index=['a', 'b', 'c', 'd', 'e']).argsort()

a    0
b    2
c    1
d   -1
e    3
dtype: int64

## Series.asfreq()

Series.asfreq(freq, method=None, how=None, normalize=False, fill_value=None)

用于将时间序列重新采样到指定的频率，它有以下参数：
> freq: 必需参数，表示重新采样的频率，可以是一个字符串别名（如 'D' 表示日频率）或一个 pandas.DateOffset 对象<br>
method: 可选参数，表示重新采样时需要执行的操作，比如 'ffill/pad' 或 'bfill/backfill'。默认值为 None<br>
how: 可选参数，只用于PeriodIndex对象，请在PeriodIndex.asfreq那里查看使用方法<br>
normalize: 可选参数，表示是否将时间戳规范化为零点。默认值为 False，表示不规范化。<br>
fill_value: 可选参数，表示用于填充缺失值的值。默认值为 None，表示使用前向填充或后向填充的值。

In [87]:
# 先生成一个时间序列索引
index_asfreq = pd.date_range('2023-01-01', '2023-01-03', freq='d')
index_asfreq

DatetimeIndex(['2023-01-01', '2023-01-02', '2023-01-03'], dtype='datetime64[ns]', freq='D')

In [88]:
# 将时间序列按没4小时扩展,freq参数的offset用法待后面学习了再回来完善。这里可以看到，扩展后没有的时间后面对应的值为空值
pd.Series(range(len(index_asfreq)), index=index_asfreq).asfreq('4H')

2023-01-01 00:00:00    0.0
2023-01-01 04:00:00    NaN
2023-01-01 08:00:00    NaN
2023-01-01 12:00:00    NaN
2023-01-01 16:00:00    NaN
2023-01-01 20:00:00    NaN
2023-01-02 00:00:00    1.0
2023-01-02 04:00:00    NaN
2023-01-02 08:00:00    NaN
2023-01-02 12:00:00    NaN
2023-01-02 16:00:00    NaN
2023-01-02 20:00:00    NaN
2023-01-03 00:00:00    2.0
Freq: 4H, dtype: float64

In [94]:
# method参数用于提供给空值的填充方式
pd.Series(range(len(index_asfreq)), index=index_asfreq).asfreq('4H', method='pad')  # 用空值前面的值填充

2023-01-01 00:00:00    0
2023-01-01 04:00:00    0
2023-01-01 08:00:00    0
2023-01-01 12:00:00    0
2023-01-01 16:00:00    0
2023-01-01 20:00:00    0
2023-01-02 00:00:00    1
2023-01-02 04:00:00    1
2023-01-02 08:00:00    1
2023-01-02 12:00:00    1
2023-01-02 16:00:00    1
2023-01-02 20:00:00    1
2023-01-03 00:00:00    2
Freq: 4H, dtype: int64

In [90]:
pd.Series(range(len(index_asfreq)), index=index_asfreq).asfreq('4H', method='bfill') # 用空值后面的值填充

2023-01-01 00:00:00    0
2023-01-01 04:00:00    1
2023-01-01 08:00:00    1
2023-01-01 12:00:00    1
2023-01-01 16:00:00    1
2023-01-01 20:00:00    1
2023-01-02 00:00:00    1
2023-01-02 04:00:00    2
2023-01-02 08:00:00    2
2023-01-02 12:00:00    2
2023-01-02 16:00:00    2
2023-01-02 20:00:00    2
2023-01-03 00:00:00    2
Freq: 4H, dtype: int64

In [96]:
# normalize参数就是将日期全部变成了零点
pd.Series(range(len(index_asfreq)), index=index_asfreq).asfreq('4H', normalize=True)

2023-01-01    0.0
2023-01-01    NaN
2023-01-01    NaN
2023-01-01    NaN
2023-01-01    NaN
2023-01-01    NaN
2023-01-02    1.0
2023-01-02    NaN
2023-01-02    NaN
2023-01-02    NaN
2023-01-02    NaN
2023-01-02    NaN
2023-01-03    2.0
dtype: float64

In [98]:
# fill_value就是给空值填充的值，如果已经有了method参数，fill_value会无效的

# 可以看到这里虽然要将空值填充为100，但是因为指定了method方法，所以还是按method方法填充的
pd.Series(range(len(index_asfreq)), index=index_asfreq).asfreq('4H', fill_value=100, method='pad')  

2023-01-01 00:00:00    0
2023-01-01 04:00:00    0
2023-01-01 08:00:00    0
2023-01-01 12:00:00    0
2023-01-01 16:00:00    0
2023-01-01 20:00:00    0
2023-01-02 00:00:00    1
2023-01-02 04:00:00    1
2023-01-02 08:00:00    1
2023-01-02 12:00:00    1
2023-01-02 16:00:00    1
2023-01-02 20:00:00    1
2023-01-03 00:00:00    2
Freq: 4H, dtype: int64

## Series.asof()

Series.asof(where, subset=None)