## 6.2. Series

In [1]:
import pandas as pd
import numpy as np
from pandas import Series, DataFrame, Index

s = pd.Series(np.random.rand(10))
s

0    0.151706
1    0.119440
2    0.812976
3    0.553514
4    0.622026
5    0.144119
6    0.691493
7    0.392788
8    0.942169
9    0.166289
dtype: float64

In [2]:
s.index

RangeIndex(start=0, stop=10, step=1)

In [3]:
s.values

array([0.15170609, 0.11943978, 0.81297643, 0.55351446, 0.62202603,
       0.14411863, 0.69149263, 0.39278849, 0.94216852, 0.1662885 ])

In [4]:
s[0]

0.15170608706872146

In [5]:
s[1:3]

1    0.119440
2    0.812976
dtype: float64

In [6]:
named = pd.Series(np.random.rand(5), index=['a', 'b', 'c', 'd', 'e'])
named

a    0.007233
b    0.290163
c    0.088454
d    0.199055
e    0.610035
dtype: float64

In [7]:
named['a']

0.0072325419652532474

In [8]:
named['a'] = 0.11111

In [9]:
named

a    0.111110
b    0.290163
c    0.088454
d    0.199055
e    0.610035
dtype: float64

### 6.2.1 辞書からシリーズを生成する

In [10]:
d1 = {'A': 10, 'B': 20, 'C': 30}
s1 = pd.Series(d1)
s1

A    10
B    20
C    30
dtype: int64

In [11]:
# 「キー」でアクセス
s1['A']

10

In [12]:
# 明示的なインデックスでスライシング
# 最後のインデックスの要素を含む
s1['A':'B']

A    10
B    20
dtype: int64

In [13]:
# 暗黙的なインデックスでスライシング
# 最後のインデックスの要素を含まない
s1[0:1]

A    10
dtype: int64

In [14]:
# インデックスで「値」を修正
s1['C'] = 40
s1

A    10
B    20
C    40
dtype: int64

In [15]:
# ファンシーインデックス
s1[['A','C']]

A    10
C    40
dtype: int64

In [16]:
# Seriesオブジェクトをタプル(tuple)形式で出力
list(named.items())

[('a', 0.11111),
 ('b', 0.29016280587259324),
 ('c', 0.08845394132678286),
 ('d', 0.19905487936443123),
 ('e', 0.6100354176497079)]

### 6.2.2 明示的なインデックスと暗黙的なインデックス

In [17]:
s2 = pd.Series(np.random.rand(5), index=[3,4,5,6,7])
s2

3    0.782494
4    0.249431
5    0.866005
6    0.035868
7    0.689831
dtype: float64

In [18]:
# インデックスによるアクセス
s2[4]

0.24943085278987265

In [19]:
# 暗黙的なインデックスで、4番目の要素にアクセス
s2.iloc[3]

0.035868301833170024

In [20]:
# 明示的なインデックスで、インデックス値が3の要素にアクセス
s2.loc[3]

0.7824936919780533

In [21]:
s1

A    10
B    20
C    40
dtype: int64

In [22]:
# インデックスが整数ではなく文字列の場合は区別が容易です。
s1.loc['C']

40

In [23]:
s1.iloc[2]

40

In [24]:
s1['C']

40

### 6.2.3 条件文による配列の抽出：マスキング

In [25]:
named[ named > 0.5]

e    0.610035
dtype: float64

### 6.2.4 ベクトル演算

In [26]:
named * 3

a    0.333330
b    0.870488
c    0.265362
d    0.597165
e    1.830106
dtype: float64

In [27]:
named1 = pd.Series(np.arange(0,5,1), index=['a', 'b', 'c', 'd', 'e'])
named2 = pd.Series(np.arange(0,10,2), index=['b', 'a', 'c', 'd', 'e'])
named1

a    0
b    1
c    2
d    3
e    4
dtype: int32

In [28]:
named2

b    0
a    2
c    4
d    6
e    8
dtype: int32

In [29]:
named1 + named2

a     2
b     1
c     6
d     9
e    12
dtype: int32

### 6.2.5 その他

In [30]:
named2.name = 'named2'
named2

b    0
a    2
c    4
d    6
e    8
Name: named2, dtype: int32

In [31]:
named2.index.name = 'label'
named2

label
b    0
a    2
c    4
d    6
e    8
Name: named2, dtype: int32

In [32]:
named2.index = ['AA', 'BB', 'CC', 'DD', 'EE']
named2


AA    0
BB    2
CC    4
DD    6
EE    8
Name: named2, dtype: int32