In [2]:
import pandas as pd

   # 예제 4-1 숫자와 문자 인덱스 생성

In [3]:
pd.Index

pandas.core.indexes.base.Index

In [4]:
idx1 = pd.Index([1,2,3,4])

In [5]:
type(idx1)

pandas.core.indexes.numeric.Int64Index

In [6]:
idx2 = pd.Index(range(1,4))

In [7]:
# 인덱스를 지정하지 않고 자동으로 만들어지는 디폴트 인덱스도 RangeIndex
type(idx2)

pandas.core.indexes.range.RangeIndex

In [8]:
# 개별적으로는 둘 다 int64 타입
idx1.dtype, idx2.dtype

(dtype('int64'), dtype('int64'))

In [9]:
idx_s = pd.Index(['a','b','c'])

In [10]:
idx_s

Index(['a', 'b', 'c'], dtype='object')

In [11]:
type(idx_s)

pandas.core.indexes.base.Index

In [12]:
idx_s.values

array(['a', 'b', 'c'], dtype=object)

In [13]:
idx_s.shape

(3,)

In [14]:
idx_f = pd.Index([1,2,3,4],dtype = 'float')

In [15]:
idx_f

Float64Index([1.0, 2.0, 3.0, 4.0], dtype='float64')

# 예제 4-2 숫자와 문자 인덱스 특징

In [16]:
idx1, idx_s

(Int64Index([1, 2, 3, 4], dtype='int64'),
 Index(['a', 'b', 'c'], dtype='object'))

In [17]:
idx1[0], idx1[1:3], idx1[:]

(1, Int64Index([2, 3], dtype='int64'), Int64Index([1, 2, 3, 4], dtype='int64'))

In [18]:
idx_s[0], idx_s[1:3], idx_s[:]

('a',
 Index(['b', 'c'], dtype='object'),
 Index(['a', 'b', 'c'], dtype='object'))

In [19]:
# 팬시검색처럼도 인덱스 번호 검색이 가능하나, 결과값에 큰 의미가 없다
idx1[[0]]

Int64Index([1], dtype='int64')

In [21]:
idx1

Int64Index([1, 2, 3, 4], dtype='int64')

In [20]:
# 인덱스 검색 조건 설정도 가능
idx1[idx1 <3]

Int64Index([1, 2], dtype='int64')

In [24]:
try:
    idx1.loc[0]
except Exception as e:
    print(e)

'Int64Index' object has no attribute 'loc'


In [25]:
idx4 = pd.Index([4,5,6,7])

In [26]:
# 인덱스 값 변경은 허용되지 않는다
try:
    idx4[0] = 100
except Exception as e:
    print(e)

Index does not support mutable operations


In [27]:
# 새로 만들어 재할당 할 수밖에 없다
idx4 = pd.Index([1,2,3,4])

In [28]:
idx4

Int64Index([1, 2, 3, 4], dtype='int64')

# 예제 4-3 숫자와 문자 인덱스 메소드 처리

In [29]:
idx1

Int64Index([1, 2, 3, 4], dtype='int64')

In [30]:
idx2

RangeIndex(start=1, stop=4, step=1)

In [32]:
# idx1은 1,2,3,4  idx2는 1,2,3 다른점은 4 (인덱스 관점)
idx1.difference(idx2)

Int64Index([4], dtype='int64')

In [33]:
# 기존의 인덱스의 모든 요소에 3을 더하여 새로운 객체로 반환
idx1 + 3

Int64Index([4, 5, 6, 7], dtype='int64')

In [34]:
# 인덱스는 immutable 객체이기 때문에 원본에는 영향이 없다.
idx1

Int64Index([1, 2, 3, 4], dtype='int64')

# 예제 4-4 암묵적 인덱스 변경

In [35]:
import numpy as np

In [36]:
s1 = pd.Series(index = list('aaab'), data = np.arange(4))

In [37]:
s1

a    0
a    1
a    2
b    3
dtype: int32

In [38]:
s2 = pd.Series(index = list('baaa'), data = np.arange(4))

In [39]:
s2

b    0
a    1
a    2
a    3
dtype: int32

In [40]:
# 두개의 시리즈를 더하면 두개의 레이블이 달라 시리즈 안에 레이블 개수를 곱한만큼
# 카테시언 프로덕트(Cartesian priduct)를 처리한 레이블이 생긴다.
# 따라서 모든 경우의 수를 표기한다
s1 + s2

a    1
a    2
a    3
a    2
a    3
a    4
a    3
a    4
a    5
b    3
dtype: int32

In [42]:
# 해결책
s1.sort_index()+ s2.sort_index()

a    1
a    3
a    5
b    3
dtype: int32

In [45]:
s1

a    0
a    1
a    2
b    3
dtype: int32

In [46]:
s3 = pd.Series(index = list('aaab'), data = np.arange(4))

In [47]:
s1 + s3

a    0
a    2
a    4
b    6
dtype: int32