![image.png](attachment:image.png)

![image.png](attachment:image.png)

In [8]:
import pandas as pd
import numpy as np

In [9]:
df = pd.DataFrame(np.arange(10, 22).reshape(3, 4),
                  index=["a", "b", "c"],
                  columns=["A", "B", "C", "D"])
df

Unnamed: 0,A,B,C,D
a,10,11,12,13
b,14,15,16,17
c,18,19,20,21


In [10]:
# loc 인덱서를 사용하려면 df.loc[행 인덱스, 열 인덱스]와 같은 형태로 사용한다.
# 행 인덱스 라벨값이 a, 열 인덱스 라벨값이 A인 위치의 값을 구하는 것은 다음과 같다.

df.loc["a", "A"]

10

In [11]:
# 라벨값의 슬라이싱 또는 리스트를 사용할 수도 있다.

df.loc["b":, "A"]

b    14
c    18
Name: A, dtype: int32

In [12]:
df.loc["a", :]

A    10
B    11
C    12
D    13
Name: a, dtype: int32

In [13]:
df.loc[["a", "b"], ["B", "D"]]

Unnamed: 0,B,D
a,11,13
b,15,17


In [14]:
df.loc[["a","c"],["A","B"]]

Unnamed: 0,A,B
a,10,11
c,18,19


In [16]:
df.A

a    10
b    14
c    18
Name: A, dtype: int32

In [15]:
df.loc[df.A > 10, :]

Unnamed: 0,A,B,C,D
b,14,15,16,17
c,18,19,20,21


In [17]:
# loc 인덱서를 사용하면 하나의 행을 시리즈 자료형으로 뽑아낼 수도 있다.
df.loc["a", :]

A    10
B    11
C    12
D    13
Name: a, dtype: int32

In [18]:
# 만약 loc 인덱서를 사용하지 않고 하나의 행을 뽑으려면 다음처럼 슬라이싱을 해야 하는데 이때는 데이터프레임 자료형을 반환한다.

df[:1]  # loc 인덱서를 사용하지 않는 경우

Unnamed: 0,A,B,C,D
a,10,11,12,13


In [21]:
# 인덱스 대신 인덱스 값을 반환하는 함수를 사용할 수도 있다. 다음 함수는 A열의 값이 12보다 큰 행만 선택한다.

def select_rows(df):
    return df.A > 12

In [22]:
select_rows(df)

a    False
b     True
c     True
Name: A, dtype: bool

In [23]:
df.loc[select_rows(df), ["B"]]

Unnamed: 0,B
b,15
c,19


In [26]:
# 인덱서 내의 인덱스 하나로는 1차원 리스트 혹은 시리즈만을 받는다. 데이터프레임과 같은 2차원 데이터는 받을 수 없다.

In [27]:
df[:1]

Unnamed: 0,A,B,C,D
a,10,11,12,13


In [28]:
df.loc["a", :]

A    10
B    11
C    12
D    13
Name: a, dtype: int32

In [29]:
df.loc[:, df[:1] <= 11]  # 데이터프레임은 loc 인덱서에 넣을 수 없으므로 에러!

ValueError: Cannot index with multidimensional key

In [30]:
df.loc[:, df.loc["a", :] <= 11]  # 이렇게 해야 한다.

Unnamed: 0,A,B
a,10,11
b,14,15
c,18,19


In [31]:
# 만약 loc 인덱서를 사용하면서 인덱스를 하나만 넣으면 행(row)을 선택한다.

df.loc["a"]

A    10
B    11
C    12
D    13
Name: a, dtype: int32

In [32]:
df.loc["e"] = [90, 91, 92, 93]
df

Unnamed: 0,A,B,C,D
a,10,11,12,13
b,14,15,16,17
c,18,19,20,21
e,90,91,92,93


In [33]:
# 원래 인덱스 자체가 정수값을 가지는 경우에는 loc 인덱서의 인덱스로 정수를 쓸 수 있다.
# 이때는 정수가 순서를 나타내는 값이 아닐 수 있다.

df2 = pd.DataFrame(np.arange(10, 26).reshape(4, 4), columns=np.arange(1, 8, 2))
df2

Unnamed: 0,1,3,5,7
0,10,11,12,13
1,14,15,16,17
2,18,19,20,21
3,22,23,24,25


In [34]:
df2.loc[1, 1]

14

In [35]:
#이 때는 슬라이싱도 라벨 슬라이싱 방법을 따르게 된다. 즉, 슬라이스의 마지막 값이 포함된다.

df2.loc[1:2, :]

Unnamed: 0,1,3,5,7
1,14,15,16,17
2,18,19,20,21


![image.png](attachment:image.png)

In [36]:
df

Unnamed: 0,A,B,C,D
a,10,11,12,13
b,14,15,16,17
c,18,19,20,21
e,90,91,92,93


In [37]:
df.iloc[0, 1]

11

In [38]:
df.iloc[:2, 2]

a    12
b    16
Name: C, dtype: int64

In [39]:
df.iloc[0, -2:]

C    12
D    13
Name: a, dtype: int64

In [40]:
df.iloc[2:3, 1:3]

Unnamed: 0,B,C
c,19,20


In [41]:
# loc 인덱서와 마찬가지로 인덱스가 하나만 들어가면 행을 선택한다.

df.iloc[-1]

A    90
B    91
C    92
D    93
Name: e, dtype: int64

In [42]:
df.iloc[-1] = df.iloc[-1] * 2
df

Unnamed: 0,A,B,C,D
a,10,11,12,13
b,14,15,16,17
c,18,19,20,21
e,180,182,184,186


![image.png](attachment:image.png)

In [43]:
df

Unnamed: 0,A,B,C,D
a,10,11,12,13
b,14,15,16,17
c,18,19,20,21
e,180,182,184,186


In [44]:
%timeit df.loc["a", "A"]

20.1 µs ± 4.71 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [45]:
%timeit df.at["a", "A"]

10.2 µs ± 550 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [46]:
%timeit df.iloc[0, 0]

18.6 µs ± 712 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [47]:
%timeit df.iat[0, 0]

12.4 µs ± 923 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
