In [1]:
import numpy as np

## numpy basic

In [18]:
# 행렬의 인덱싱과 슬라이싱
A = np.array([[1,2,3], [4,5,6], [7,8,9]])
print(A)
# 가장 바깥의 리스트를 기준으로 인덱싱을 한다고 생각
print(A[0])
print(A[1:])

print(A[0][2])
print(A[0, 2]) # 일반 리스트 타입에서는 허용하지 않는 문법(넘파이에서만 사용)

B = [[1,2,3,4], [5,6,7,8]]
print(B[0][2])
# print(B[0,2]) # Error

print(A[1, :]) # [1행, 전부]
print(A[1, 0:3:2]) # [1행, 1행의 열에 해당하는 인덱싱]
print(A[:, 2]) # [모든 행, 2번째 열]

A = np.array([[1,2,3,4], [5,3,7,3]])
print(A==3) # 모든 원소에 대해 3과 같은지 비교하고 A와 동일한 사이즈의 행렬을 반환

# 마스킹 연산
print(A[A==3]) # boolean 행렬로 인덱싱이 가능하다
A[A==3] = 100 # A행렬에서 원소가 3인 부분을 100으로 바꿔준다
print(A)

# 행, 열 인덱싱과 마스킹 연산을 조합
A = np.array([[1,2], [3,4], [5,6], [7,8]]) # 4x2 행렬
B = np.array([True, False, False, True]) # 4x1 boolean 행렬

A[B, :] # A의 행에 대해 B행렬에서 True인 행만 가져옴 => 0행, 3행만 가져온다


[[1 2 3]
 [4 5 6]
 [7 8 9]]
[1 2 3]
[[4 5 6]
 [7 8 9]]
3
3
3
[4 5 6]
[4 6]
[3 6 9]
[[False False  True False]
 [False  True False  True]]
[3 3 3]
[[  1   2 100   4]
 [  5 100   7 100]]


array([[1, 2],
       [7, 8]])

In [24]:
# 3차원 행렬의 인덱싱
# 대괄호가 하나 늘어나면 shape에서 왼쪽에 추가가 된다
A = np.arange(24).reshape(2,3,4) # 3x4행렬이 2층(채널)
print(A[0, 1, 2])
B = [True, False, True]
print(A[:, B, 0:2]) # A의 모든 층에 대해 B에서 True에 해당되는 행에서 0:2까지에 해당하는 열만 가져온다


6
[[[ 0  1]
  [ 8  9]]

 [[12 13]
  [20 21]]]


## numpy의 여러가지 함수들

In [27]:
A = np.random.randn(3, 3) # 3x3행렬 생성
B = np.random.rand(3, 3)
# A의 shape과 인덱싱의 의미를 잘 파악하면 됨
print(A[ A[:, 0]<0, :]) # A의 각 행의 0번째 열들이 0보다 작은 모든 행들을 가져옴

[]


In [30]:
A = np.random.randn(3,4)
print(A)
# 가장 큰 값 반환 np.max()
print(np.max(A)) # A의 모든 원소 중 가장 큰 원소 한개 
print(np.max(A, axis=0)) # A의 각 행의 원소들끼리 비교 => 총 4개의 결과
print(np.max(A, axis=1)) # A의 각 열의 원소들끼리 비교 => 총 3개의 결과
print(np.max(A, axis=0, keepdims=True)) # A의 형태를 유지 => 1x4
print(np.max(A, axis=1, keepdims=True)) # A의 형태를 유지 => 3x1
# 가장 큰 값의 인덱스 반환 np.argmax()
print(np.argmax(A)) # A의 원소 중 가장 큰 원소의 인덱스
print(np.argmax(A, axis=0)) # A의 각 열에서 가장 큰 원소가 존재하는 인덱스
print(np.argmax(A, axis=1)) # A의 각 행에서 가장 큰 원소가 존재하는 인덱스

[[ 9.03408326e-01 -3.55786212e-01  6.04037002e-01  9.58705182e-01]
 [-1.27644623e-01 -1.57021347e+00  5.26665457e-01  7.58677168e-04]
 [-7.05941477e-01 -1.11248990e-01 -7.21254399e-01 -6.04818825e-01]]
0.9587051824472539
[ 0.90340833 -0.11124899  0.604037    0.95870518]
[ 0.95870518  0.52666546 -0.11124899]
[[ 0.90340833 -0.11124899  0.604037    0.95870518]]
[[ 0.95870518]
 [ 0.52666546]
 [-0.11124899]]
3
[0 2 0 0]
[3 2 1]


In [32]:
# np.reshape => 파이썬은 배열에서 원소들을 무조건 가로로 읽는다(인덱스 부여도 가로먼저)
# 가로부터의 의미는 즉, 가장 안쪽의 행부터 차례대로 읽는다라는 의미
A = np.random.randint(1, 5, size=(3, 4))
print(A)
print(A.shape)
# A의 0번째 인덱스부터 차례대로 재배열
# 재배열 시 가장 낮은 행부터 배열
B = A.reshape(2, 2, 3)
print(B)


[[1 1 4 3]
 [3 1 1 4]
 [1 4 3 4]]
(3, 4)
[[[1 1 4]
  [3 3 1]]

 [[1 4 1]
  [4 3 4]]]


In [35]:
# np.transpose
a = np.array([1,2,3])
b = np.array([4,5,6])

a = a.reshape(3, 1)
b = b.reshape(3, 1)
print(a.T@b) # a와 b의 내적

A = np.random.randn(4, 3, 2)
print(A.transpose(0, 1, 2).shape)
print(A.transpose(2, 1, 0).shape)

[[32]]
(4, 3, 2)
(2, 3, 4)


In [39]:
A = np.arange(20)
print(A)
print(A.reshape(4, 5))
print(A.reshape(4, -1).shape) # 4개행이 될 수 있도록 열의 수를 알아서 맞춰줌(-1의 역할)
print(A.reshape(2, -1, 5).shape) # -1 ==> 2
print(A.reshape(1, -1).shape) # => 2차원 행 벡터
print(A.reshape(-1, 1).shape) # => 2차원 열 벡터

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19]
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]
 [15 16 17 18 19]]
(4, 5)
(2, 2, 5)
(1, 20)
(20, 1)


In [None]:
# 다차원 배열의 인덱싱
x  np.random.randn(2,3,4,5,6) # 5차원 배열
print(x[1, 2, :, :, :].shape)
print(x[1, 2, ...].shape) # 위와 동일