In [1]:
import numpy as np

# 통계를 위한 연산
- 배열의 합, 평균, 표준편차, 분산, 최소값, 최대값, 누적합, 누적곱 등

In [4]:
arr1 = np.arange(5)
arr1

array([0, 1, 2, 3, 4])

In [5]:
# 합과 산술 평균 : sum(), mean()
(arr1.sum(), arr1.mean())

(10, 2.0)

In [11]:
# 표준편차와 분산 : std(), var()
(arr1.std().round(3), arr1.var())

(1.414, 2.0)

In [12]:
# 최소값과 최대값 : min(), max()
(arr1.min(), arr1.max())

(0, 4)

In [16]:
arr2 = np.arange(1,6)
arr2

array([1, 2, 3, 4, 5])

In [15]:
# 누적합과 누적곱 : cumsum(), cumprod()
(arr2.cumsum(), arr2.cumprod())

(array([ 1,  3,  6, 10, 15]), array([  1,   2,   6,  24, 120]))

## 행렬 연산
- 선형 대수를 위한 행렬(2차원 배열) 연산
- 행렬 곱, 전치 행렬, 역행렬, 행렬식 등
    - 행렬곱 : A.dot(B) 혹은 np.dot(A, B)
    - 전치행렬 : A.transpose() 혹은 np.transpose(A)
    - 역행렬 : np.linalg.inv(A)
    - 행렬식 : np.linalg.det(A)

In [21]:
A = np.arange(1, 5).reshape(2,2)
# array([[1, 2],
#        [3, 4]])
B = np.array([3,2,0,1]).reshape(2,2)
# array([[3, 2],
#        [0, 1]])

### 행렬의 곱

In [24]:
A.dot(B) # np.dot(A, B)

array([[ 3,  4],
       [ 9, 10]])

In [25]:
B.dot(A) # np.dot(B, A)

array([[ 9, 14],
       [ 3,  4]])

### 전치행렬

In [26]:
A.transpose()

array([[1, 3],
       [2, 4]])

###  역행렬 (inverse)

In [27]:
np.linalg.inv(A)

array([[-2. ,  1. ],
       [ 1.5, -0.5]])

###  행렬식 (determinent)

In [32]:
np.linalg.det(A).round()

-2.0

In [37]:
# A * inv(A) = I (단위 행렬)
np.dot(A, np.linalg.inv(A)).round()

array([[1., 0.],
       [0., 1.]])

---

## Array 인덱싱(indexting)과 슬라이싱(Slicing)
- 인덱싱 : 배열 위치나 조건을 지정해 배열의 원소를 선택
- 슬라이싱 : 배열의 범위를 지정해 배열의 원소를 선택

### 1차원 배열의 인덱싱 
**배열명[위치]**
- 파이썬의 인덱싱과 동일
- 0번째로 시작함

In [40]:
arr = np.arange(10)
arr

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [41]:
arr[0]

0

In [43]:
arr[3]

3

In [44]:
arr[3:8]

array([3, 4, 5, 6, 7])

### 배열명[[위치1, 위치2, ...]]

In [49]:
arr[[1,3,4]]

array([1, 3, 4])

### 2차원 배열의 인덱싱 
**배열명[행위치, 열위치]**
- 파이썬의 인덱싱과 동일
- 0번째로 시작함

In [50]:
arr2 = np.arange(1,13).reshape(3,4)
arr2

array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

In [51]:
arr2[2,3]

12

In [54]:
arr2[0,0] = 90
arr2

array([[90,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

**2차원배열명[행위치]**

: 2차원 배열에서 지정한 행 전체가 선택됨

In [56]:
arr2[1]

array([5, 6, 7, 8])

In [58]:
arr2[1] = (8, 7, 6, 5)
arr2

array([[90,  2,  3,  4],
       [ 8,  7,  6,  5],
       [ 9, 10, 11, 12]])

**2차원배열명[:,열위치]**

: 2차원 배열에서 지정한 열 전체가 선택됨

In [61]:
arr2[:,1]

array([ 2,  7, 10])

**배열명[조건]**

: 배열에서 조건을 만족하는 원소만 선택

In [62]:
arr2>10

array([[ True, False, False, False],
       [False, False, False, False],
       [False, False,  True,  True]])

In [65]:
arr2[arr2>10]

array([90, 11, 12])

In [66]:
arr2[arr2%2==0]

array([90,  2,  4,  8,  6, 10, 12])

**배열명[[행],[열]]**
**배열명[행][열]**


In [71]:
arr2[[1,2],[1]]

array([ 7, 10])

In [117]:
arr2

array([[90,  2,  3,  4],
       [ 8,  7,  6,  5],
       [ 9, 10, 11, 12]])

In [119]:
arr2[1][1]

7

In [123]:
arr2[1:][1:]

array([[ 9, 10, 11, 12]])

### 1차원 배열의 슬라이싱 
**배열명[행위치, 열위치]**
- 시작위치에서 끝위치-1에 해당하는 배열의 원소 반환

In [72]:
arr1

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [81]:
# array_name[start:end+1:step] : start~end 범위 step 간격
arr[3:9:2] 

array([3, 5, 7])

In [84]:
arr1[::2]

array([0, 2, 4, 6, 8])

### 2차원 배열의 슬라이싱 
**배열명[(행):, (열):]**
- 시작위치에서 끝위치-1에 해당하는 배열의 원소 반환

In [100]:
arr2

array([[90,  2,  3,  4],
       [ 8,  7,  6,  5],
       [ 9, 10, 11, 12]])

In [101]:
arr2[2,2]

11

In [112]:
arr2[1:,1:3]

array([[ 7,  6],
       [10, 11]])

In [115]:
arr3 = np.arange(10,100,10).reshape(3,3)
arr3

array([[10, 20, 30],
       [40, 50, 60],
       [70, 80, 90]])

### 슬라이싱 된 배열에 값을 지정

In [129]:
arr3[:2, 1:3]=np.array([[1,3],[4,1]])
arr3

array([[10,  1,  3],
       [40,  4,  1],
       [70, 80, 90]])

## Array boolean 인덱싱(Mask)
- 다차원의 인덱싱을 응용하여 boolean 인덱싱.
- boolean 인덱싱을 통해 만들어낸 array를 통해 원하는 행이나 열의 값만 뽑아냄
- 가리고 싶은 부분은 가리고 원하는 요소만 꺼냄

In [132]:
names = np.array(['Beomwoo','Beomwoo','Kim','Joan','Lee','Beomwoo',
                  'Park','Beomwoo'])
names.shape

(8,)

In [145]:
# 8행 4열의 실수 난수 배열 생성
data = np.random.randn(8,4)
print(data, data.shape)

[[ 0.50515819 -1.85238729  0.56790041 -0.71064539]
 [ 0.29454238 -0.30393496  0.71642036  0.43753707]
 [ 0.55909944  0.96507972  0.37193658 -0.34193699]
 [-0.87574602  1.32068369 -0.26429151 -0.79399209]
 [ 0.16839787 -0.35629456  1.45189897 -0.53564703]
 [-0.5456024  -0.82219796 -0.22218858 -1.05460551]
 [-0.93844568 -0.74301426 -0.10802547  1.94741154]
 [ 0.11877315 -0.55284578 -0.15310142  1.39459484]] (8, 4)


In [146]:
# 요소가 Beomwoo인 항목에 대한 mask 생성
names_mask_Beomwoo = (names == 'Beomwoo')
names_mask_Beomwoo

array([ True,  True, False, False, False,  True, False,  True])

In [None]:
names_mask_Beomwoo