# Numpy

In [None]:
import numpy as np

In [None]:
# ndarray 생성
a = np.arange(5, 10, 2)

a.shape     # 차원 조회
a.size      # 데이터 갯수
a.ndim      # 차원 갯수
a.dtype     # 데이터 타팁
a.itemsize  # 사용하는 메모리
type(a)     # 데이터 타입

In [None]:
# 형 변환
a = np.array([10, 20, 30])
print(a.dtype.name)

a = a.astype('float64')
print(a.dtype.name)

a[2] = 30.1
a

---
## 1. Array 생성

In [None]:
a = np.array([10, 20, 30])                                      # 1차원
a = np.array([[10,20,30], [40,50,60]])                          # 2차원
a = np.array([ [[10, 20], [30, 40]], [[50, 60], [70, 80]] ])    # 3차원

- Array 만들기 함수

In [None]:
a = np.arange(10)           # 원하는 갯수의 Array 생성
a = np.zeros(10)            # 원하는 갯수의 Array 생성하고 zero로 채우기
a = np.ones(10)             # 원하는 갯수의 Array 생성하고 1로 채우기
a = np.linspace(0, 10, 50)  # 시작 ~ 종료까지 n 개의 Array 생성
a = np.logspace(0, 1, 50)   # 시작 ~ 종료까지 n 개의 log scale Array 생성

In [None]:
def f(x, y):
    return x*y
np.fromfunction(f, (4,4), dtype=int)
np.fromfunction(lambda x, y : x*y, (4,4), dtype=int)

- Matrix : 2차원 Array

In [None]:
m = np.matrix([ [10,20], [20,30] ])
m[1, 1]

--- 
## 2. Slice & Dice

In [None]:
a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print(a)

a[2][2]
a[2,2]

# Slice
a[0]
a[-1]
a[[0,2]]
a[0:2]
a[0:3:2]
a[:]
a[::-1]

# Dice
a[:,[1,2]]
a[:,1:3]
a[:,::-1]


---
## 3. 기본 연산

In [None]:
a = np.array([10, 20, 30, 23])
b = np.array([21, 3, 40, 8])

# 추가/삭제
a = np.insert(a, 0, 5)
a = np.delete(a, 0)

# 연산 함수
np.add(a, b)
np.subtract(a, b)
np.multiply(a, b)
np.divide(a, b)
np.divmod(a, b)
np.exp(b)
np.sqrt(b)

# 통계 함수
np.mean(a)                              # 평균
np.average(a, weights=[1, 1, 1, 1])     # 평균 + 가중치(weight로 줄 수 있음)
np.median(a)                            # 중앙치
np.cumsum(a)                            # 누적 합계
np.cov(a)                               # 공분산
np.std(a)                               # 표준편차
np.var(a)                               # 분산
np.sum(a)                               # 합계
np.min(a)                               # 최소값
np.argmin(a)                            # 최소값 위치
np.max(a)                               # 최대값
np.argmax(a)                            # 최대값 위치
np.ptp(a)                               # 최대값과 최소값의 차이

# 정렬/검색
np.sort(a)                              # 정렬
np.argsort(a)                           # 정렬 인덱스
np.searchsorted(a, b)                   # 두 array를 합칠때 b가 정렬되는 위치 
np.nonzero(a)                           # 0이 아닌 위치를 반환


---
## 4. 논리 연산

In [None]:
a = np.array([0, 1, 2])

a.all()         # 전체가 True?
a.any()         # 하나라도 True?

np.where(a>1)   # 논리연산 결과 인덱스 확인
np.where(a==0)
np.where(a<1)

---
## 5. Array 관리

- Array 차원 변경

In [None]:
# 차원 전환
a = np.arange(1, 7, 1)
a.reshape(2,3)
np.linspace(1, 10, 100).reshape(5,-1)

# 1차원 배열로 변경
a.flatten()
a.reshape(-1)

# 반복해서 array 입력
a = np.array([[1, 2], [2, 3]])
np.repeat(a, 2, axis=0)

a = np.array([[1, 2], [2, 3]])
np.repeat(a, 2, axis=1)

a = np.array([[1, 2], [2, 3]])
np.repeat(a, [2, 3], axis=0)    # 반복할 횟수를 각각 지정

# 불필요한 Array 차원을 축소
a = np.array([[10, 20, 30]])
a.squeeze()

- Array 병합

In [None]:
a = np.array([[1], [2], [3]])
b = np.array([[3], [4], [5]])

np.vstack((a,b))                # 행으로
np.concatenate((a, b), axis=0)

np.hstack((a,b))                # 종으로
np.concatenate((a, b), axis=1)

- Array 분할

In [None]:
a = np.array([
    [1, 2, 3], [2, 3, 4], [3, 4, 5]
    ])
v = np.vsplit(a, 3)
h = np.hsplit(a, 3)

- Array 치환

In [None]:
a = np.array([[10, 20, 30], [40, 50, 60], [70, 80, 90]])
np.transpose(a)

- Array 복사

In [None]:
a = np.array([[10, 20, 30], [40, 50, 60], [70, 80, 90]])
b = a
print(id(a), id(b), a is b)

c = a.copy()
print(id(a), id(c), a is c)

---
## 6. 행렬 연산

In [None]:
# 대각선 방향 값 합계
a = np.ones((3,3))
np.trace(a)

In [None]:
# 대각선 방향 값 채우기
np.fill_diagonal(a, 100)
np.trace(a)

In [None]:
a = np.array([10, 20, 30, 40])
b = np.array([30, 50])

np.union1d(a, b)        # 합집합
np.intersect1d(a, b)    # 교집합
np.setdiff1d(a, b)      # 차집합
np.setxor1d(a, b)       # Exclusive OR

---
## 7. 기타

In [1]:
# Random 함수
np.random.rand(5)                       # 필요한 갯수의 랜덤한 숫자 리턴 - 균등분포
np.random.randn(5)                      # 필요한 갯수의 랜덤한 숫자 리턴 - 정규분포
np.random.randint(5)                    # 범위 안에서 랜덤한 숫자 1개 리턴
np.random.choice(np.arange(0, 100), 5)  # 랜덤 샘플링

# 난수의 Seed를 고정
rs = np.random.RandomState(10)
rs.rand(5)

NameError: name 'np' is not defined