### __배열 축 바꾸기__

다차원 array 생성
    - array.T
    - array.transpose()

In [None]:
import numpy as np
arr = np.arange(15).reshape((3, 5))
arr

In [None]:
arr.T

In [None]:
arr.transpose()

### __리스트와의 차이점__
    - 리스트보다 훨씬 간결하다!

In [None]:
xarr = np.array([1, 2, 3, 4, 5])

In [None]:
yarr = np.array([1000, 2000, 2000, 2000, 2000])

In [None]:
condition = np.array([True, False, True, True, False])

In [None]:
condition

#### 순수 파이썬 문제점

- 큰 배열 빠르게 처리 불가
- 다차원 배열 사용 불가

In [None]:
result = [(x if c else y)
          for x, y, c in zip(xarr, yarr, condition)]

In [None]:
result

#### numpy.where 
    - numpy.where(조건, 참값, 거짓값)
    - 조건이 True일 때 참값이 실행되며, 조건이 False일 때 거짓값이 실행
    - 참값과 거짓값 인수의 형태는 ndarray가 아니어도 괜찮다(list, 상수, ...)

In [None]:
result = np.where(condition, xarr, yarr)

In [None]:
result

#### numpy.random
    - 임의의 값을 할당하기 위한 메서드

In [None]:
arr = np.random.randn(4, 4)

In [None]:
arr

In [None]:
np.where(arr > 0, 2, -2)

In [None]:
np.where(arr > 0, 2, arr)

### __수학 & 통계 메서드__
    - mean
    - sum
    - max

In [None]:
arr = np.random.randn(5, 4)

In [None]:
arr

In [None]:
arr.mean()

In [None]:
np.mean(arr)

In [None]:
arr.sum()

mean과 sum은 축을 지정할 수 있다
    - axis = 1 : 행으로 계산
    - axis = 0 : 열로 계산

In [None]:
arr.mean(axis=1)

In [None]:
# axis 인자를 넘긴 것과 넘기지 않은 것의 결과값이 같다.
arr.sum(axis=0)

In [None]:
arr.sum(0)

In [None]:
arr.sum(axis=1)

In [None]:
arr.sum(1)

In [None]:
arr.max(1)

In [None]:
arr.sum(0)

### __불리언 메서드__
    - True : 1, False : 0 으로 할당 됨
    - sum을 하게 되면 True의 수를 알 수 있음
    - any(): 하나 이상의 True값 검사
    - all(): 모든 원소가 True인지 검사

In [None]:
arr = np.random.randn(100)
arr

In [None]:
(arr > 0).sum()

In [None]:
conditions = np.array([False, False, True, False])

In [None]:
conditions.any()

In [None]:
conditions.all()

In [None]:
bools = np.array([True, True, True, True])

In [None]:
bools.any()

In [None]:
bools.all()

### __정렬__
    - sort()
    - argsort()

In [None]:
arr = np.random.randn(8)

In [None]:
arr

In [None]:
arr.sort()

In [None]:
arr

In [None]:
arr[::-1].sort()

In [None]:
arr

#### 다차원 배열의 정렬은 sort 메서드에 넘긴 축의 값에 따라 1차원 부분 정렬

In [None]:
np.random.seed(0)
arr = np.random.randint(30, size=(3, 4))
arr

In [None]:
# row sort
arr.sort(1)
arr

In [None]:
np.random.seed(0)
arr = np.random.randint(30, size=(3, 4))
# column sort
arr.sort(0)
arr

In [None]:
np.random.seed(0)
arr = np.random.randint(30, size=(3, 4))
# row sort == arr.sort(1)
arr.sort()
arr

위의 방식은 모든 행 또는 모든 열이 sorting이 되는 문제가 있음 \
기준이 되는 열 또는 행만 정렬하려면 어떻게 해야 할까

    -argsort() 사용
   

In [None]:
np.random.seed(0)
arr = np.random.randint(30, size=(3, 4))

# 1.첫 번째 열 값으로 모든 행을 정렬
arr[np.argsort(arr[:,0])] 

In [None]:
# 2.두 번째 열 값으로 모든 행을 정렬
arr[np.argsort(arr[:,1])] 

In [None]:
# 3.첫 번째 행 값으로 모든 행을 정렬
arr[:3, np.argsort(arr[0,:])] 

### __집합 함수__

#### 배열 집합 연산

Method | Comment
--- |----
unique(x) | 배열 x에서 중복된 원소를 제거한 후 정렬하여 반환한다.
intersect1d(x, y) | 배열 x와 y에 공통적으로 존재하는 원소를 정렬하여 반환한다.
union1d(x, y) | 두 배열의 합집합을 반환한다.
in1d(x, y) | x의 원소 중 y의 원소를 포함하는지를 나타내는 불리언 배열을 반환한다.
setdiff1d(x, y) | x와 y의 차집합을 반환한다.
setxor1d(x, y) | 한 배열에는 포함되지만 두 배열 모두에는 포함되지 않는 원소들의 집합인 대칭차집합을 반환한다.

In [None]:
names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])

In [None]:
np.unique(names)

In [None]:
ints = np.array([3, 3, 3, 2, 2, 1, 1, 4, 4])

In [None]:
np.unique(ints)

####순수 파이썬 구현

In [None]:
sorted(set(names))

In [None]:
%timeit np.unique(names)

In [None]:
%timeit sorted(set(names))