# Num Py( Numerical Python ) 

# http://numpy.org
- 조밀한 데이터 버퍼에서 저장하고 처리하는 효과적인 인터페이스를 제공
- NumPy 배열은 파이썬의 내장 타입인 list와 비슷하지만 배열의 규모가 커질수록 데이터 저장 및 처리에 훨씬 더 효율적이다.
- NumPy 배열은 파이썬의 데이터 과학 도구로 구성된 전체 생태계의 해심을 이루고 있다.

- 파이썬 데이터 과학도구 생태계
 - NumPy : 배열 표현
 - pandas : 데이터 처리
 - Matplotilb : 시각화 처리

##### NumPy를 사용하기 위해서는 import문을 통해 numpy를 import한다

In [2]:
import numpy as np                           # 배열을 제공하는 라이브러리라고 생각하면 됨

In [3]:
np.__version__

'1.18.1'

## NumPy 배열과 파이썬 배열의 비교

#### 파이썬은 데이터를 효율적이고 고정 타입 데이터 버퍼에 저장하는 다양한 방식을 제공
#### 내장 array 모듈은 단일 타입의 조밀한 배열( dense array )을 만드는데 사용할 수 있다.

In [4]:
import array

In [5]:
L = list( range( 10 ) )
a = array.array( 'i', L )                       # array = 반드시 동일한 자료형 집합 / # list는 타입이 다양(다양한 타입을 저장 가능)해서 처리속도가 느림(데이터 분석에 부적절)
a

array('i', [0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

- aaray는 기존의 list보다 동일 자료형을 저장하는 배열이므로 속도가 빠르다
- array보다 더 유용한 배열은 NumPy 모듈의 ndarray 객체이다.
- 파이썬의 array 객체는 배열 기반의 데이터에 효율적인 저장소를 제공하는 반면에 
- NumPy는 그 데이터의 효율적인 연산을 추가한다


### NumPy를 이용한 배열 생성

In [21]:
np.array( [ 1, 4, 2, 5, 3 ] )

array([1, 4, 2, 5, 3])

- 파이썬 리스트와 달리 NumPy는 배열의 모든 요소가 같은 타입이어야 한다.
- 타입이 일치하지 않으면 NumPy는 가능한 경우 상위 타입으로 변환하여 저장한다.

In [23]:
np.array( [ 3.14, 4, 2.3 ] )   # 실수와 정수가 섞였을 때 내부적으로 타입을 하나로 맞춘다 즉 정수 4를 4. 으로 실수로 나타냄

array([3.14, 4.  , 2.3 ])

- 파이썬 list는 다양한 자료형을 저장하는 배열              # import없이 사용 가능
- 파이썬 array는 동일한 자료형을 저장하는 배열             # import array 필요
- NumPy ndarray는 동일한 자료형을 저장하는 배열( 배열에 대한 연산이 포함 )   # import numpy as np 필요   

## NumPy 배열을 생성하는 다양한 방법

https://numpy.org/doc/stable/user/basics.creation.html

- 규모가 큰 배열의 경우 NumPy에 내장된 함수를 사용하여 처음부터 배열을 생성하는 것이 더 효율적이다.

- 기본 1차원 배열 생성 (열의 집합)

In [25]:
np.array( [ 1, 2, 3, 4, 5 ] )

array([1, 2, 3, 4, 5])

- 기본 2차원 배열 생성 ( 행/열의 집합 )

In [26]:
np.array( [ range( i, i + 3 ) for i in [ 2, 4, 6 ] ] )

array([[2, 3, 4],
       [4, 5, 6],
       [6, 7, 8]])

In [28]:
np.array( [ [ 2, 3, 4 ],
            [ 4, 5, 6 ],
            [ 6, 7, 8 ] ] )

array([[2, 3, 4],
       [4, 5, 6],
       [6, 7, 8]])

0으로 채운 길이 10의 정수 배열 생성

In [30]:
np.zeros( 10, dtype = int )

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

1로 채운 3 X 5 부동 소수점 배열 생성

In [31]:
np.ones( ( 3, 5 ) , dtype = float )

array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])

3.14로 채운 3 X 5 배열 생성

In [32]:
np.full( ( 3, 5 ), 3.14 )

array([[3.14, 3.14, 3.14, 3.14, 3.14],
       [3.14, 3.14, 3.14, 3.14, 3.14],
       [3.14, 3.14, 3.14, 3.14, 3.14]])

#### 선형, 수열로 채운 배열 생성

In [38]:
# 0에서 시작해서 2씩 더해 20까지 채움( 내잠함수 range()와 유사 )
np.arange( 0, 20, 2 )

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])

#### 0과 1사이에 일정한 간격을 가진 다섯 개의 값을 채운 배열 생성

In [36]:
np.linspace( 0, 1, 5 )

array([0.  , 0.25, 0.5 , 0.75, 1.  ])

#### 균등하게 분포된 3 X 3 배열 생성(  0 ~ 1사이의 난수로 채움 )

In [37]:
np.random.random( ( 3, 3 ) )

array([[0.71546922, 0.17979604, 0.9094021 ],
       [0.73485702, 0.84363993, 0.86023687],
       [0.18305803, 0.81953442, 0.02536057]])

#### 정규 분포( 평균 = 0, 표준편차 = 1 )의 난수로 채운 3 X 3 배열 생성

In [46]:
np.random.normal( 0, 1 ( 3, 3 ) )          # (평균, 표준편차 ( 행, 열 ) )     # 강사님 꺼랑 대입

TypeError: 'int' object is not callable

#### [ 0, 10 ] 구간의 임의의 정수를 채운 3 X 3 배열 생성 

In [40]:
np.random.randint( 0, 10, ( 3, 3 ) )

array([[4, 4, 6],
       [3, 7, 1],
       [0, 4, 9]])

#### 3 X 3 크기의 단위 행렬 생성

In [41]:
np.eye( 3 ) # 3을 주면 3 x 3 을 생성함 (정사각형 형태로) 4를 주면 4 x 4 생성

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

#### 세 개의 정수를 가지는 초기화 되지 않은 배열 생성, 초기화 되는 값은 해당 메모리 위치에 이미 존재하고 있는 값(garbage 값)으로 채운다.

In [48]:
np.empty( 3 )  # 1이라는 값은 의미가 없는 값, empty는 배열 공간만 할당하는 것, 값을 채우지는 않음 의미없는 값 1만 채움

array([1., 1., 1.])

## NumPy 표준 데이터 타입

### https://numpy.org/doc/stable/user/basics.types.html      # 타입별 설명

NumPy 배열은 한 가지 타입의 값을 담고 있으므로 해당 타입과 그 타입의 제약 사항을 자세히 알고 사용하는 것이 중요하다.

#### 배열을 구성할 때 데이터 타입은 문자열을 이용해 지정

In [49]:
np.zeros( 10, dtype = 'int16' )       # 16같은 뒤에 숫자는 크기를 정해주는 것

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0], dtype=int16)

#### 해당 데이터 타입과 관련된 NumPy 객체를 사용해 지정

In [50]:
np.zeros( 10, dtype = np.int16 )

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0], dtype=int16)

## NumPy 배열 사용

- 파이썬에서 데이터 처리는 NumPy 배열 처리와 거의 비슷하다.
- Pandas도 NumPy배열을 기반으로 작성되었다.

### NumPy 배열 기본 조작

- 배열 속성 지정
    - 배열의 크기, 모양, 메모리, 소비량, 데이터 타입을 결정한다
    
- 배열 인덱싱
    - 개별 배열 요소값을 가져오고 실행한다.

~ 배열 슬라이싱
    - 큰 배열 내에 있는 작은 하위 배열을 가져오고 설정한다.

- 배열 재구조화
    - 해당 배열의 형상을 변경한다.

- 배열 결합 및 분할
    - 여러 배열을 하나로 결합하고 하나의 배열을 여러개로 분할한다.

#### 배열 속성 지정 : 배열의 크기, 모양, 메모리 소비량, 데이터 타입을 결정한다.

*파이썬에서 array함수를 제공하느데 왜 NumPy를 쓰냐? -> 속도 때문에 (데이터가 많을 수록 NumPy가 효율적)*

In [53]:
np.random.seed( 0 )                   # 재현 가능성을 위한 시드값 부여 -> 시드값을 부여하면 한상 같은 값으로 나오

In [54]:
x1 = np.random.randint( 10, size = 6 ) # 1차원 배열                   # randint = 임의의 정수
x2 = np.random.randint( 10, size = ( 3, 4 ) ) # 2차원 배열
x3 = np.random.randint( 10, size = ( 3, 4 ,5 ) ) # 3차원 배열

In [87]:
x1

array([5, 0, 3, 3, 7, 9])

In [88]:
x2

array([[3, 5, 2, 4],
       [7, 6, 8, 8],
       [1, 6, 7, 7]])

In [89]:
x3

array([[[8, 1, 5, 9, 8],
        [9, 4, 3, 0, 3],
        [5, 0, 2, 3, 8],
        [1, 3, 3, 3, 7]],

       [[0, 1, 9, 9, 0],
        [4, 7, 3, 2, 7],
        [2, 0, 0, 4, 5],
        [5, 6, 8, 4, 1]],

       [[4, 9, 8, 1, 1],
        [7, 9, 9, 3, 6],
        [7, 2, 0, 3, 5],
        [9, 4, 4, 6, 4]]])

- 각 배열은 속성으로 ndim( 차원의 개수 ), shape( 각 차원의 크기 )를 가지고 있다.

In [97]:
print( 'x1 ndim : ', x1.ndim ) # 차원의 개수
print( 'x1 shape : ', x1.shape ) # 차원의 크기
print( 'x1 size : ', x1.size ) # 전체 배열의 크기

x1 ndim :  1
x1 shape :  (6,)
x1 size :  6


In [98]:
print( 'x2 ndim', x2.ndim ) # 차원의 개수
print( 'x2 shape', x2.shape ) # 차원의 크기
print( 'x2 size', x2.size ) # 전체 배열의 크기

x2 ndim 2
x2 shape (3, 4)
x2 size 12


In [99]:
print( 'x3 ndim', x3.ndim ) # 차원의 개수
print( 'x3 shape', x3.shape ) # 차원의 크기         > 3면 4행 5열
print( 'x3 size', x3.size ) # 전체 배열의 크기     -> 4x5 가 3개 있어서 60

x3 ndim 3
x3 shape (3, 4, 5)
x3 size 60


object(객체).속성(변수) / 객체.메소드()(함수)  -> ex) x1(객체).ndim(속성, 변수) / 

In [94]:
print( 'x1 dtype :', x1.dtype )  # 배열의 type
print( 'x2 dtype :', x2.dtype )   #
print( 'x3 dtype :', x3.dtype )

x1 dtype : int32
x2 dtype : int32
x3 dtype : int32


- itemsize = 각 배열 요소의 크기를 바이트 단위로 표시
- nbytes = 배열 전체 크기를 바이트 단위로 표시. itemsize를 size로 곤한값과 동일

In [96]:
print( 'x1 itemsize : ', x1.itemsize, 'bytes' )          # itemsize = 배열요소 하나의 크기
print( 'x1 nbyte : ', x1.nbytes, 'bytes' )               # nbyte = 4바이트 짜리 6개 여서 24바이트
print( 'x2 itemsize : ', x2.itemsize, 'bytes' ) 
print( 'x2 nbyte : ', x2.nbytes, 'bytes' )               # 4바이트 12개여서
print( 'x3 itemsize : ', x3.itemsize, 'bytes' )
print( 'x3 nbyte : ', x3.nbytes, 'bytes' )               # 4바이트 60개

x1 itemsize :  4 bytes
x1 nbyte :  24 bytes
x2 itemsize :  4 bytes
x2 nbyte :  48 bytes
x3 itemsize :  4 bytes
x3 nbyte :  240 bytes


#### 배열 인덱싱 : 배열 요소에 접근하기

### https://numpy.org/doc/stable/user/basics.indexing.html  

In [101]:
x1


array([5, 0, 3, 3, 7, 9])

In [102]:
x1[ 0 ]

5

In [103]:
x1[ 4 ] 

7

In [104]:
x1[ -1 ] # 배열 끝에서부터 인덱싱하려면 음수 인덱스 사용

9

In [105]:
x1[ -2 ]

7

- 다차원 배열에서는 ,로 구분된 인덱스 튜플을 이용해 배열 항목에 접근할 수 있다.

In [106]:
x2

array([[3, 5, 2, 4],
       [7, 6, 8, 8],
       [1, 6, 7, 7]])

In [107]:
x2[ 0, 0 ]

3

In [109]:
x2[ 2, 0 ] 

1

In [110]:
x2[ 2, -1 ]

7

- 인덱스 표기법을 사용하여 요소의 값을 수정할 수도 있다.

In [111]:
x2[ 0, 0 ] = 12
x2

array([[12,  5,  2,  4],
       [ 7,  6,  8,  8],
       [ 1,  6,  7,  7]])

- 파이썬 list와 달리 NumPy 배열은 고정 타입을 가진다는 점을 명심하자.
- 예로 정수 배열에 부등 소수점 값을 기억시키면 그 값은 소수점 이하를 잘라버리고 저장한다.

In [113]:
x1[ 0 ] = 3.141592
x1

array([3, 0, 3, 3, 7, 9])

### 배열 슬라이싱 : 하위 배열에 접근하기

- []을 사용해 개별 배열 요소에 접근할 수 있는  것처럼 : 기호로 표시되는 슬라이스( slice ) 표기법으로 하위 배열에 접근할 수 있다.
- NumPy 슬라이싱 구문은 표준 파이썬 리스트의 슬라이싱 구문을 따른다.
- 배열 x 의 슬라이스에 접근하려면 다음 구문을 사용한다.

x[ start : stop : step ] 

- 이 중 하나라도 지정되지 않으면 기본으로 start = 0, stop = 배열 차원의 크기, step = 1로 값이 설정된다.

In [114]:
# 1차원 하위 배열
x = np.arange( 10 )
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [115]:
x[ :5 ]

array([0, 1, 2, 3, 4])

In [116]:
x[ 5: ]

array([5, 6, 7, 8, 9])

In [118]:
x[ 4:7 ]

array([4, 5, 6])

In [120]:
x[ ::2 ]

array([0, 2, 4, 6, 8])

In [121]:
x[ 1::2 ]               # 지정숫자 1부터

array([1, 3, 5, 7, 9])

- step값을 음수로 부여했을때 혼동이 올 수 있다. 이 경우에는 start와 step의 기본 값이 서로 바뀐다.
- 이는 배열을 꺼꾸로 만드는 편리한 방법이 될 수 있다.

In [122]:
x[ ::-1 ]

array([9, 8, 7, 6, 5, 4, 3, 2, 1, 0])

In [123]:
x[ 5::-2 ]

array([5, 3, 1])

In [124]:
# 다차원 배열 슬라이싱
x2

array([[12,  5,  2,  4],
       [ 7,  6,  8,  8],
       [ 1,  6,  7,  7]])

In [128]:
x2[ :2, :3 ]       # -> [ 1행:2, 2행:3 ]

array([[12,  5,  2],
       [ 7,  6,  8]])

In [126]:
x2[ :3, ::2 ]

array([[12,  2],
       [ 7,  8],
       [ 1,  7]])

In [127]:
x2[ ::-1, ::-1 ]

array([[ 7,  7,  6,  1],
       [ 8,  8,  6,  7],
       [ 4,  2,  5, 12]])

### 배열의 행과 열에 접근

- 한 가지 공통으로 필요한 루틴은 배열의 단일 행이나 열에 접근하는 것이다.
- 이것은 단일 콜론으로 표시된 빈 슬라이스를 사용해 인덱싱과 슬라이싱을 결합함으로써 할 수 있다.

In [131]:
print( x2[ :, 0 ] )     # 슬라이싱과 인덱싱을 결합해서 쓴 것   -> 0열에 대한 것만 나옴

[12  7  1]


In [130]:
print( x2[ 0, : ] )     # 0행 전체 

[12  5  2  4]


- 행에 접근하는 경우 더 간결한 구문을 위해 빈 슬라이스를 생략할 수 있다.

In [132]:
print( x2[ 0 ] )     # x2[ 0, : ]와 동일

[12  5  2  4]


### 사본이 아닌 뷰로서의 하위 배열

- 배열 슬라이스가 배열 데이터의 사본( copy )이 아니라 뷰( view )를 반환한다는 점
- 이는 NumPy 배열 슬라이싱이 파이썬 리스트 슬라이싱과 다른 점으로 주의할 점
- 파이썬 리스트에서 슬라이스는 사본이다.

In [133]:
x2

array([[12,  5,  2,  4],
       [ 7,  6,  8,  8],
       [ 1,  6,  7,  7]])

In [134]:
x2_sub = x2[ :2, :2 ]       # 0~1행, 0~1열 2 x 2 크기의 하위 배열
x2_sub

array([[12,  5],
       [ 7,  6]])

In [135]:
x2_sub[ 0, 0 ] = 99
x2_sub



array([[99,  5],
       [ 7,  6]])

In [136]:
x2                          # 실제로 x2_sub를 바꿧는데 실제로 x2가 바뀜 -> numpy에서는 직접 바뀜( x2의 뷰를 가져와서 바꾼 것
                             # 이런것을 뷰라고 하고 뷰는 실제로 그 데이터가 바뀐다.), ##원본에 영향을 미침!##

array([[99,  5,  2,  4],
       [ 7,  6,  8,  8],
       [ 1,  6,  7,  7]])

- 위와 같은 동작은 실제로 매우 유용하다.
- 이것은 매우 큰 데이터세트를 다룰 때 기반 데이터 버퍼를 복사하지 않아도 이 데이터의 일부에 접근하고 처리할 수 있다는 뜻이다.

### 배열 사본 만들기

- 배열 뷰의 기능이 유용해도 때로는 배열이나 하위 배열 내의 데이터를 명시적으로 복사하는 것이 더 유용할 때가 있다.
- copy() 메서드를 이용하여 배열 명시적 복사를 수행할 수 있다.

In [137]:
x2_sub_copy = x2[ :2, :2 ].copy()
x2_sub_copy

array([[99,  5],
       [ 7,  6]])

In [138]:
x2_sub_copy[ 0, 0 ] = 42
x2_sub_copy

array([[42,  5],
       [ 7,  6]])

In [139]:
x2                           # copy는 직접 데이터를 바꾸지 않음, 즉 원본에 영향을 미치지 않ㄹ음

array([[99,  5,  2,  4],
       [ 7,  6,  8,  8],
       [ 1,  6,  7,  7]])

## 배열 재구조화

- 배열의 형상을 변경하는 것이다.
- reshape() 메서드를 사용한다,

In [141]:
grid = np.arange( 1, 10 ).reshape( ( 3, 3 ) )     # reshape = 형상을 1차원 배열에서 2차원 3행 3열로 바꾸겠다.
grid

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

- 위 코드 동작시 초기 배열의 규모가 형상이 변경된 배열의 규모와 일치해야 한다.  # 요소 수
- reshape() 메서드가 초기 배열의 사본(copy)이 아닌 뷰( view )를 사용하겠지만, 연속되지 않은 메모리 버퍼일 경우에는 그렇지 않을 수도 있다.
- 또 다른 일반적인 재구조화 패턴은 1차원 배열을 2차원 행이나 열 매트릭스로 전환하는 것이다.
- 이 작업은 reshape() 메서드로 할 수 있으며, 그렇지 않으면 슬라이스 연산 내에 newaxis(축지정) 키워드를 사용할 수도 있다.

In [143]:
x = np.array( [ 1, 2, 3 ] )
x

array([1, 2, 3])

In [144]:
x.reshape( ( 1, 3 ) )     # reshape를 이용한 행 백터로 재구조화    # 1행짜리 2차원 배열 []가 2개

array([[1, 2, 3]])

In [145]:
x[ np.newaxis, : ]        # newaxis를 이용한 행 백터로 재구조화    # 위와 같은 것

array([[1, 2, 3]])

In [146]:
x.reshape( ( 3, 1 ) )     # reshape를 이용한 행 백터로 재구조화    # 

array([[1],
       [2],
       [3]])

In [147]:
x[ :, np.newaxis ]        # newaxis를 이용한 행 백터로 재구조화

array([[1],
       [2],
       [3]])

## NumPy 배열 연산 :  유니버셜 함수( 유니버셜 함수에는 for 구문이 내장되어 있음) 

- NumPy는 데이터 배열을 사용하여 최적화된 연산을 쉽고 유연한 인터페이스를 제공
- NumPy 배열의 연산은 아주 빠르거나 아주 느릴 수 있다.
- 이 연산을 빠르게 만드는 핵심은 벡터화( vectorized ) 연산을 사용하는 것이다.
- 일반적으로 NumPy의 유니버설 함수를 통해 구현
- 배열 요소에 대한 반복적인 계산을 효율적으로 수행하게 해준다.   

- 벡터화 연산은 간단히 배열에 연산을 수행해 각 요소에 적용함으로써 수행할 수 있다.
- NumPy에서 백터화 연산은 NumPy 배열의 값에 반복된 연산을 빠르게 수행하는 것을 주목적으로 하는 ufuncs를 통해 구현
- ufuncs는 스칼라( 값 )와 배열 사이의 연산 및 두 배열 간의 연산도 가능하다.

In [148]:
x = np.arange( 4 )
x

array([0, 1, 2, 3])

In [149]:
print( 'x      = ', x ) 
print( 'x + 5  = ', x + 5 )
print( 'x - 5  = ', x - 5 )
print( 'x * 5  = ', x * 5 )
print( 'x / 5  = ', x / 5 )
print( 'x // 2 = ', x // 2 )
print( '-x     = ', -x )
print( 'x ** 2 = ', x ** 2 )
print( 'x %  2 = ', x % 2 )
# 특별히 for반복문을 쓰지 않아도 값을 넣어 연산하면 유니버셜 펑션은 각각 요소에 연산을 함

x      =  [0 1 2 3]
x + 5  =  [5 6 7 8]
x - 5  =  [-5 -4 -3 -2]
x * 5  =  [ 0  5 10 15]
x / 5  =  [0.  0.2 0.4 0.6]
x // 2 =  [0 0 1 1]
-x     =  [ 0 -1 -2 -3]
x ** 2 =  [0 1 4 9]
x %  2 =  [0 1 0 1]


# 유용한 유니버설 펑션

#### 집계

- 배열을 특정 연산으로 축소하고자 할 때 사용하는 메서드 : reduce()
- reduce() 메서드는 결과가 하나만 남을 때 까지 해당 연산을 배열 요소에 반복해서 적용한다.

In [150]:
x = np.arange( 1, 6 )
x

array([1, 2, 3, 4, 5])

In [151]:
np.add.reduce( x )     # add는 1부터 5까지 요소마다 계속 더해주는 것 .reduce는 과정 삭제 

15

In [152]:
np.multiply.reduce( x )

120

- 계산 중간 결과를 모두 저장하고 싶다면 accumulate() 메서드를 사용

In [153]:
np.add.accumulate( x )                   # 위에 15가 어떻게 15가 된건지 과정까지 담은 것

array([ 1,  3,  6, 10, 15], dtype=int32)

In [155]:
np.multiply.accumulate( x )b

array([  1,   2,   6,  24, 120], dtype=int32)

#### 배열의 합 계산

In [156]:
a = np.random.random( 100 )
a

array([0.65279032, 0.63505887, 0.99529957, 0.58185033, 0.41436859,
       0.4746975 , 0.6235101 , 0.33800761, 0.67475232, 0.31720174,
       0.77834548, 0.94957105, 0.66252687, 0.01357164, 0.6228461 ,
       0.67365963, 0.971945  , 0.87819347, 0.50962438, 0.05571469,
       0.45115921, 0.01998767, 0.44171092, 0.97958673, 0.35944446,
       0.48089353, 0.68866118, 0.88047589, 0.91823547, 0.21682214,
       0.56518887, 0.86510256, 0.50896896, 0.91672295, 0.92115761,
       0.08311249, 0.27771856, 0.0093567 , 0.84234208, 0.64717414,
       0.84138612, 0.26473016, 0.39782075, 0.55282148, 0.16494046,
       0.36980809, 0.14644176, 0.56961841, 0.70373728, 0.28847644,
       0.43328806, 0.75610669, 0.39609828, 0.89603839, 0.63892108,
       0.89155444, 0.68005557, 0.44919774, 0.97857093, 0.11620191,
       0.7670237 , 0.41182014, 0.67543908, 0.24979628, 0.31321833,
       0.96541622, 0.58846509, 0.65966841, 0.53320625, 0.23053302,
       0.39486929, 0.61880856, 0.47486752, 0.47013219, 0.71607

In [157]:
# 파이썬 내장 함수
sum( a )

52.12818058833704

In [158]:
# NumPy 내장 함수
np.sum( a )

52.12818058833702

In [159]:
# 파이썬 내장 함수
min( a ), max( a )

(0.009356704856532616, 0.9952995676778876)

In [160]:
# NumPy 함수
np.min( a ), np.max( a )

(0.009356704856532616, 0.9952995676778876)

In [161]:
a.sum(), a.min() , a.max()

(52.12818058833702, 0.009356704856532616, 0.9952995676778876)

In [None]:
# *a.sum() -> 객체 지향 방식(a라는 객체에 sum을 실행) / np.sum( a ) -> 기능적 방식( 함수에 객체를 적용, 이게 더 빠름)
# --> 주체에 따라서 기준

#### 다차원 집계 -> 다차원 배열은 연산 수행시 행이나 열을 기준으로 집계한다.

In [162]:
M.sum()

NameError: name 'M' is not defined

In [163]:
M.sum( axis = 0 )

NameError: name 'M' is not defined

In [None]:
M.sum( axis = 0 )

- 다차원 집계 함수는 어느 축( axis )을 지정하느냐에 따라 집계할 축을 결정할 수 있다.
- axis 키워드는 축소할 배열의 차원은 지정한다, 즉 축을 결정한다.
  - axis = 0은 열을 지정
  - axis = 1은 행을 지정

In [None]:
M.min( axis = 0 )     # 열에 대한 최솟값

In [None]:
M.min( axis = 0 )     # 행에 대한 최솟값