# Numpy 기초

## 1. Numpy 란?



![행렬](https://upload.wikimedia.org/wikipedia/commons/thumb/4/4d/Matrix_ko.svg/220px-Matrix_ko.svg.png)

행렬의 기초 : https://m.blog.naver.com/ehdsnck/221794368721

Numpy는 C언어로 구현된 파이썬 라이브러리로써, 고성능의 수치계산을 위해 제작되었습니다. Numerical Python의 줄임말이기도 한 Numpy는 벡터 및 행렬 연산에 있어서 매우 편리한 기능을 제공합니다.

또한 이는 데이터분석을 할 때 사용되는 라이브러리인 pandas와 matplotlib의 기반으로 사용되기도 합니다.

numpy에서는 기본적으로 array라는 단위로 데이터를 관리하며 이에 대해 연산을 수행합니다. array는 말그대로 행렬이라는 개념으로 생각하시면 됩니다.



먼저 numpy를 사용하기 위해서는 아래와 같은 코드로 numpy를 import해야 합니다.


```python
import numpy as np
```


사실상, numpy를 설치하고 단순히 import numpy 만 해도 되지만, 이를 코드에서 보다 편하게 사용하기 위해 as np 를 붙임으로써 np라는 이름으로 numpy를 사용합니다.

In [1]:
# numpy 사용하기
import numpy as np

## 2. Array 정의 및 사용하기

In [2]:
data1 = [1,2,3,4,5]
data1

[1, 2, 3, 4, 5]

In [3]:
data2 = [1,2,3,3.5,4]
data2

[1, 2, 3, 3.5, 4]

In [4]:
# numpy를 이용하여 array 정의하기
# 1. 위에서 만든 python list를 이용
arr1 = np.array(data1)
arr1

array([1, 2, 3, 4, 5])

In [5]:
# array의 형태(크기)를 확인할 수 있다.
arr1.shape

(5,)

In [6]:
# 2. 바로 python list를 넣어 줌으로써 만들기
arr2 = np.array([1,2,3,4,5])
arr2

array([1, 2, 3, 4, 5])

In [7]:
arr2.shape

(5,)

In [8]:
# array의 자료형을 확인할 수 있다.
arr2.dtype

dtype('int64')

In [9]:
arr3 = np.array(data2)
arr3

array([1. , 2. , 3. , 3.5, 4. ])

In [10]:
arr3.shape

(5,)

In [11]:
arr3.dtype

dtype('float64')

In [12]:
arr4 = np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
arr4

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

In [13]:
arr4.shape

(4, 3)

### numpy shape

numpy에서는 해당 array의 크기를 알 수 있다.

shape 을 확인함으로써 몇개의 데이터가 있는지, 몇 차원으로 존재하는지 등을 확인할 수 있다.

위에서 arr1.shape의 결과는 (5,) 으로써, 1차원의 데이터이며 총 5라는 크기를 갖고 있음을 알 수 있다.

arr4.shape의 결과는 (4,3) 으로써, 2차원의 데이터이며 4 * 3 크기를 갖고 있는 array 이다.

### numpy 자료형

arr1이나 arr2는 int64라는 자료형을 갖는 것에 반해 arr3는 float64라는 자료형을 갖는다.

이는 arr3내부 데이터를 살펴보면 3.5라는 실수형 데이터를 갖기 때문임을 알 수 있다.

numpy에서 사용되는 자료형은 아래와 같다. (자료형 뒤에 붙는 숫자는 몇 비트 크기인지를 의미한다.)

- 부호가 있는 정수 int(8, 16, 32, 64)
- 부호가 없는 정수 uint(8 ,16, 32, 54)
- 실수 float(16, 32, 64, 128)
- 복소수 complex(64, 128, 256)
- 불리언 bool
- 문자열 string_
- 파이썬 오프젝트 object
- 유니코드 unicode_

### 2-1. np.zeros(), np.ones(), np.arange() 함수
numpy에서 array를 정의할 때 사용되는 함수들이다.

아래 실습을 통해 각각이 어떻게 다른지 살펴본다.

In [14]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [15]:
np.zeros((3,5)) # 3행 5열

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

> np.zeros() 함수는 인자로 받는 크기만큼, 모든요소가 0인 array를 만든다.

In [16]:
np.ones(9)

array([1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [17]:
np.ones((2,10))

array([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.]])

> np.ones() 함수는 인자로 받는 크기만큼, 모든요소가 1인 array를 만든다.

In [18]:
np.arange(10)   # arrange가 아닌 arange

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [19]:
np.arange(3,11)

array([ 3,  4,  5,  6,  7,  8,  9, 10])

> np.arange() 함수는 인자로 받는 값 만큼 1씩 증가하는 1차원 array를 만든다.  
> 이때 하나의 인자만 입력하면 0 ~ 입력한 인자, 값 만큼의 크기를 가진다.

### 3. Array 연산
기본적으로 numpy에서 연산을 할때는 크기가 서로 동일한 array 끼리 연산이 진행된다.

이때 같은 위치에 있는 요소들 끼리 연산이 진행된다.

In [20]:
arr1 = np.array([[1,2,3],[4,5,6]])
arr1

array([[1, 2, 3],
       [4, 5, 6]])

In [21]:
arr1.shape

(2, 3)

In [22]:
arr2 = np.array([[10,11,12],[13,14,15]])
arr2

array([[10, 11, 12],
       [13, 14, 15]])

In [23]:
arr2.shape

(2, 3)

#### 3-1. array 덧셈

In [24]:
arr1 + arr2

array([[11, 13, 15],
       [17, 19, 21]])

#### 3-2. array 뺄셈

In [25]:
arr1 - arr2

array([[-9, -9, -9],
       [-9, -9, -9]])

#### 3-3. array 곱셈

주의

행렬의 곱처럼 곱셈이 진행되는 것이 아니라 각 요소별로 곱셈이 진행된다.

행렬의 곱셈: https://ko.wikipedia.org/wiki/%ED%96%89%EB%A0%AC_%EA%B3%B1%EC%85%88

In [26]:
arr1 * arr2

array([[10, 22, 36],
       [52, 70, 90]])

#### 3-4. array 나눗셈

In [27]:
arr1 / arr2

array([[0.1       , 0.18181818, 0.25      ],
       [0.30769231, 0.35714286, 0.4       ]])

#### 3-5. array의 브로드 캐스트

위에서는 array가 같은 크기를 가져야 서로 연산이 가능하다고 했지만,

numpy에서는 브로드캐스트라는 기능을 제공한다.

브로드캐스트란, 서로 크기가 다른 array가 연산이 가능하게끔 하는 것이다.

In [28]:
arr1

array([[1, 2, 3],
       [4, 5, 6]])

In [29]:
arr1.shape

(2, 3)

In [30]:
arr3 = np.array([10,11,12])
arr3

array([10, 11, 12])

In [31]:
arr3.shape

(3,)

In [32]:
arr1 + arr3

array([[11, 13, 15],
       [14, 16, 18]])

In [33]:
arr1 * arr3

array([[10, 22, 36],
       [40, 55, 72]])

위와 같이 서로 크기가 다른 arr1과 arr3의 연산이 가능하다.

연산결과를 살펴보면 arr3이 [10,11,12] 에서 [[10,11,12],[10,11,12]]로 확장되어 계산되었음을 확인할 수 있다.

동일한 방식으로 하나의 array에 스칼라 연산도 가능하다.

In [34]:
arr1 * 10

array([[10, 20, 30],
       [40, 50, 60]])

In [35]:
# 요소에 대해 제곱처리
arr1 ** 2

array([[ 1,  4,  9],
       [16, 25, 36]])

### 4. Array 인덱싱
numpy에서 사용되는 인덱싱은 기본적으로 python 인덱싱과 동일하다.

이때, python에서와 같이 1번째로 시작하는 것이 아니라 0번째로 시작하는 것에 주의한다.

In [36]:
arr1 = np.arange(10)
arr1

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [37]:
# 0번째 요소
arr1[0]

0

In [38]:
# 3번째 요소
arr1[3]

3

In [39]:
# 3번째 요소부터 8번째 요소
arr1[3:9]

array([3, 4, 5, 6, 7, 8])

In [40]:
arr1[:]

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

물론 1차원이 아닌 그 이상의 차원에서도 인덱싱이 가능하다.

In [41]:
arr2 = np.array([[1,2,3,4],
                 [5,6,7,8],
                 [9,10,11,12]])
arr2

array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

In [42]:
# 2차원의 array에서 인덱싱을 하기 위해선 2개의 인자를 입력해야 합니다.
arr2[0,0]

1

In [43]:
# 2행의 모든 요소 꺼내기
arr2[2,:]

array([ 9, 10, 11, 12])

In [44]:
# 2행의 3번째 요소 꺼내기
arr2[2,3]

12

In [45]:
# 모든 열의 3번째 요소 꺼내기
arr2[:,3]

array([ 4,  8, 12])

### 5. Array boolean 인덱싱(마스크)
위에서 이용한 다차원의 인덱싱을 응용하여 boolean 인덱싱을 할 수 있다.

이 기능은 주로 마스크라고 이야기하는데, boolean인덱싱을 통해 만들어낸 array를 통해 우리가 원하는 행 또는 열의 값만 뽑아낼 수 있다.

즉, 마스크처럼 우리가 가리고 싶은 부분은 가리고, 원하는 요소만 꺼낼 수 있다.

In [46]:
names = np.array(['Beomwoo','Beomwoo','Kim','Joan','Lee','Beomwoo','Park','Beomwoo'])
names

array(['Beomwoo', 'Beomwoo', 'Kim', 'Joan', 'Lee', 'Beomwoo', 'Park',
       'Beomwoo'], dtype='<U7')

In [47]:
names.shape

(8,)

In [48]:
# 아래에서 사용되는 np.random.randn() 함수는 기대값이 0이고, 표준편차가 1인 가우시안 정규 분포를 따르는 난수를 발생시키는 함수이다.
# 이 외에도 0~1의 난수를 발생시키는 np.random.rand() 함수도 존재한다.
data = np.random.randn(8,4)
data

array([[ 0.30737746,  0.09339552,  0.40732199,  1.25236902],
       [-0.37110234,  1.3024113 ,  0.45145565,  0.09934858],
       [-0.12822901,  0.6621956 , -1.70987785, -0.82388932],
       [-0.73657511, -2.29972703,  1.21726756, -0.78136461],
       [-0.43129285,  0.45262907,  1.21232927, -1.13579974],
       [ 0.12713584,  0.34502912,  0.61572268, -0.89976821],
       [ 1.26759537,  1.91748774,  0.13805197,  1.47575858],
       [ 0.06541148,  2.05757985,  0.20650982, -0.68503477]])

In [49]:
data.shape

(8, 4)

위와 같은 names와 data라는 array가 있다.

이때, names의 각 요소가 data의 각 행과 연결된다고 가정해보자.

그리고 이 때, names가 Beomwoo인 행의 data만 보고 싶을 때 다음과 같이 마스크를 사용한다.

In [50]:
# 요소가 Beomwoo인 항목에 대한 mask 생성
names_Beomwoo_mask = (names == 'Beomwoo')
names_Beomwoo_mask

array([ True,  True, False, False, False,  True, False,  True])

In [51]:
# [ True,  True, False, False, False,  True, False,  True] 중 
# True가 행에 가 포함되어있는 열만 뽑기
data[names_Beomwoo_mask,:]

array([[ 0.30737746,  0.09339552,  0.40732199,  1.25236902],
       [-0.37110234,  1.3024113 ,  0.45145565,  0.09934858],
       [ 0.12713584,  0.34502912,  0.61572268, -0.89976821],
       [ 0.06541148,  2.05757985,  0.20650982, -0.68503477]])

위의 결과를 보면, 요소가 Beomwoo인 것은 0번째, 1번째, 5번째, 7번째 이므로

data에서 0,1,5,7행의 모든 요소를 꺼내와야 한다.

이를 위해 요소가 Beomwoo인 것에 대한 boolean 값을 가지는 mask를 만들었고

마스크를 인덱싱에 응용하여 data의 0,1,5,7행을 꺼냈다.

In [52]:
# 요소가 Kim인 행의 데이터만 꺼내기
data[names == 'Kim',:]

array([[-0.12822901,  0.6621956 , -1.70987785, -0.82388932]])

In [53]:
# 논리 연산을 응용하여, 요소가 Kim 또는 Park인 행의 데이터만 꺼내기
data[(names == 'Kim') | (names == 'Park'),:]

array([[-0.12822901,  0.6621956 , -1.70987785, -0.82388932],
       [ 1.26759537,  1.91748774,  0.13805197,  1.47575858]])

물론 data array 자체적으로도 마스크를 만들고, 이를 응용하여 인덱싱이 가능하다.

data array에서 0번째 열의 값이 0보다 작은 행을 구해보자.

1,1 / 1,2 / 1,3 / 1,4 ... 중 0보다 작은 데이터

In [54]:
# 먼저 마스크를 만든다.
# data array에서 0번째 열이 0보다 작은 요소의 boolean 값은 다음과 같다.
data[:,0] < 0

array([False,  True,  True,  True,  True, False, False, False])

In [55]:
# 위에서 만든 마스크를 이용하여 0번째 열의 값이 0보다 작은 행을 구한다.
# 위 array에서 true를 반환한 행들만 출력
data[data[:,0]<0,:]

array([[-0.37110234,  1.3024113 ,  0.45145565,  0.09934858],
       [-0.12822901,  0.6621956 , -1.70987785, -0.82388932],
       [-0.73657511, -2.29972703,  1.21726756, -0.78136461],
       [-0.43129285,  0.45262907,  1.21232927, -1.13579974]])

이를 통해 특정 위치에만 우리가 원하는 값을 대입할 수 있다.

위에서 얻은, 0번째 열의 값이 0보다 작은 행의 2,3번째 열값에 0을 대입해보자.

In [56]:
# 0번째 열의 값이 0보다 작은 행의 2,3번째 열 값
data[data[:,0]<0,2:4]     # 행 == data[:,0]<0  열 == 2:4

array([[ 0.45145565,  0.09934858],
       [-1.70987785, -0.82388932],
       [ 1.21726756, -0.78136461],
       [ 1.21232927, -1.13579974]])

In [57]:
data[data[:,0]<0,2:4] = 0
data

array([[ 0.30737746,  0.09339552,  0.40732199,  1.25236902],
       [-0.37110234,  1.3024113 ,  0.        ,  0.        ],
       [-0.12822901,  0.6621956 ,  0.        ,  0.        ],
       [-0.73657511, -2.29972703,  0.        ,  0.        ],
       [-0.43129285,  0.45262907,  0.        ,  0.        ],
       [ 0.12713584,  0.34502912,  0.61572268, -0.89976821],
       [ 1.26759537,  1.91748774,  0.13805197,  1.47575858],
       [ 0.06541148,  2.05757985,  0.20650982, -0.68503477]])

## 6. Numpy 함수

numpy에서는 array에 적용되는 다양한 함수가 있다.


### 6-1. 하나의 array에 적용되는 함수

In [58]:
arr1 = np.random.randn(5,3)   # 크기가 5, 3인 난수 행렬
arr1

array([[ 0.621196  , -1.40801962,  1.09065589],
       [ 1.00958951, -1.29614006,  1.56934888],
       [-0.94677184, -0.04781376,  1.24270936],
       [ 0.42106114, -2.07176653, -1.17746036],
       [-1.56582282, -1.14312756,  1.15504945]])

In [59]:
# 각 성분의 절대값 계산하기
np.abs(arr1)

array([[0.621196  , 1.40801962, 1.09065589],
       [1.00958951, 1.29614006, 1.56934888],
       [0.94677184, 0.04781376, 1.24270936],
       [0.42106114, 2.07176653, 1.17746036],
       [1.56582282, 1.14312756, 1.15504945]])

In [60]:
# 각 성분의 제곱근 계산하기 ( == array ** 0.5)
np.sqrt(arr1)

  


array([[0.78815988,        nan, 1.04434472],
       [1.00478332,        nan, 1.25273655],
       [       nan,        nan, 1.11476875],
       [0.64889224,        nan,        nan],
       [       nan,        nan, 1.07473227]])

In [61]:
# 각 성분의 제곱 계산하기
np.square(arr1)

array([[3.85884470e-01, 1.98251925e+00, 1.18953027e+00],
       [1.01927098e+00, 1.67997907e+00, 2.46285589e+00],
       [8.96376924e-01, 2.28615568e-03, 1.54432655e+00],
       [1.77292481e-01, 4.29221656e+00, 1.38641290e+00],
       [2.45180112e+00, 1.30674061e+00, 1.33413922e+00]])

In [62]:
# 각 성분을 무리수 e의 지수로 삼은 값을 계산하기
np.exp(arr1)

array([[1.86115265, 0.24462726, 2.9762255 ],
       [2.74447421, 0.27358578, 4.80351949],
       [0.3879915 , 0.95331131, 3.46498866],
       [1.52357742, 0.12596307, 0.30806011],
       [0.20891604, 0.31882033, 3.17418036]])

In [63]:
# 각 성분을 자연로그, 상용로그, 밑이 2인 로그를 씌운 값을 계산하기
np.log(arr1)

  


array([[-0.47610863,         nan,  0.08677925],
       [ 0.00954382,         nan,  0.4506608 ],
       [        nan,         nan,  0.21729396],
       [-0.86497724,         nan,         nan],
       [        nan,         nan,  0.14414315]])

In [64]:
np.log10(arr1)

  """Entry point for launching an IPython kernel.


array([[-0.20677135,         nan,  0.03768775],
       [ 0.00414483,         nan,  0.1957195 ],
       [        nan,         nan,  0.09436957],
       [-0.37565484,         nan,         nan],
       [        nan,         nan,  0.06260058]])

In [65]:
np.log2(arr1)

  """Entry point for launching an IPython kernel.


array([[-0.68687956,         nan,  0.12519599],
       [ 0.01376883,         nan,  0.65016611],
       [        nan,         nan,  0.31348892],
       [-1.24789837,         nan,         nan],
       [        nan,         nan,  0.20795461]])

In [66]:
# 각 성분의 부호 계산하기(+인 경우 1, -인 경우 -1, 0인 경우 0)
np.sign(arr1)

array([[ 1., -1.,  1.],
       [ 1., -1.,  1.],
       [-1., -1.,  1.],
       [ 1., -1., -1.],
       [-1., -1.,  1.]])

In [67]:
# 각 성분의 소수 첫 번째 자리에서 올림한 값을 계산하기
np.ceil(arr1)

array([[ 1., -1.,  2.],
       [ 2., -1.,  2.],
       [-0., -0.,  2.],
       [ 1., -2., -1.],
       [-1., -1.,  2.]])

In [68]:
# 각 성분의 소수 첫 번째 자리에서 내림한 값을 계산하기
np.floor(arr1)

array([[ 0., -2.,  1.],
       [ 1., -2.,  1.],
       [-1., -1.,  1.],
       [ 0., -3., -2.],
       [-2., -2.,  1.]])

In [69]:
# 각 성분이 NaN인 경우 True를, 아닌 경우 False를 반환하기
np.isnan(arr1)

array([[False, False, False],
       [False, False, False],
       [False, False, False],
       [False, False, False],
       [False, False, False]])

In [70]:
np.isnan(np.log(arr1))

  """Entry point for launching an IPython kernel.


array([[False,  True, False],
       [False,  True, False],
       [ True,  True, False],
       [False,  True,  True],
       [ True,  True, False]])

In [71]:
# 각 성분이 무한대인 경우 True를, 아닌 경우 False를 반환하기
np.isinf(arr1)

array([[False, False, False],
       [False, False, False],
       [False, False, False],
       [False, False, False],
       [False, False, False]])

In [72]:
# 각 성분에 대해 삼각함수 값을 계산하기(cos, cosh, sin, sinh, tan, tanh)
np.cos(arr1)

array([[ 0.81318296,  0.16205883,  0.46190374],
       [ 0.53220829,  0.2712161 ,  0.00144745],
       [ 0.58430589,  0.99885714,  0.32223263],
       [ 0.91265574, -0.48027675,  0.38327176],
       [ 0.00497348,  0.41475066,  0.4038733 ]])

In [73]:
np.tanh(arr1)

array([[ 0.5519602 , -0.88707285,  0.79711741],
       [ 0.76559218, -0.86072617,  0.91692213],
       [-0.7383181 , -0.04777736,  0.84622655],
       [ 0.39782401, -0.96876225, -0.82664912],
       [-0.91635877, -0.81546456,  0.81941996]])

### 6-2. 두 개의 array에 적용되는 함수

In [74]:
arr1

array([[ 0.621196  , -1.40801962,  1.09065589],
       [ 1.00958951, -1.29614006,  1.56934888],
       [-0.94677184, -0.04781376,  1.24270936],
       [ 0.42106114, -2.07176653, -1.17746036],
       [-1.56582282, -1.14312756,  1.15504945]])

In [75]:
arr2 = np.random.randn(5,3)
arr2

array([[ 0.32010425,  0.9248702 , -0.18934834],
       [ 0.59441928,  0.47365478,  1.08252195],
       [-0.89706518, -0.212121  , -0.15013366],
       [ 0.64875802, -1.32423899, -0.59062611],
       [ 1.65590462,  0.43736122, -0.26856496]])

In [76]:
# 두 개의 array에 대해 동일한 위치의 성분끼리 연산 값을 계산하기(add, subtract, multiply, divide)
np.multiply(arr1,arr2)

array([[ 0.19884748, -1.30223539, -0.20651388],
       [ 0.60011947, -0.61392294,  1.6988546 ],
       [ 0.84931605,  0.0101423 , -0.1865725 ],
       [ 0.27316679,  2.74351403,  0.69543884],
       [-2.59285325, -0.49995966, -0.31020581]])

In [77]:
# 두 개의 array에 대해 동일한 위치의 성분끼리 비교하여 최대값 또는 최소값 계산하기(maximum, minimum)
np.maximum(arr1,arr2)

array([[ 0.621196  ,  0.9248702 ,  1.09065589],
       [ 1.00958951,  0.47365478,  1.56934888],
       [-0.89706518, -0.04781376,  1.24270936],
       [ 0.64875802, -1.32423899, -0.59062611],
       [ 1.65590462,  0.43736122,  1.15504945]])

#### 6-3. 통계 함수
통계 함수를 통해 array의 합이나 평균등을 구할 때,

추가로 axis라는 인자에 대한 값을 지정하여 열 또는 행의 합 또는 평균등을 구할 수 있다.


> axis에 대한 이해

http://machinelearningkorea.com/2019/05/18/%ED%8C%8C%EC%9D%B4%EC%8D%AC-axis-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0-%EC%B9%98%ED%8A%B8%EC%BD%94%EB%93%9C/

![](https://taewanmerepo.github.io/2017/09/numpy_axis/axis.jpg)

![](https://taewanmerepo.github.io/2017/09/numpy_axis/axis0-cube.jpg)

![](https://taewanmerepo.github.io/2017/09/numpy_axis/axis1-cube.jpg)

![](https://taewanmerepo.github.io/2017/09/numpy_axis/axis2-cube.jpg)


In [78]:
arr1

array([[ 0.621196  , -1.40801962,  1.09065589],
       [ 1.00958951, -1.29614006,  1.56934888],
       [-0.94677184, -0.04781376,  1.24270936],
       [ 0.42106114, -2.07176653, -1.17746036],
       [-1.56582282, -1.14312756,  1.15504945]])

In [79]:
# 전체 성분의 합을 계산
np.sum(arr1)

-2.5473123420288166

In [80]:
# 열 간의 합을 계산
np.sum(arr1, axis=1)

array([ 0.30383227,  1.28279832,  0.24812376, -2.82816575, -1.55390094])

In [81]:
# 행 간의 합을 계산
np.sum(arr1, axis=0)

array([-0.46074802, -5.96686753,  3.88030321])

In [82]:
# 전체 성분의 평균을 계산
np.mean(arr1)

-0.1698208228019211

In [83]:
# 행 간의 평균을 계산
np.mean(arr1, axis=0)

array([-0.0921496 , -1.19337351,  0.77606064])

전체 성분의 표준편차, 분산, 최소값, 최대값 계산(std, var, min, max)

In [84]:
# 전체 성분의 표준편차 계산
np.std(arr1)

1.2021937106671508

In [85]:
np.min(arr1, axis=1)

array([-1.40801962, -1.29614006, -0.94677184, -2.07176653, -1.56582282])

In [86]:
# 전체 성분의 최소값, 최대값이 위치한 인덱스를 반환(argmin, argmax)
np.argmin(arr1)

10

np.argmax(array, axis)

In [87]:
np.argmax(arr1,axis=0)

array([1, 2, 1])

In [88]:
# 맨 처음 성분부터 각 성분까지의 누적합 또는 누적곱을 계산(cumsum, cumprod)
np.cumsum(arr1)

array([ 0.621196  , -0.78682362,  0.30383227,  1.31342178,  0.01728171,
        1.58663059,  0.63985875,  0.59204499,  1.83475435,  2.25581548,
        0.18404895, -0.99341141, -2.55923423, -3.70236179, -2.54731234])

In [89]:
np.cumsum(arr1,axis=1)    # 누적합

array([[ 0.621196  , -0.78682362,  0.30383227],
       [ 1.00958951, -0.28655055,  1.28279832],
       [-0.94677184, -0.9945856 ,  0.24812376],
       [ 0.42106114, -1.65070539, -2.82816575],
       [-1.56582282, -2.70895038, -1.55390094]])

In [90]:
np.cumprod(arr1)    # 누적곱

array([ 0.621196  , -0.87465615, -0.95394888, -0.96309679,  1.24830833,
        1.95903128, -1.85475566,  0.08868284,  0.110207  ,  0.04640388,
       -0.09613801,  0.1131987 , -0.17724911,  0.20261834,  0.2340342 ])

#### 6-4. 기타 함수

In [91]:
arr1

array([[ 0.621196  , -1.40801962,  1.09065589],
       [ 1.00958951, -1.29614006,  1.56934888],
       [-0.94677184, -0.04781376,  1.24270936],
       [ 0.42106114, -2.07176653, -1.17746036],
       [-1.56582282, -1.14312756,  1.15504945]])

In [93]:
np.sort(arr1, axis=1)

array([[-1.40801962,  0.621196  ,  1.09065589],
       [-1.29614006,  1.00958951,  1.56934888],
       [-0.94677184, -0.04781376,  1.24270936],
       [-2.07176653, -1.17746036,  0.42106114],
       [-1.56582282, -1.14312756,  1.15504945]])

In [94]:
np.sort(arr1, axis=0)

array([[-1.56582282, -2.07176653, -1.17746036],
       [-0.94677184, -1.40801962,  1.09065589],
       [ 0.42106114, -1.29614006,  1.15504945],
       [ 0.621196  , -1.14312756,  1.24270936],
       [ 1.00958951, -0.04781376,  1.56934888]])