In [1]:
import numpy as np

# 함수, 클래스 정의 방법(복습)

## 함수 정의 및 호출

In [2]:
# 함수 정의
def test_fn(arg):
    print(f'Hello, {arg}!')

In [3]:
# 함수 호출
test_fn('FUNCTION')

Hello, FUNCTION!


## 클래스 정의 및 메서드 호출

In [5]:
# 클래스 정의
class Myclass:
    # 메서드 정의
    def test_method(self, arg):
        print(f'Hello, {arg}!')

In [6]:
# Myclass 클래스의 인스턴스 생성
cls=Myclass()

In [7]:
# 인스턴스가 메서드를 호출
cls.test_method('METHOD')

Hello, METHOD!


# Numpy의 함수와 ndarray 클래스의 메서드
**Numpy의 많은 기능들(합계, 평균, 표준편차, ...)은 함수와 ndarray 클래스의 메서드로 구현되어 있다.**

* **`np.function_name(ndarray, arg, ...)`**
* **`ndarray.method_name(arg, ...`**

## numpy 패키지의 함수 호출 및 ndarray 객체 메서드 호출 방법

In [8]:
arr = np.arange(10)
print(arr)

[0 1 2 3 4 5 6 7 8 9]


In [9]:
# 함수 호출
np.sum(arr)

45

In [10]:
# ndarray 객체 arr에 대하여, ndarray 클래스 메서드 호출
arr.sum()

45

## numpy의 통계관련 함수/메서드

In [12]:
print(arr)

[0 1 2 3 4 5 6 7 8 9]


### 합계(sum)

In [13]:
# numpy 패키지 함수
np.sum(arr)

45

In [14]:
# ndarray 인스턴스에 메서드 호출
arr.sum()

45

### 평균(mean)

In [15]:
# numpy 패키지 함수
np.mean(arr)

4.5

In [16]:
# ndarray 인스턴스에 메서드 호출
arr.mean()

4.5

### 분산(variance)

In [17]:
# numpy 패키지 함수
np.var(arr)

8.25

In [18]:
# ndarray 인스턴스에 메서드 호출
arr.var()

8.25

### 표준편차(standard deviation)

In [19]:
# numpy 패키지 함수
np.std(arr)

2.8722813232690143

In [20]:
# ndarray 인스턴스에 메서드 호출
arr.std()

2.8722813232690143

### 최대값(max)

In [21]:
# numpy 패키지의 함수
np.max(arr)

9

In [22]:
# ndarray 인스턴스의 메서드 호출
arr.max()

9

### 최소값(min)

In [23]:
# numpy 패키지의 함수
np.min(arr)

0

In [24]:
# ndarray 인스턴스의 메서드 호출
arr.min()

0

### 중앙값(median)
* numpy.median(인스턴스) 함수는 있지만, numpy.ndarray.median() 메서드는 없다.

In [25]:
# numpy 패키지의 함수
np.median(arr)

4.5

## numpy.max(), numpy.min() 함수와 numpy.maximum(), numpy.minimum() 함수의 차이
* **`numpy.max(array)`** : array의 최대값을 리턴
* **`numpy.maximum(a1, a2)`** : 배열(과 비슷한 객체)인 a1, a2의 같은 인덱스 원소들 중 **최대값들로 이루어진 배열**

In [27]:
a1 = np.random.randint(0, 20, size = 10)
a2 = np.random.randint(0, 20, size = 10)
print('a1:', a1)
print('a2:', a2)

a1: [ 5 17 10  1  6 18 12 16 14 13]
a2: [ 6 10  2 18  6  1  7  9 13 12]


In [29]:
# ndarray 객체 a1의 원소들 중 가장 큰 값 1개를 출력하기
print(np.max(a1))
print(a1.max())

18
18


In [30]:
# ndarray 객체 a2의 원소들 중 가장 작은 값 1개를 출력하기
print(np.min(a2))
print(a2.min())

1
1


In [32]:
# ndarray 객체 a1, a2의 같은 인덱스의 원소들 중 큰 값들로만 이루어진 새로운 리스트 리턴하기
print(a1)
print(a2)
print(np.maximum(a1, a2))

[ 5 17 10  1  6 18 12 16 14 13]
[ 6 10  2 18  6  1  7  9 13 12]
[ 6 17 10 18  6 18 12 16 14 13]


## np.argmax(array) 함수, ndarray.argmax() 메서드
* 배열의 **최대값의 위치(인덱스) 리턴**

In [33]:
np.argmax(a2)

3

In [34]:
a2.argmax()

3

## np.argmin(array) 함수, ndarray.argmin() 메서드
* **배열의 최소값의 위치(인덱스) 리턴**

In [35]:
np.argmin(a1)

3

In [36]:
a1.argmin()

3

In [38]:
# a1에서 원소들의 평균보다 큰 값으로 이루어진 1-d ndarray 찾기
# 원소들의 평균 : array.mean() 또는 np.mean(array)
a1[a1 > np.mean(a1)]

array([17, 18, 12, 16, 14, 13])

## 2-d ndarray(2차원 배열)의 통계관련 함수/메서드

In [39]:
array = np.random.randint(0, 10, size = (4, 5))
print(array)

[[4 5 3 6 6]
 [4 4 4 7 1]
 [0 2 5 2 4]
 [4 2 2 0 5]]


### 합계(sum)

In [40]:
# numpy 패키지의 sum 함수
np.sum(array)

70

In [41]:
# ndarray 인스턴스의 메서드 호출
array.sum()

70

In [42]:
np.sum(array, axis = 0) # 원소가 5개인 1차원 배열(1-d array). 축 방향이 0(세로 방향)인 쪽으로의 합계

array([12, 13, 14, 15, 16])

In [44]:
np.sum(array, axis = 1) # 원소가 4개인 1차원 배열(1-d array). 축 방향이 1(가로 방향)인 쪽으로의 합계

array([24, 20, 13, 13])

In [45]:
np.sum(array, axis = 0, keepdims = True)

array([[12, 13, 14, 15, 16]])

In [46]:
np.sum(array, axis = 1, keepdims = True)

array([[24],
       [20],
       [13],
       [13]])