# ![링크 텍스트](https://numpy.org/doc/stable/_static/numpylogo.svg)

*Python을 사용하는 과학 계산(scientific computing)을 위한 핵심 패키지*

---

**NumPy**는 오픈 소스 Python 라이브러리로써 거의 대부분의 과학 및 엔지니어링 분야에 사용된다. NumPy는 Python을 통해 수치와 관련된 데이터를 다룰 때 선택할 수 있는 수단 중에서 보편적인 표준으로써 여겨지며, 과학 관련 Python 및 PyData 생태계의 중심에 위치해 있다고 할 수 있다. 그렇기 때문에 NumPy는 Pandas, SciPy, Matplotlib, scikit-learn, scikit-image 등 대부분의 데이터 과학 관련 Python 패키지에서 또한 연계되어 광범위하게 이용된다.

# <font color="blue">다차원 배열</font>

## <font color="green">1. 숫자 자료형</font>

Python에서는 숫자형 변수로 데이터를 표현할 수 있다.

예를 들어, 세 명의 학생들로 이루어진 반이 있고 이 학생들의 수학 점수를 각각 **숫자형 변수**에 저장하는 경우, 아래처럼 처리할 수 있다.

In [None]:
math1 = 11
math2 = 12
math3 = 13

점수들의 합과 평균은 다음과 같이 구할 수 있다.

In [None]:
math_sum = math1 + math2  + math3
math_avg = math_sum / 3

print("수학 점수 합: {}".format(math_sum))
print("수학 점수 평균: {}".format(math_avg))

그런데 만약 새로운 학생이 전학을 와서 시험을 치렀고, 이 학생의 성적을 추가한 점수들의 합과 평균을 구하려면 어떻게 해야 할까?

새로운 변수를 추가해야 한다.

In [None]:
math4 = 14

그리고 합과 평균을 구하는 코드 역시 수정해야 한다.

In [None]:
math_sum = math1 + math2 + math3 + math4 # 항목 추가
math_avg = math_sum / 4 # 분모 변경

print("수학 점수 합: {}".format(math_sum))
print("수학 점수 평균: {}".format(math_avg))

<font color="red">**데이터가 추가될 때마다 매번 코드를 바꾸는 것은 매우 비효율적**</font>이다.

## <font color="green">2. 리스트 자료형</font>

리스트 자료형에 데이터를 저장하여 이 문제를 해결할 수 있다.

세 명의 학생들로 이루어진 반이 있고 이 학생들의 수학 점수를 **리스트**에 저장하는 경우, 아래와 같이 처리할 수 있다.

In [None]:
math_list = [11, 12, 13]

점수들의 합과, 평균은 다음과 같이 구할 수 있다.

In [None]:
math_sum = 0
math_avg = 0

for score in math_list:
    math_sum += score
math_avg = math_sum / len(math_list)

print("수학 점수 합: {}".format(math_sum))
print("수학 점수 평균: {}".format(math_avg))

그런데 만약 새로운 학생이 전학을 와서 시험을 치렀고, 이 학생의 성적을 추가한 점수들의 합과 평균을 구하려면 어떻게 해야 할까?

~~새로운 변수를 추가해야 한다.~~

**기존의 리스트에 새로운 데이터를 추가한다.**

In [None]:
math_list.append(14)

~~그리고 합과 평균을 구하는 코드 역시 수정해야 한다.~~

새로운 데이터가 추가되어도 <font color="green">**코드는 바꾸지 않고 그대로 사용할 수 있다**</font>.



In [None]:
math_sum = 0
math_avg = 0

for score in math_list:
    math_sum += score
math_avg = math_sum / len(math_list)

print("수학 점수 합: {}".format(math_sum))
print("수학 점수 평균: {}".format(math_avg))

그런데 만약 시험 문제에서 오류가 발견되어 모든 학생의 점수를 1점씩 올려줘야 하는 상황이 발생한다면 어떻게 처리해야 할까?

반복문이나 List comprehension같은 방법이 있다.

In [None]:
math_list2 = []
for score in math_list:
    math_list2.append(score + 1)
print(math_list2)

In [None]:
math_list3 = [score + 1 for score in math_list]
print(math_list3)

---

여기서 구조를 확장해서,

1반의 점수가 11, 12, 13

2반의 점수가 21, 22, 23

3반의 점수가 31, 32, 33점이라고 한다면 중첩 리스트를 통해 아래처럼 나타낼 수 있다.

In [None]:
nested_math_list = [[11, 12, 13], [21, 22, 23], [31, 32, 33]]
print(nested_math_list)

중첩 리스트에서 각 원소에 1을 더하는 코드는 다음과 같다.

In [None]:
nested_math_list2 = []

for inner_list in nested_math_list:
    temp_list = []

    for score in inner_list:
        temp_list.append(score + 1)

    nested_math_list2.append(temp_list)

print(nested_math_list2)

<font color="red">**문제점**</font>

자료 구조의 중첩이 증가하면 반복문도 하나 더 사용해야 한다.

일반적으로 자료 구조의 중첩이 증가할수록, 자료 구조를 조작하는 코드는 복잡해질 수밖에 없다.

## <font color="green">3. NumPy로 구현한 다차원 배열</font>

**NumPy**를 사용하면 중첩된 자료구조를 효율적으로 다룰 수 있다.
 
`import numpy as np` 형태로 사용하는게 일반적이다.

In [None]:
import numpy as np

print(np.__version__)

In [None]:
math_ndarray = np.array(nested_math_list)
# math_ndarray = np.array([[11, 12, 13], [21, 22, 23], [31, 32, 33]])

print(math_ndarray)
print(type(math_ndarray)) # 다차원 배열이라고 부른다.

각 원소에 1을 더하려면,

In [None]:
new_ndarray = math_ndarray + 1
print(new_ndarray)

NumPy에 구현된 함수를 이용해서 합이나 평균도 쉽게 구할 수 있다.

In [None]:
# 전체 합 구하기
np.sum(math_ndarray)

In [None]:
# 전체 평균 구하기
np.mean(math_ndarray)

In [None]:
# 열의 평균 구하기
np.mean(math_ndarray, axis=0)

In [None]:
# 행의 평균 구하기
np.mean(math_ndarray, axis=1)

## <font color="green">4. Python의 list와 NumPy의 ndarray의 성능 비교</font>

In [None]:
import time

# 코드 실행 시간을 측정하기 위한 클래스
class Timer:
    # Timer 클래스의 생성자
    def __init__(self, name):
        self.name = name

    # with 문이 시작할 때 실행되는 함수
    def __enter__(self):
        print("[%s]" % self.name)
        self.start = time.time()

    # with 문이 끝날 때 실행되는 함수
    def __exit__(self, type, value, traceback):
        print("실행 시간: %.6f 초" % (time.time() - self.start))

In [None]:
with Timer("코드 실행 시간을 측정하는 예제"):
    time.sleep(1)

In [None]:
# Python의 list와 NumPy의 ndarray의 성능을 비교하기 위해 똑같은 데이터를 가지는 자료 구조를 생성한다.
rows = 100 # 행
cols = 100 # 열
rand_array = np.random.rand(rows, cols) # 0 이상 1 미만의 난수로 이루어진 100행 100열짜리 ndarray 선언
rand_list = rand_array.tolist() # ndarray를 list로 변환

In [None]:
print(rand_array)
print(type(rand_array))

In [None]:
print(rand_list)
print(type(rand_list))

In [None]:
with Timer("Python의 list를 사용해서 모든 원소의 합 구하기"):
    result = 0
    for inner_list in rand_list:
        for e in inner_list:
            result += e
    print("합계:", result)

print("-" * 20)

with Timer("Python의 list를 사용해서 모든 원소에 1 더하기"):
    result_list = []
    for inner_list in rand_list:
        temp_list = []
        for e in inner_list:
            temp_list.append(e + 1)
        result_list.append(temp_list)

print("=" * 20)

with Timer("NumPy의 ndarray를 사용해서 모든 원소의 합 구하기"):
    result = np.sum(rand_array)
    print("합계:", result)
    
print("-" * 20)

with Timer("NumPy의 ndarray를 사용해서 모든 원소에 1 더하기"):
    result_array = rand_array + 1

### NumPy의 장점

- 코어 부분이 C로 구현되어 동일한 연산을 하더라도 Python에 비해 속도가 빠름
- 라이브러리에 구현되어있는 함수들을 활용해 짧고 간결한 코드 작성 가능
- 효율적인 메모리 사용이 가능하도록 구현됨

### Python의 list가 느린 이유

- 파이썬 리스트는 결국 포인터의 배열
- 경우에 따라서 각각 객체가 메모리 여기저기 흩어져 있음
- 그러므로 캐시 활용이 어려움

### NumPy의 ndarray가 빠른 이유

- ndarray는 타입을 명시하여 원소의 배열로 데이터를 유지
- 다차원 데이터도 연속된 메모리 공간이 할당됨
- 많은 연산이 dimensions과 strides를 잘 활용하면 효율적으로 가능

![title](http://jakevdp.github.io/images/array_vs_list.png)

# <font color="blue">기초 문법</font>

NumPy는 `ndarray`라고 부르는 배열 클래스를 주로 다루며, 줄여서 `array`라고도 부른다. ndarray 객체에서 사용할 수 있는 주요 속성들은 다음과 같다.

---

**ndarray.ndim**

> 배열의 축(차원)의 개수.

**ndarray.shape**
> 배열의 차원. 배열의 각 차원의 크기를 나타내는 정수 튜플이다. n개의 행과 m개의 열로 이루어진 행렬의 경우, (n, m)이 된다. 따라서 shape 튜플의 길이는 축의 개수, 즉 ndim과 같다.

**ndarray.size**
> 배열의 요소의 총 개수. shape의 요소의 곱과도 같다.

**ndarray.dtype**
> 배열의 요소의 자료형. 배열 생성 시 Python 표준 자료형을 지정할 수도 있고 NumPy에서 지원하는 자체 자료형을 사용할 수도 있다.

In [None]:
import numpy as np
a = np.array([[[1, 0, 0], [0, 1, 2]]])

print(a) # 배열 출력
print("type:", type(a))

print("차원의 수(ndim):", a.ndim)
print("차원(shape):", a.shape)
print("요소의 총 개수(size):", a.size)
print("요소의 자료형(dtype):", a.dtype)

## <font color="green">배열 생성</font>

다차원 배열을 만드는 방법에는 여러 가지가 있다.

가장 기본적인 방법은, `array` 함수를 사용하여 일반적인 Python list 또는 tuple로부터 다차원 배열을 만드는 것이다.

In [None]:
import numpy as np

a = np.array([2, 3, 4])
print(a)

빈번하게 발생하는 실수 중 하나는 array 함수에 여러 개의 인수를 입력하는 것이다.

In [None]:
a = np.array(1, 2, 3, 4)    # 틀림
# a = np.array([1, 2, 3, 4])  # 맞음

array 함수는 시퀀스 안에 시퀀스가 중첩되어 있는 객체를 2차원 배열로 생성해준다. 마찬가지로 시퀀스 안에 시퀀스 안에 시퀀스가 중첩되어 있는 구조라면 3차원 배열로 생성해주는 식으로 동작한다.

In [None]:
b = np.array([(1.5, 2, 3), (4, 5, 6)])
print(b)
print(b.ndim)

In [None]:
b = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print(b)
print(b.ndim)

배열 생성 시 자료형을 명시적으로 지정할 수도 있다. dtype 키워드 인수에 Python 표준 자료형을 사용하여 지정할 수도 있고, NumPy에서 지원하는 자체 자료형(numpy.int32, numpy.int16, numpy.float64 등)을 사용할 수도 있다.

In [None]:
# c = np.array([[1, 2], [3, 4]], dtype=float) # 파이썬의 float 자료형 적용
c = np.array([[1, 2], [3, 4]], dtype=np.float64) # numpy 모듈의 float64 자료형 적용
print(c)
print(c.dtype.name)

다양한 함수를 이용해서 다차원 배열을 만들 수도 있다.

`zeros` 함수는 모든 요소가 0으로 이루어진 다차원 배열을 생성한다.

`ones` 함수는 모든 요소가 1로 이루어진 다차원 배열을 생성한다.

`full` 함수는 모든 요소가 특정 값으로 이루어진 다차원 배열을 생성한다.

`empty` 함수는 모든 요소가 메모리의 초기값으로 이루어진 다차원 배열을 생성한다.

In [None]:
print("zeros 함수를 이용한 (3, 4) 형태의 2차원 배열")
print(np.zeros((3, 4))) # 기본 자료형이 float이다.

print("\nones 함수를 이용한 (3, 4) 형태의 2차원 배열")
print(np.ones((3, 4), dtype=np.int16))

print("\nfull 함수를 이용한 (3, 4) 형태의 2차원 배열")
print(np.full((3, 4), -1))

print("\nempty 함수를 이용한 (2, 3, 4) 형태의 3차원 배열")
print(np.empty((2, 3, 4)))

연속된 숫자로 이루어진 다차원 배열을 만들 수 있는, Python의 `range` 내장 함수와 유사한 함수인 `arange` 함수를 제공한다.

In [None]:
print(np.arange(0, 2, 0.3)) # 0 이상 2 미만의 범위에서 각 요소 값들이 0.3씩 차이가 나도록 설정

In [None]:
print(np.arange(10, 30, 5)) # 10 이상 30 미만의 범위에서 각 요소 값들이 5씩 차이가 나도록 설정

`arange` 함수와 유사하게 범위를 설정하지만 대신 총 요소의 개수를 설정할 수 있는 `linspace` 함수를 제공한다.

In [None]:
print(np.linspace(0, 2, 9)) # 0 이상 2 이하의 범위를 9등분하여 설정

In [None]:
x = np.linspace(0, 2 * np.pi, 10) # 0 이상 2π 이하의 범위를 10등분하여 설정
print(x)
f = np.sin(x) # 삼각함수의 input으로 자주 설정하는 방식
print(f)

## <font color="green">2. 기본 연산 및 조작 함수</font>

다차원 배열에 대해 산술, 비교 연산자를 적용할 때 *요소별*로 계산된다. 연산 결과로 새로운 배열이 생성되고 결과로 채워진다.

In [None]:
a = np.array([20, 35, 40, 55])
print("a:", a)

print("-" * 20)

print("a + 100:", a + 100)
print("a ** 2", a ** 2)
print("10 * np.sin(a):", 10 * np.sin(a))
print("a > 35:", a > 35)
print("a % 2 == 0:", a % 2 == 0)

두 개 이상의 배열에 대해서 또한 마찬가지로, 각 배열의 같은 위치에 있는 요소끼리 연산한다.

In [None]:
a = np.array([1, 10, 100, 1000])
b = np.array([10, 20, 30, 40])
print("a:", a)
print("b:", b)

print("-" * 20)

print("a + b:", a + b)
print("a / b:", a / b)
print("a > b:", a > b)
print("a <= b * 3:", a <= b * 3)

`*` 연산자 또한 요소별로 적용된다.

`@` 연산자 또는 `dot` 함수를 사용하여 행렬 곱을 수행할 수 있다.

In [None]:
A = np.array([[1, 1], 
              [0, 1]])
B = np.array([[2, 0],
              [3, 4]])
print(A * B)
print(A @ B)
print(A.dot(B))

`+=` 및 `*=`과 같은 일부 연산자는 새 배열을 생성하지 않고 기존 배열을 수정한다.

In [None]:
a = np.ones((2, 3), dtype=int)
print(a)

a += 1
print(a)

a *= 3
print(a)

연산 시 자료형은 적절하게 형변환(Upcasting)된다.

In [None]:
a = np.ones(3, dtype=np.int32)
b = np.linspace(0, pi, 3)
print(a.dtype.name)
print(b.dtype.name)

c = a + b
print(c.dtype.name)

배열의 모든 요소의 합을 구하기 등, 많은 단항 연산이 `ndarray` 클래스의 메서드로 구현되어 있다.

In [None]:
a = np.random.random((2, 3))
print(a)
print(a.sum()) # 모든 요소의 합
print(a.min()) # 모든 요소 중 최소값
print(a.max()) # 모든 요소 중 최대값

대부분의 이러한 연산들은 `axis` 매개 변수를 지정하면 배열의 지정된 축을 따라 작업을 적용 할 수 있다.

In [None]:
b = np.arange(12).reshape(3, 4)
print(b)
print(b.mean(axis=1)) # 각 행의 평균
print(b.std(axis=0)) # 각 열의 표준편차
print(b.cumsum(axis=1)) # 각 행의 누적합

## <font color="green">3. 인덱싱, 슬라이싱, 반복</font>

**1차원** 배열은 Python list와 같이 인덱싱, 슬라이싱, 반복할 수 있다.

In [None]:
a = np.arange(10) ** 3
print(a)
print(a[2]) # 인덱싱
print(a[2:5]) # 슬라이싱

for i in a:
    print(i ** (1 / 3))

다차원 배열은 축 별로 인덱스를 가진다. 각 축에 대해 인덱싱, 슬라이싱을 차례로 적용할 수 있다.

In [None]:
b = np.arange(16).reshape(4, 4)
print(b)
print(b[2, 3]) # 인덱싱
print(b[:2, 1]) # 행 슬라이싱과 열 인덱싱
print(b[1, 2:]) # 행 인덱싱과 열 슬라이싱
print(b[1:3, 2:]) # 슬라이싱

축 수보다 적은 수의 인덱스를 제공한 경우, 생략된 인덱스는  전 범위에 대한 슬라이스(`:`)로 간주된다.

In [None]:
print(b[-2])

다차원 배열에 대한 **반복**은 첫 번째 축부터 수행된다.

In [None]:
for row in b: # 다차원 배열에서 행을 하나씩 꺼내옴
    for val in row: # 행에서 요소를 하나씩 꺼내옴
        print(val)

`flat` 속성을 이용하면 모든 요소에 대해 반복을 수행할 수 있다.

In [None]:
for element in b.flat:
    print(element)

# <font color="blue">응용 문법</font>

## <font color="green">1. 형태(shape) 조작</font>

### <font color="red">1-1. 형태를 직접 변경하는 함수들</font>



#### numpy.reshape() 혹은 numpy.ndarray.reshape()

데이터를 변경하지 않고 배열을 새로운 shape로 수정한다.

In [None]:
import numpy as np

a = np.arange(6)
print(a)

In [None]:
a.reshape((3, 2))

In [None]:
b = a.reshape((3, 2))
print(b)

In [None]:
np.reshape(b, (2, 3))

In [None]:
# 결과가 2차원이다.
c = np.reshape(a, (1, 6))
print(c, c.ndim)

In [None]:
# 결과가 1차원이다.
d = np.reshape(a, 6)
print(d, d.ndim)

#### numpy.ndarray.resize()

원본 배열을 새로운 shape로 수정한다.

In [None]:
a = np.arange(12)
a.resize((3, 4))
print(a)

#### numpy.ndarray.flatten()

배열을 1차원으로 만든다.

In [None]:
a = np.array([[1, 2], [3, 4]])
print(a)

In [None]:
print(a.flatten())

### <font color="red">1-2. 다차원 배열 병합</font>

#### numpy.concatenate()

두 개 이상의 배열을 연결한다.

`concatenate()` 함수를 수행하려면 차원 수가 같아야 한다.

In [None]:
a = np.array([[1, 2], [3, 4]])
print(a) # 2차원 배열

In [None]:
b = np.array([5, 6])
print(b) # 1차원 배열

In [None]:
np.concatenate((a, b)) # 차원 수가 다르기 때문에 안 됨

In [None]:
b = np.array([[5, 6]])
print(b) # 2차원 배열

In [None]:
c = np.concatenate((a, b))
print(c)

세 개 이상의 배열을 연결할 수도 있다.

In [None]:
d = np.concatenate((a, b, c))
print(d)

axis 인수를 설정하여 연결 방향을 정할 수 있다.

In [None]:
e = np.concatenate((a, d.T), axis=1)
print(e)

#### numpy.vstack(), numpy.hstack()

수직(vertical) 또는 수평(horizontal) 방향으로 다차원 배열을 추가한다.

In [None]:
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])
print(a, "\n")
print(b, "\n")

c = np.vstack((a, b)) # 수직 방향으로 추가
print(c, "\n")
d = np.hstack((a, b)) # 수평 방향으로 추가
print(d)

`vstack()` 함수의 경우, `concatenate()` 함수와 다르게, 차원 수가 달라도 조작할 수 있다.

In [None]:
a = np.array([[1, 2], [3, 4]]) # 2차원 배열
b = np.array([5, 6]) # 1차원 배열
print(a, "\n")
print(b, "\n")

c = np.vstack((a, b)) # 수직 방향으로 추가
print(c, "\n")

#### numpy.column_stack(), numpy.row_stack()

열, 행으로써 다차원 배열을 추가한다.

In [None]:
a = np.array([1, 2])
b = np.array([100, 200])
print(a, "\n")
print(b, "\n")

c = np.column_stack((a, b))
print(c, "\n")
d = np.row_stack((a, b))
print(d)

`column_stack()` 함수의 경우, *2차원 배열*에 대해서 `hstack()` 함수와 동일하게 동작한다.

In [None]:
a = np.array([[1, 2], [3, 4]])
b = np.array([[11, 12], [13, 14]])
print(a, "\n")
print(b, "\n")

c = np.column_stack((a, b))
print(c, "\n")
d = np.hstack((a, b))
print(d)

`row_stack()` 함수의 경우, 항상 `vstack()` 함수와 동일하게 동작한다.

In [None]:
a = np.array([[1, 2], [3, 4]])
b = np.array([100, 200])
print(a, "\n")
print(b, "\n")

c = np.row_stack((a, b))
print(c, "\n")
d = np.vstack((a, b))
print(d)

### <font color="red">1-3. 다차원 배열 분할</font>

#### numpy.split(), numpy.array_split()

다차원 배열을 행 또는 열에 대해서 분할할 수 있다. 함수를 실행한 결과, 분할된 부분 배열들을 python list에 담아서 반환한다.

In [None]:
x = np.arange(36).reshape(6, 6)
print(x, "\n")

y_list = np.split(x, 3, axis=0) # 행을 나눠서 총 3개의 다차원 배열 생성
for y in y_list:
    print(y, "\n")

# y_list = np.split(x, 3, axis=1) # 열을 나눠서 총 3개의 다차원 배열 생성
# for y in y_list:
#     print(y, "\n")

# y_list = np.split(x, (1, 5), axis=0) # 첫 번째, 다섯 번째 행에서 나누기
# for y in y_list:
#     print(y, "\n")

# y_list = np.split(x, (1, 5), axis=1) # 첫 번째, 다섯 번째 열에서 나누기
# for y in y_list:
#     print(y, "\n")

`array_split()` 함수는 기본적으로 `split()` 함수와 동일하게 동작한다.

In [None]:
x = np.arange(36).reshape(6, 6)
print(x, "\n")

y_list = np.array_split(x, 3, axis=0) # 행을 나눠서 총 3개의 다차원 배열 생성
for y in y_list:
    print(y, "\n")

# y_list = np.array_split(x, 3, axis=1) # 열을 나눠서 총 3개의 다차원 배열 생성
# for y in y_list:
#     print(y, "\n")

# y_list = np.array_split(x, (1, 5), axis=0) # 첫 번째, 다섯 번째 행에서 나누기
# for y in y_list:
#     print(y, "\n")

# y_list = np.array_split(x, (1, 5), axis=1) # 첫 번째, 다섯 번째 열에서 나누기
# for y in y_list:
#     print(y, "\n")

`split()` 함수는 균등하게 분리할 수 없는 경우, 오류가 발생한다.

In [None]:
x = np.arange(8)
print(x, "\n")

# y_list = np.split(x, 3) # 8개의 요소를 균등하게 3분할 불가
# for y in y_list:
#     print(y, "\n")

`array_split()` 함수는 균등하게 분리할 수 없어도, 적절히 처리된다.

In [None]:
x = np.arange(8)
print(x, "\n")

y_list = np.array_split(x, 3) # 8개의 요소를 3개, 3개, 2개로 분할
for y in y_list:
    print(y, "\n")

#### numpy.hsplit(), numpy.vsplit()

`hsplit()`은 다차원 배열을 열에서 분할한다.

In [None]:
x = np.concatenate((np.full((3, 3), 1), np.full((3, 3), 2), np.full((3, 3), 3)), axis=1)
print(a, "\n")

y_list = np.hsplit(x, 3) # 열을 나눠서 총 3개의 다차원 배열 생성
for y in y_list:
    print(y, "\n")

# y_list = np.hsplit(x, (4, 5)) # 네 번째, 다섯 번째 열에서 나누기
# for y in y_list:
#     print(y, "\n")

`vsplit()`은 다차원 배열을 행에서 분할한다.

In [None]:
x = np.concatenate((np.full((3, 3), 1), np.full((3, 3), 2), np.full((3, 3), 3)))
print(a, "\n")

y_list = np.vsplit(x, 3) # 행을 나눠서 총 3개의 다차원 배열 생성
for y in y_list:
    print(y, "\n")

# y_list = np.vsplit(x, (4, 5)) # 네 번째, 다섯 번째 행에서 나누기
# for y in y_list:
#     print(y, "\n")

## <font color="green">2. 전치(transpose)</font>

#### np.transpose() 혹은 np.ndarray.transpose() 혹은 np.ndarray.T


전치는 기존 행렬의 행과 열을 교환하는 것, 즉 주대각선을 기준으로 반사 대칭하는 것을 말한다.

In [None]:
x = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(x)

In [None]:
print(np.transpose(x))
# print(x.transpose())
# print(x.T)

1차원 배열을 전치할 경우, 결과 배열은 원본 배열과 동일하다.

In [None]:
y = x.flatten()
print(y, y.ndim)

In [None]:
print(y.T, y.T.ndim)

#### np.moveaxis(), np.swapaxes()

`moveaxis()` 함수는 특정 축을 지정해서 다른 위치로 이동한다.

In [None]:
x = np.empty((3, 4, 5))
print(x.shape)

In [None]:
y = np.moveaxis(x, 0, 1) # 0번 인덱스 축을 지정해서 1번 인덱스 축으로 이동
print(y.shape)

z = np.moveaxis(x, 0, -1) # 0번 인덱스 축을 지정해서 -1번(맨 뒤) 인덱스 축으로 이동
print(z.shape)

`swapaxes()` 함수는 두 축을 지정해서 위치를 서로 바꾼다.

In [None]:
x = np.empty((3, 4, 5))
print(x.shape)

In [None]:
y = np.swapaxes(x, 0, 1) # 0번 인덱스 축을 지정해서 1번 인덱스 축과 서로 교체
print(y.shape)

z = np.swapaxes(x, 0, -1) # 0번 인덱스 축을 지정해서 -1번(맨 뒤) 인덱스 축과 서로 교체
print(z.shape)

`moveaxis()` 함수 또는 `swapaxes()` 함수를 이용하면 전치한 것과 같은 효과를 얻을 수 있다.

In [None]:
x = np.array([[1, 1, 1], [10, 10, 10], [100, 100, 100]])
print(x, "\n")

In [None]:
y = np.moveaxis(x, 0, 1)
# y = np.swapaxes(x, 0, 1)
print(y)

## <font color="green">3. random 모듈</font>

#### np.random.random()

> 0 이상 1 미만의 임의의 실수를 만든다. shape를 전달하면 그 크기에 맞는 다차원 배열을 생성한다.

In [None]:
a = np.random.random() # 난수 1개 생성
print(a)

b = np.random.random(3) # 1차원 배열 생성
print(b)

c = np.random.random((3, 4)) # 2차원 배열을 만들 때 튜플 형태로 전달
print(c)

#### np.random.rand()

> 0 이상 1 미만의 임의의 실수를 만든다. shape를 전달하면 그 크기에 맞는 다차원 배열을 생성한다.

In [None]:
a = np.random.rand() # 난수 1개 생성
print(a)

b = np.random.rand(3) # 1차원 배열 생성
print(b)

c = np.random.rand(3, 4) # 2차원 배열을 만들 때 두 개의 인수를 전달
print(c)

#### np.random.randn()

> 0에 근사한 임의의 실수를 만든다. shape를 전달하면 그 크기에 맞는 다차원 배열을 생성한다.

In [None]:
a = np.random.randn() # 난수 1개 생성
print(a)

b = np.random.randn(3) # 1차원 배열 생성
print(b)

c = np.random.randn(3, 4) # 2차원 배열을 만들 때 두 개의 인수를 전달
print(c)

`rand()` 함수는 균일 분포를 따르고, `randn()` 함수는 평균이 0, 표준 편차가 1인 표준 정규 분포를 따른다.

In [None]:
a = np.random.rand(100, 100)
print(a)
print(a.mean()) # 0.5에 근사한 평균
b = np.random.randn(100, 100)
print(b)
print(b.mean()) # 0.0에 근사한 평균

#### np.random.randint()

> 주어진 범위의 임의의 정수를 만든다.

In [None]:
a = np.random.randint(3) # 0 이상 3 미만의 임의의 정수 1개 생성
print(a)

b = np.random.randint(2, 5) # 2 이상 5 미만의 임의의 정수 1개 생성
print(b)

c = np.random.randint(1, 46, 6) # 1 이상 46 미만의 임의의 정수 6개 생성
print(c)

d = np.random.randint(0, 100, (100, 100)) # 0 이상 100 미만의 임의의 정수로 이루어진 100행 100열의 2차원 배열 생성
print(d)