In [1]:
# NumPy(Numerical Python)
# 다차원 배열의 연산 기능을 모아 놓은 라이브러리.
# 수치 연산을 위한 다양한 기능을 제공하는 패키지.

# NumPy 활용 분야
# 데이터 전처리 - 대용량 데이터의 빠른 계산
# 과학 계산 - 수학적 연산 및 통계 분석
# 이미지 처리 - 픽셀 데이터 조작
# 머신러닝 - 행렬 연산의 기초
# 신호 처리 - 시계열 데이터 분석

In [2]:
# 배열(Array)
# 데이터 처리를 효율적으로 하기 위한 자료구조.
# 연속적으로 데이터를 담을 수 있는 객체.
# 숫자 및 문자열을 연속으로 담을 수 있음.

In [3]:
# 1차원 배열
# array([0, 4, 7, 3])
# array(['I', 'Love', 'You])와 같은 형식.
# 육안 상으로는리스트와 유사해 보임.
# NumPy는 데이터를 연속된 메모리 블록에 저장하고, 일반적인 Python 자료형 보다 더 적은 메모리를 사용함.
# 내부 연산은 C로 작성되어 메모리를 직접 조작해 처리하기 때문에, 배열을 빠르고 효율적으로 처리 가능.

In [4]:
# 배열의 특징 01. 배열 안에 같은 종류의 데이터만 담을 수 있음.
# 리스트는 다양한 타입의 데이터를 요소로 저장 가능.
list_ex = [1, 'hello', 3.14, True]
print(type(list_ex))

# 배열은 같은 타입만 가능
import numpy as np
array_ex = np.array([1, 2, 3, 4])
print(type(array_ex))

<class 'list'>
<class 'numpy.ndarray'>


In [5]:
# 배열의 특징 02. 차원을 가짐.
# 1차원 배열, 2차원 배열, 3차원 배열, ...
# 다차원 배열: 차원이 여러 개인 배열. 'n-dimension array', 줄여서 'ndarray'
# 차원: 데이터가 배열되는 방향의 수

# 1차원 배열: 같은 유형의 데이터를 연속적으로 관리할 때 사용.
# ex) 한 반의 성적 데이터, 월별 몸무게, 일별 매출 등

# 2차원 배열: 동일한 크기의 1차원 배열이 여러 개 모여 있는 표 형테의 데이터
# ex) 1학년 2반의 수학 성적 & 영어 성적 & 국어 성적 등
import numpy as np
grades_2nd_cls = np.array([
    [85, 92, 78],   # 학생 1
    [90, 87, 95],   # 학생 2
    [78, 89, 82]    # 학생 3
])

# 3차원 배열: 2차원 배열이 여러 개 모여 있는 형태.
# ex) 1학년 2반, 3반, 4반 등 각 반의 성적. 단, 이 때는 모든 반의 학생 수가 같아야 함.
# ex) 이미지 데이터 - 색상이 있는 이미지는 RGB 세 개의 레이어로 구성되어 있음.

# .shape: 배열의 구조를 확인하는 함수.
arr_1d = np.array([1, 2, 3])                                # 1차원 배열
print(arr_1d.shape)                                         # 길이가 3인 1차원 배열 ==> (3, )

arr_2d = np.array([[1, 2, 3, 4], [5, 6, 7, 8]])             # 2차원 배열
print(arr_2d.shape)                                         # 이 2차원 배열 안에는 1차원 배열이 2개 있고, 각 1차원 배열의 길이는 4임. ==> (2, 4)

arr_3d = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])     # 3차원 배열
print(arr_3d.shape)                                         # 이 3차원 배열 안에는 2차원 배열이 2개 있고, 각 2차원 배열 안에는 1차원 배열이 2개 있고, 각 1차원 배열의 길이는 2임. ==> (2, 2, 2)

(3,)
(2, 4)
(2, 2, 2)


In [6]:
# 배열의 특징 03. 빠르고 간단하게 연산을 처리할 수 있음.
# 반복문을 사용하지 않고도 한꺼번에 연산을 할 수 있음.
# 리스트의 연산 - 반복문을 사용해야 함.
list_ex = [1, 2, 3, 4]
result_list = []
for i in list_ex:
    result_list.append(i * 2)

# 배열의 연산 - 반복문 사용하지 않아도 됨.
array_ex = np.array([1, 2, 3, 4])
result_arr = array_ex * 2

print(f"리스트의 연산 결과: {result_list}")
print(f"배열의 연산 결과: {result_arr}")

리스트의 연산 결과: [2, 4, 6, 8]
배열의 연산 결과: [2 4 6 8]


In [4]:
# 참고용. 리스트와 배열의 연산 속도 비교
import time
import numpy as np

def dangerous_benchmark():

    # 리스트를 사용한 연산
    start_time = time.time()
    python_list = list(range(1000000000))
    result_list = [x * 2 for x in python_list]
    list_time = time.time() - start_time

    # NumPy 배열을 사용한 연산
    start_time = time.time()
    numpy_array = np.arange(1000000000)
    result_array = numpy_array * 2
    numpy_time = time.time() - start_time

    print(f"리스트의 연산 소요 시간: {list_time:.4f}초")
    print(f"NumPy의 연산 소요 시간: {numpy_time:.4f}초")
    print(f"속도 개선: {list_time/numpy_time:.1f}배")

if __name__ == "__main__":
    pass

# 위의 코드에서 원소 개수를 10억개로 했더니, VSCode가 튕김.
# 물어보니, 64GB보다 훨씬 많은 메모리를 사용하게 되어, OOM이 자체적으로 프로그램을 종료함.
# Python의 list는 정수 객체를 가리키는 포인터들의 배열임.
# 포인트 1개가 8Byte이고, int 객체 1개가 최소 28Byte 이상 사용함.
# 그래서 기본 원본 리스트를 처리하는 경우에만 무려 오버헤드를 제외하고 36GB의 메모리가 필요함.
# 근데 result_list 때문에 똑같은 용량의 메모리가 잡혀, 노트북의 RAM이 버티지 못함.
# 그래서 GPT에게 제안받은 코드를 아래에 작성해서 돌림.
# C처럼 '#if 0 ~ #endif'의 기능을 하는 구문은 Python에서 없다고 함.
# 그래서 실행하면 안되는 부분을 함수로 묶고 호출을 안 함.
# 그리고 'if __name__ == "__main__":'에 pass 처리를 해서 그냥 지나가게 만듦.
n = 500_000_000

# Python의 리스트
t0 = time.perf_counter()        # time.time() 대신 벤치마크용 고해상도 타이머를 사용.
python_list = list(range(n))
result_list = [x * 2 for x in python_list]
t1 = time.perf_counter()
list_time = t1 - t0

# NumPy Array
t0 = time.perf_counter()
numpy_array = np.arange(n, dtype = np.int64)
result_array = numpy_array * 2
t1 = time.perf_counter()
numpy_time = t1 - t0

print(f"리스트의 연산 소요 시간: {list_time:.4f}초")
print(f"NumPy의 연산 소요 시간: {numpy_time:.4f}초")
print(f"속도비(list/numpy): {list_time/numpy_time:.1f}배")
print(f"NumPy의 원소 당 Byte(itemsize): {numpy_array.itemsize}Bytes")

리스트의 연산 소요 시간: 14.7509초
NumPy의 연산 소요 시간: 0.8063초
속도비(list/numpy): 18.3배
NumPy의 원소 당 Byte(itemsize): 8Bytes


In [8]:
# 리스트와 배열 성능 비교 코드 심화편
# 제너레이터 + 청크 조합을 사용해 메모리 퍼짐 방지.
# 리스트 청크: chunk_list만 생성하고, 결과는 청크 단위로만 만들었다가 바로 버림.
# 리스트 제너레이터: 아예 결과 리스트를 만들지 않고 흘려보내며(= sum으로 소비) 처리.
# NumPy 청크(+ out/in-place): np.multiply(~)로 추가 결과 배열의 생성 없이 처리.
# 시간 측정은 time.perf_counter() 사용. (짧은 구간 측정에 고해상도 카운터)
# tracemalloc으로 파이썬 레벨 메모리 피크를 참고로 출력. (단, NumPy의 네이티브 할당은 완전히 반영되지 않을 수 있음.)
import time
import tracemalloc
import numpy as np
from itertools import islice

# Utility: iterable을 'chunk'로 잘라서 내보내기.
# itertools.islice는 sequence slicing처럼 동작하지만, iterator에 메모리를 효율적으로 적용 가능.
def chunked(iterable, chunk_size: int):
    it = iter(iterable)
    while True:
        chunk = list(islice(it, chunk_size))
        if not chunk:
            break
        yield chunk
    
def bench_list_chunk_listcomp(total_n: int, chunk_size: int):
    # list chunk를 만들고, list comprehension으로 결과 list도 생성 후 바로 버림.
    # 이것은 list 방식을 유지하면서 메모리 폭발만 막는 형태.
    checksum = 0
    t0 = time.perf_counter()        # 고해상도 성능 카운터
    for chunk in chunked(range(total_n), chunk_size):
        out = [x * 2 for x in chunk]        # chunk 단위의 결과 list(크기는 chunk_size)
        checksum += out[-1]                 # 소비(최적화 방지용) / python에서 거의 하지 않는 최적화로, 안전장치용.
    t1 = time.perf_counter()

    return (t1 - t0), checksum

def bench_list_chunk_generator(total_n: int, chunk_size: int):
    # list chunk는 만들지만, 결과를 list로 만들지 않고 generator expression으로 흘려보내며 소비.
    # list comprehension보다 결과 list 메모리를 더 아낌.
    checksum = 0
    t0 = time.perf_counter()
    for chunk in chunked(range(total_n), chunk_size):
        checksum += sum(x * 2 for x in chunk)           # 결과 list는 없음. (streaming 형식)
    t1 = time.perf_counter()

    return (t1 - t0), checksum

def bench_numpy_chunk_out(total_n: int, chunk_size: int):
    # Numpy는 chunk마다 arange를 만들고, np.multiply(...)로 추가 결과용 배열 없이 같은 buffer에 써서 파크 메모리를 억제.
    # numpy.multiply는 out parameter로 출력 배열 지정 가능.
    checksum = 0
    t0 = time.perf_counter()
    for start in range(0, total_n, chunk_size):
        size = min(chunk_size, total_n - start)
        arr = np.arange(start, start + size, dtype = np.int64)
        np.multiply(arr, 2, out = arr)      # in-place(out) 처리
        checksum += int(arr[-1])
    t1 = time.perf_counter()

    return (t1 - t0), checksum

def run_all(total_n: int = 10_000_000_000, chunk_size: int = 5_000_000):
    # total_n: 총 원소의 수
    # chunk_size: chunk 크기(값이 너무 크면 메모리 피크 상승 유발)
    print(f"TOTAL N={total_n:,}, CHUNK={chunk_size:,}")

    # tracemalloc은 python 할당 추적. 현재와 peak를 (current, peak) 형식으로 제공.
    tracemalloc.start()

    tracemalloc.reset_peak()
    t_list_lc, c1 = bench_list_chunk_listcomp(total_n, chunk_size)
    cur, peak = tracemalloc.get_traced_memory()
    print(f"[List + listcomp per chunk] time={t_list_lc:.3f}초 | checksum={c1} | tracemalloc_peak={peak/1024/1024:.1f} MB")

    tracemalloc.reset_peak()
    t_list_gen, c2 = bench_list_chunk_generator(total_n, chunk_size)
    cur, peak = tracemalloc.get_traced_memory()
    print(f"[List | generator sum] time={t_list_gen:.3f}초 | checksum={c2} | tracemalloc_peak={peak/1024/1024:.1f} MB")

    tracemalloc.reset_peak()
    t_np_out, c3 = bench_numpy_chunk_out(total_n, chunk_size)
    cur, peak = tracemalloc.get_traced_memory()
    print(f"[NumPy + out(in-place)] time={t_np_out:.3f}초 | checksum={c3} | tracemalloc_peak={peak/1024/1024:.1f} MB")

    tracemalloc.stop()

    print("\n※ 주의: tracemalloc은 '파이썬이 추적하는 메모리 블록' 기준이라, NumPy의 네이티브 할당이 완전히 잡히지 않을 수 있습니다. :contentReference[oaicite:6]{index=6}")
    print("※ 스크립트/모듈 겸용으로 쓰려면 아래처럼 __main__ 가드 사용이 표준입니다. :contentReference[oaicite:7]{index=7}")

if __name__ == "__main__":      # top-level 실행일 때만 동작함.
    run_all(total_n=200_000_000, chunk_size=5_000_000)

TOTAL N=200,000,000, CHUNK=5,000,000
[List + listcomp per chunk] time=113.726초 | checksum=8199999920 | tracemalloc_peak=583.5 MB
[List | generator sum] time=98.342초 | checksum=39999999800000000 | tracemalloc_peak=389.0 MB
[NumPy + out(in-place)] time=0.190초 | checksum=8199999920 | tracemalloc_peak=76.3 MB

※ 주의: tracemalloc은 '파이썬이 추적하는 메모리 블록' 기준이라, NumPy의 네이티브 할당이 완전히 잡히지 않을 수 있습니다. :contentReference[oaicite:6]{index=6}
※ 스크립트/모듈 겸용으로 쓰려면 아래처럼 __main__ 가드 사용이 표준입니다. :contentReference[oaicite:7]{index=7}
