# 알고리즘 개요



---



# 1.알고리즘이란?

## 알고리즘 성능 분석
- **연산량**： 알고리즘이 얼마나 적은 연산을 수행하는가?
- **메모리 사용량**： 얼마나 적은 메모리 공간을 사용하는가?

### @연산량 확인 방법

|연산량 확인 방법|설명|주요 도구|
|----|----|----|
|연산 횟수 직접 카운팅 |특정 코드에서 연산 횟수를 직접 세어 연산량을 측정 | 변수 사용 (count += 1)|
|Big-O 분석을 위한 타이머 활용 | 실행 시간을 여러 입력 크기에 대해 측정하여 시간 복잡도 분석 | time 모듈 (time.time()) |
|프로파일링 도구 활용 | 함수 실행 횟수, 실행 시간 분석 | cProfile, line-profiler |
|CPU 사용량 확인 |연산량이 CPU 사용률에 미치는 영향 분석 | psutil.cpu_percent() |



#### 1.연산 횟수 직접 카운팅
알고리즘 내에서 수행되는 주요 연산(반복문, 재귀 호출, 비교 연산 등)의 횟수 센다.</br>**(전역 변수 or 데코레이터 활용)**

In [None]:
# 버블 정렬의 연산 횟수 측정
import random

count = 0  # 연산 횟수 카운트

def bubble_sort(arr):
    global count
    n = len(arr)
    for i in range(n):
        for j in range(0, n-i-1):
            count += 1  # 비교 연산 횟수 증가
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]

arr = [random.randint(0, 100) for _ in range(10)]
print(arr)
bubble_sort(arr)
print(f"Total Operations: {count}")

#### 2.Big-O 분석을 위한 타이머 활용
정렬 알고리즘의 실행 시간을 여러 크기의 입력에서 측정하여 Big-O 복잡도(O(n²), O(n log n) 등)를 분석할 수 있다.

In [None]:
# 정렬 알고리즘의 시간 복잡도 비교
import time
import random

def measure_time(sort_function, size):
    arr = [random.randint(0, 10000) for _ in range(size)]
    start = time.time()  # 시간 측정 시작
    sort_function(arr)
    end = time.time()    # 시간 측정 종료
    return end - start

sizes = [100, 500, 1000, 5000]
for size in sizes:
    print(f"Size {size}: Bubble Sort = {measure_time(bubble_sort, size):.6f} sec")


- 그래프로 표현

In [None]:
import time
import random
import matplotlib.pyplot as plt

def measure_time(sort_function, sizes):
    times = []
    for size in sizes:
        arr = [random.randint(0, 10000) for _ in range(size)]
        start = time.time()
        sort_function(arr)
        end = time.time()
        times.append(end - start)
    return times

sizes = [100, 500, 1000, 5000]
bubble_times = measure_time(bubble_sort, sizes)
plt.plot(sizes, bubble_times, label="Bubble Sort", marker='o')
plt.xlabel("Input Size")
plt.ylabel("Execution Time (seconds)")
plt.legend()
plt.title("Algorithm Complexity Analysis")
plt.show()


#### 3.프로파일링 도구 활용
cProfile: 각 함수가 몇 번 호출되었는지와 실행 시간을 출력해 준다.

In [None]:
# cProfile을 이용한 함수 호출 수 측정
import cProfile

def test_function():
    total = 0
    for i in range(1000000):
        total += i
    return total

cProfile.run('test_function()')


- line_profiler: 코드 라인별 연산량 확인

In [None]:
!pip install line-profiler

In [None]:
from line_profiler import LineProfiler

def test_function():
    total = 0
    for i in range(1000000):  # 연산량이 많은 부분
        total += i
    return total

lp = LineProfiler()
lp.add_function(test_function)

lp.enable()   # LineProfiler: 시작
test_function()
lp.disable()  # LineProfiler: 종료

lp.print_stats()


#### 4.CPU 사용량 확인

In [None]:
import psutil
import time

def test_function():
    total = 0
    for i in range(1000000):
        total += i
    return total

# CPU 및 메모리 사용량 측정
process = psutil.Process()
start_cpu = process.cpu_percent(interval=None)

start_time = time.time()
test_function()
end_time = time.time()

end_cpu = process.cpu_percent(interval=None)

print(f"Execution Time: {end_time - start_time:.6f} seconds")
print(f"CPU Usage: {end_cpu:.2f}%")


### [실습문제] 정렬 알고리즘 시간 성능 분석
- bubble_sort, merge_sort, builtin_sort  사용
- sizes =  [100, 500, 1000, 5000, 10000] 임의의 정수 사용
- 각 알고리즘의 실행 시간(time) 측정하여 하나의 그래프에 시각화하기

In [None]:
# 버블 정렬 (느림)
def bubble_sort(arr):
    n = len(arr)
    for i in range(n):
        for j in range(0, n-i-1):
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]

# 병합 정렬 (중간)
def merge_sort(arr):
    if len(arr) > 1:
        mid = len(arr) // 2
        L, R = arr[:mid], arr[mid:]
        merge_sort(L)
        merge_sort(R)
        i = j = k = 0
        while i < len(L) and j < len(R):
            if L[i] < R[j]:
                arr[k] = L[i]
                i += 1
            else:
                arr[k] = R[j]
                j += 1
            k += 1
        while i < len(L):
            arr[k] = L[i]
            i += 1
            k += 1
        while j < len(R):
            arr[k] = R[j]
            j += 1
            k += 1

# 파이썬 내장 정렬 (빠름)
def builtin_sort(arr):
    arr.sort()




---



### @메모리 사용량 확인 방법


 |메모리 사용량 확인 방법 | 설명 | 주요 도구 |
 |--------- |---------- |----- |
|(전체 프로세스)메모리 사용량 측정 | 현재 실행 중인 프로세스가 사용하는 전체 메모리 크기 확인  | psutil.memory_info()  |
|(코드 라인별)메모리 사용량 측정 | 특정 코드 라인에서 사용된 메모리 크기를 분석하여 가장 많은 메모리를 차지하는 부분 확인 |memory_profiler |
|메모리 사용량 추적 | 프로그램 실행 중 메모리 변화량을 추적하여 메모리 증가 여부 분석 |tracemalloc |
|Garbage Collector 메모리 수거 확인|Python이 자동으로 해제하지 않은 메모리를 강제로 수거하여 메모리 최적화 확인 |  gc (Garbage Collector)|



#### 1.(전체 프로세스)메모리 사용량 측정

In [None]:
import psutil
import time

def memory_intensive_function():
    data = [i for i in range(10**7)]  # 큰 리스트 생성
    return sum(data)

# 현재 프로세스의 메모리 사용량 측정
# - rss:Resident Set Size, 현재 프로세스가 실제로 물리적 RAM에서 차지하고 있는 메모리 크기
process = psutil.Process()
start_memory = process.memory_info().rss / (1024 * 1024)  # MB 단위

start_time = time.time()
memory_intensive_function()
end_time = time.time()

end_memory = process.memory_info().rss / (1024 * 1024)  # MB 단위

print(f"Memory Usage Before: {start_memory:.2f} MB")
print(f"Memory Usage After: {end_memory:.2f} MB")
print(f"Memory Increased: {end_memory - start_memory:.2f} MB")
print(f"Execution Time: {end_time - start_time:.6f} sec")


#### 2.(코드 라인별)메모리 사용량 측정

In [None]:
!pip install memory_profiler

In [None]:
from memory_profiler import memory_usage
import time

def memory_intensive_function():
    data = [i for i in range(10**6)]  # 큰 리스트 생성
    total = sum(data)
    return total

# 메모리 사용량 측정
mem_usage, _ = memory_usage((memory_intensive_function, ), interval=0.1, retval=True)
print(f"Peak Memory Usage: {max(mem_usage):.2f} MB")


In [None]:
'''
이 코드는 코랩에서는 IPython 환경과 호환되지 않아서 오류가 발생함
PC 파이썬 인터프리터에서 실행
- 각 코드 라인이 얼마나 많은 메모리를 사용하는지 확인 가능
'''
from memory_profiler import profile

@profile
def memory_intensive_function():
    data = [i for i in range(10**6)]  # 큰 리스트 생성
    total = sum(data)
    return total

memory_intensive_function()


#### 3.메모리 사용량 추적

In [None]:
'''
메모리 증가량을 추적하고, 프로그램이 가장 많은 메모리를 사용할 때를 확인 가능
'''
import tracemalloc

def memory_intensive_function():
    data = [i for i in range(10**6)]  # 큰 리스트 생성
    return sum(data)

# 메모리 사용량 추적 시작
tracemalloc.start()

memory_intensive_function()

# 메모리 사용량 확인
current, peak = tracemalloc.get_traced_memory()
print(f"Current memory usage: {current / (1024 * 1024):.2f} MB")
print(f"Peak memory usage: {peak / (1024 * 1024):.2f} MB")

# 메모리 추적 종료
tracemalloc.stop()


#### 4.Garbage Collector 메모리 수거 확인

In [None]:
import gc
import psutil

def create_large_data():
    return [i for i in range(10**6)]  # 큰 리스트 생성

process = psutil.Process()
print(f"Memory Before: {process.memory_info().rss / (1024 * 1024):.2f} MB")

data = create_large_data()

print(f"Memory After: {process.memory_info().rss / (1024 * 1024):.2f} MB")

del data  # 메모리 해제
gc.collect()  # 가비지 컬렉션 실행

print(f"Memory After GC: {process.memory_info().rss / (1024 * 1024):.2f} MB")




---



### [실습문제] 정렬 알고리즘 성능 분석 (시간, 메모리)
- bubble_sort, merge_sort, builtin_sort  사용
- sizes =  [100, 500, 1000, 5000, 10000] 임의의 정수 사용
- 실행 시간(time), 전체 메모리 사용량 측정하여  그래프에 시각화하기