# Step 1: Python과 NumPy 기초

딥러닝을 시작하기 전에 Python과 NumPy의 기초를 탄탄히 다져봅시다.

## 학습 목표
1. Python의 기본 자료구조 이해
2. NumPy 배열 다루기
3. 행렬 연산 이해하기
4. 딥러닝에 필요한 수학 함수들 익히기

## 1. Python 기본 자료구조 복습

In [None]:
# 리스트 (List)
numbers = [1, 2, 3, 4, 5]
print("리스트:", numbers)

# 리스트 컴프리헨션 - 딥러닝에서 자주 사용됩니다
squared = [x**2 for x in numbers]
print("제곱된 값들:", squared)

# 딕셔너리 (Dictionary) - 모델 파라미터 저장 등에 사용
model_params = {
    'learning_rate': 0.01,
    'epochs': 100,
    'batch_size': 32
}
print("\n모델 파라미터:", model_params)

## 2. NumPy 소개

NumPy는 Python에서 수치 연산을 위한 핵심 라이브러리입니다. 딥러닝의 기초가 되는 행렬 연산을 효율적으로 수행할 수 있습니다.

In [None]:
import numpy as np

# NumPy 배열 생성
arr = np.array([1, 2, 3, 4, 5])
print("NumPy 배열:", arr)
print("배열의 타입:", type(arr))
print("배열의 형태:", arr.shape)
print("배열의 차원:", arr.ndim)

### 2.1 다차원 배열 (텐서)

딥러닝에서는 다차원 배열을 텐서(Tensor)라고 부릅니다.
- 1차원 텐서: 벡터 (Vector)
- 2차원 텐서: 행렬 (Matrix)
- 3차원 이상: 텐서 (Tensor)

In [None]:
# 1차원 배열 (벡터)
vector = np.array([1, 2, 3])
print("벡터:", vector)
print("형태:", vector.shape)

# 2차원 배열 (행렬)
matrix = np.array([[1, 2, 3],
                   [4, 5, 6]])
print("\n행렬:")
print(matrix)
print("형태:", matrix.shape)  # (행, 열)

# 3차원 배열 (텐서)
tensor = np.array([[[1, 2], [3, 4]],
                   [[5, 6], [7, 8]]])
print("\n3차원 텐서:")
print(tensor)
print("형태:", tensor.shape)  # (깊이, 행, 열)

### 2.2 유용한 배열 생성 함수들

In [None]:
# zeros: 0으로 채워진 배열
zeros = np.zeros((3, 4))
print("영행렬 (3x4):")
print(zeros)

# ones: 1로 채워진 배열
ones = np.ones((2, 3))
print("\n1로 채워진 행렬 (2x3):")
print(ones)

# random: 무작위 값으로 채워진 배열 (가중치 초기화에 사용)
random_array = np.random.randn(3, 3)  # 표준정규분포
print("\n무작위 행렬 (3x3):")
print(random_array)

# arange: 연속된 값들로 배열 생성
sequence = np.arange(0, 10, 2)  # 0부터 10까지 2씩 증가
print("\n연속 배열:", sequence)

## 3. 배열 연산 (딥러닝의 핵심!)

딥러닝은 결국 행렬 연산의 연속입니다. NumPy로 이를 효율적으로 수행할 수 있습니다.

In [None]:
# 기본 연산
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])

print("행렬 a:")
print(a)
print("\n행렬 b:")
print(b)

# 요소별 연산 (element-wise)
print("\n요소별 덧셈 (a + b):")
print(a + b)

print("\n요소별 곱셈 (a * b):")
print(a * b)

# 행렬 곱셈 (dot product) - 신경망의 순전파에 사용
print("\n행렬 곱셈 (a @ b):")
print(a @ b)  # 또는 np.dot(a, b)

### 3.1 브로드캐스팅 (Broadcasting)

서로 다른 크기의 배열을 연산할 때 자동으로 크기를 맞춰주는 기능입니다.

In [None]:
# 브로드캐스팅 예제
matrix = np.array([[1, 2, 3],
                   [4, 5, 6]])
scalar = 10
vector = np.array([1, 2, 3])

print("원본 행렬:")
print(matrix)

# 스칼라와의 연산
print("\n행렬 + 스칼라:")
print(matrix + scalar)

# 벡터와의 연산 (각 행에 벡터를 더함)
print("\n행렬 + 벡터:")
print(matrix + vector)

## 4. 딥러닝에 필요한 수학 함수들

In [None]:
# 지수 함수 (활성화 함수에 사용)
x = np.array([-2, -1, 0, 1, 2])
print("입력값 x:", x)
print("exp(x):", np.exp(x))

# 시그모이드 함수 (이진 분류에 사용)
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

print("\nsigmoid(x):", sigmoid(x))

# ReLU 함수 (가장 많이 사용되는 활성화 함수)
def relu(x):
    return np.maximum(0, x)

print("\nReLU(x):", relu(x))

### 4.1 통계 함수들

In [None]:
# 데이터 생성
data = np.random.randn(100, 5)  # 100개 샘플, 5개 특징

# 평균과 표준편차
print("전체 평균:", np.mean(data))
print("열별 평균:", np.mean(data, axis=0))  # 각 특징의 평균
print("\n전체 표준편차:", np.std(data))

# 최댓값, 최솟값
print("\n최댓값:", np.max(data))
print("최솟값:", np.min(data))

# argmax, argmin (분류 문제에서 예측값 찾기)
predictions = np.array([0.1, 0.3, 0.8, 0.2])
print("\n예측 확률:", predictions)
print("가장 높은 확률의 인덱스:", np.argmax(predictions))

## 5. 실습: 간단한 데이터 전처리

딥러닝 모델에 데이터를 입력하기 전에 전처리가 필요합니다.

In [None]:
# 데이터 정규화 (Normalization)
# 각 특징의 평균을 0, 표준편차를 1로 만들기

# 샘플 데이터 생성
np.random.seed(42)  # 재현 가능한 결과를 위해
raw_data = np.random.randn(5, 3) * 10 + 50  # 평균 50, 표준편차 10

print("원본 데이터:")
print(raw_data)
print("\n원본 데이터 통계:")
print(f"평균: {np.mean(raw_data, axis=0)}")
print(f"표준편차: {np.std(raw_data, axis=0)}")

# 정규화
mean = np.mean(raw_data, axis=0)
std = np.std(raw_data, axis=0)
normalized_data = (raw_data - mean) / std

print("\n정규화된 데이터:")
print(normalized_data)
print("\n정규화된 데이터 통계:")
print(f"평균: {np.mean(normalized_data, axis=0)}")
print(f"표준편차: {np.std(normalized_data, axis=0)}")

## 6. 미니 프로젝트: 선형 회귀를 위한 데이터 준비

간단한 선형 관계를 가진 데이터를 생성하고 시각화해봅시다.

In [None]:
import matplotlib.pyplot as plt

# 선형 데이터 생성
np.random.seed(42)
X = np.random.rand(100, 1) * 10  # 0~10 사이의 100개 점
y = 2 * X + 1 + np.random.randn(100, 1) * 2  # y = 2x + 1 + 노이즈

# 데이터 시각화
plt.figure(figsize=(8, 6))
plt.scatter(X, y, alpha=0.6)
plt.xlabel('X')
plt.ylabel('y')
plt.title('선형 회귀를 위한 샘플 데이터')
plt.grid(True, alpha=0.3)
plt.show()

print(f"X 형태: {X.shape}")
print(f"y 형태: {y.shape}")

## 7. 연습 문제

아래 문제들을 직접 풀어보세요!

In [None]:
# 문제 1: 3x3 단위 행렬(identity matrix) 만들기
# 힌트: np.eye() 함수 사용
identity = None  # 여기에 코드 작성

# 문제 2: 1부터 9까지의 숫자로 3x3 행렬 만들기
# 힌트: np.arange()와 reshape() 사용
matrix_1_to_9 = None  # 여기에 코드 작성

# 문제 3: 위에서 만든 행렬의 전치행렬(transpose) 구하기
transposed = None  # 여기에 코드 작성

# 문제 4: Softmax 함수 구현하기 (다중 클래스 분류에 사용)
def softmax(x):
    # 힌트: exp(x) / sum(exp(x))
    # 수치 안정성을 위해 x - max(x)를 먼저 계산
    pass  # 여기에 코드 작성

## 정리

이번 튜토리얼에서 배운 내용:
1. Python의 기본 자료구조
2. NumPy 배열의 생성과 조작
3. 행렬 연산과 브로드캐스팅
4. 딥러닝에 필요한 수학 함수들
5. 데이터 전처리 기법

다음 단계에서는 이러한 기초를 바탕으로 실제 신경망을 구현해보겠습니다!