# 🔍 배열 기반 검색 알고리즘 문제 세트
본 노트북은 인공지능을 위한 알고리즘 및 자료구조 수업의 **기초 검색 알고리즘 실습**을 위해 작성되었습니다.
다음 문제들을 직접 해결해보며 선형 검색, 이진 검색, 해시 검색의 원리를 익혀보세요.

## ✅ 문제 1. 선형 검색 구현
**설명**: 주어진 정수 배열에서 특정 값을 선형 검색(linear search) 방식으로 찾는 함수를 작성하세요.  
- 입력: 정수 배열 `arr`과 정수 `target`  
- 출력: `target`이 존재하면 인덱스, 존재하지 않으면 `-1` 반환
```python
def linear_search(arr: list[int], target: int) -> int:
    pass  # 여기에 구현
```
**예시**
```python
>>> linear_search([3, 5, 2, 9], 5)
1
>>> linear_search([3, 5, 2, 9], 7)
-1
```

In [7]:
def linear_search(arr: list[int], target: int) -> int:
    for i in range(len(arr)):
        if arr[i] == target:
            return i
    return -1

## ✅ 문제 2. 이진 검색 구현
**설명**: 정렬된 배열에서 이진 검색(binary search)을 구현하세요.  
- 입력: 오름차순 정렬된 정수 배열 `arr`과 정수 `target`
- 출력: `target`의 인덱스, 없으면 `-1`
```python
def binary_search(arr: list[int], target: int) -> int:
    pass  # 여기에 구현
```
**예시**
```python
>>> binary_search([1, 3, 5, 7, 9], 7)
3
>>> binary_search([1, 3, 5, 7, 9], 4)
-1
```

In [8]:
def binary_search(arr: list[int], target: int) -> int:
    left = 0
    right = len(arr) - 1
    
    while left <= right:
        mid = (left + right) // 2
        
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
            
    return -1

## ✅ 문제 3. 체이닝 해시맵 구현 (기초 버전)
**설명**: 해시 충돌을 체이닝(chaining) 방식으로 해결하는 해시맵을 클래스 형태로 구현하세요.
- 제공 기능:
  - `put(key, value)`: 키-값 삽입
  - `get(key)`: 키로 값 검색
  - `remove(key)`: 키 삭제
```python
class ChainedHashMap:
    def __init__(self, size: int = 10):
        pass
    def put(self, key: str, value: int) -> None:
        pass
    def get(self, key: str) -> int | None:
        pass
    def remove(self, key: str) -> None:
        pass
```

In [None]:
class ChainedHashMap:
    def __init__(self, size: int = 10):
        self.size = size
        self.table = [[] for _ in range(size)]  # 각 버킷은 리스트(체인)
    
    def _hash(self, key: str) -> int:
        # 간단한 해시 함수
        return sum(ord(c) for c in key) % self.size
    
    def put(self, key: str, value: int) -> None:
        index = self._hash(key)
        # 이미 키가 존재하는지 확인
        for item in self.table[index]:
            if item[0] == key:
                item[1] = value  # 값 업데이트
                return
        # 새로운 키-값 쌍 추가
        self.table[index].append([key, value])
    
    def get(self, key: str) -> int | None:
        index = self._hash(key)
        # 체인에서 키 검색
        for item in self.table[index]:
            if item[0] == key:
                return item[1]
        return None
    
    def remove(self, key: str) -> None:
        index = self._hash(key)
        # 체인에서 키 검색 후 삭제
        for i, item in enumerate(self.table[index]):
            if item[0] == key:
                self.table[index].pop(i)
                return

## ✅ 문제 4. 해시 충돌 시나리오 실습
**설명**: 같은 해시값이 나오도록 `size=1`인 해시맵을 만들고, 여러 key를 넣고 체이닝 충돌 상황을 관찰하세요.
```python
# 직접 put 여러 번 실행 후 내부 구조를 출력해보세요.
```

In [10]:
class ChainedHashMap:
    def __init__(self, size: int = 10):
        self.size = size
        self.table = [[] for _ in range(size)]
    
    def _hash(self, key: str) -> int:
        return sum(ord(c) for c in key) % self.size
    
    def put(self, key: str, value: int) -> None:
        index = self._hash(key)
        for item in self.table[index]:
            if item[0] == key:
                item[1] = value
                return
        self.table[index].append([key, value])
    
    # 내부 구조를 보기 위한 메서드 추가
    def display(self):
        for i in range(self.size):
            print(f"Bucket {i}: {self.table[i]}")

# 테스트 코드
hash_map = ChainedHashMap(size=1)  # 크기가 1인 해시맵 생성

# 여러 키-값 쌍 삽입
hash_map.put("apple", 5)
hash_map.put("banana", 8)
hash_map.put("orange", 3)
hash_map.put("grape", 7)

# 내부 구조 출력
print("해시맵의 내부 구조:")
hash_map.display()

해시맵의 내부 구조:
Bucket 0: [['apple', 5], ['banana', 8], ['orange', 3], ['grape', 7]]


## ✅ 문제 5. 검색 알고리즘 비교 실험
**설명**: 10만 개의 랜덤 숫자 배열을 만들어 선형 검색과 이진 검색의 속도 차이를 실험하세요.  
- `random.randint(0, 1_000_000)`으로 배열 생성
- 타이밍 측정에 `time` 모듈 사용
```python
# 실험 결과를 print로 비교해보세요.
```

In [12]:
import random
import time

def linear_search(arr: list[int], target: int) -> int:
    for i in range(len(arr)):
        if arr[i] == target:
            return i
    return -1

def binary_search(arr: list[int], target: int) -> int:
    left = 0
    right = len(arr) - 1
    while left <= right:
        mid = (left + right) // 2
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    return -1

size = 100_000
numbers = [random.randint(0, 1_000_000) for _ in range(size)]
sorted_numbers = sorted(numbers)

target = numbers[random.randint(0, size-1)]

# 여러 번 반복 실행
iterations = 1000
linear_total_time = 0
binary_total_time = 0

for _ in range(iterations):
    # 선형 검색 시간 측정
    start_time = time.time()
    linear_result = linear_search(numbers, target)
    linear_total_time += time.time() - start_time
    
    # 이진 검색 시간 측정
    start_time = time.time()
    binary_result = binary_search(sorted_numbers, target)
    binary_total_time += time.time() - start_time

# 평균 시간 계산
linear_avg_time = linear_total_time / iterations
binary_avg_time = binary_total_time / iterations

print(f"배열 크기: {size:,}")
print(f"찾은 값: {target}")
print(f"선형 검색 평균 시간: {linear_avg_time:.8f}초")
print(f"이진 검색 평균 시간: {binary_avg_time:.8f}초")
print(f"속도 차이: {linear_avg_time/binary_avg_time:.1f}배")

배열 크기: 100,000
찾은 값: 589837
선형 검색 평균 시간: 0.00589678초
이진 검색 평균 시간: 0.00001873초
속도 차이: 314.8배


## ✅ 문제 6. 체인드 해시의 시간복잡도 분석
**설명**: 아래 각 연산에 대해 평균적인 경우와 최악의 경우의 시간복잡도 Big-O를 분석해보세요.
1. `put(key, value)` – 키-값 추가
2. `get(key)` – 키를 이용한 검색
3. `remove(key)` – 키에 해당하는 값 삭제

**힌트**: 해시 테이블의 크기와 충돌 수에 따라 성능이 어떻게 달라질까요?

**답안 예시**:
```python
# 평균 시간복잡도:
# put: O(1), get: O(1), remove: O(1)

# 최악 시간복잡도:
# put: O(n), get: O(n), remove: O(n)
```
※ `n`은 테이블 전체에 저장된 키의 수입니다.

In [None]:
"""
평균 시간복잡도:
put: O(1)   - 해시 함수 계산과 체인 끝에 추가는 상수 시간
get: O(1)   - 해시 함수 계산과 짧은 체인 검색은 상수 시간
remove: O(1) - 해시 함수 계산과 짧은 체인에서 삭제는 상수 시간

최악 시간복잡도:
put: O(n)   - 모든 키가 같은 버킷에 있을 때 체인 전체 검색 필요
get: O(n)   - 모든 키가 같은 버킷에 있을 때 체인 전체 검색 필요
remove: O(n) - 모든 키가 같은 버킷에 있을 때 체인 전체 검색 필요
"""

---
### 🎯 보너스 과제
1. 해시맵에 학생 이름(key)과 점수(value)를 저장하고, 이름으로 검색 및 삭제 기능을 구현하시오.
2. 이진 검색은 정렬된 배열에서만 동작한다. 정렬되지 않은 배열에서 이진 검색을 사용할 경우 어떤 문제가 발생하는지 예를 들어 설명하시오.

In [13]:
class StudentScores:
    def __init__(self, size: int = 10):
        self.size = size
        self.table = [[] for _ in range(size)]
    
    def _hash(self, name: str) -> int:
        return sum(ord(c) for c in name) % self.size
    
    def add_score(self, name: str, score: int) -> None:
        index = self._hash(name)
        for item in self.table[index]:
            if item[0] == name:
                item[1] = score  # 기존 점수 업데이트
                return
        self.table[index].append([name, score])
    
    def get_score(self, name: str) -> int | None:
        index = self._hash(name)
        for item in self.table[index]:
            if item[0] == name:
                return item[1]
        return None
    
    def remove_student(self, name: str) -> None:
        index = self._hash(name)
        for i, item in enumerate(self.table[index]):
            if item[0] == name:
                self.table[index].pop(i)
                return

scores = StudentScores()
scores.add_score("Alice", 95)
scores.add_score("Bob", 87)
scores.add_score("Charlie", 92)

print(scores.get_score("Bob"))      
scores.remove_student("Bob")
print(scores.get_score("Bob"))    

87
None


정렬되지 않은 배열 [7, 2, 9, 1, 5]에서 5를 찾기

중간값 9 확인 -> 5가 더 작으므로 왼쪽 탐색
왼쪽 부분 [7, 2]의 중간값 7 확인 -> 5가 더 작으므로 왼쪽 탐색
왼쪽에는 2만 남음 → 5를 찾지 못함