# 🔍 배열 기반 검색 알고리즘 문제 세트
본 노트북은 인공지능을 위한 알고리즘 및 자료구조 수업의 **기초 검색 알고리즘 실습**을 위해 작성되었습니다.
다음 문제들을 직접 해결해보며 선형 검색, 이진 검색, 해시 검색의 원리를 익혀보세요.

## ✅ 문제 1. 선형 검색 구현
**설명**: 주어진 정수 배열에서 특정 값을 선형 검색(linear search) 방식으로 찾는 함수를 작성하세요.  
- 입력: 정수 배열 `arr`과 정수 `target`  
- 출력: `target`이 존재하면 인덱스, 존재하지 않으면 `-1` 반환
```python
def linear_search(arr: list[int], target: int) -> int:
    pass  # 여기에 구현
```
**예시**
```python
>>> linear_search([3, 5, 2, 9], 5)
1
>>> linear_search([3, 5, 2, 9], 7)
-1
```

In [26]:
def linear_search(arr: list[int], target: int) -> int:
    for i, value in enumerate(arr):
        if value == target:
            return i
    return -1

print(linear_search([3, 5, 2, 9], 5))
print(linear_search([3, 5, 2, 9], 7))

1
-1


## ✅ 문제 2. 이진 검색 구현
**설명**: 정렬된 배열에서 이진 검색(binary search)을 구현하세요.  
- 입력: 오름차순 정렬된 정수 배열 `arr`과 정수 `target`
- 출력: `target`의 인덱스, 없으면 `-1`
```python
def binary_search(arr: list[int], target: int) -> int:
    pass  # 여기에 구현
```
**예시**
```python
>>> binary_search([1, 3, 5, 7, 9], 7)
3
>>> binary_search([1, 3, 5, 7, 9], 4)
-1
```

In [40]:
def binary_search(arr: list[int], target: int)-> int:
    start = 0
    end = len(arr) -1

    while start <= end:
        mid = (start + end) // 2
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            start = mid + 1
        else:
            end = mid - 1
    return -1

print(binary_search([1, 3, 5, 7, 9], 7))
print(binary_search([1, 3, 5, 7, 9], 4))

3
-1


## ✅ 문제 3. 체이닝 해시맵 구현 (기초 버전)
**설명**: 해시 충돌을 체이닝(chaining) 방식으로 해결하는 해시맵을 클래스 형태로 구현하세요.
- 제공 기능:
  - `put(key, value)`: 키-값 삽입
  - `get(key)`: 키로 값 검색
  - `remove(key)`: 키 삭제
```python
class ChainedHashMap:
    def __init__(self, size: int = 10):
        pass
    def put(self, key: str, value: int) -> None:
        pass
    def get(self, key: str) -> int | None:
        pass
    def remove(self, key: str) -> None:
        pass
```

In [18]:
import hashlib

class Node:
    def __init__(self, key: str, value: int, next=None):
        self.key = key
        self.value = value
        self.next = next

class ChainedHashMap:
    def __init__(self, size: int = 10):
        self.size = size
        self.table = [None] * self.size

    def put(self, key: str, value: int) -> None:
        idx = int(hashlib.sha256(key.encode()).hexdigest(), 16) % self.size
        node = self.table[idx]
        while node:
            if node.key == key:
                node.value = value
                return
            node = node.next
        self.table[idx] = Node(key, value, self.table[idx])

    def get(self, key: str) -> int | None:
        idx = int(hashlib.sha256(key.encode()).hexdigest(), 16) % self.size
        node = self.table[idx]
        while node:
            if node.key == key:
                return node.value
            node = node.next
        return None

    def remove(self, key: str) -> None:
        idx = int(hashlib.sha256(key.encode()).hexdigest(), 16) % self.size
        node = self.table[idx]
        prev = None
        while node:
            if node.key == key:
                if prev is None:
                    self.table[idx] = node.next
                else:
                    prev.next = node.next
                return
            prev = node
            node = node.next


## ✅ 문제 4. 해시 충돌 시나리오 실습
**설명**: 같은 해시값이 나오도록 `size=1`인 해시맵을 만들고, 여러 key를 넣고 체이닝 충돌 상황을 관찰하세요.
```python
# 직접 put 여러 번 실행 후 내부 구조를 출력해보세요.
```

In [19]:
hash = ChainedHashMap(1)

hash.put('소희', 23)
hash.put('의찬', 25)
hash.put('새움', 22)

node = hash.table[0]
while node:
    print(f"{node.key}: {node.value}")
    node = node.next

새움: 22
의찬: 25
소희: 23


## ✅ 문제 5. 검색 알고리즘 비교 실험
**설명**: 10만 개의 랜덤 숫자 배열을 만들어 선형 검색과 이진 검색의 속도 차이를 실험하세요.  
- `random.randint(0, 1_000_000)`으로 배열 생성
- 타이밍 측정에 `time` 모듈 사용
```python
# 실험 결과를 print로 비교해보세요.
```

In [31]:
import random
import time

arr = [random.randint(0, 1_000_000) for _ in range(100_000)]
target = random.choice(arr)

start_time = time.time()
linear_search(arr,target)
linear_search_time = time.time() - start_time

arr.sort()
start_time = time.time()
binary_search(arr,target)
binary_search_time = time.time() - start_time

print(f"Linear Search Time: {linear_search_time:.6f}초")
print(f"Binary Search Time: {binary_search_time:.6f}초")

Linear Search Time: 0.002625초
Binary Search Time: 0.000000초


## ✅ 문제 6. 체인드 해시의 시간복잡도 분석
**설명**: 아래 각 연산에 대해 평균적인 경우와 최악의 경우의 시간복잡도 Big-O를 분석해보세요.
1. `put(key, value)` – 키-값 추가
2. `get(key)` – 키를 이용한 검색
3. `remove(key)` – 키에 해당하는 값 삭제

**힌트**: 해시 테이블의 크기와 충돌 수에 따라 성능이 어떻게 달라질까요?

**답안 예시**:
```python
# 평균 시간복잡도:
# put: O(1), get: O(1), remove: O(1)

# 최악 시간복잡도:
# put: O(n), get: O(n), remove: O(n)
```
※ `n`은 테이블 전체에 저장된 키의 수입니다.

### 1. put(key, value)
- 평균: 해시 함수 계산과 해당 인덱스의 버킷에 새 노드를 삽입하는 작업은 상수 시간에 이루어지므로 **O(1)**
- 최악: 모든 키가 같은 버킷에 해시될 경우 중복 키 여부를 확인하기 위해 전체 체인을 탐색해야 하므로 **O(n)**
  
### 2. get(key)
- 평균: 해시값에 해당하는 버킷의 연결 리스트를 탐색하면 되므로 평균적으로 **O(1)**
- 최악: 모든 키가 하나의 버킷에 몰려 있을 경우 원하는 키를 찾기 위해 리스트 전체를 탐색해야 하므로 **O(n)**
  
### 3. remove(key)
- 평균: 삭제할 키가 있는 노드를 빠르게 찾고 제거할 수 있어 상수 시간에 수행되므로 **O(1)**
- 최악: 하나의 버킷에 키가 모두 모인 경우, 해당 키를 찾기 위해 리스트 전체를 탐색해야 하므로 **O(n)**

---
### 🎯 보너스 과제
1. 해시맵에 학생 이름(key)과 점수(value)를 저장하고, 이름으로 검색 및 삭제 기능을 구현하시오.
2. 이진 검색은 정렬된 배열에서만 동작한다. 정렬되지 않은 배열에서 이진 검색을 사용할 경우 어떤 문제가 발생하는지 예를 들어 설명하시오.

In [36]:
# 이름으로 검색 및 삭제
hash = ChainedHashMap()

hash.put("안소희", 98)
hash.put("정의찬", 92)
hash.put("정새움", 85)

print(hash.get("안소희"))

hash.remove("정새움")
print(hash.get("정새움"))

98
None


In [42]:
arr = [99, 3, 7, 2, 3, 1, 21]  # 정렬되지 않은 배열
target = 1

# 이진 검색 실행 (정상적으로는 작동하지 않음)
binary_search(arr, target)  # 결과: 잘못된 위치 또는 -1

# 이유: 이진 검색은 중간 값을 기준으로 "왼쪽은 작고 오른쪽은 크다"는 조건을 기반으로 하므로,
# 정렬되지 않은 배열에서는 탐색 방향이 잘못되어 원하는 값을 찾지 못할 수 있음.

-1