# 🔍 배열 기반 검색 알고리즘 문제 세트
본 노트북은 인공지능을 위한 알고리즘 및 자료구조 수업의 **기초 검색 알고리즘 실습**을 위해 작성되었습니다.
다음 문제들을 직접 해결해보며 선형 검색, 이진 검색, 해시 검색의 원리를 익혀보세요.

## ✅ 문제 1. 선형 검색 구현
**설명**: 주어진 정수 배열에서 특정 값을 선형 검색(linear search) 방식으로 찾는 함수를 작성하세요.  
- 입력: 정수 배열 `arr`과 정수 `target`  
- 출력: `target`이 존재하면 인덱스, 존재하지 않으면 `-1` 반환
```python
def linear_search(arr: list[int], target: int) -> int:
    pass  # 여기에 구현
```
**예시**
```python
>>> linear_search([3, 5, 2, 9], 5)
1
>>> linear_search([3, 5, 2, 9], 7)
-1
```

In [1]:
def linear_search(arr: list[int], target: int) -> int:
    for index, value in enumerate(arr):
        if value == target:
            return index
    return -1

target = int(input("찾고자 하는 숫자를 입력하세요: "))
arr = list(map(int, input("정수 리스트를 입력하세요: ").split()))

print("입력된 리스트:", arr)
print("찾고자 하는 숫자:", target)

result = linear_search(arr, target)
if result != -1:
    print(f"숫자 {target}은(는) 인덱스 {result}에 있습니다.")
else:
    print(f"숫자 {target}은(는) 리스트에 없습니다.")


입력된 리스트: [4]
찾고자 하는 숫자: 4
숫자 4은(는) 인덱스 0에 있습니다.


## ✅ 문제 2. 이진 검색 구현
**설명**: 정렬된 배열에서 이진 검색(binary search)을 구현하세요.  
- 입력: 오름차순 정렬된 정수 배열 `arr`과 정수 `target`
- 출력: `target`의 인덱스, 없으면 `-1`
```python
def binary_search(arr: list[int], target: int) -> int:
    pass  # 여기에 구현
```
**예시**
```python
>>> binary_search([1, 3, 5, 7, 9], 7)
3
>>> binary_search([1, 3, 5, 7, 9], 4)
-1
```

In [2]:
# binary_search.py

def binary_search(arr: list[int], target: int) -> int:
    left, right = 0, len(arr) - 1
    while left <= right:
        mid = (left + right) // 2
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    return -1


target = int(input("찾고자 하는 숫자를 입력하세요: "))
arr2 = list(map(int, input("정수 리스트를 입력하세요: ").split()))

arr2.sort()  # 이진 탐색은 정렬이 필요

print("입력된 리스트:", arr2)
print("찾고자 하는 숫자:", target)

result = binary_search(arr2, target)
if result != -1:
    print(f"숫자 {target}은(는) 인덱스 {result}에 있습니다.")
else:
    print(f"숫자 {target}은(는) 리스트에 없습니다.")



입력된 리스트: [1, 2, 3]
찾고자 하는 숫자: 3
숫자 3은(는) 인덱스 2에 있습니다.


## ✅ 문제 3. 체이닝 해시맵 구현 (기초 버전)
**설명**: 해시 충돌을 체이닝(chaining) 방식으로 해결하는 해시맵을 클래스 형태로 구현하세요.
- 제공 기능:
  - `put(key, value)`: 키-값 삽입
  - `get(key)`: 키로 값 검색
  - `remove(key)`: 키 삭제
```python
class ChainedHashMap:
    def __init__(self, size: int = 10):
        pass
    def put(self, key: str, value: int) -> None:
        pass
    def get(self, key: str) -> int | None:
        pass
    def remove(self, key: str) -> None:
        pass
```

In [None]:
# chaining hashmap

class ChainedHashMap:
    def __init__(self, size: int = 10):
        self.size = size
        self.table = [[] for _ in range(size)]
    
    def hash(self, key: str) -> int:
        # 문자열 key를 정수 인덱스로 변환하는 간단한 해시 함수
        return sum(ord(c) for c in key) % self.size

    def put(self, key: str, value: int) -> None:
        # 탐색한 뒤 key가 존재하면 value를 업데이트
        for i, (k, v) in enumerate(self.table[self.hash(key)]):
            if k == key:
                self.table[self.hash(key)][i] = (key, value)
                return
        # key가 존재하지 않으면 새로운 엔트리를 추가
        self.table[self.hash(key)].append((key, value))

    def get(self, key: str) -> int | None:
        # 탐색한 뒤 key가 존재하면 value를 반환
        for k, v in self.table[self.hash(key)]:
            if k == key:
                return v
        # key가 존재하지 않으면 None을 반환
        return -1
    
    def remove(self, key: str) -> None:
        # 탐색한 뒤 key가 존재하면 삭제
        for i, (k, v) in enumerate(self.table[self.hash(key)]):
            if k == key:
                del self.table[self.hash(key)][i]
                return
        # key가 존재하지 않으면 -1 반환
        return -1



hashmap = ChainedHashMap(size=10)

print("Chained HashMap")
print("---------------")
print("1. 추가")
print("2. 조회")
print("3. 삭제")
print("4. 종료")
print("---------------")

while True:
    choice = int(input("원하는 작업을 선택하세요: "))

    if choice == 1:
        print("추가")
        key = input("키를 입력하세요: ")
        value = int(input("값을 입력하세요: "))
        hashmap.put(key, value)
        print(f"{key} : {value} 추가 완료")

    elif choice == 2:
        print("조회")
        key = input("조회할 키를 입력하세요: ")
        value = hashmap.get(key)
        if value != -1:
            print(f"{key} : {value}")
        else:
            print(f"{key}는(은) 존재하지 않습니다.")

    elif choice == 3:
        print("삭제")
        key = input("삭제할 키를 입력하세요: ")
        value = hashmap.remove(key)
        if value != -1:
            print(f"{key} 삭제 완료")
        else:
            print(f"{key}는(은) 존재하지 않습니다.")

    elif choice == 4:
        print("종료.")
        break

    else:
        print("잘못된 선택.")


  if value is not -1:
  if value is not -1:


Chained HashMap
---------------
1. 추가
2. 조회
3. 삭제
4. 종료
---------------
종료.


## ✅ 문제 4. 해시 충돌 시나리오 실습
**설명**: 같은 해시값이 나오도록 `size=1`인 해시맵을 만들고, 여러 key를 넣고 체이닝 충돌 상황을 관찰하세요.
```python
# 직접 put 여러 번 실행 후 내부 구조를 출력해보세요.
```

In [None]:
# hash collision, set hash size 1

class ChainedHashMap:
    def __init__(self, size: int = 1):
        self.size = size
        self.table = [[] for _ in range(size)]
    
    def hash(self, key: str) -> int:
        return sum(ord(c) for c in key) % self.size

    def put(self, key: str, value: int) -> None:
        # 탐색한 뒤 key가 존재하면 value를 업데이트
        for i, (k, v) in enumerate(self.table[self.hash(key)]):
            if k == key:
                self.table[self.hash(key)][i] = (key, value)
                return
        # key가 존재하지 않으면 새로운 엔트리를 추가
        self.table[self.hash(key)].append((key, value))

    def get(self, key: str) -> int | None:
        # 탐색한 뒤 key가 존재하면 value를 반환
        for k, v in self.table[self.hash(key)]:
            if k == key:
                return v
        # key가 존재하지 않으면 None을 반환
        return -1
    
    def remove(self, key: str) -> None:
        # 탐색한 뒤 key가 존재하면 삭제
        for i, (k, v) in enumerate(self.table[self.hash(key)]):
            if k == key:
                del self.table[self.hash(key)][i]
                return
        # key가 존재하지 않으면 -1 반환
        return -1
    

hashmap = ChainedHashMap(size=1)

print("Chained HashMap")
print("---------------")
print("1. 추가")
print("2. 조회")
print("3. 삭제")
print("4. 종료")
print("5. 전체 조회")
print("---------------")

while True:
    choice = int(input("원하는 작업을 선택하세요: "))

    if choice == 1:
        print("추가")
        key = input("키를 입력하세요: ")
        value = int(input("값을 입력하세요: "))
        hashmap.put(key, value)
        print(f"{key} : {value} 추가 완료")

    elif choice == 2:
        print("조회")
        key = input("조회할 키를 입력하세요: ")
        value = hashmap.get(key)
        if value != -1:
            print(f"{key} : {value}")
        else:
            print(f"{key}는(은) 존재하지 않습니다.")

    elif choice == 3:
        print("삭제")
        key = input("삭제할 키를 입력하세요: ")
        value = hashmap.remove(key)
        if value != -1:
            print(f"{key} 삭제 완료")
        else:
            print(f"{key}는(은) 존재하지 않습니다.")

    elif choice == 4:
        print("종료.")
        break

    # 전체 조회
    elif choice == 5:
        print("전체 조회")
        for i, bucket in enumerate(hashmap.table):
            print(f"버킷 {i}: {bucket}")
    else:
        print("잘못된 선택.")


Chained HashMap
---------------
1. 추가
2. 조회
3. 삭제
4. 종료
---------------
추가
2 : 3 추가 완료
추가
4 : 5 추가 완료
전체 조회
버킷 0: [('2', 3), ('4', 5)]


ValueError: invalid literal for int() with base 10: ''

## ✅ 문제 5. 검색 알고리즘 비교 실험
**설명**: 10만 개의 랜덤 숫자 배열을 만들어 선형 검색과 이진 검색의 속도 차이를 실험하세요.  
- `random.randint(0, 1_000_000)`으로 배열 생성
- 타이밍 측정에 `time` 모듈 사용
```python
# 실험 결과를 print로 비교해보세요.
```

In [None]:
# time taken for each method linear, binary

import time
import random

def linear_search(arr: list[int], target: int) -> int:
    for index, value in enumerate(arr):
        if value == target:
            return index
    return -1

def binary_search(arr: list[int], target: int) -> int:
    left, right = 0, len(arr) - 1
    while left <= right:
        mid = (left + right) // 2
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    return -1


random_list = list(range(100000000))  # 1,000,000개의 정수로 이루어진 리스트
target = random.choice(random_list)  # 리스트에서 무작위로 숫자 선택

print("무작위 리스트:", random_list[:10], "...")  # 처음 10개만 출력
print("찾고자 하는 숫자:", target)

# 선형 탐색
start_time = time.time()
result = linear_search(random_list, target)
end_time = time.time()
print(f"선형 탐색의 인덱스 위치: {result}")
print(f"선형 탐색 시간: {end_time - start_time:.6f}초")

# 이진 탐색

start_time = time.time()
result = binary_search(random_list, target)
end_time = time.time()
print(f"이진 탐색의 인덱스 위치: {result}")
print(f"이진 탐색 시간: {end_time - start_time:.6f}초")


무작위 리스트: [5600908, 51116279, 25491815, 38809998, 1115814, 72070834, 24467233, 189372, 6240432, 78182148] ...
찾고자 하는 숫자: 77715339
선형 탐색의 인덱스 위치: 82627939
선형 탐색 시간: 11.526284초
이진 탐색의 인덱스 위치: 77715339
이진 탐색 시간: 0.000000초


: 

## ✅ 문제 6. 체인드 해시의 시간복잡도 분석
**설명**: 아래 각 연산에 대해 평균적인 경우와 최악의 경우의 시간복잡도 Big-O를 분석해보세요.
1. `put(key, value)` – 키-값 추가
2. `get(key)` – 키를 이용한 검색
3. `remove(key)` – 키에 해당하는 값 삭제

**힌트**: 해시 테이블의 크기와 충돌 수에 따라 성능이 어떻게 달라질까요?

**답안 예시**:
```python
# 평균 시간복잡도:
# put: O(1), get: O(1), remove: O(1)

# 최악 시간복잡도:
# put: O(n), get: O(n), remove: O(n)
```
※ `n`은 테이블 전체에 저장된 키의 수입니다.

---
### 🎯 보너스 과제
1. 해시맵에 학생 이름(key)과 점수(value)를 저장하고, 이름으로 검색 및 삭제 기능을 구현하시오.
2. 이진 검색은 정렬된 배열에서만 동작한다. 정렬되지 않은 배열에서 이진 검색을 사용할 경우 어떤 문제가 발생하는지 예를 들어 설명하시오.