In [None]:
# 정렬
# [1, 23, 4, 10, 21]
# - 데이터 검색 효율성 향상
# - 데이터 구조의 최적화, 분석
# - 중복 데이터 제거
# 버블, 선택, 삽입, 병합, 퀵 정렬

In [None]:
# 버블 정렬
# 인접한 두 요소를 비교해서 잘못된 순서면 교환하는 방식으로 배열의 끝까지 반복해서 정렬
# 시간 복잡도는 O(n^2), 구현이 매우 간단하지만 효율성이 떨어져 작은 데이터셋에만 적합

class BubbleSort:
  def sort(self, array):
    n = len(array)
    for i in range(n):
      print(i, array)
      for j in range(0, n - i - 1):
        if array[j] > array[j + 1]:
          array[j], array[j + 1] = array[j + 1], array[j]
    return array

array = [64, 34, 25, 12]
sorted_array = BubbleSort().sort(array)
print("sorted_array", sorted_array)

0 [64, 34, 25, 12]
1 [34, 25, 12, 64]
2 [25, 12, 34, 64]
3 [12, 25, 34, 64]
sorted_array [12, 25, 34, 64]


In [None]:
# 선택 정렬: Selection Sort
# 배열에서 가장 작은 요소를 찾아, 첫 번째 요소와 교환하고
# 그 다음 작은 요소를 찾아 두 번째 요소와 교환하는 방식이 계속 반복됨
# 시간 복잡도 O(n^2), 구현이 단순하고 직관적이지만 효율성이 떨어짐

class SelectionSort:
  def sort(self, array):
    n = len(array)  # 배열의 길이
    for i in range(n):
      min_idx = i
      for j in range(i + 1, n):   # i를 제외한 범위에서 가장 작은 숫자의 index 검색
        if array[j] < array[min_idx]:
          min_idx = j
      # 가장 작은 값과 i에 있는 요소 교환
      array[i], array[min_idx] = array[min_idx], array[i]
    return array

array = [64, 24, 12, 22]
sorted_array = SelectionSort().sort(array)
print(sorted_array)

In [None]:
# 삽입 정렬: Insertion Sort
# 배열의 두 번째 요소부터 시작하여, 앞의 요소들과 비교하여 적절한 위치에 삽입
# 시간 복잡도 최악의 경우 O(n^2), 최선의 경우 O(n)
# 부분적으로 정렬된 배열일 땐 효율적이나, 최악의 경우 느린 편.

class InsertionSort:
  def sort(self, array):
    n = len(array)
    for i in range(1, n):   # 두 번째 요소부터 시작
      key = array[i]    # 현재 요소
      j = i - 1

      while j >= 0 and key < array[j]:
        array[j + 1] = array[j]   # 앞의 요소가 현재 요소보다 크면 오른쪽으로 이동시킴
        j -= 1
      array[j + 1] = key    # 빈 자리에 현재 요소를 삽입
      print(array)
    return array

array = [12, 22, 17, 5]
sorted_array = InsertionSort().sort(array)
print("sorted_array", sorted_array)

[12, 22, 17, 5]
[12, 17, 22, 5]
[5, 12, 17, 22]
sorted_array [5, 12, 17, 22]


In [None]:
# 병합 정렬(Merge Sort)
# 배열을 절반으로 나누고, 각각 재귀적으로 정렬한 뒤, 두 개의 정렬된 배열을 하나로 합병
# 시간 복잡도는 O(n log n)
# 안정적인 정렬 알고리즘으로 대규모 데이터셋에 적합
# 다만 추가적인 메모리 공간이 필요함

class MergeSort:
  def sort(self, array):
    if len(array) > 1:
      # 리스트 분할
      mid = len(array) // 2
      left_half = array[:mid]
      right_half = array[mid:]    # 쪼갠 각 정렬이 새로운 리스트에 대입 : 추가적인 메모리 공간

      # 재귀적으로 하위 배열 정렬
      self.sort(left_half)
      self.sort(right_half)

      i = j = k = 0
      # 병합 과정 : 정렬이 된 하위 배열을 대상으로
      # 더 작은 요소부터 왼쪽에 추가
      while i < len(left_half) and j < len(right_half):
        if left_half[i] < right_half[j]:
          array[k] = left_half[i]
          i += 1
        else:
          array[k] = right_half[j]
          j += 1
        k += 1
      # 남은 요소 처리
      while i < len(left_half):
        array[k] = left_half[i]
        i += 1
        k += 1
      while j < len(right_half):
        array[k] = right_half[j]
        j += 1
        k += 1
    return array

array = [38, 27, 43, 3, 9]
sorted_array = MergeSort().sort(array)
print("sorted_array", sorted_array)

sorted_array [3, 9, 27, 38, 43]


In [None]:
# 퀵 정렬(Quick Sort)
# 배열에서 하나의 요소를 pivot(피벗)으로 선택
# 피벗보다 작은 요소는 피벗 왼쪽, 피벗보다 큰 요소들은 피벗 오른쪽에 위치하도록 분할
# 하위 배열에 대해 재귀적으로 퀵 정렬 수행, 피벗을 기준으로 결합
# 퀵 정렬은 평균 시간 복잡도 O(n logn), 최악 시간 복잡도 O(n^2)
# 대체적으로 빠른 성능을 자랑하며 추가적인 메모리 공간도 거의 필요하지 않음
class QuickSort:
  def sort(self, array):
    self._quick_sort(array, 0, len(array) - 1)
    return array

  def _quick_sort(self, array, low, high):    # 내부적으로 호출하는 메서드 / 이는 관습적으로 앞에 _(언더바)를 추가함
    if low < high:
      pi = self._partition(array, low, high)
      self._quick_sort(array, low, pi - 1)
      self._quick_sort(array, pi + 1, high)

  def _partition(self, array, low, high):
    pivot = array[high]   # 배열의 마지막 요소를 피벗으로 설정
    i = low - 1   # i는 피벗보다 작은 요소의 index 표시
    for j in range(low, high):
      if array[j] < pivot:    # 피벗보다 작은 요소 탐색
        i += 1
        array[i], array[j] = array[j], array[i]

    array[i + 1], array[high] = array[high], array[i + 1]   # 피벗을 올바른 위치로 이동
    return i + 1    # 피벗의 인덱스 반환

array = [22, 3, 37, 10, 28, 15]
sorted_array = QuickSort().sort(array)
print("sorted_array", sorted_array)

sorted_array [3, 10, 15, 22, 28, 37]


In [None]:
"""
해쉬 테이블 : Key와 Value 쌍으로 데이터를 저장하는 자료구조
매우 빠른 검색, 삽입, 삭제가 가능
해쉬 함수(Hash Function)를 사용해 key를 해쉬 값(Hash Valye)으로 변환. 이 해쉬 값을 인덱스로 사용해 데이터를 저장.

해쉬 테이블은 해쉬 테이블의 크기가 한정되어 있음
충돌 : 두 개 이상의 key가 같은 해쉬 값을 갖는 경우 충돌이 발생
즉, 해쉬 함수의 반환값이 같을 때, 충돌이 발생 가능

[충돌 방지 방법]
- 체이닝(Chaining) : 해쉬 값을 갖는 모든 키-값 쌍을 연결 리스트로 저장
- 오픈 어드레싱(Open Addressing) : 해쉬 테이블 내의 다른 빈 공간을 찾아 데이터를 저장
"""

In [None]:
# Chaining
class HashTableWithChaining:
  def __init__(self, size):
    self.size = size
    self.table = [[] for _ in range(size)]

  def _hash_function(self, key):
    return sum(ord(char) for char in key) % self.size   # 아스키 코드 = 컴퓨터가 인식하는 문자 고유의 숫자값

  def insert(self, key, value):
    index = self._hash_function(key)
    for kv in self.table[index]:
      if kv[0] == key:
        kv[1] = value
        return
    self.table[index].append([key, value])

hash_table = HashTableWithChaining(10)
hash_table.insert("apple", 5)
hash_table.insert("banana", 7)
hash_table.insert("iherry", 11)
print(hash_table.table)

[[['apple', 5]], [], [], [], [], [], [], [], [], [['banana', 7], ['iherry', 11]]]


In [None]:
table = [[] for _ in range(4)]
table

[[], [], [], []]

In [None]:
class HashTableLinearProbing:
  def __init__(self, size = 10):
    self.size = size
    self.table = [[] for _ in range(size)]

  def _hash_function(self, key):
    # 해쉬 함수 : 키의 각 문자열 아스키 값을 더하고, 그걸 size로 나눠서
    # 해쉬 값으로 return
    return sum(ord(char) for char in key) % self.size

  def insert(self, key, value):
    index = self._hash_function(key)
    while self.table[index]:
      if self.table[index][0] == key:
        self.table[index] = (key, value)
        return
      index = (index + 1) % self.size
      if index == self._hash_function(key):
        raise Exception("Hash table is full")
    self.table[index] = (key, value)

hash_table = HashTableLinearProbing()
hash_table.insert("apple", 5)
hash_table.insert("banana", 7)
hash_table.insert("iherry", 10)
print(hash_table.table)

[('apple', 5), ('iherry', 10), [], [], [], [], [], [], [], ('banana', 7)]
