# 정렬

## 1. 버블 정렬
- 인접한 두 원소를 비교하여 필요시 교환 -> 가장 큰 값을 거품처럼 위로 올려보냄
- 단순하지만 비효율적

### 특징
- 시간 복잡도 : O(n^2)
- 공간 복잡도 : O(1)

In [1]:
def bubble_sort(arr):
    n = len(arr)

    for i in range(n):
        for j in range(0, n-i-1):
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]

    return arr

## 2. 선택 정렬
- 전체에서 최솟값(또는 최댓값)을 찾아 맨 앞으로 보내는 방식
- 교환 횟수가 적지만 여전히 느림

### 특징
- 시간 복잡도 : O(n^2)
- 공간 복잡도 : O(1)
- 교환 횟수가 최대 n번

In [3]:
def selected_sort(arr):
    n = len(arr)
    for i in range(n):
        min_idx = i
        for j in range(i+1, n):
            if arr[j] < arr[min_idx]:
                min_idx = j
        
        arr[i], arr[min_idx] = arr[min_idx], arr[i]
    return arr

## 3. 삽입 정렬
- 이미 정렬된 구간에 새로운 원소를 삽입하는 방식
- 거의 정렬된 데이터에 유리
- 삽입 정렬은 두 번째 자료부터 시작하여 그 앞의 자료들과 비교하여 삽입할 위치를 지정한 후 자료를 뒤로 옮기고 지정한 자리에 자료를 다시 삽입하여 정렬하는 알고르짐

### 특징
- 시간 복잡도 : O(n^2)
- 공간 복잡도 : O(1)

In [4]:
def insertion_sort(arr):
    for i in range(1, len(arr)):
        for j in range(i, 0, -1):
            if arr[j] < arr[j-1]:
                arr[j], arr[j-1] = arr[j-1], arr[j]

    return arr

## 4. 병합 정렬
- 분할 정복 사용
- 배열을 반으로 나누고 각각 정렬 -> 병합

### 특징
- 시간 복잡도 : O(nlogn)
- 공간 복잡도 : O(n) ; 추가 메모리 필요

In [5]:
def merge_sort(arr):
    if len(arr) <= 1:
        return arr
    
    mid = len(arr) // 2
    left = merge_sort(arr[:mid])
    right = merge_sort(arr[mid:])

    return merge(left, right)

def merge(left, right):
    result = []
    i = j = 0
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            result.append(left[i])
            i += 1

        else:
            result.append(right[j])
            j += 1

    # while루프가 끝났다는건 한쪽 배열이 완전히 소모됐다는 것
    # 나머지 배열은 이미 정렬된 상태이고, 꺼낸 원소들보다 항상 크거나 같음
    # 따라서 그대로 부여도 정렬 상태 유지 됨
    result.extend(left[i:])
    result.extend(right[j:])

    return result

## 5. 퀵 정렬
- 분할 정복 알고리즘
- 피벗(pivot)을 기준으로 작은 값/큰 값 분할 후 재귀 정렬

### 특징
- 시간 복잡도 : 평균 O(nlong), 최악 O(n^2)
- 공간 복잡도 : 평균 O(logn)
- 대부분의 경우 가장 빠른 정렬

In [None]:
def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    
    pivot = arr[len(arr)//2]
    left = [x for x in arr if x < pivot]
    right = [x for x in arr if x > pivot]
    return quick_sort(left) + [pivot] + quick_sort(right)

## 6. 힙 정렬
- 힙 자료구조 이용 (완전 이진 트리)
- 최대 힙을 구성 -> 루트 꺼내 정렬

### 특징
- 시간 복잡도 : O(nlong)
- 공간 복잡도 : O(1)

In [7]:
def heapify(arr, n, i):
    largest = i     # 루트 노트 인덱스 (0부터)
    l = 2 * i + 1 
    r = 2 * i + 2

    # 왼쪽 자식이 루트보다 크면 갱신
    if arr[l] > arr[largest] and l < n:
        largest = l

    # 오른쪽 자식이 루트보다 크면 갱신
    if arr[r] > arr[largest] and r < n:
        largest = r

    # largest 가 바꼈으면 부모와 교환 후 재귀 호출
    if largest != i:
        arr[i], arr[largest] = arr[largest], arr[i]
        heapify(arr, n, largest)    # largest 가 교환되었으니까 교환된 위치서부터 다시 힙 구조로 만든다


def heap_sort(arr):
    n = len(arr)

    # 최대 힙 만들기
    for i in range(n//2-1, -1, -1):
        heapify(arr, n, i)
    
    # 힙에서 요소 하나씩 꺼내 정렬
    for i in range(n-1, 0, -1):
        arr[i], arr[0] = arr[0], arr[i] # 최댓값 맨 뒤로
        heapify(arr, i, 0)

    return arr

---

## 문제 1. k번째 수
배열 array의 i번째 숫자부터 j번째 숫자까지 자르고 정렬했을 때, k번째에 있는 수를 구하려 합니다.
예를 들어 array가 [1, 5, 2, 6, 3, 7, 4], i = 2, j = 5, k = 3이라면
1. array의 2번째부터 5번째까지 자르면 [5, 2, 6, 3]입니다.
2. 1에서 나온 배열을 정렬하면 [2, 3, 5, 6]입니다.
3. 2에서 나온 배열의 3번째 숫자는 5입니다.

배열 array, [i, j, k]를 원소로 가진 2차원 배열 commands가 매개변수로 주어질 때, commands의 모든 원소에 대해 앞서 설명한 연산을 적용했을 때 나온 결과를 배열에 담아 return 하도록 solution 함수를 작성해주세요.

In [9]:
def solution(array, commands):
    answer = []

    for command in commands:
        new_arr = array[command[0]-1 : command[1]]
        new_arr.sort()

        answer.append(new_arr[command[2]-1])

    return answer


array = [1, 5, 2, 6, 3, 7, 4]
commands = [[2, 5, 3], [4, 4, 1], [1, 7, 3]]
print(solution(array, commands))

[5, 6, 3]


---

## 문제2. 가장 큰 수
0 또는 양의 정수가 주어졌을 때, 정수를 이어 붙여 만들 수 있는 가장 큰 수를 알아내 주세요.
예를 들어, 주어진 정수가 [6, 10, 2]라면 [6102, 6210, 1062, 1026, 2610, 2106]를 만들 수 있고, 이중 가장 큰 수는 6210입니다.
0 또는 양의 정수가 담긴 배열 numbers가 매개변수로 주어질 때, 순서를 재배치하여 만들 수 있는 가장 큰 수를 문자열로 바꾸어 return 하도록 solution 함수를 작성해주세요.

In [None]:
def solution(numbers):
    numbers = list(map(str, numbers))
    numbers.sort(key=lambda x: x*4, reverse=True)
    answer = ''.join(numbers)

    return str(int(answer))


# numbers = [6, 10, 2]
numbers = [3, 30, 34, 5, 9]
print(solution(numbers))

9534330


---

## 문제3. H-Index
H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.

어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.

어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.

In [21]:
def solution(citations):

    citations.sort(reverse=True)

    h_idx = 0
    for i, c in enumerate(citations):
        h = i + 1
        if c >= h:
            h_idx = h
        else:
            break

    return h_idx

citations = [3, 0, 6, 1, 5]
print(solution(citations))

3
