# Chapter 12. 정렬 알고리즘



:::{admonition} 학습목표와 기대효과 
:class: info  
- 학습목표
  - 파이썬의 정렬 기능을 알아본다.
  - 정렬 알고리즘으로 버블정렬, 선택정렬, 삽입정렬의 동작 방법을 이해하고 구현해보자.

- 기대효과
  - 알고리즘의 효율성을 고려하여 프로세스를 디자인해볼 수 있다.

:::

## 정렬

정렬(sorting)은 순서가 없는 데이터들을 특정 기준에 따라 재배열하는 것을 의미한다. 예를 들어, 이름을 가나다 순으로 정렬하거나 학생들을 키 순으로 정렬하거나 책을 제목, 저자명 등을 기준으로 오름차순이나 내림차순으로 정렬 할 수 있다.


### 파이썬에서의 정렬함수
- 파이썬에서도 정렬을 위한 함수가 존재한다.
```
datalist.sort(key=..., reverse=True/False)
sorted(datalist, key=..., reverse=True/False)
```
- datalist.sort()는 원본데이터의 아이템들을 정렬하여 datalist에 적용한다. 반환값은 없다.
- sorted(datalist)는 원본데이터의 정렬된 결과를 반환하나 원본데이터에 적용하지는 않는다. 

- 랜덤데이터를 만들어보고 정렬해보자.

In [1]:
import random

n=10
data = [random.randint(0,100) for i in range(n)]
print(data)
print(len(data))

[33, 21, 2, 10, 0, 90, 54, 81, 28, 46]
10


- data.sort()는 변수 data의 아이템들을 오름차순으로 정렬하여 data에 바로 적용시킨다. 
- sort()함수는 반환이 없으므로 print(data.sort())와 같이 하면 None이 출력된다.

In [None]:
print(data)
data.sort()
print('Sorted list:', data)

In [None]:
vowels = ['e', 'a', 'u', 'o', 'i']
vowels.sort()
print('Sorted list:', vowels)

- 내림차순으로 정렬하려면 reverse옵션을 True로 설정하면 된다.

In [None]:
data.sort(reverse=True)
print(data)

[83, 66, 60, 50, 50, 22, 16, 15, 12, 11]


- sorted(data)함수는 괄호안의 data를 정렬하여 반환한다.
- 그러나 data에 정렬결과를 적용시키지 않으므로 주로 원본 데이터를 변경하지 않기를 원할 때 사용한다. 

In [None]:
sorted(data)

- 마찬가지로 내림차순으로 정렬하려면 reverse옵션을 True로 설정하면 된다.

In [None]:
sorted(data, reverse=True )

- 파이썬 sort()와 sorted() 모두 key를 사용하여 정렬 기준을 명시해줄 수 있다.
- 아래의 코드에서 key=len으로 주면 len()함수가 전달되어 단어의 길이순으로 정렬하라는 의미이다. 이때 괄호없이 함수명만 적어준다.

In [None]:
vowels = ['err', 'aetn', 'u', 'oo', 'iiiii']
vowels.sort(key=len) 
print('Sorted list:', vowels)

- 기준으로 사용할 사용자 정의 함수를 만들어서 적용할 수도 있다.
- 아래의 코드에서는 튜플의 인덱스 1의 값을 반환하는 함수 takeSecond()를 정의하고, 반환값을 기준으로 정렬하였다.

In [5]:
random = [(2, 2), (3, 4), (4, 1), (1, 3)]

def takeSecond(elem):
    return elem[1]

random.sort(key=takeSecond)

print('Sorted list:', random)

Sorted list: [(4, 1), (2, 2), (1, 3), (3, 4)]


- 딕셔너리의 값을 기준으로 삼아 정렬할 수도 있다.
- get_name()함수는 딕셔너리의 키와 매핑하는 value를 반환한다. 

In [None]:
employees = [
  {'Name': 'Alan Turing', 'age': 25, 'salary': 10000},
  {'Name': 'Sharon Lin', 'age': 30, 'salary': 8000},
  {'Name': 'John Hopkins', 'age': 18, 'salary': 1000},
  {'Name': 'Mikhail Tal', 'age': 40, 'salary': 15000},
]

In [None]:
employees[0].get('Name')

- employee.get('Name')은 이름을 반환한다. 즉 이름을 오름차순으로 정렬한다. 

In [None]:
def get_name(employee):
    return employee.get('Name')

employees.sort(key=get_name)
print(employees)

- get_name()과 같은 함수를 정의하는 대신 lambda 키워드를 사용하여 익명함수를 정의하여 사용할 수 있다.

In [None]:
employees.sort(key=lambda x: x.get('Name'))
print(employees)

😄 변수 employees 데이터에서 나이를 기준으로 오름차순으로 정렬하여 출력하시오.


😄 변수 employees 데이터에서 연봉이 높은순부터 낮은순으로(내림차순) 정렬하여 출력하시오.