## 알고리즘 표현법

### 슈도코드

 - 특정 프로그래밍 언어의 문법을 따라 쓰여진 것이 아니라, 일반적인 언어로 코드를 흉내 내어 알고리즘을 써 놓은 코드 
  
  - 의사 코드로 흉내만 내는 코드
  
  - 실제적인 프로그래밍 언어로 작성된 코드처럼 컴퓨터에서 실행할 수 없음
  
  - 특정 언어로 프로그램을 작성하기 전에 알고리즘을 대략적으로 모델링하는 데에 쓰임
  
### 순서도
 프로그램이나 작업의 진행 흐름을 순서에 따라 여러 가지 기호나 문자로 나타난 도표
 
 - 흐름도, 프로그램의 논리적인 흐름, 데이터의 처리 과정을 표현하는 데 사용.
 
 - 프로그램을 작성하기 전에 프로그램의 전체적인 흐름과 과정 파악을 위해 필수적으로 거쳐야 되는 작업
 
### 알고리즘의 성능 분석
 - 정확성 : 얼마나 정화과게 동작하는가?
 
 - 작업량 : 얼마나 적은 연산으로 원하는 결과를 얻어내는가?
 
 - 메모리 사용량 : 얼마나 적은 메모리를 사용하는가?
 
 - 단순성 : 얼마나 단순한가?
 
 - 최적성 : 더 이상 개선할 여지 없이 최적화되었는가?
 
### 알고리즘의 성능 분석 필요
 - 많은 문제에서 알고리즘의 성능 분석 기준으로 알고리즘의 작업량을 비교
 
 - 실제 걸리는 시간을 측정(컴퓨터 상태에 다를 수 있다.)
 
 - 실행되는 명령문의 개수를 계산
 
### 시간 복잡도 -> 빅-오(O)표기법
 - 시간 복잡도 함수 중에서 가장 큰 영향력을 주는 n에 대한 항만을 표시
 
 - 계수(Coefficient)는 생략하여 표시
```
 O(2n + 1) 
 = O(2n) #최고차 항(2n)만 선택 
 = O(n) #계수 2제거
```
```
O(2n^2 + 10n + 100) 
= O(n^2)
#상수값 표기는 1로한다.
O(4) = O(1)
```

요소 수가 증가함에 따라 각기 다른 시간복잡도의 알고리즘은 아래와 같은 연산 수를 보임

---

Python : 인터프리터 방식이라 느리지만 플랫폼에 상관없이 사용할 수 있다.

최근 window를 제외한 os는 기본적으로 python이 설치되어있다.

Iot분야의 라즈베리파이, 최근 빅데이터의 자료분석 등에서 파이썬의 관심이 높아짐

하드웨어의 성능 개선으로 실행 속도의 차이가 크지 않음

-> 더 쉽게 더 빠르게 개발할 수 있는 것이 중요해졌다.

>Yes,Python is Slow, and I Don't Care. A rant on sacrificing performance for productivity

### 변수

파이썬의 모든 자료는 객체로 참조형변수로 처리한다. 

-> Java나 C에서 사용되는 기본형 타입 변수도 파이썬에서는 객체

-> 그래서 파이썬은 완벽한 객체지향 언어라고 불려진다.

변수의 선언은 따로 없음

 - 변수에 값을 초기화 시 변수가 메모리에 생성
 
 -> 하나의 변수에 다른 타입의 값을 변수에 저장할 수 있음
 
 ```
 a = 3
 a = "hello"
 ```
 
 이게 가능
 
### 자료형
파이썬의 변수에는 함수,클래스,모든것을 저장할 수 있다.

 - 타입 : type() : 
    
 - 정수 : int
 
 - 실수 : float
 
 - 복소수 : complex
 
 - 불 : bool
 
 - 문자열 : str
 
 - 튜플 : tuple
 
 - 리스트 : list
 
 - 사전 : dict
 
 - 셋 : set
 
 - None : NodeType

 - 함수 : function
 
 - 클래스 : 클래스명

파이썬은 언어레벨에서 여러가지 자료구조를 지원한다.

다수의 데이터를 저장할 수 있는 컨테이너
 - tuple : 순서가 있다. 순서있기때문에 중복 허용, 데이터 변경x, packing,unpacking
 
 - list : 순서가 있다. 순서있기때문에 중복 허용, 데이터 변경o
 
 - dictionary : 키와 값, 키중복 허용x,값 중복o, 순서x
 
 - set : 순서x, 중복x, 
 
 dictionary key와 set은 중복을 허용하지 않는다. 내부적으로 중복을 처리하는 과정에서 hashing기법이 사용되어  dictionary key와 set 값이 변경될 수 없는 불변 객체만 사용될 수 있다.
 
### List
같은 타입 변수들을 하나의 이름으로 열거하여 사용하는 자료구조

-> 파이썬의 리스트는 C나 Java에서의 배열과 비슷한 자료구조.

 - 리스트를 사용하면 하나의 변수를 통해서 대량의 데이터를 효율적으로 처리할 수 있음.


---

### 파이썬의 변수

별도의 선언 방법이 없으며 변수에 처음 값을 할당할 때 생성

값을 초기화하기 전에, 변수를 미리 만들어 두어야 할 경우

-> 공백 리스트 생성

방법1. ```num = []``` : 리스트형식을 표현하는 대괄호를 사용

방법2. ```num = list()``` : 리스트클래스의 생성자를 사용하여 생성

### 배열과 리스트의 차이점

 - 배열 : 같은 타입의 데이터만 저장 : 처음 크기를 지정한 후 변경할 수 없음
 
 - 리스트 : 다양한 데이터를 저장할 수 있음 : 크기를 가변적으로 변경할 수 있음
 
 -> 리스트가 사용하기 편리하다.
 
 - 리스트로 차원을 표현할 수 있음.
 
 
### Sequence자료형
 순서가 존재함으로, 인덱싱과 슬라이싱의 연산 모두 적용가능
 
 - 인덱싱(Indexing) : 시퀀스 자료형에서 하나의 요소를 인덱스 연산자를 통하여 참조하는 것
 
```
arr = [4,5,6,7,8]
arr[0] #4
arr[-1]
```
인덱스 범위를 벗어나면 에러가 남.

 - 슬라이싱(Slicing) : 시퀀스 자료형의 원하는 범위를 선택하는 연산
```
arr = [4,5,6,7,8,9]

a[1:3] #[5,6]
a[:3] #[4,5,6]
a[1:] #[5,6,7,8,9]
a[:] #[4,5,6,7,8,9]
```

### 함수와 연산
시퀀스 자료형의 함수와 연산을 사용할 수 있다.

 - len()
 
 - +
 
 - *
 
 - in
 
 - not in
 
 - min()
 
 - man()
 
 - sorted() : 정렬된 리스트 반환. 원본데이터 정렬되어 변경된다.
 
 - append()
 
 - insert()
 
 - pop()
 
 - remove()
 
 - count()

### 리스트 훔축(List Comprehension)
수학에서 집합을 정의하는 표현식과 유사함.

-> 복잡한 작업을 쉽게 처리할 수 있다.

ex) 10보다 작은 짝수들의 집합을 원소로 하는 리스트

C/C++
```
int mylist[5] = {2,3,4,5,6};
int newlist[5];
for(int cnt=0;i=0;i<5;i++){
  if(mylist[i]%2==0){
    newlist[cnt++]=mylist[i];
    }
  }
```

Python
```
mylist = [2,3,4,5,6]
newlist = [i for i in mylist if i%2 ==0]
```



## Exhaustive Search(완전 검색)
문제의 해법으로 생각할 수 있는 모든 경우의 수를 나열해보고 확인하는 기법
1. Brute-force 혹은 Generate-and-Test 기법이라고도 불림
2. 모든 경우의 수를 테스트한 후, 최종 해법을 도출함
3. 일반적으로 경우의 수가 상대적으로 작을 때 유용함
4. 모든 경우의 수를 생성하고 테스트하기 때문에 수행 속도는 느리지만, 해답을 찾아내지 못할 확률이 작음
5. 주어진 문제를 풀 때, 우선 완전 검색으로 접근하여 해답을 도출한 후, 성능 개선을 위해 알고리즘을 사용하고 해답을 확인하는 것이 바람직함.

ex) Baby-gin 게임
1-9 숫자카드에서 3개씩 2번 뽑는다.
연속된 숫자가 3개(run) or 같은 숫자 3개(triplete)
run과 triplete으로만 뽑으면 baby-gin


## Greedy Algorithm(탐욕 알고리즘)
1. 여러 경우 중 하나를 결정해야 할 때마다 그 순간에 최적이라고 생각되는 것을 선택해 나가는 방식으로 진행하여 최종적인 해답에 도달함
2. 각 선택의 시점에서 이루어지는 결정은 지역적으로는 최적이지만, 그것들을 계속 수집하여 최종적인 해답을 만들었다고 하여, 최적이라는 보장은 없음
3. 일반적으로, 머리속에 떠오르는 생각을 검증 없이 바로 구현하면 Greedy 접근이 된다.

### 탐욕 알고리즘의 수행 과정
- 해 선택 : 현재 상태에서 부분 문제의 최적 해를 구한 뒤, 이를 부분 해 집합(Solution Set)에 추가함
- 실행 가능성 검사 : 새로운 부분 해 집합이 실행 가능한지를 확인, 곧, 문제의 제약 조건을 위반하지 않는지를 검사함
- 해 검사 : 새로운 부분 해 집합이 문제의 해가 되는지를 확인, 아직 전체 문제의 해가 완성되지 않았다면 해 선택부터 다시 시작함.

ex) 거스름돈 줄이기.
어떻게 하면 손님에세 거스름돈으로 주는 지폐와 동전의 개수를 최소한으로 줄일 수 있을까?
- 해 선택 : 가장 좋은 해를 선택, 가장 단위가 큰 동전을 하나 골라 거스름돈에 추가함.
- 실행 가능성 검사 : 거스름돈이 손님에세 내드려야 할 액수를 초과하는지를 확인, 초과한다면 마지막에 추가한 동전을 거스름돈에서 빼고, 해 선택으로 돌아가서 현재보다 한 단계 작은 단위의 동전을 추가함.
- 해 검사 : 거스름돈이 손님에세 내드려야 하는 액수와 일치하는지 확인, 액수에 모자라면 다시 해 선택으로 돌아가서 거스름돈에 추가할 동전을 고름

ex) 완전 검색이 아닌 Baby-gin 방법으로 풀기
1. 6개의 숫자는 6자리의 정수 값으로 입력됨
2. COUNTS 리스트의 각 원소를 체크하여 run과 triplete 및 Baby-gin 여부를 판단함
- 탐욕 알고리즘을 적용함
- COUNTS 리스트에서 run과 triplete 중에 가능한 것을 조사함
- 조서에 사용한 데이터는 삭제함
- 남은 데이터를 다시 run과 triplete 중에 가능한지를 조사함

In [2]:
# 슈도코드로 표현한 구현
num = 456789 # Baby Gin 확인할 6자리수 
c = [0]*12 # 6자리 수로부터 각 자리 수를 추출하여 개수를 누적할 리스트
for i in range(6):
    c[num%10] += 1
    num //=10
    
i = 0
tri = run = 0
while i < 0:
    if c[i]>=3 : # triplete 조사 후 데이터 삭제
        c[i] -= 3
        tri += 1
        continue;
    if c[i] >= 1 and c[i+1] >= 1 and c[i+2] >= 1: # run 조사 후 데이터 삭제
        c[i] -= 1
        c[i+1] -= 1
        c[i+2] -= 1
        run += 1
        continue
    i += 1
if run + tri == 2 : print("Baby Gin")
else print("Lose")


SyntaxError: invalid syntax (<ipython-input-2-28ae07ede6df>, line 23)

### 탐욕 알고리즘 접근의 경우, 해답을 찾아내지 못할 때
입력 받은 숫자를 정렬한 후, 앞뒤 3자리씩 끊어서 run 및 triplete을 확인하는 방법을 고려

ex) 
{6,4,4,5,4,4}
-> 정렬하여 {4,4,4,4,5,6}을 얻어내면 쉽게 Baby-gin을 확인할 수 있음

{1,2,3,1,2,3}
-> 정렬하면 {1,1,2,2,3,3}로서, 오히려 Baby-gin 확인을 실패할 수 있음

탐욕 알고리즘적인 접근은 해답을 찾아내지 못하는 경우도 있음.

## Sort

대표적인 정렬 방식의 종류
1. 버블정렬 (Bubble Sort)
2. 카운팅 정렬 ( Counting Sort )
3. 선택 정렬 ( Selection Sort )
4. 퀵 정렬 ( Quick Sort )
5. 삽입 정렬 ( Insertion Sort )
6. 병합 정렬 ( Merge Sort )

1. 버블 정렬 ( Bubble Sort )
인접한 두 개의 원소를 비교하여 자리를 계속 교환하는 방식

정렬 과정
1. 첫 번쨰 원소부터 인접한 원소끼리 계속 자리를 교환하면서 맨 마지막 자리까지 이동
2. 한 단계가 끝나면 가장 큰 원소 또는 가장 작은 원소가 마지막 자리로 정렬됨
3. 교환하며 자리를 이동하는 모습이 물 위에 올라오는 거품모양 같아서 버블 정렬이라고 함

버블 정렬의 시간복잡도 -> O(n^2)

ex)
{55, 7, 78, 12, 42} 버블정렬하는 과정
맨앞원소와 다음원소를 비교를 해가면서 맨마지막에 가장큰 원소가 정렬된다.(고정)
하나씩 비교하며 역순으로 정렬을 마무리 한다. 

2. 카운팅 정렬 ( Counting Sort ) 
항목들의 순서를 결정하기 위해 집합에 각 항목이 몇 개씩 있는지 세는 작업을 하여, 선형 시간에 정렬하는 효율적인 알고리즘

정렬 과정
- 정수나 정소로 표현할 수 있는 자료에 대해서만 적용 가능. 각 항목의 발생 회수를 기록하기 위해, 정수 항목으로 인덱스되는 카운트들의 리스트를 사용하기 때문임
- 카운트들을 위한 충분한 공간을 할당하려면 집합 내의 가장 큰 정수를 알아야 함

카운팅 정렬의 시간 복작도 -> O(n+k) : n은 리스트의 개수, k는 정수의 최댓값

ex) {0, 4, 1, 3, 1, 2, 4, 1}을 카운팅 정렬하는 과정
1. Data에서 각 항목들의 발생 회수를 세고, 정수 항목들로 직접 인덱스 되는 카운트 리스트 COUNTS에 저장
- COUNTS [1, 3, 1, 1, 2]

2. 정렬된 집합에서 각 항목의 앞에 위치할 항목의 개수를 반영하기 위해 COUNTS의 원소를 조정
- COUNTS [1, 3, 1, 1, 2]
-> COUNTS [1, 4, 5, 6, 8]

DATA [0, 1, 1, 1, 2, 3, 4, 4] : 원소를 하나씩 삽입하면서 COUNTS값을 감소시킨다.

In [1]:
# 슈도 코드로 구현
def CountingSort(A, B, k) :
    # A[1 .. n] -- 입력 리스트에 사용된 숫자(1 ~ k)
    # B[1 .. n] -- 정렬된 리스트
    # C[1 .. k] -- 카우트 리스트
    
    C = [0] * k
    
    for i in range(0, len(B)) : 
        C[A[i]] += 1
        
    for i in range(1, len(C)) :
        C[i] += C[i-1]
    
    for i in range(len(B)-1, -1, -1) :
        B[c[a[i]]-1] = A[i]
        C[A[i]] -=1
        

In [4]:
a = [0, 4, 1, 3, 1, 2, 4, 1]
b = [0] * len(a)
CountingSort(a, b, 5)
print(b)

NameError: name 'c' is not defined

+
- 선택 정렬 
  수행시간 : O(n^2)
  알고리즘 기법 : 비교와 교환
  교환의 회수가 버블, 삽입정렬보다 작음
  
- 퀵 정렬
  평균 수행시간 : O(n log n)
  최악 수행시간 : O(N^2)
  알고리즘 기법 : 분할 정복
  최악의 경우 O(n^2)이지만, 평균적으로는 가장 빠름
  
- 삽입 정렬
  수행 시간 : O(n^2)
  알고리즘 기법 : 비교와 교환
  n의 개수가 작을 때 효과적
  
- 병합 정렬
  수행시간 : O(n log n)
  알고리즘 기법 : 분할 정복
  연결 리스트의 경우 가장 효율적인 방식