## 배열 (Array)

- 데이터를 나열하고 각 데이터를 인덱스에 대응하도록 구성한 데이터 구조
- 파이썬에서는 리스트 타입이 배열 기능을 제공하고 있음

## 1. 배열이 왜 필요할까?

- 같은 종류의 데이터를 효율적으로 관리하기 위해 사용
- 같은 종류의 데이터를 순차적으로 저장

- 배열의 장점:
    - 빠른 접근 가능
- 배열의 단점:
    - 추가/삭제가 쉽지 않음
    - 미리 최대 길이를 지정해야 함

## 2. 파이썬과 C 언어의 배열 예제

In [2]:
#include <stdio.h>

int main(int argc, char *argv[])
{
    char country[3] = "US";
    printf("%c%c\n", country[0], country[1]);
    printf("%s\n", country);
    return 0;
}

SyntaxError: invalid syntax (<ipython-input-2-7a6c0ee1a316>, line 3)

In [3]:
country = 'US'
print(country)

country = country + 'A'
print(country)

US
USA


## 3. 파이썬과 배열
- 파이썬 리스트 활용

In [4]:
## 1차원 배열: 리스트로 구현시
data = [1,2,3,4,5]
print(data)

[1, 2, 3, 4, 5]


In [5]:
## 2차원 배열: 리스트로 구현시
data = [[1,2,3],[4,5,6],[7,8,9]]
data

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [6]:
print(data[0])

[1, 2, 3]


In [12]:
print(data[0][0])
print(data[0][1])
print(data[1][2])

1
2
6


## 3. 프로그래밍 연습

#### 연습1: 위의 2차원 배열에서 9,8,7 순서로 출력해보기

In [14]:
print(data[2][2], data[2][1], data[2][0])

9 8 7


#### 연습2:  다음 dataset에서 전체 이름 안에 M이 몇번 나왔는지 빈도수 출력하기

In [17]:
dataset = ['Maria', 'Mammoth', 'Normal']

In [19]:
m_count = 0
for data in dataset:
    for index in range(len(data)):
        if data[index] == 'M':
            m_count += 1;

print(m_count)

2


## Queue

### 1. FIFO Queue

In [9]:
import queue

data_queue = queue.Queue()

In [10]:
data_queue.put("queuequeue")
data_queue.put(1)

In [11]:
data_queue.qsize()

2

In [12]:
data_queue.get()

'queuequeue'

In [13]:
data_queue.qsize()

1

### 2. LifoQueue() 로 큐 만들기(LIFO(Last-In, First-Out))

In [15]:
import queue
data_queue = queue.LifoQueue()

In [16]:
data_queue.put("queuequeue")
data_queue.put(1)

In [17]:
data_queue.qsize()

2

In [18]:
data_queue.get()

1

### 3. PriorityQueue()로 큐 만들기

In [23]:
import queue
data_queue = queue.PriorityQueue()

In [24]:
data_queue.put((10, "korea"))
data_queue.put((5, 1))
data_queue.put((2, "china"))

In [25]:
data_queue.qsize()

3

In [26]:
data_queue.get()

(2, 'china')

In [27]:
data_queue.get()

(5, 1)

In [28]:
data_queue.get()

(10, 'korea')

### 4. 어디에 큐가 많이 쓰일까?

- 멀티 태스킹을 위한 프로세스 스케쥴링 방식을 구현하기 위해 많이 사용됨(운영체제 참조)
    - 큐의 경우에는 장단점 보다는, 큐이 활용 예로 프로세스 스케쥴링 방식을 함께 이해해두는 것이 좋음

### 5. 프로그래밍 연습

#### 연습1: 리스트 변수로 큐를 다루는 enqueue, dequeue기능 구현해보기

In [31]:
queue_list = list()

def enqueue(data):
    queue_list.append(data)
    
def dequeue():
    data = queue_list[0]
    del queue_list[0]
    return data

In [32]:
for index in range(10):
    enqueue(index)

In [33]:
len(queue_list)

10

In [34]:
dequeue()

0

## 스택

* 데이터를 제한적으로 접근할 수 있는 구조
    - 한쪽 끝에서만 자료를 넣거나 뺼 수 있는 구조
* 가장 나중에 넣은 데이터를 가장 먼저 빼낼 수 있는 데이터 구조
    - 큐: FIFO 정책
    - 스택: LIFO 정책

### 1. 스택구조
- 스택은 LIFO(Last In, First Out) 또는 FILO(First In, Last Out) 데이터 관리 방식을 따름
    - LIFO: 마지막에 넣은 데이터를 가장 먼저 추출하는 데이터 관리 정책
    - FILO: 처음에 넣은 데이터를 가장 나중에 추출하는 데이터 관리 정책

### 2. 스택 구조와 프로세스 스택
- 스택 구조는 프로세스 실행 구조의 가장 기본
    - 함수 호출시 프로세스 실행 구조를 스택과 비교해서 이해 필요

In [35]:
#재귀 함수
def recursive(data):
    if data < 0:
        print("ended")
    else:
        print(data)
        recursive(data - 1)
        print("returned", data)

In [36]:
recursive(4)

4
3
2
1
0
ended
returned 0
returned 1
returned 2
returned 3
returned 4


### 3. 자료구조 스택의 장단점
- 장점
    - 구조가 단순해서, 구현이 쉽다.
    - 데이터 저장/읽기 속도가 빠르다.
- 단점(일반적인 스택 구현시)
    - 데이터 최대 갯수를 미리 정해야 한다.
        - 파이썬의 경우 재귀 함수는 1000번까지만 호출이 가능함
    - 저장 공간의 낭비가 발생할 수 있음
        - 미리 최대 갯수만큼 저장 공간을 확보해야 함

- 스택은 단순하고 빠른 성능을 위해 사용되므로, 보통 배열 구조를 활용해서 구현하는 것이 일반적임. 이 경우, 위에서 열거한 단점이 있을 수 있음

### 4. 파이썬 리스트 기능에서 제공하는 메서드로 스택 사용해보기
- append(push), pop 메서드 제공

In [40]:
data_stack = list()
data_stack.append(1)
data_stack.append(2)

In [41]:
data_stack

[1, 2]

In [42]:
data_stack.pop()

2

### 5. 프로그래밍 연습
- 연습1: 리스트 변수로 스택을 다루는 pop, push 기능 구현해보기(pop, push 사용 ㄴㄴ)

In [47]:
stack_list = list()

def push(data):
    stack_list.append(data)
    
def pop():
    data = stack_list[-1]
    del stack_list[-1]
    return data

In [48]:
for index in range(10):
    push(index)

In [49]:
pop()

9

## 링크드 리스트(Linked List)

### 1. 링크드 리스트(Linked List) 구조
- 연결 리스트라고도 함
- 배열은 순차적으로 연결된 공간에 데이터를 나열하는 데이터 구조
- 링크드 리스트는 떨어진 곳에 존재하는 데이터를 화살표로 연결해서 관리하는 구조
- 본래 C언어에서는 주요한 데이터 구조이지만, 파이썬은 리스트 타입이 링크드 리스트의 기능을 모두 지원

- 링크드 리스트 기본 구조와 용어
    - 노드(Node): 데이터 저장 단위(데이터값, 포인터)로 구성
    - 포인터(Pointer): 각 노드 안에서, 다음이나 이전의 노드와의 연결 정보를 가지고 있는 공간

### 2. 간단한 링크드 리스트 예
#### Node 구현
- 보통 파이썬에서 링크드 리스트 구현시, 파이썬 클래스를 활용함
    - 파이썬 객체지향 문법 이해 필요

In [50]:
class Node:
    def __init__(self, data):
        self.data = data
        self.next = None

In [51]:
class Node:
    def __init__(self, data, next=None):
        self.data = data
        self.next = next

#### Node와 Node 연결하기 (포인터 활용)

In [53]:
node1 = Node(1)
node2 = Node(2)
node1.next = node2
head = node1

#### 링크드 리스트로 데이터 추가하기

In [65]:
class Node:
    def __init__(self, data, next=None):
        self.data = data
        self.next = next
        
def add(data):
    node = head
    while node.next:
        node = node.next
    node.next = Node(data)

In [66]:
node1 = Node(1)
head = node1
for index in range(1, 10):
    add(index)

#### 링크드 리스트 데이터 출력하기(검색하기)

In [67]:
node = head
while node.next:
    print(node.data)
    node = node.next
print(node.data)

1
1
2
3
4
5
6
7
8
9


## 해쉬 테이블

### 1. 해쉬 구조
- Hash Table: 키(Key)에 데이터(Value)를 저장하는 데이터 구조
    - Key를 통해 바로 데이터를 받아올 수 있으므로, 속도가 획기적으로 빨라짐
    - 파이선 딕셔너리(Dictionary) 타입이 해쉬 테이블의 예: Key를 가지고 바로 데이터(Value)를 꺼냄
    - 보통 배열로 미리 Hash Table 사이즈만큼 생성 후에 사용(공간과 탐색 시간을 맞바꾸는 기법)
    - 단, 파이썬에서는 해쉬를 별도 구현할 이유가 없음. 딕셔너리 사용하면 됨.

### 2. 알아둘 용어
- 해쉬(Hash): 임의 값을 고정 길이로 변환하는 것
- 해쉬 테이블(Hash Table): 키 값의 연산에 의해 직접 접근이 가능한 데이터 구조
- 해싱 함수(Hashing): Key에 대해 산술 연산을 이용해 데이터 위치를 찾을 수 있는 함수
- 해쉬 값(Hash Value) 또는 해쉬 주소(Hash Address): Key를 해싱함수로 연산해서, 해쉬 값을 알아내고, 이를 기반으로 해쉬 테이블에서 해당 Key에 대한 데이터 위치를 일관성 있게 찾을 수 있음
- 슬롯(Slot): 한 개의 데이터를 저장할 수 있는 공간
- 저장할 데이터에 대해 Key를 추출할 수 있는 별도 함수도 존재할 수 있음

### 3. 간단한 해쉬 예

#### 3.1. hash table 만들기(list Comprehension 사용)

In [93]:
hash_table = list([0 for i in range(10)])
hash_table

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

#### 3.2. 간단한 해쉬 함수 만들어보기

In [71]:
def hash_func(key):
    return key % 5

#### 3.3. 해쉬 테이블 저장
- 데이터에 따라 필요시 key 생성 방법 정의가 필요함

In [74]:
data1 = 'Andy'
data2 = 'Dave'
data3 = 'Trump'

## ord(): 문자의 ASCII(아스키)코드 리턴
print(ord(data1[0]), ord(data2[0]), ord(data3[0]))
print(ord(data1[0]), hash_func(ord(data1[0])))

65 68 84
65 0


In [75]:
def storage_data(data, value):
    key = ord(data[0])
    hash_address = hash_func(key)
    hash_table[hash_address] = value

#### 3.4. 해쉬 테이블에서 특정 주소의 데이터를 가져오는 함수 만들기

In [77]:
storage_data('Andy', '01011112222')
storage_data('Dave', '01022223333')
storage_data('Trump', '01033334444')

#### 3.5. 실제 데이터를 저장하고, 읽어본다.

In [82]:
def get_data(data):
    key = ord(data[0])
    hash_address = hash_func(key)
    return hash_table[hash_address]

In [83]:
get_data('Andy')

'01011112222'

### 4. 자료 구조 해쉬 테이블의 장단점과 주요 용도
- 장점
    - 데이터 저장/읽기 속도가 빠르다.(검색 속도가 빠르다.)
    - 해쉬는 키에 대한 데이터가 있는지(중복)확인이 쉬움
- 단점
    - 일반적으로 저장공간이 좀 더 많이 필요하다.
    - 여러 키에 해당하는 주소가 동일할 경우 충돌을 해결하기 위한 별도 자료구조가 필요함.
- 주요 용도
    - 검색이 많이 필요한 경우
    - 저장, 삭제, 읽기가 빈번한 경우
    - 캐쉬 구현시(중복 확인이 쉽기 때문)

### 5. 프로그래밍 연습
- 연습1: 리스트 변수를 활용해서 해쉬 테이블 구현해보기
    1. 해쉬 함수: key % 8
    2. 해쉬 키 생성: hash(data)

In [89]:
hash_table = list([0 for i in range(8)])

def get_key(data):
    return hash(data)

def hash_function(key):
    return key % 8

def save_data(data, value):
    hash_address = hash_function(get_key(data))
    hash_table[hash_address] = value
    
def read_data(data):
    hash_address = hash_function(get_key(data))
    return hash_table[hash_address]

In [90]:
save_data('Dave', '01011112222')
save_data('Andy', '01022223333')
read_data('Dave')

'01011112222'

In [91]:
hash_table

['01011112222', 0, 0, 0, 0, '01022223333', 0, 0]

### 6. 충돌(Collision) 해결 알고리즘(좋은 해쉬 함수 사용하기)
- 해쉬 테이블의 가장 큰 문제는 충돌(Collision)의 경우이다. 이 문제를 충돌(Collision) 또는 해쉬 충돌(Hash Collision)이라고 부른다.

#### 6.1. Chaining 기법
- 개방 해슁 또는 Open Hashing 기법 중 하나: 해쉬 테이블 저장공간 외의 공간을 활용하는 방법
- 충돌이 일어나면, 링크드 리스트라는 자료 구조를 사용해서, 링크드 리스트로 데이터를 추가로 뒤에 연결시켜서 저장하는 기법

##### 연습2: 연습1의 해쉬 테이블 코드에 Chaining 기법으로 충돌해결 코드를 추가해보기
1. 해쉬 함수: key % 8
2. 해쉬 키 생성: hash(data)

In [124]:
hash_table = list([0 for i in range(8)])

def get_key(data):
    return hash(data)

def hash_function(key):
    return key % 8

def save_data(data, value):
    index_key = get_key(data)
    hash_address = hash_function(index_key)
    if hash_table[hash_address] != 0:
        for index in range(len(hash_table[hash_address])):
            if hash_table[hash_address][index][0] == index_key:
                hash_table[hash_address][index][1] = value
                return
            hash_table[hash_address].append([index_key, value])
    else:
        hash_table[hash_address] = [[index_key, value]]
            
def read_data(data):
    index_key = get_key(data)
    hash_address = hash_function(index_key)
    if hash_table[hash_address] != 0:
        for index in range(len(hash_table[hash_address])):
            if hash_table[hash_address][index][0] == index_key:
                return hash_table[hash_address][index][1]
        return None
    else:
        return None

In [125]:
print(hash('Dave')%8)
print(hash('Dd')%8)
print(hash('Data')%8)

0
1
0


In [126]:
save_data('Dave', '12321123')
save_data('Dd', '2321312312')
save_data('Data', '3331313')
read_data('Data')

'3331313'

In [127]:
hash_table

[[[546232062468092320, '12321123'], [-6416489038896441992, '3331313']],
 [[4562940548834591993, '2321312312']],
 0,
 0,
 0,
 0,
 0,
 0]

#### 6.2. Linear Probing 기법
- 폐쇄 해슁 또는 Close Hashing 기법 중 하나: 해쉬 테이블 저장공간 안에서 충돌 문제를 해결하는 기법
- 충돌이 일어나면, 해당 hash address의 다음 address부터 맨 처음 나오는 빈공간에 저장하는 기법
    - 저장공간 활용도를 높이기 위한 기법

##### 연습3: 연습 1의 해쉬 테이블 코드에 Linear Probing 기법으로 충돌해결 코드 추가하기
1. 해쉬 함수: key % 8
2. 해쉬 키 생성: hash(data)