# 6.2

카운팅 정렬

## 1) 문제 정의 (MD)

리스트를 한번 스캔하면서 각 항목이 리스트에 몇 번 나타났는지 빈도수를 계산한다. 빈도수가 구해지면 가장 작은 항목부터 순서대로 빈도수만큼 나열한다

## 2) 손으로 푼 예제 (MD, 이미지 삽입)

![KakaoTalk_20240524_220958078_01.jpg](attachment:124bec58-e4cd-4e05-8753-7f77067a2705.jpg)

## 또 다른 예

![KakaoTalk_20240524_220958078.jpg](attachment:b3fcd331-485a-41e7-abf7-64b26e332c0e.jpg)

## 3) 코드 개요(입력 변수, 출력, 함수 설명) (MD)

리스트를 입력 변수로 받아 출력 변수는 정렬된 리스트가 나온다. 함수 자체 코드는 임시 리스트를 만들어 각 숫자의 빈도를 계산 및 count라는 변수에 저장하고 임시 리스트에서 원소를 꺼내어 쓸 때마다 빈도 수의 -1을 해준다 이렇게 정렬 결과를 원래 배열에 복사를 하게 된다

## 4) 코드 (PY,C)

In [3]:
def counting_sort(A):
    output = [0] * len(A)
    count = [0] * (MAX_VAL + 1) 

    for i in A:
        count[i] += 1

    for i in range(1, MAX_VAL + 1):
        count[i] += count[i - 1]

    for i in range(len(A) - 1, -1, -1): 
        output[count[A[i]] - 1] = A[i]
        count[A[i]] -= 1

    for i in range(len(A)):
        A[i] = output[i]


## 5) 테스트 코드 (PY,C)

In [4]:
def counting_sort(A):
    output = [0] * len(A)
    count = [0] * (MAX_VAL + 1) 

    for i in A:
        count[i] += 1

    for i in range(1, MAX_VAL + 1):
        count[i] += count[i - 1]

    for i in range(len(A) - 1, -1, -1): 
        output[count[A[i]] - 1] = A[i]
        count[A[i]] -= 1

    for i in range(len(A)):
        A[i] = output[i]

MAX_VAL = 10
data = [1, 4, 1, 2, 7, 5, 2]
print("Original:", data)
counting_sort(data)
print("Counting:", data)

Original: [1, 4, 1, 2, 7, 5, 2]
Counting: [1, 1, 2, 2, 4, 5, 7]


## 6) 수행 결과 (MD, 결과 캡춰하여 이미지로 삽입)

![image.png](attachment:ae0f8305-ae78-47c8-8e83-818a9dccf09d.png)

## 7) 복잡도 분석 (MD)

O(k+n)
입력 리스트에 나타낼 수 있는 키 값의 종류를 k이므로 O(상수+n)=>O(n)이다.

# 6.3

문자열 매칭

## 1) 문제 정의 (MD) 

전처리 과정을 통해 패턴에 대한 정보를 얻고 이것을 테이블에 저장한 다음 텍스트에서 패턴을 매칭하는 동안 이 정보를 활용한다.

## 2) 손으로 푼 예제 (MD, 이미지 삽입)

![KakaoTalk_20240525_212034494.jpg](attachment:e80f1547-e74a-4c66-ac64-6bacf5f9b89f.jpg)

## 3) 코드 개요(입력 변수, 출력, 함수 설명) (MD)

텍스트 문자열과 패턴 문자열을 입력으로 받아서 매칭이 된 경우 매칭이 된 부분부터 1씩 증가하여 탐색을 하고 첫번째 위치를 반환하고 만약 다르다면 쉬프트 테이블로 만든 표에 맞게 몇번을 뛰는 지 또는 몇개는 매칭이 맞지만 몇개는 안된다고 하면 매칭된 부분은 빼고 몇개 부분을 뛰어서 반환한다.

## 4) 코드 (PY,C)

In [5]:
NO_OF_CHARS = 128

def shift_table(pat):
    m = len(pat)
    tbl = [m] * NO_OF_CHARS

    for i in range(m - 1):
        tbl[ord(pat[i])] = m - 1 - i

    return tbl

def search_horspool(text, pat):
    m = len(pat)
    n = len(text)
    tbl = shift_table(pat)
    
    i = m - 1

    while i < n:
        k = 0
        while k < m and pat[m - 1 - k] == text[i - k]:
            k += 1
        
        if k == m:
            return i - m + 1
        else:
            i += tbl[ord(text[i])]
    
    return -1

## 5) 테스트 코드 (PY,C)

In [6]:
NO_OF_CHARS = 128

def shift_table(pat):
    m = len(pat)
    tbl = [m] * NO_OF_CHARS

    for i in range(m - 1):
        tbl[ord(pat[i])] = m - 1 - i

    return tbl

def search_horspool(text, pat):
    m = len(pat)
    n = len(text)
    tbl = shift_table(pat)
    
    i = m - 1

    while i < n:
        k = 0
        while k < m and pat[m - 1 - k] == text[i - k]:
            k += 1
        
        if k == m:
            return i - m + 1
        else:
            i += tbl[ord(text[i])]
    
    return -1
print("패턴의 위치:", search_horspool("APPLEMANGOBANANAGRAPE", "BANAN"))



패턴의 위치: 10


## 6) 수행 결과 (MD, 결과 캡춰하여 이미지로 삽입)

![image.png](attachment:3e0ea2da-58b8-4603-b745-edcbd6460065.png)

## 7) 복잡도 분석 (MD)

O(mn)

# 6.4

해싱

## 1) 문제 정의 (MD) 

탐색키를 테이블에 있는 레코드와 하나씩 비교하는 것이 아니라 킷값에 산술적인 연산을 적용하여 레코드가 저장되어야 할 위치를 직접 계산한다.
즉, 탐색키로부터 레코드가 있어야 할 위치를 바로 계산하고, 그 위치에 레코드가 있는지만 확인하면 된다.

## 2) 손으로 푼 예제 (MD, 이미지 삽입)

![KakaoTalk_20240525_213514628.jpg](attachment:0a7cb09d-83ba-4226-9886-8ec05232ac7a.jpg)

## 3) 코드 개요(입력 변수, 출력, 함수 설명) (MD)

크기가 m인 테이블을 만들고 Nono(항목 없음)으로 초기화한다.  : 해시 함수로 킷값을 M으로 나눈 나머지 연산을 사용한다.  : 킷값을 해시 함수에 적용해 해시 주소 id를 구한다. 행 id번째 테이블이 비어있지 않으면 계속 다음 위치를 검사한다.2행: 비어있는 버킷을 찾으면 키를 저장한다.
 해당 버킷이 비었으면 찾는 항목이 없는 것이다.   해당 버킷이 비어있지 않은데 찾는 키도 아니면 다른 키에 의해 사용되고 있는 경우이다. 이 경우 연속적으로 다음 버킷을 
해당 버킷에 찾는 키가 있으면 이제 그 항목을 삭제한다. 이때,None으로 처리하지 않고 -1로 처리하였다. 이것은 사용되었다가 삭제된 버킷을 의미하는 것이다.
 문자열의 모든 문자에 대해   그 문자의 아스키 코드 값을 sum에 더함검사한다.

## 4) 코드 (PY,C)

삽입

In [7]:
M = 13
NONE = None
table = [NONE] * M

def hashFn(key):
    return key % M

def lp_insert(key):
    id = hashFn(key)
    count = M
    while count > 0 and (table[id] != NONE):
        id = (id + 1) % M
        count -= 1
    if count > 0:
        table[id] = key
    return

탐색

In [8]:
def lp_search(key):
    id = hashFn(key)
    count = M
    while count > 0 :
        if table[id] == None :
            return None
        if table[id] == key :
            return table[id] 
        id = (id + 1 + M) % M
        count -= 1
    return None

삭제

In [9]:
def lp_delete(key):
    id = hashFn(key)
    count = M
    while count > 0 :
        if table[id] == None : return
        if table[id] != -1 and table[id] == key :
            table[id] =-1
            return
        id = (id + 1 + M) % M
        count -= 1

탐색키의 해시 함수 계산

In [10]:
M = 13

def hashFn(key):
    sum = 0
    for c in key:
        sum += ord(c)
    return sum % M


## 5) 테스트 코드 (PY,C)

## 삽입, 삭제, 탐색

In [11]:
M = 13
NONE = None
table = [NONE] * M

def hashFn(key):
    return key % M

def lp_insert(key):
    id = hashFn(key)
    count = M
    while count > 0 and (table[id] != NONE):
        id = (id + 1) % M
        count -= 1
    if count > 0:
        table[id] = key

def lp_search(key):
    id = hashFn(key)
    count = M
    while count > 0 :
        if table[id] == None :
            return None
        if table[id] == key :
            return table[id] 
        id = (id + 1 + M) % M
        count -= 1
    return None
def lp_delete(key):
    id = hashFn(key)
    count = M
    while count > 0 :
        if table[id] == None : return
        if table[id] != -1 and table[id] == key :
            table[id] =-1
            return
        id = (id + 1 + M) % M
        count -= 1

print(" 최초:", table)
lp_insert(45); print("45 삽입:", table)
lp_insert(27); print("27 삽입:", table)
lp_insert(88); print("88 삽입:", table)
lp_insert(9); print("9 삽입:", table)
lp_insert(71); print("71 삽입:", table)
lp_insert(60); print("60 삽입:", table)
lp_insert(46); print("46 삽입:", table)
lp_insert(38); print("38 삽입:", table)
lp_insert(24); print("24 삽입:", table)
lp_delete(60); print("60 삭제", table)
print("46 탐색:", lp_search(46) )

 최초: [None, None, None, None, None, None, None, None, None, None, None, None, None]
45 삽입: [None, None, None, None, None, None, 45, None, None, None, None, None, None]
27 삽입: [None, 27, None, None, None, None, 45, None, None, None, None, None, None]
88 삽입: [None, 27, None, None, None, None, 45, None, None, None, 88, None, None]
9 삽입: [None, 27, None, None, None, None, 45, None, None, 9, 88, None, None]
71 삽입: [None, 27, None, None, None, None, 45, 71, None, 9, 88, None, None]
60 삽입: [None, 27, None, None, None, None, 45, 71, 60, 9, 88, None, None]
46 삽입: [None, 27, None, None, None, None, 45, 71, 60, 9, 88, 46, None]
38 삽입: [None, 27, None, None, None, None, 45, 71, 60, 9, 88, 46, 38]
24 삽입: [24, 27, None, None, None, None, 45, 71, 60, 9, 88, 46, 38]
60 삭제 [24, 27, None, None, None, None, 45, 71, -1, 9, 88, 46, 38]
46 탐색: 46


![image.png](attachment:bb8294d1-9282-4932-9a79-a90bf0d6dfdb.png)

## 탐색키의 해시 함수 

In [14]:
M = 13

def hashFn(key):
    sum = 0
    for c in key:
        sum += ord(c)
    return sum % M

keys = ["apple", "banana", "cherry", "date", "fig", "grape", "kiwi", "lemon", "mango"]
print("키\t\t해시값")
print("-------------------")
for key in keys:
    print(f"{key}\t\t{hashFn(key)}")

키		해시값
-------------------
apple		10
banana		11
cherry		3
date		11
fig		11
grape		7
kiwi		7
lemon		6
mango		10


![image.png](attachment:db4cd844-e81b-4cda-9522-80141e0aabb5.png)

## 7) 복잡도 분석 (MD)

O(n)