# 선형조사

선형조사는 충돌이 일어난 지점으로부터 순차적으로 검색하여 처음 발견한 빈 공간에 충돌이 일어난 키를 저장합니다.

<img src="./img/linear.jpg" width="500"/>

### 핵심 아이디어 : (h(key) + j) % M, j = 1, 2, 3, ...

충돌이 나면 바로 다음 원소를 검사하자


### 문제점

충돌이 발생하는 지점이 같은 경우 그 다음 원소를 검사하여 이동할 때 빈 인덱스가 없으면 마찬가지로 충돌이 발생하게 됩니다. 이때 해시테이블의 키들이 빈틈없이 뭉쳐지는 현상이 발생하게 되는데 이를 1차 군집화라고 합니다. 이러한 군집화는 탐색, 삽입, 삭제 연산을 수행할 때 군집된 키들을 순차적으로 방문해야 하는 문제점을 발생시켜 해시 성능을 저하시킵니다. 이러한 군집화는 비어있는 원소의 수가 적을수록 심집니다.

# 해시함수

In [None]:
def hash(self, key): # 나눗셈 해시 함수
        return key % self.M

# 삽입

In [None]:
def put(self, key, data):
        initial_position = self.hash(key) # 초기 위치
        i = initial_position
        j = 0
        
        while True:
            if self.a[i] == None: # 빈곳을 발견! 
                self.a[i] = key # key값은 해시테이블a에
                self.d[i] = data # data는 리스트d에 저장
                return 
            if self.a[i] == key: # key값이 이미 해시테이블에 존재
                self.d[i] = data # 데이터 갱신
                return 
            
            j += 1
            i = (initial_position + j) % self.M # 다음 원소 검사
            if i == initial_position: # 처음 위치로 돌아올시 저장 실패. 남은 공간이 없다.
                break 

# 탐색

In [None]:
    def get(self, key):
        initial_position = self.hash(key) # 초기 위치
        i = initial_position
        j = 1
        
        while self.a[i] != None:
            if self.a[i] == key:
                return self.d[i] # 탐색에 성공! 키값에 해당되는 해시테이블과 키값이 같을때 리스트d에서 data를 가져옴
            
            i = (initial_position + j) % self.M # 다음 원소 검사
            j += 1
            if i == initial_position:
                return None # 탐색 실패
        return None # 탐색 실패

# 삭제

In [None]:
    def delete(self, key): # 삭제 연산
        initial_position = self.hash(key)
        i = initial_position
        j = 1
        
        while self.a[i] != None: # a[i]가 empty가 아니면
            if self.a[i] == key:
                self.a[i] = None
                self.d[i] = None
                return
            
            i = (initial_position + j) % self.M  # i의 다음 위치
            j += 1   
            if i == initial_position: # i가 초기위치와 같으면 루프 종료
                return None # 삭제 실패             
        return None # 삭제 실패    

# 전체 코드

In [60]:
class LinearProbing:
    def __init__(self, size):
        self.M = size # 테이블의 크기    
        self.a = [None] * size # 해시테이블 a
        self.d = [None] * size # 데이터 저장용 d
    
    def hash(self, key): # 나눗셈 해시 함수
        return key % self.M
    
    def put(self, key, data):
        initial_position = self.hash(key) # 초기 위치
        i = initial_position
        j = 0
        
        while True:
            if self.a[i] == None: # 빈곳을 발견! 
                self.a[i] = key # key값은 해시테이블a에
                self.d[i] = data # data는 리스트d에 저장
                return 
            if self.a[i] == key: # key값이 이미 해시테이블에 존재
                self.d[i] = data # 데이터 갱신
                return 
            
            j += 1
            i = (initial_position + j) % self.M # 다음 원소 검사
            if i == initial_position: # 처음 위치로 돌아올시 저장 실패. 남은 공간이 없다.
                break 
            
    
    def get(self, key):
        initial_position = self.hash(key) # 초기 위치
        i = initial_position
        j = 1
        
        while self.a[i] != None:
            if self.a[i] == key:
                return self.d[i] # 탐색에 성공! 키값에 해당되는 해시테이블과 키값이 같을때 리스트d에서 data를 가져옴
            
            i = (initial_position + j) % self.M # 다음 원소 검사
            j += 1
            if i == initial_position:
                return None # 탐색 실패
        return None # 탐색 실패
    
    def delete(self, key): # 삭제 연산
        initial_position = self.hash(key)
        i = initial_position
        j = 1
        
        while self.a[i] != None: # a[i]가 empty가 아니면
            if self.a[i] == key:
                self.a[i] = None
                self.d[i] = None
                return
            i = (initial_position + j) % self.M  # i의 다음 위치
            j += 1   
            if i == initial_position: # i가 초기위치와 같으면 루프 종료
                return None # 삭제 실패             
        return None # 삭제 실패    
    
    def print_table(self): # 해시테이블 출력
        for i in range(self.M):
            print('{:8}'.format(str(i)), ' ', end='')
        print()
        for i in range(self.M):
            print('{:8}'.format(str(self.a[i])), ' ', end='')
        print()
        for i in range(self.M):
            print('{:8}'.format(str(self.d[i])), ' ', end='')
        print()
        


if __name__ == '__main__':
    t = LinearProbing(13)
    t.put(25, 'grape')
    t.put(37, 'apple')
    t.put(18, 'banana')
    t.put(55, 'cherry')
    t.put(22, 'mango')
    t.put(35, 'lime')
    t.put(50, 'orange')
    t.put(63, 'melon')
    print("탐색결과")
    print('50의 data = ', t.get(50))
    print('63의 data = ', t.get(63))
    print("")
    print('해시테이블')
    t.print_table()
    print("")
    t.delete(35)
    t.delete(25)
    print("삭제후 해시테이블")
    t.print_table()

탐색결과
50의 data =  orange
63의 data =  melon

해시테이블
0         1         2         3         4         5         6         7         8         9         10        11        12        
50        63        None      55        None      18        None      None      None      22        35        37        25        
orange    melon     None      cherry    None      banana    None      None      None      mango     lime      apple     grape     

삭제후 해시테이블
0         1         2         3         4         5         6         7         8         9         10        11        12        
50        63        None      55        None      18        None      None      None      22        None      37        None      
orange    melon     None      cherry    None      banana    None      None      None      mango     None      apple     None      
