# Hash Table

해시 테이블은 키 값을 벨류에 맵핑해서 효율적인 탐색이 가능하게 해주는 자료구조 

## 해시테이블 계산법

1. 키에 대한 해시 코드를 계산
문자열을 숫자로 바꾸는 것을 해시함수라고 하며 그 값을 해시 코드라고 한다.
    
    → ex) string이면 Ascii/Unicode를 이용해서 숫자로 변환하여 해시코드를 생성
    
2. 해시 코드를 인덱스로 변환
    
    → ex) 해시 코드 % array_length
    
3. 충돌 해결
서로 다른 값이 같은 해시 코드를 갖거나, 다른 해시 코드가 같은 인덱스로 매핑되는 경우가 있다. 이 경우 인덱스에 (인덱스값, 벨류값) 이렇게 같이 저장하면서 충돌 되지 않도록 관리한다.
    
    → ex) 인덱스 3에는 (index 3, “value1”) - (index 3, “value 2) 연결 리스트가 저장됨.
    

Key Point: 해시 테이블은, 해시 코드를 사용하여 원래 값을 역연산 하는 것이 아니라, 인덱스값과 원래 value값을 같이 저장하면서 빠르게 찾게 도와주는 툴!

## 해시 테이블 탐색 시간 복잡도

보통 키를 해시 함수에 넣으면 곧바로 배열 인덱스 값을 얻을 수 있기 때문에 연산이 고정된 횟수로 끝나게 된다. 따라서 O(1) 시간이 걸린다.

최악의 경우에는 해시 충돌이 많이 발생하는 경우인데, 특정 인덱스에 값이 몰려있을 경우이다. 이 인덱스에 연결된 연결리스트 값이 N개가 있다면 이를 모두 순회해야 하므로 O(N)이 소요되는 것이다.

## 해시 함수 성능

Load Factor = 저장된 항목 수 / 배열 크기 이라는 것을 이용해서 해시 함수의 성능을 판단할 수 있다.

이 수치가 높아질 수록 충돌이 많아지기 때문에 0.75 이상이 되면 배열 크기를 늘리는 resizing을 하게 된다.

resizing은 말 그대로, 모든 해시 값을 다시 계산해서 새로운 테이블에 넣는 것!

# Hash Table
A **Hash Table** is a data structure that maps keys to values to enable efficient searching.

## **How a Hash Table Works:**

1. **Calculating the Hash Code:**
   A hash function converts the key into a numeric value, known as the hash code.

   * Example: For a string key, the hash function may use ASCII or Unicode values to generate the hash code.

2. **Converting the Hash Code to an Index:**
   The hash code is then converted into an array index.

   * Example: `hash_code % array_length`

3. **Handling Collisions:**
   When different keys result in the same hash code or when different hash codes map to the same index, a collision occurs.

   * To resolve this, the index stores pairs in the form of `(index, value)` to manage collisions using a linked list or other structures.
   * Example: At index 3, the values might be stored as `(3, "value1") - (3, "value2")`, forming a linked list.

## **Key Point:**

A hash table does not reverse-engineer the original key from the hash code. Instead, it stores both the index and the value together, allowing for quick look-up using the key.

---

## **Time Complexity Analysis for Hash Tables:**

* The time complexity for searching is generally **O(1)**, as the key is directly mapped to the index through the hash function.
* In the worst-case scenario, when many collisions occur and a single index contains multiple values (linked list of length `N`), the time complexity becomes **O(N)** due to the need to traverse all elements at that index.

---

## **Evaluating Hash Function Performance:**

* **Load Factor:** The ratio of the number of stored entries to the size of the array (`number_of_entries / array_size`).
* As the load factor increases, collisions become more frequent.
* When the load factor exceeds **0.75**, resizing is triggered.
* **Resizing** involves recalculating all hash codes and inserting them into a new, larger array.


# ArrayList & Resizable Arrays

Array와 ArrayList의 차이는 dynamic-resizing 기능을 제공하는가 여부이다.

## ArrayList의 시간 복잡도

| ArrayList 연산 | 시간 복잡도 | 설명 |
| --- | --- | --- |
| 인덱스 접근 | O(1) | 인덱스를 통한 직접 접근 |
| 값 검색 | O(n) | 순차 탐색이 필요함 |
| 끝에 삽입 | O(1) 또는 O(n) | 리사이징이 없는 경우 O(1), 리사이징 발생 시 O(n) |
| 중간 삽입 | O(n) | 삽입 후 요소 이동 |
| 끝에서 삭제 | O(1) | 마지막 요소 삭제 |
| 중간 삭제 | O(n) | 삭제 후 요소 이동 |

Key Point: 탐색을 ‘인덱스’로 하는 지 ‘value’로 하는지 헷갈리지 말 것.

연결리스트는 인덱스로 찾는다고 해도 포인터를 찾아야 하는 이유 때문에 탐색이 O(N)이 걸리는 것.

# ArrayList & Resizable Arrays

The key difference between an `Array` and an `ArrayList` is whether it provides dynamic resizing functionality.

## **Time Complexity of ArrayList**

| ArrayList Operation | Time Complexity | Description                                               |
| ------------------- | --------------- | --------------------------------------------------------- |
| Index Access        | O(1)            | Direct access via index                                   |
| Value Search        | O(n)            | Sequential search required                                |
| Append at End       | O(1) or O(n)    | O(1) if no resizing occurs, O(n) if resizing is triggered |
| Insert at Index     | O(n)            | Elements shifted after insertion                          |
| Remove Last Element | O(1)            | Last element removed                                      |
| Remove at Index     | O(n)            | Elements shifted after removal                            |

**Key Point:**
Be clear about whether the search is conducted using an **index** or a **value**.

In the case of a `LinkedList`, even if accessed by index, it still requires traversal through the pointers, resulting in **O(n)** time complexity.


# StringBuilder

StringBuilder는 문자열을 저장하는 동적 배열을 만들고, 마지막에 한 번에 문자열로 합쳐주는 방식

## String과 StringBuilder

- String: 불변 자료형 immutable
    
    따라서, `sentence = sentence + w` 는 사실 새로운 문자열을 새로 계속 만드는 것.
    
    Python의 `+` 연산
    
- StringBuilder: 가변 자료형 mutable
    
    한 객체 안에서 문자열을 점점 이어붙이는 것 → 메모리 낭비 없음.
    
    ArrayList라고 생각하면 된다.
    
    Python의 `''.join(list)` 연산

# StringBuilder

`StringBuilder` creates a dynamic array to store strings and concatenates them into a single string at the end.

## **String vs. StringBuilder**

* **String:** Immutable data type

  * Every time you perform `sentence = sentence + w`, a new string object is created.
  * Equivalent to Python’s `+` operation.

* **StringBuilder:** Mutable data type

  * Appends strings within the same object without creating new ones, preventing memory waste.
  * Can be thought of as a `ArrayList` for strings.
  * Equivalent to Python’s `''.join(list)` operation.


# Allocated QUIZ

1.3 URLify:
    
Write a method to replace all spaces in a string with `%20`. You may assume that the string has sufficient space at the end to hold the additional characters, and that you are given the “true” length of the string.
    
(Note: If implementing in Java, please use a character array so that you can perform this operation in place.)
    
**EXAMPLE**
    
    Input: "Mr John Smith    ", 13
    
    Output:  "Mr%20John%20Smith"
    
    *Hints: #53, #118*

## First trial

In [1]:
input_str = "Mr John Smith    "
true_length = 13

In [2]:
def replace_spaces(input_str, true_length):
    return '%20'.join(input_str.split())

In [3]:
replace_spaces(input_str, true_length)

'Mr%20John%20Smith'

문제 무시하고 답만 맞춘 방법..🙄

### 이해가 안갔던 점
1. space 크기가 다른 것으로 봐서 꼭 space가 1칸인거 아닌거 같은데 영향이 있을까?

    2번 내용을 쓰다가 알게된건데 위 아래 문자열 위치 대조해보면, space는 1칸이었다는 것을 알수있다..!
    만약 space가 앞쪽에 1칸 이상 있을 수 있으면, Hint 53의 뒷 부분부터 시작하라는 부분이 소용이 없어질거란 생각이 들었다.
    "Mr     John smith "이런 식이면, 뒷부분부터 채울때 %20을 넣는순간, 유효 데이터인 it가 없어질 예정이었으니까..!
   
3. 메모리를 절약하기 위해서 제공된 input string에서 값만 수정하는 식으로 하는건가?

    A common approach in string manipulation problems is to edit the string starting from the end and working backwards. This is useful because we have an extra buffer at the end, which allows us to change characters without worrying about what we're overwriting.

    위 solution설명을 보고 input string에서 사용하는건가 생각했는데, 이게 맞는 것 같다.
    또한, 문제도 자세히보니 input과 output의 "위치가 같은걸 보니 input string으로 들어오는 값의 길이 내에서 %20을 다 처리할 수 있다는 의미였다.

4. true length 사이즈의 배열을 만들어서 사용하는건가?

    1, 2번 생각하다보니 해결.

### Points of Confusion

1. The size of the space seems to vary, so I wondered if the space was always a single character. Could this affect the implementation?

   * While working through the second point, I realized that by comparing the position of characters in the original and modified strings, we can confirm that each space is indeed a single character.
   * If the space were more than one character, the hint about starting from the end would become irrelevant.
   * For example, if the input string were `"Mr     John smith "`, then when filling from the end, as soon as we replace a space with `%20`, the valid data (`it`) would get overwritten.

2. Are we modifying the provided input string directly to save memory?

   * The solution explanation mentions editing the string in place, starting from the end and working backwards. This suggests that the input string itself is being modified to accommodate `%20`.
   * Additionally, upon closer inspection of the problem, we can see that the positions of characters in the input and output strings are aligned, indicating that the `%20` replacements can be handled within the existing length of the input string.

3. Are we creating an array of size `true length` to handle this?

   * While considering points 1 and 2, I was able to resolve this question.


# Solution

In [4]:
input_str = "Mr John Smith    "
true_length = 13

In [5]:
def replace_spaces(input_str, true_length):
    input_str = list(input_str)
    index = len(input_str) - 1
    for i in range(true_length-1, -1, -1):
        if input_str[i]==" ":
            input_str[index] = "0"
            input_str[index-1] = "2"
            input_str[index-2] = "%"
            index -= 3
            continue

        input_str[index] = input_str[i]
        index -= 1
    return ''.join(input_str)

In [6]:
replace_spaces(input_str, true_length)

'Mr%20John%20Smith'

# Hints
53. It's often easiest to modify strings by going from the end of the string to the beginning.

118. You might find you need to know the number of spaces. Can you just count them?

# 질문

![스크린샷 2025-05-10 오전 11.34.39.png](attachment:c2bd2bfa-7768-4433-9cb3-0407c3c80e1d.png)

/0가.. 리스트의 끝이었나 string의 끝이었나 한데, line no.9 의 필요 이유가 뭔지 아시는분..?