## ⭐ String
컴퓨터가 문자를 저장하는 방법을 배울 수 있다.  

##### ⏩ 코드체계
문자에 대응되는 숫자를 정한 것  
- ex) 영여는 대소문자 52자 이므로 6비트(64가지 경우)면 저장할 수 있음

```
'a' --> 000000(0) 과 같이 6비트 이진수를 배정하여 사용함
```

코드체계는 왜 생겼나?
- 네트워크가 발전되기 전 미국의 각 지역 별로 코드체계를 정해 놓고 사용함
- 네트워크가 발전하면서 서로 정보를 주고 받을 때 정보를 달리 해석한다는 문제가 생김
- 혼동을 피하기 위해 표준안을 만들기로 함

코드체계 개선
- 1967년 미국에서 ASCII 라는 문자 인코딩 표준이 제정됨
- ASCII는 7-bit 인코딩으로 128문자를 표현하며 33개의 출력 불가능한 제어 문자들과 공백을 비롯한 95개의 출력 가능한 문자들로 이루어짐
  
![image.png](./img/ASCII.png)  

##### ✔️ 확장 아스키
- 표준 문자 이외의 악센트 문자, 도형 문자, 특수 문자, 특수 기호 등 부가적인 문자를 128개 추가
- 표준 아스키는 7-bit를 사용하여 문자를 표현, 확장 아스키는 1Byte 내의 8-bit를 모두 사용함으로써 추가적인 문자를 표현할 수 있음
  
![image.png](./img/extra_ASCII.png)  

##### ✔️ 유니코드
- 컴퓨터가 발전하면서 미국 뿐만 아니라 각 나라에서 컴퓨터가 발전함
- 각 국가들은 자국의 문자를 표현하기 위하여 코드체계를 만들어서 사용하게 됨
  --> 우리나라도 한글 코드체계를 만들어 사용했고, 조합형/완성형 두 종류를 가짐
- 인터넷이 전 세계로 발전하면서 ASCII를 만들기 전과 같은 문제가 국가 사이에 정보를 주고 받을 때 발생함
- 자국의 코드체계를 타국가가 가지고 있지 않으면 정보를 잘못 해석 할 수 밖에 없음
- 다국어 처리를 위해 표준인 유니코드를 만듦
  
![image.png](./img/unicode.png)  

##### ✔️ 유니코드 Character Set
- 유니코드도 다시 Character Set으로 분류됨
- UCS-2
- USC-4
- 유니코드를 저장하는 변수의 크기를 정의함
- 파일을 읽을 때 UCS-2 / ICS-4 인지 인식하고 각 경우를 구분해서 모두 다르게 구현해야 하는 문제가 발생

In [None]:
print('\\B364')

/\B364


## ⭐ python 인코딩

In [None]:
import sys
sys.stdin = open('input2.txt')

# 북 페이지 찾는 함수 작성
def search_book_page(total_page, find_page):
    # 이진탐색을 위한 start, end 변수 할당
    # start를 1로 주어야 함 (주어진 조건)
    start_page = 1
    end_page = total_page

    # 이진탐색 횟수를 세는 count 변수 할당
    count = 0

    # 이진탐색 시작
    while start_page <= end_page:
        # end_page가 홀수로 끝날 수도 있으니, 해당 값까지 반영해야 함
        half = int((start_page + end_page) / 2)
        if half == find_page:
            return count
            break
        elif half > find_page:
            end_page = half 
            count += 1
        elif half < find_page:
            start_page = half 
            count += 1
    return count

T = int(input())

for time in range(1, T+1):
    P, A, B = map(int,input().split())

    result_A = search_book_page(P, A)
    result_B = search_book_page(P, B)

    # return count 변수가 작은 사람을 출력함
    if result_A > result_B:
        print(f'#{time} B')
    elif result_A == result_B:
        print(f'#{time} 0')
    elif result_A < result_B:
        print(f'#{time} A')



## ⭐ 회문

In [3]:
# 회문 예시

arr = '소주만병만주소'
N = len(arr)


flag = True
for i in range(N//2):
    if arr[i] != arr[N-1-i]:
        print('회문 아님')
        flag = False # 반복을 하고 끝날 때, 정상적으로 돌았는지 확인하려면 깃발을 꽂음
        break
else:
    print('회문')

print(flag)

회문
True


## ✍️ 연습문제

##### ✍️ 문자열_글자수

1. 두 개의 문자열 str1과 str2가 주어진다. 문자열 str1에 포함된 글자들이 str2에 몇 개씩 들어있는지 찾고, 그중 가장 많은 글자의 개수를 출력하는 프로그램을 만드시오.  

2. 예를 들어 str1 = “ABCA”, str2 = “ABABCA”인 경우, str1의 A가 str2에 3개 있으므로 가장 많은 글자가 되고 3을 출력한다.

3. 파이썬의 경우 딕셔너리를 이용할 수 있다.


[입력]  
1. 첫 줄에 테스트 케이스 개수 T가 주어진다.  1≤T≤50
2. 다음 줄부터 테스트 케이스 별로 길이가 N인 문자열 str1과 길이가 M인 str2가 각각 다른 줄에 주어진다. 5≤N≤100, 10≤M≤1000, N≤M

[출력]  
1. 각 줄마다 "#T" (T는 테스트 케이스 번호)를 출력한 뒤, 답을 출력한다.



In [None]:
T = int(input())

for time in range(1, T+1):
    str1 = list(input())
    str2 = list(input())
    new_arr = {}
    str1_1 = []
    count = 0

    for i in str1:
        if i not in str1_1:
            str1_1.append(i)

    for i in str1_1:
        for j in str2:
            if i == j and not i in new_arr:
                new_arr.update({i:count+1})
            elif i == j and i in new_arr:
                new_arr[i] += 1

    max_value = new_arr[str1[0]]

    for key, value in new_arr.items():
        if max_value < new_arr[key]:
            max_value = new_arr[key]

    print(f'#{time} {max_value}')


##### ✍️ 초심자의 회문 검사

1. "level" 과 같이 거꾸로 읽어도 제대로 읽은 것과 같은 문장이나 낱말을 회문(回文, palindrome)이라 한다.
2. 단어를 입력 받아 회문이면 1을 출력하고, 아니라면 0을 출력하는 프로그램을 작성하라.

[제약 사항]  
1. 각 단어의 길이는 3 이상 10 이하이다.

[입력]  
1. 가장 첫 줄에는 테스트 케이스의 개수 T가 주어지고, 그 아래로 각 테스트 케이스가 주어진다.
2. 각 테스트 케이스의 첫 번째 줄에 하나의 단어가 주어진다.


[출력]  
1. 출력의 각 줄은 '#t'로 시작하고, 공백을 한 칸 둔 다음 정답을 출력한다. (t는 테스트 케이스의 번호를 의미하며 1부터 시작한다.)  


In [11]:

T = int(input())

for time in range(1, T+1):
    str = input()
    N = len(str)
    count = 0

    for i in range(N):
        if str[i] != str[N-1-i]:
            count -= 1
        else:
            count += 1

    if count > N//2:
        print(f'#{time} 1')
    else:
        print(f'#{time} 0')


#1 1
#2 0
#3 1


##### ✍️ [S/W 문제해결 기본] 5일차 - GNS

1. 숫자 체계가 우리와 다른 어느 행성이 있다. 아래는 이 행성에서 사용하는 0 ~ 9의 값을 순서대로 나타낸 것이다.
2. "ZRO", "ONE", "TWO", "THR", "FOR", "FIV", "SIX", "SVN", "EGT", "NIN"
3. 0 ~ 9 의 값을 나타내는 단어가 섞여 있는 문자열을 받아 작은 수부터 차례로 정렬하여 출력하는 프로그램을 작성하라.
4. 예를 들어 입력 문자열이 "TWO NIN TWO TWO FIV FOR" 일 경우 정렬한 문자열은 "TWO TWO TWO FOR FIV NIN" 이 된다.

[입력]  
1. 입력 파일의 첫 번째 줄에는 테스트 케이스의 개수가 주어진다.
2. 그 다음 줄에 #기호와 함께 테스트 케이스의 번호가 주어지고 공백 문자 후 테스트 케이스의 길이가 주어진다.
3. 테스트 케이스의 길이란, 문자열의 글자수가 아닌 단어의 갯수를 말한다.
4. 그 다음 줄부터 바로 테스트 케이스가 주어진다. 단어와 단어 사이는 하나의 공백으로 구분하며, 문자열의 길이 N은 100≤N≤10000이다.

[출력]  
1. '#'부호와 함께 테스트 케이스의 번호를 출력하고, 공백 문자 후 정렬된 문자열을 출력한다.



In [None]:
T = int(input())

for _ in range(T):
    time, N = input().split()
    str = input().split()

    counting_sort = [0]*10

    dic_str = {'ZRO' : 0, 'ONE' : 1, 'TWO' : 2, 'THR':3, 'FOR':4, 'FIV':5, 'SIX':6, 'SVN':7, 'EGT':8, 'NIN':9}

    for i in str:
        counting_sort[dic_str[i]] += 1

    print(f'{time}')
    i = 0
    for key in dic_str.keys():
        print(counting_sort[i] * f'{key} ', end='') 
        i += 1

#1
ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO ZRO Z