## 1. 문자열 기본 연산
1. 문자열 슬라이싱
2. 대소문자 변환
3. 공백 제거


In [1]:
# 문자열 슬라이싱
s = 'Hello World'

print(s[:5]) # Hello
print(s[6:]) # World
print(s[-5:]) # World
print(s[::-1]) # dlroW olleH (역순)
print(s[::2]) # HloWrd

Hello
World
World
dlroW olleH
HloWrd


In [3]:
# 대소문자 변환

s = 'Hello World'

# 문자열 s의 모든 문자를 대문자로 변환
print(s.upper())

# 문자열 s의 모든 문자를 소문자로 변환
print(s.lower())

# 문자열 s의 대문자는 소문자로, 소문자는 대문자로 바꿔서 출력
print(s.swapcase())

# 문자열 s의 첫 글자만 대문자로, 나머지는 소문자로 변환
print(s.capitalize())

# 문자열 s의 각 단어의 첫 글자를 대문자로, 나머지는 소문자로 변환
print(s.title())


HELLO WORLD
hello world
hELLO wORLD
Hello world
Hello World


In [5]:
# 공백 제거

s = '   hello   '

# 문자열 양쪽 끝의 공백(스페이스, 탭, 줄바꿈 등)을 제거
print(s.strip())

# 문자열 왼쪽(앞쪽)의 공백만 제거
print(s.lstrip())

# 문자열 오른쪽(뒤쪽)의 공백만 제거
print(s.rstrip())

# 문자열 안의 모든 공백(" ")을 빈 문자열("")로 바꿔서 제거
print(s.replace(" ", ""))

hello
hello   
   hello
hello


## 2. 문자열 검색 & 카운팅
1. 문자 찾기
2. 문자별 카운팅

In [6]:
# 문자 찾기

s = 'banana'

# 'na'가 처음 나타나는 위치(인덱스)를 반환 — 없으면 -1을 반환
print(s.find('na'))       # 결과: 2

# 'na'가 처음 나타나는 위치(인덱스)를 반환 — 없으면 오류(ValueError) 발생
print(s.index('na'))      # 결과: 2

# 문자열 안에 'na'가 몇 번 등장하는지 개수를 셈
print(s.count('na'))      # 결과: 2

# 'na'라는 부분 문자열이 s 안에 포함되어 있는지 확인 (True/False 반환)
print('na' in s)          # 결과: True

# 문자열이 'ba'로 시작하는지 확인 (True/False 반환)
print(s.startswith('ba')) # 결과: True

# 문자열이 'na'로 끝나는지 확인 (True/False 반환)
print(s.endswith('na'))   # 결과: True

2
2
2
True
True
True


In [11]:
# 문자별 등장 횟수를 세기 위한 Counter 클래스 불러오기
from collections import Counter

s = 'banana'

# Counter 객체를 사용해 각 문자의 등장 횟수를 자동으로 세어줌
counter = Counter(s)

# 등장 횟수가 많은 순으로 2개만 출력 (문자, 개수) 형태의 리스트 반환
print(counter.most_common(2))   # 결과: [('a', 3), ('n', 2)]

# ----------------------------------------------------
# Counter를 직접 구현한 버전

freq = {}  # 문자별 빈도수를 저장할 빈 딕셔너리 생성

# 문자열의 각 문자(char)에 대해 반복
for char in s:
    # 해당 문자가 이미 있으면 +1, 없으면 기본값 0에서 +1
    freq[char] = freq.get(char, 0) + 1

print(freq)  # 결과: {'b': 1, 'a': 3, 'n': 2}


[('a', 3), ('n', 2)]
{'b': 1, 'a': 3, 'n': 2}


## 3. 문자열 분할 & 결합
1. split & join
2. 리스트를 문자열

In [16]:
# split & join

s = "apple,banana,cherry"
arr = s.split(',')
print(arr)
print(",".join(arr))

# 공백 기준으로 분할
s = "hello world python"
print(s.split())

# 최대 분할 횟수 지정
print('a-b-c-d'.split('-', 2))

['apple', 'banana', 'cherry']
apple,banana,cherry
['hello', 'world', 'python']
['a', 'b', 'c-d']


In [23]:
# 리스트를 문자열로
arr = ['H', 'e', 'l', 'l', 'o']
print("".join(arr)) # (빈 문자열)은 붙일 때 구분자(separator) 역할

nums = [1,2,3]
result = "".join(map(str, nums))
print(result)

Hello
123


## 4. 문자열 변환
1. 문자 <--> 아스키코드
2. 정렬


In [30]:
# 문자 <--> 아스키코드

print(ord('A'))    # 65
print(ord('a'))    # 97
print(chr(65))     # 'A'
print(ord('C'))  # 67

# 알파벳 순서 (0-based)
# 문자를 알파벳 순서(0부터 시작)로 바꾸는 방법
print(ord('A') - ord('A'))
print(ord('C') - ord('A')) # 67 - 65 = 2

65
97
A
67
0
2


In [34]:
# 정렬
s = "dcba"
print(sorted(s))
print("".join(sorted(s)))

# 내림차순
print("".join(sorted(s, reverse=True)))

# 커스텀 정렬
print(sorted(s, key=lambda x : (x.lower(), x)))  # 대소문자 구분 없이

['a', 'b', 'c', 'd']
abcd
dcba
['a', 'b', 'c', 'd']


### 문법 공부
`lambda x: (x.lower(), x)` 의미
- lambda는 익명 **함수를 만드는 문법**
```python
lambda x: <표현식>
```
- 위의 코드에서는
```python
lambda x: (x.lower(), x)
```
- 각 문자를 **튜플** (x.lower(), x)로 바꿔서 정렬 기준으로 사용

### lambda 예시
```python
# 일반 함수
def add(x, y):
    return x + y

print(add(2, 3))  # 5
```
---
```python
# lambda 버전
add = lambda x, y: x + y
print(add(2, 3))  # 5
```
- `lambda x, y: x + y`
  - “입력값 x와 y를 받아서 x + y를 반환하는 함수”

```python
print((lambda x, y: x + y)(2, 3))  # 5
```
- 함수 이름 없이 바로 호출 가능
---

## 5. 문자열 체크
1. 타입 확인

In [37]:
s = "Hello123"

print(s.isalpha())   # False (알파벳만)
print(s.isdigit())  # False (숫자만)
print(s.isalnum())  # True (알파벳+숫자)
print(s.isspace())   # False (공백만)
print(s.islower())   # False (소문자만)
print(s.isupper())   # False (대문자만)
print()

print("123".isdigit())
print("abc".isalpha())

False
False
True
False
False
False

True
True


## 6. 자주 나오는 패턴
1. 애너그램 체크
2. 팰린드롬 체크
3. 중복 문자 제거
4. 가장 긴 반복 문자

In [42]:
# 애너그램 체크

def is_anagram(s1, s2):
    return sorted(s1) == sorted(s2) #글자 정렬 후 비교
    # 또는
    #return Counter(s1) == Counter(s2)

is_anagram("abc",'bac')

True

In [40]:
def is_anagram(s1, s2):
    # 또는
    return Counter(s1) == Counter(s2) # 글자 등장 횟수 비교
is_anagram("abc",'daf')

False

In [48]:
# 팰린드롬 체크

def is_palindrome(s):
  return s == s[::-1] # 문자열 뒤집기

print(is_palindrome("abc"))
print(is_palindrome("Level"))
print(is_palindrome("level"))

False
False
True


In [50]:
# 대소문자·공백 무시

def is_palindrome_v2(s):
  # 1. 모두 소문자로 변환
  # 2. 문자열 안의 공백 제거
  s = s.lower().replace(" ","")
  return s == s[::-1]

is_palindrome_v2("Leve l")

True

In [52]:
# 중복 문자 제거 (순서 유지)

def remove_duplicates(s):
    seen = set() # 이미 나온 문자를 저장할 집합
    result = [] # 중복 제거된 문자를 순서대로 저장할 리스트
    for char in s:
        if char not in seen: # 아직 나온 적 없는 문자면
            seen.add(char) # 집합에 추가
            result.append(char)  # 결과 리스트에도 추가
    return "".join(result)  # 리스트를 문자열로 합쳐서 반환

s = "banana"

# 또는 dict 사용 (Python 3.7+)
"".join(dict.fromkeys(s))

'ban'

- `set()` → 빠른 중복 체크

- `result.append(char)` → 원래 순서 유지

- `"".join(result)` → 리스트를 문자열로 변환

In [53]:
 # 가장 긴 반복 문자
 # 문자열에서 같은 문자가 연속으로 반복되는 최대 길이

def longest_repeat(s):
    if not s: return 0 # 문자열이 비어있으면 반복되는 문자가 없으므로 0 반환

    # 최소 반복 길이는 1
    max_len = 1
    curr_len = 1

    # 문자 비교
    for i in range(1, len(s)):
        if s[i] == s[i-1]:
            curr_len += 1
            max_len = max(max_len, curr_len)
        else:
            curr_len = 1
    return max_len

longest_repeat("aaabbcaaaa")  # 4

4

### 문자 비교 - 부분

```python
for i in range(1, len(s)):
    if s[i] == s[i-1]:
        curr_len += 1
        max_len = max(max_len, curr_len)
    else:
        curr_len = 1
```
- 현재 문자(`s[i]`)가 이전 문자(`s[i-1]`)와 같으면 연속 길이 증가
- 다르면 연속이 끊겼으므로 현재 길이 1로 초기화
- `max_len`을 계속 갱신하며 최대 연속 길이를 저장

## 7. 데이터 처리
1. 2차원 배열
2. 배열 평탄화
3. 라스트 정렬 (다중 키)

In [58]:
matrix = [[1,2,3], [4,5,6], [7,8,9]]

# 90도 시계방향 회전
rotated = [list(row) for row in zip(*matrix[::-1])]
print(rotated)

# 90도 반시계방향 회전
rotated = [list(row) for row in zip(*matrix)][::-1]
print(rotated)

# 전치 (transpose)
transposed = [list(row) for row in zip(*matrix)]
print(rotated)

[[7, 4, 1], [8, 5, 2], [9, 6, 3]]
[[3, 6, 9], [2, 5, 8], [1, 4, 7]]
[[3, 6, 9], [2, 5, 8], [1, 4, 7]]


```python
# 예제 행렬

matrix = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]
```
위 행렬을 시각적으로 보면 ...
```text
1 2 3
4 5 6
7 8 9
```
#### 1️⃣ zip()과 * 연산자
- `*matrix` → 리스트를 풀어서 각각의 행을 인자로 zip에 전달
- `zip()` → 여러 iterable을 같은 인덱스끼리 묶어서 **튜플**로 반환

##### 예시
```python
matrix = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

list(zip(*matrix))
```
결과 : `[(1,4,7), (2,5,8), (3,6,9)]`

---

#### 2️⃣ 90도 시계방향 회전
```python
matrix = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

rotated = [list(row) for row in zip(*matrix[::-1])]

print(rotated)
```
- `matrix[::-1]` → 행 순서를 뒤집음
- `*matrix[::-1]` → 각 행을 zip으로 풀어줌
- `zip(*matrix[::-1])` → 열끼리 묶어서 새로운 행 생성
- 결과 : `[[7, 4, 1], [8, 5, 2], [9, 6, 3]]`

---
#### 3️⃣ 90도 반시계방향 회전


