__팁__
- 위에서 아래로 **차례대로** 실행하세요.
- 셀 실행: **Shift + Enter**
- 에러가 나면 보통 **따옴표/괄호/인덱스 범위** 문제입니다.

# 3교시: 문자열 (Strings) — 아주 기초부터

이번 시간에는 **문자열(글자)** 을 다룹니다.

문자열은 생각보다 정말 많이 씁니다.
- 이름, 문장, 파일 경로, URL, 데이터 전처리(정리) 등…



---

## 오늘 학습목표
1) 문자열이 **불변(immutable)** 임을 설명하고, 수정이 필요할 때 **새 문자열 생성/재할당**으로 처리합니다.  
2) 인덱싱/슬라이싱으로 **부분 문자열**을 정확히 추출하고, `[::-1]`, `[1::2]`, `[-5:]` 같은 패턴을 활용합니다.  
3) 전처리에 자주 쓰는 메서드(`strip/lstrip/rstrip`, `lower/upper`, `replace`, `split`, `join`, `count`, `find`)를 **적재적소에 적용**합니다.  
4) `find()`는 실패 시 **-1 반환**, `index()`는 실패 시 **예외 발생**을 이해하고 상황에 맞게 선택합니다.  


## 0) 문자열(String)이란?

문자열은 **글자들의 모음**입니다.
- `"안녕하세요"`
- `"Python"`
- `"123"` (이건 “숫자처럼 보이지만” 글자입니다)

⚠️ 중요: `"123"`은 숫자 123이 아니라 **문자열**입니다.


In [1]:
s1 = "Python"
s2 = "123"
print(s1, type(s1))
print(s2, type(s2))

Python <class 'str'>
123 <class 'str'>


### 따옴표는 왜 필요할까요?
문자열은 `" "` 또는 `' '`로 감싸야 합니다.
- `"적토마"`
- `'적토마'`

둘은 대부분 같은 역할을 합니다(기초 단계에서는 거의 동일하게 생각하셔도 됩니다).


In [2]:
a = "적토마"
b = '적토마'
print(a, b)


적토마 적토마


In [4]:
c = "적토마"

## 1) 문자열은 불변(immutable)입니다

“불변(immutable)”은 **한 번 만든 문자열은 ‘그 자리에서’ 수정할 수 없다**는 뜻입니다.

예를 들어, `"hello"`에서 첫 글자 `h`를 `H`로 바꾸고 싶다고 해 봅시다.  
많은 초보자분들이 아래처럼 시도합니다:

```python
word = "hello"
word[0] = "H"   # ❌ 에러
```

왜 에러일까요?
- 문자열은 “글자들을 담은 상자”처럼 보이지만
- 파이썬에서는 **수정 불가능한 타입**으로 설계되어 있습니다.

대신, **새 문자열을 만들어서 다시 저장(재할당)** 해야 합니다.


In [7]:
word = "hello"
word = "Hello"

In [None]:
word = "hello"
print(word)

# 아래는 에러 예시입니다(주석을 풀면 TypeError).
# word[0] = "H"

print("에러 예시는 주석으로 막아두었습니다.")

### 1-1) 문자열을 “수정”하고 싶을 때의 정답: 새 문자열 만들기

방법 예시:
- `replace()` 사용
- 슬라이싱으로 조합해서 새 문자열 만들기


In [16]:
x = "abcdef"


print(x[0:3]) #0번째(포함o)~3번째(포함x) #abc
print(x[:3])

print(x[0:4]) #0번째(포함o)~4번째(포함x) #abcd
print(x[:4])

print(x[1:3])  #1번째(포함o)~3번째(포함x) # bc

print(x[1:]) #1번째(포함o)~마지막까지 #bcdef

abc
abc
abcd
abcd
bc
bcdef


#### ✅ 새 문자열 만들기 예제 (6개)

In [9]:
# 예제 1: replace로 바꾸기
word = "hellohhhh"
new_word = word.replace("h", "H", 2)  # 첫 번째 h만 바꿈
print(word, "->", new_word)

hellohhhh -> HelloHhhh


In [17]:
# 예제 2: 슬라이싱으로 조합하기
word = "hello"
new_word = "H" + word[1:]
print(word, "->", new_word)

hello -> Hello


In [18]:
# 예제 3: 끝에 느낌표 붙이기
msg = "good"
msg2 = msg + "!"
print(msg, "->", msg2)

good -> good!


In [22]:
# 예제 4: 공백 제거 후 다시 저장
text = "   hi   "
text.strip()
#text = text.strip()  # "hi"
print(text)

   hi   


In [23]:
# 예제 5: 대문자로 바꾸기
name = "redhorse"
name2 = name.upper()
print(name, "->", name2)

redhorse -> REDHORSE


In [24]:
# 예제 6: 문자열은 그대로, 변수만 다른 값을 가리킴
s = "abc"
t = s
t = t + "d"
print("s:", s)
print("t:", t)

s: abc
t: abcd


### 1-2) 헷갈리기 쉬운 상황(중요)

`text.strip()`을 했는데, 왜 `text`가 그대로일 때가 있을까요?  
답: `strip()`은 **새 문자열을 반환**합니다.  
그래서 `text = text.strip()`처럼 **다시 저장**해야 합니다.


In [None]:
text = "   hello   "
text.strip()          # 결과를 버림(저장 안 함)
print("저장 안 함:", repr(text))

text = text.strip()   # 결과를 다시 저장
print("저장 함:", repr(text))

## 2) 인덱싱(Indexing)과 슬라이싱(Slicing)

문자열의 각 글자에는 **번호(인덱스)** 가 있습니다.

예: `s = "Python"`

- `s[0]` → `"P"` (첫 글자)
- `s[1]` → `"y"`
- `s[5]` → `"n"` (마지막 글자)

그리고 뒤에서부터도 셀 수 있습니다:
- `s[-1]` → 마지막 글자
- `s[-2]` → 뒤에서 두 번째

아래를 직접 실행해 보세요.


In [25]:
s = "Python"
print("s[0] =", s[0])
print("s[1] =", s[1])
print("s[-1] =", s[-1])
print("s[-2] =", s[-2])

s[0] = P
s[1] = y
s[-1] = n
s[-2] = o


### 2-1) 슬라이싱: 부분을 잘라내기

슬라이싱 기본 형태:
`문자열[start : end]`

- start 포함
- end는 포함하지 않음 (여기가 가장 헷갈립니다)

예: `s = "Python"`  
- `s[0:2]` → `"Py"` (0,1까지만)
- `s[2:6]` → `"thon"`


In [26]:
s = "Python"
print(s[0:2])
print(s[2:6])
print(s[:2])   # start 생략 = 처음부터
print(s[2:])   # end 생략 = 끝까지

Py
thon
Py
thon


### 2-2) step(간격)까지 포함한 슬라이싱

형태:
`문자열[start : end : step]`

- step=2면 한 글자씩 건너뜁니다.
- step=-1이면 뒤집습니다.

이번 수업 목표에 나온 패턴을 직접 써 보겠습니다.


In [29]:
x = "abcdefghijklmnop"
print(x[0:-1:2])

acegikmo


#### ✅ 자주 쓰는 패턴 예제 (8개)

In [30]:
s = "abcdefg" #[start:end:step]
print("[::-1] 뒤집기:", s[::-1])

[::-1] 뒤집기: gfedcba


In [31]:
s = "abcdefg" #[start:end:step]
print("[1::2] 1번부터 2칸씩:", s[1::2])

[1::2] 1번부터 2칸씩: bdf


In [None]:
s = "abcdefg"#[start:end:step]
print("[-5:] 뒤에서 5글자:", s[-5:])

In [None]:
s = "0123456789"#[start:end:step]
print("[::2] 짝수 인덱스:", s[::2])

In [None]:
s = "0123456789"#[start:end:step]
print("[1::2] 홀수 인덱스:", s[1::2])

In [None]:
s = "Python"#[start:end:step]
print("[::-2] 뒤에서 2칸씩:", s[::-2])

In [None]:
s = "Hello, World!" #[start:end:step]
print("[7:12] 부분 추출:", s[7:12])

In [None]:
s = "Korea"#[start:end:step]
print("[0:100] end가 넘어가도 괜찮음:", s[0:100])

### 2-3) 헷갈리기 쉬운 상황(매우 중요)

#### (1) end는 포함하지 않습니다
`s[0:2]`는 0과 1까지만입니다. 2는 포함되지 않습니다.

#### (2) 인덱스가 범위를 넘어가면?
- 인덱싱 `s[999]`는 에러입니다(범위 밖).
- 슬라이싱 `s[0:999]`는 에러가 아니라 가능한 만큼만 가져옵니다.

직접 확인해 보세요.


In [None]:
s = "abc"
# print(s[10])  # 주석을 풀면 IndexError
print(s[0:10])  # 슬라이싱은 안전하게 동작

## 3) 문자열 전처리(정리) 메서드

실무/실습에서 문자열을 “정리”하는 일이 정말 많습니다.  
대표적으로:
- 앞뒤 공백 제거
- 대소문자 통일
- 특정 글자 바꾸기
- 문장을 단어로 나누기(split)
- 단어들을 다시 합치기(join)
- 특정 단어가 몇 번 나오는지(count)
- 특정 글자가 어디 있는지(find)

아래 메서드들을 하나씩 “언제 쓰는지” 예시로 익히겠습니다.


### 3-1) 공백 제거: `strip()`, `lstrip()`, `rstrip()`

- `strip()` : 양쪽(왼쪽+오른쪽) 공백 제거
- `lstrip()` : 왼쪽 공백만 제거
- `rstrip()` : 오른쪽 공백만 제거

#### ✅ 예제 (6개)


In [None]:
text = "   hello   "
print("원본:", repr(text))
print("strip:", repr(text.strip()))
print("lstrip:", repr(text.lstrip()))
print("rstrip:", repr(text.rstrip()))

In [None]:
# 탭(	)도 공백처럼 제거됩니다.
text = "\t\tHi\t"
print("원본:", repr(text))
print("strip:", repr(text.strip()))

In [None]:
# 특정 문자도 제거할 수 있습니다(양쪽에서만)
text = "###title###"
print(text.strip("#"))

In [None]:
# (헷갈림) strip은 "가운데"는 못 지웁니다.
text = "a  b  c"
print(text.strip())   # 가운데 공백은 그대로

In [None]:
# (자주 쓰는 패턴) split 전에 strip
line = "   10, 20, 30   "
parts = [p.strip() for p in line.strip().split(",")]
print(parts)

In [None]:
# 입력을 받을 때 빈 문자열인지 확인하는 데도 씁니다.
s = "   "
print(s.strip() == "")

### 3-2) 대소문자 통일: `lower()`, `upper()`

- `lower()` : 모두 소문자
- `upper()` : 모두 대문자

#### ✅ 예제 (5개)


In [None]:
s = "PyThOn"
print(s.lower())
print(s.upper())

In [None]:
# 검색을 할 때 대소문자 무시하고 싶다면?
text = "Hello Python"
keyword = "python"
print(keyword in text)            # False 가능
print(keyword in text.lower())    # True

In [None]:
# (헷갈림) lower/upper도 새 문자열입니다(원본은 안 바뀜)
s = "ABC"
s.lower()
print(s)

In [None]:
s = "ABC"
s = s.lower()
print(s)

In [None]:
# 사용자 입력 통일(예: YES/yes/Yes 모두 처리)
ans = input("yes/no 입력: ").strip().lower()
print("입력 정리:", ans)
print(ans == "yes")

### 3-3) 바꾸기: `replace(old, new)`

문자열에서 특정 부분을 다른 글자로 바꿉니다.

#### ✅ 예제 (6개)


In [None]:
s = "I like apple"
print(s.replace("apple", "banana"))

In [None]:
# 여러 번 등장하면 모두 바뀝니다.
s = "ha ha ha"
print(s.replace("ha", "ho"))

In [None]:
# 특정 문자 제거(공백 제거 등)에도 쓸 수 있습니다.
s = "1,234,567"
print(s.replace(",", ""))

In [None]:
# (헷갈림) 원본은 안 바뀝니다.
s = "apple"
s.replace("a", "A")
print(s)

In [None]:
# 다시 저장해야 합니다.
s = "apple"
s = s.replace("a", "A")
print(s)

In [None]:
# 첫 번째만 바꾸고 싶으면 count 인자 사용(선택)
s = "banana"
print(s.replace("a", "A", 1))

### 3-4) 나누기/합치기: `split()`과 `join()`

- `split()` : 문자열을 쪼개서 리스트로
- `join()` : 리스트의 문자열을 하나로 합치기

#### ✅ 예제 (8개)


In [None]:
s = "a b c"
print(s.split())

In [None]:
s = "10,20,30"
print(s.split(","))

In [None]:
# 쉼표 뒤 공백이 있으면?
s = "10, 20, 30"
parts = s.split(",")
print(parts)
clean = [p.strip() for p in parts]
print(clean)

In [None]:
# join: 리스트를 문자열로 합치기
words = ["I", "like", "python"]
print(" ".join(words))

In [None]:
# join: 구분자를 바꿀 수도 있습니다.
words = ["2026", "01", "04"]
print("/".join(words))

In [None]:
# (헷갈림) split은 리스트, join은 문자열
s = "a,b,c"
parts = s.split(",")
print(parts, type(parts))
print("-".join(parts), type("-".join(parts)))

In [None]:
# join은 리스트 요소가 "문자열"이어야 합니다.
# 아래는 에러 예시입니다.
# print(",".join([1, 2, 3]))

In [None]:
# 해결: 숫자는 str로 바꾼 뒤 join
nums = [1, 2, 3]
print(",".join(map(str, nums)))

### 3-5) 개수/위치 찾기: `count()`, `find()`

- `count(sub)` : 부분 문자열이 몇 번 나오는지
- `find(sub)` : 부분 문자열의 “처음 위치(인덱스)”를 찾습니다. 없으면 **-1**

#### ✅ 예제 (7개)


In [None]:
s = "banana"
print(s.count("a"))
print(s.count("na"))

In [None]:
s = "Hello Python"
print(s.find("Python"))
print(s.find("Java"))  # 없으면 -1

In [None]:
# find 결과로 존재 여부 판단
s = "abc"
idx = s.find("d")
print(idx)
print(idx == -1)

In [None]:
# 특정 위치 이후에서 찾기(선택)
s = "ababa"
print(s.find("ba", 1))

In [None]:
# (헷갈림) find는 첫 번째 위치만
s = "ababa"
print(s.find("ba"))

In [None]:
# 두 번째 위치를 찾고 싶다면: 첫 번째 위치 다음부터 다시 find
s = "ababa"
first = s.find("ba")
second = s.find("ba", first + 1)
print(first, second)

In [None]:
# count와 find를 같이 사용하면 전처리에 도움이 됩니다.
s = "a,b,c,d"
print("쉼표 개수:", s.count(","))
print("첫 쉼표 위치:", s.find(","))

## 6) 미니 프로젝트: “문장 정리기” 만들기

### 목표
사용자에게 문장을 입력받아, 아래를 출력하는 프로그램을 만드세요.

1) 양쪽 공백 제거(앞뒤)
2) 모두 소문자로 바꾸기
3) 쉼표 `,`를 공백으로 바꾸기

아래 셀을 완성해 보세요.


In [None]:
text = input("문장을 입력하세요: ")

# TODO 1: 공백 제거
# TODO 2: 소문자 변환
# TODO 3: 쉼표를 공백으로 바꾸기



---
## (정답 예시) — 스스로 푼 뒤에만 보세요

정답은 여러 방식이 있을 수 있습니다. 아래는 “가능한 예시”입니다.


In [None]:
# 불변 + 재할당 예시
s = "python"
s = s[0].upper() + s[1:]
print(s)  # Python

# 슬라이싱 예시
t = "abcdef"
print(t[1:4])  # bcd
print(t[::-1]) # fedcba


## 오늘 정리 체크리스트

- [ ] 문자열은 불변(immutable)이라서, 바꾸려면 **새 문자열을 만들어 재할당**해야 합니다.  
- [ ] 인덱싱/슬라이싱으로 부분 문자열을 정확히 뽑을 수 있습니다.  
- [ ] `strip/lower/replace/split/join/count/find`를 전처리에 맞게 사용할 수 있습니다.  
- [ ] `find`는 실패 시 -1, `index`는 실패 시 예외라는 차이를 알고 선택할 수 있습니다.  

