In [None]:
{
 "cells": [
  {
   "cell_type": "markdown",
   "id": "21ecc6c1",
   "metadata": {},
   "source": [
    "__팁__\n",
    "- 위에서 아래로 **차례대로** 실행하세요.\n",
    "- 셀 실행: **Shift + Enter**\n",
    "- 에러가 나면 보통 **따옴표/괄호/인덱스 범위** 문제입니다."
   ]
  },
  {
   "cell_type": "markdown",
   "id": "96ddc8cb",
   "metadata": {},
   "source": [
    "# 3교시: 문자열 (Strings) — 아주 기초부터\n",
    "\n",
    "이번 시간에는 **문자열(글자)** 을 다룹니다.\n",
    "\n",
    "문자열은 생각보다 정말 많이 씁니다.\n",
    "- 이름, 문장, 파일 경로, URL, 데이터 전처리(정리) 등…\n",
    "\n",
    "\n",
    "\n",
    "---\n",
    "\n",
    "## 오늘 학습목표\n",
    "1) 문자열이 **불변(immutable)** 임을 설명하고, 수정이 필요할 때 **새 문자열 생성/재할당**으로 처리합니다.  \n",
    "2) 인덱싱/슬라이싱으로 **부분 문자열**을 정확히 추출하고, `[::-1]`, `[1::2]`, `[-5:]` 같은 패턴을 활용합니다.  \n",
    "3) 전처리에 자주 쓰는 메서드(`strip/lstrip/rstrip`, `lower/upper`, `replace`, `split`, `join`, `count`, `find`)를 **적재적소에 적용**합니다.  \n",
    "4) `find()`는 실패 시 **-1 반환**, `index()`는 실패 시 **예외 발생**을 이해하고 상황에 맞게 선택합니다.  \n",
    "5) 경로/정규표현식 등에서 **Raw 문자열**(r'...')의 필요성을 설명할 수 있습니다.\n"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "6ec30d0c",
   "metadata": {},
   "source": [
    "## 0) 문자열(String)이란?\n",
    "\n",
    "문자열은 **글자들의 모음**입니다.\n",
    "- `\"안녕하세요\"`\n",
    "- `\"Python\"`\n",
    "- `\"123\"` (이건 “숫자처럼 보이지만” 글자입니다)\n",
    "\n",
    "⚠️ 중요: `\"123\"`은 숫자 123이 아니라 **문자열**입니다.\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "c975d199",
   "metadata": {},
   "outputs": [],
   "source": [
    "s1 = \"Python\"\n",
    "s2 = \"123\"\n",
    "print(s1, type(s1))\n",
    "print(s2, type(s2))"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "6542713e",
   "metadata": {},
   "source": [
    "### 따옴표는 왜 필요할까요?\n",
    "문자열은 `\" \"` 또는 `' '`로 감싸야 합니다.\n",
    "- `\"적토마\"`\n",
    "- `'적토마'`\n",
    "\n",
    "둘은 대부분 같은 역할을 합니다(기초 단계에서는 거의 동일하게 생각하셔도 됩니다).\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "3bc1f8bf",
   "metadata": {},
   "outputs": [],
   "source": [
    "a = \"적토마\"\n",
    "b = '적토마'\n",
    "print(a, b)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "2029cb7f",
   "metadata": {},
   "source": [
    "## 1) 문자열은 불변(immutable)입니다\n",
    "\n",
    "“불변(immutable)”은 **한 번 만든 문자열은 ‘그 자리에서’ 수정할 수 없다**는 뜻입니다.\n",
    "\n",
    "예를 들어, `\"hello\"`에서 첫 글자 `h`를 `H`로 바꾸고 싶다고 해 봅시다.  \n",
    "많은 초보자분들이 아래처럼 시도합니다:\n",
    "\n",
    "```python\n",
    "word = \"hello\"\n",
    "word[0] = \"H\"   # ❌ 에러\n",
    "```\n",
    "\n",
    "왜 에러일까요?\n",
    "- 문자열은 “글자들을 담은 상자”처럼 보이지만\n",
    "- 파이썬에서는 **수정 불가능한 타입**으로 설계되어 있습니다.\n",
    "\n",
    "대신, **새 문자열을 만들어서 다시 저장(재할당)** 해야 합니다.\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "77da282a",
   "metadata": {},
   "outputs": [],
   "source": [
    "word = \"hello\"\n",
    "print(word)\n",
    "\n",
    "# 아래는 에러 예시입니다(주석을 풀면 TypeError).\n",
    "# word[0] = \"H\"\n",
    "\n",
    "print(\"에러 예시는 주석으로 막아두었습니다.\")"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "bb5fca45",
   "metadata": {},
   "source": [
    "### 1-1) 문자열을 “수정”하고 싶을 때의 정답: 새 문자열 만들기\n",
    "\n",
    "방법 예시:\n",
    "- `replace()` 사용\n",
    "- 슬라이싱으로 조합해서 새 문자열 만들기\n"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "860e24e4",
   "metadata": {},
   "source": [
    "#### ✅ 새 문자열 만들기 예제 (6개)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "c1d8316d",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 예제 1: replace로 바꾸기\n",
    "word = \"hello\"\n",
    "new_word = word.replace(\"h\", \"H\", 1)  # 첫 번째 h만 바꿈\n",
    "print(word, \"->\", new_word)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "601c4abf",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 예제 2: 슬라이싱으로 조합하기\n",
    "word = \"hello\"\n",
    "new_word = \"H\" + word[1:]\n",
    "print(word, \"->\", new_word)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "2d77b966",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 예제 3: 끝에 느낌표 붙이기\n",
    "msg = \"good\"\n",
    "msg2 = msg + \"!\"\n",
    "print(msg, \"->\", msg2)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "73bbb594",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 예제 4: 공백 제거 후 다시 저장\n",
    "text = \"   hi   \"\n",
    "text = text.strip()  # 새 문자열이 나오고, 다시 text에 저장(재할당)\n",
    "print(text)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "36d08a11",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 예제 5: 대문자로 바꾸기\n",
    "name = \"redhorse\"\n",
    "name2 = name.upper()\n",
    "print(name, \"->\", name2)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "52f27952",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 예제 6: 문자열은 그대로, 변수만 다른 값을 가리킴\n",
    "s = \"abc\"\n",
    "t = s\n",
    "t = t + \"d\"\n",
    "print(\"s:\", s)\n",
    "print(\"t:\", t)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "85db0d16",
   "metadata": {},
   "source": [
    "### 1-2) 헷갈리기 쉬운 상황(중요)\n",
    "\n",
    "`text.strip()`을 했는데, 왜 `text`가 그대로일 때가 있을까요?  \n",
    "답: `strip()`은 **새 문자열을 반환**합니다.  \n",
    "그래서 `text = text.strip()`처럼 **다시 저장**해야 합니다.\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "7f554d3e",
   "metadata": {},
   "outputs": [],
   "source": [
    "text = \"   hello   \"\n",
    "text.strip()          # 결과를 버림(저장 안 함)\n",
    "print(\"저장 안 함:\", repr(text))\n",
    "\n",
    "text = text.strip()   # 결과를 다시 저장\n",
    "print(\"저장 함:\", repr(text))"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "3fe385f6",
   "metadata": {},
   "source": [
    "## 2) 인덱싱(Indexing)과 슬라이싱(Slicing)\n",
    "\n",
    "문자열의 각 글자에는 **번호(인덱스)** 가 있습니다.\n",
    "\n",
    "예: `s = \"Python\"`\n",
    "\n",
    "- `s[0]` → `\"P\"` (첫 글자)\n",
    "- `s[1]` → `\"y\"`\n",
    "- `s[5]` → `\"n\"` (마지막 글자)\n",
    "\n",
    "그리고 뒤에서부터도 셀 수 있습니다:\n",
    "- `s[-1]` → 마지막 글자\n",
    "- `s[-2]` → 뒤에서 두 번째\n",
    "\n",
    "아래를 직접 실행해 보세요.\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "65818eec",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"Python\"\n",
    "print(\"s[0] =\", s[0])\n",
    "print(\"s[1] =\", s[1])\n",
    "print(\"s[-1] =\", s[-1])\n",
    "print(\"s[-2] =\", s[-2])"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "4d1c453b",
   "metadata": {},
   "source": [
    "### 2-1) 슬라이싱: 부분을 잘라내기\n",
    "\n",
    "슬라이싱 기본 형태:\n",
    "`문자열[start : end]`\n",
    "\n",
    "- start 포함\n",
    "- end는 포함하지 않음 (여기가 가장 헷갈립니다)\n",
    "\n",
    "예: `s = \"Python\"`  \n",
    "- `s[0:2]` → `\"Py\"` (0,1까지만)\n",
    "- `s[2:6]` → `\"thon\"`\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "5c01945b",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"Python\"\n",
    "print(s[0:2])\n",
    "print(s[2:6])\n",
    "print(s[:2])   # start 생략 = 처음부터\n",
    "print(s[2:])   # end 생략 = 끝까지"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "4557a328",
   "metadata": {},
   "source": [
    "### 2-2) step(간격)까지 포함한 슬라이싱\n",
    "\n",
    "형태:\n",
    "`문자열[start : end : step]`\n",
    "\n",
    "- step=2면 한 글자씩 건너뜁니다.\n",
    "- step=-1이면 뒤집습니다.\n",
    "\n",
    "이번 수업 목표에 나온 패턴을 직접 써 보겠습니다.\n"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "b3997aaa",
   "metadata": {},
   "source": [
    "#### ✅ 자주 쓰는 패턴 예제 (8개)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "dbad1d66",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"abcdefg\"\n",
    "print(\"[::-1] 뒤집기:\", s[::-1])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "2e44e1f7",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"abcdefg\"\n",
    "print(\"[1::2] 1번부터 2칸씩:\", s[1::2])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "d1611cec",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"abcdefg\"\n",
    "print(\"[-5:] 뒤에서 5글자:\", s[-5:])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "be174e47",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"0123456789\"\n",
    "print(\"[::2] 짝수 인덱스:\", s[::2])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "1f7dc6cd",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"0123456789\"\n",
    "print(\"[1::2] 홀수 인덱스:\", s[1::2])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "b8318e32",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"Python\"\n",
    "print(\"[::-2] 뒤에서 2칸씩:\", s[::-2])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "5c5db2ad",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"Hello, World!\"\n",
    "print(\"[7:12] 부분 추출:\", s[7:12])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "869d8804",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"Korea\"\n",
    "print(\"[0:100] end가 넘어가도 괜찮음:\", s[0:100])"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "b77c2dff",
   "metadata": {},
   "source": [
    "### 2-3) 헷갈리기 쉬운 상황(매우 중요)\n",
    "\n",
    "#### (1) end는 포함하지 않습니다\n",
    "`s[0:2]`는 0과 1까지만입니다. 2는 포함되지 않습니다.\n",
    "\n",
    "#### (2) 인덱스가 범위를 넘어가면?\n",
    "- 인덱싱 `s[999]`는 에러입니다(범위 밖).\n",
    "- 슬라이싱 `s[0:999]`는 에러가 아니라 가능한 만큼만 가져옵니다.\n",
    "\n",
    "직접 확인해 보세요.\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "81114bea",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"abc\"\n",
    "# print(s[10])  # 주석을 풀면 IndexError\n",
    "print(s[0:10])  # 슬라이싱은 안전하게 동작"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "91c6fe1a",
   "metadata": {},
   "source": [
    "## 3) 문자열 전처리(정리) 메서드\n",
    "\n",
    "실무/실습에서 문자열을 “정리”하는 일이 정말 많습니다.  \n",
    "대표적으로:\n",
    "- 앞뒤 공백 제거\n",
    "- 대소문자 통일\n",
    "- 특정 글자 바꾸기\n",
    "- 문장을 단어로 나누기(split)\n",
    "- 단어들을 다시 합치기(join)\n",
    "- 특정 단어가 몇 번 나오는지(count)\n",
    "- 특정 글자가 어디 있는지(find)\n",
    "\n",
    "아래 메서드들을 하나씩 “언제 쓰는지” 예시로 익히겠습니다.\n"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "ac48ef93",
   "metadata": {},
   "source": [
    "### 3-1) 공백 제거: `strip()`, `lstrip()`, `rstrip()`\n",
    "\n",
    "- `strip()` : 양쪽(왼쪽+오른쪽) 공백 제거\n",
    "- `lstrip()` : 왼쪽 공백만 제거\n",
    "- `rstrip()` : 오른쪽 공백만 제거\n",
    "\n",
    "#### ✅ 예제 (6개)\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "0be31c54",
   "metadata": {},
   "outputs": [],
   "source": [
    "text = \"   hello   \"\n",
    "print(\"원본:\", repr(text))\n",
    "print(\"strip:\", repr(text.strip()))\n",
    "print(\"lstrip:\", repr(text.lstrip()))\n",
    "print(\"rstrip:\", repr(text.rstrip()))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "af54c0f4",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 탭(\t)도 공백처럼 제거됩니다.\n",
    "text = \"\\t\\tHi\\t\"\n",
    "print(\"원본:\", repr(text))\n",
    "print(\"strip:\", repr(text.strip()))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "c6ab296d",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 특정 문자도 제거할 수 있습니다(양쪽에서만)\n",
    "text = \"###title###\"\n",
    "print(text.strip(\"#\"))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "f2fbeebc",
   "metadata": {},
   "outputs": [],
   "source": [
    "# (헷갈림) strip은 \"가운데\"는 못 지웁니다.\n",
    "text = \"a  b  c\"\n",
    "print(text.strip())   # 가운데 공백은 그대로"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "d9e7aef5",
   "metadata": {},
   "outputs": [],
   "source": [
    "# (자주 쓰는 패턴) split 전에 strip\n",
    "line = \"   10, 20, 30   \"\n",
    "parts = [p.strip() for p in line.strip().split(\",\")]\n",
    "print(parts)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "5398d76c",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 입력을 받을 때 빈 문자열인지 확인하는 데도 씁니다.\n",
    "s = \"   \"\n",
    "print(s.strip() == \"\")"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "9b7ebc5e",
   "metadata": {},
   "source": [
    "### 3-2) 대소문자 통일: `lower()`, `upper()`\n",
    "\n",
    "- `lower()` : 모두 소문자\n",
    "- `upper()` : 모두 대문자\n",
    "\n",
    "#### ✅ 예제 (5개)\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "044db2d0",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"PyThOn\"\n",
    "print(s.lower())\n",
    "print(s.upper())"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "3d998078",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 검색을 할 때 대소문자 무시하고 싶다면?\n",
    "text = \"Hello Python\"\n",
    "keyword = \"python\"\n",
    "print(keyword in text)            # False 가능\n",
    "print(keyword in text.lower())    # True"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "45ed6d92",
   "metadata": {},
   "outputs": [],
   "source": [
    "# (헷갈림) lower/upper도 새 문자열입니다(원본은 안 바뀜)\n",
    "s = \"ABC\"\n",
    "s.lower()\n",
    "print(s)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "eff72ab1",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"ABC\"\n",
    "s = s.lower()\n",
    "print(s)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "742d0d41",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 사용자 입력 통일(예: YES/yes/Yes 모두 처리)\n",
    "ans = input(\"yes/no 입력: \").strip().lower()\n",
    "print(\"입력 정리:\", ans)\n",
    "print(ans == \"yes\")"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "7a15860b",
   "metadata": {},
   "source": [
    "### 3-3) 바꾸기: `replace(old, new)`\n",
    "\n",
    "문자열에서 특정 부분을 다른 글자로 바꿉니다.\n",
    "\n",
    "#### ✅ 예제 (6개)\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "924fe207",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"I like apple\"\n",
    "print(s.replace(\"apple\", \"banana\"))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "30bc9749",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 여러 번 등장하면 모두 바뀝니다.\n",
    "s = \"ha ha ha\"\n",
    "print(s.replace(\"ha\", \"ho\"))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "9052d130",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 특정 문자 제거(공백 제거 등)에도 쓸 수 있습니다.\n",
    "s = \"1,234,567\"\n",
    "print(s.replace(\",\", \"\"))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "bd0a4ee2",
   "metadata": {},
   "outputs": [],
   "source": [
    "# (헷갈림) 원본은 안 바뀝니다.\n",
    "s = \"apple\"\n",
    "s.replace(\"a\", \"A\")\n",
    "print(s)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "c73fdaf7",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 다시 저장해야 합니다.\n",
    "s = \"apple\"\n",
    "s = s.replace(\"a\", \"A\")\n",
    "print(s)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "34c13be0",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 첫 번째만 바꾸고 싶으면 count 인자 사용(선택)\n",
    "s = \"banana\"\n",
    "print(s.replace(\"a\", \"A\", 1))"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "52b62204",
   "metadata": {},
   "source": [
    "### 3-4) 나누기/합치기: `split()`과 `join()`\n",
    "\n",
    "- `split()` : 문자열을 쪼개서 리스트로\n",
    "- `join()` : 리스트의 문자열을 하나로 합치기\n",
    "\n",
    "#### ✅ 예제 (8개)\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "f14f3575",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"a b c\"\n",
    "print(s.split())"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "0155b108",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"10,20,30\"\n",
    "print(s.split(\",\"))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "7cf8768d",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 쉼표 뒤 공백이 있으면?\n",
    "s = \"10, 20, 30\"\n",
    "parts = s.split(\",\")\n",
    "print(parts)\n",
    "clean = [p.strip() for p in parts]\n",
    "print(clean)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "f7fe69a5",
   "metadata": {},
   "outputs": [],
   "source": [
    "# join: 리스트를 문자열로 합치기\n",
    "words = [\"I\", \"like\", \"python\"]\n",
    "print(\" \".join(words))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "8021ee03",
   "metadata": {},
   "outputs": [],
   "source": [
    "# join: 구분자를 바꿀 수도 있습니다.\n",
    "words = [\"2026\", \"01\", \"04\"]\n",
    "print(\"/\".join(words))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "d40013f6",
   "metadata": {},
   "outputs": [],
   "source": [
    "# (헷갈림) split은 리스트, join은 문자열\n",
    "s = \"a,b,c\"\n",
    "parts = s.split(\",\")\n",
    "print(parts, type(parts))\n",
    "print(\"-\".join(parts), type(\"-\".join(parts)))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "4bce3e95",
   "metadata": {},
   "outputs": [],
   "source": [
    "# join은 리스트 요소가 \"문자열\"이어야 합니다.\n",
    "# 아래는 에러 예시입니다.\n",
    "# print(\",\".join([1, 2, 3]))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "5f7fcc0b",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 해결: 숫자는 str로 바꾼 뒤 join\n",
    "nums = [1, 2, 3]\n",
    "print(\",\".join(map(str, nums)))"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "521b3a36",
   "metadata": {},
   "source": [
    "### 3-5) 개수/위치 찾기: `count()`, `find()`\n",
    "\n",
    "- `count(sub)` : 부분 문자열이 몇 번 나오는지\n",
    "- `find(sub)` : 부분 문자열의 “처음 위치(인덱스)”를 찾습니다. 없으면 **-1**\n",
    "\n",
    "#### ✅ 예제 (7개)\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "60d8480a",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"banana\"\n",
    "print(s.count(\"a\"))\n",
    "print(s.count(\"na\"))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "88d32d52",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"Hello Python\"\n",
    "print(s.find(\"Python\"))\n",
    "print(s.find(\"Java\"))  # 없으면 -1"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "63404686",
   "metadata": {},
   "outputs": [],
   "source": [
    "# find 결과로 존재 여부 판단\n",
    "s = \"abc\"\n",
    "idx = s.find(\"d\")\n",
    "print(idx)\n",
    "print(idx == -1)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "ab975a46",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 특정 위치 이후에서 찾기(선택)\n",
    "s = \"ababa\"\n",
    "print(s.find(\"ba\", 1))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "c9d65485",
   "metadata": {},
   "outputs": [],
   "source": [
    "# (헷갈림) find는 첫 번째 위치만\n",
    "s = \"ababa\"\n",
    "print(s.find(\"ba\"))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "b844a3de",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 두 번째 위치를 찾고 싶다면: 첫 번째 위치 다음부터 다시 find\n",
    "s = \"ababa\"\n",
    "first = s.find(\"ba\")\n",
    "second = s.find(\"ba\", first + 1)\n",
    "print(first, second)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "8ecf497a",
   "metadata": {},
   "outputs": [],
   "source": [
    "# count와 find를 같이 사용하면 전처리에 도움이 됩니다.\n",
    "s = \"a,b,c,d\"\n",
    "print(\"쉼표 개수:\", s.count(\",\"))\n",
    "print(\"첫 쉼표 위치:\", s.find(\",\"))"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "ee8c0405",
   "metadata": {},
   "source": [
    "## 4) `find()` vs `index()` (중요)\n",
    "\n",
    "둘 다 “부분 문자열의 위치”를 찾는 기능이지만, 실패했을 때 행동이 다릅니다.\n",
    "\n",
    "- `find()` : 없으면 **-1**을 반환 (안전하게 분기 가능)\n",
    "- `index()` : 없으면 **에러(ValueError)** 발생\n",
    "\n",
    "언제 어떤 걸 쓰면 좋을까요?\n",
    "- “없을 수도 있다” → `find()`가 편합니다.\n",
    "- “반드시 있어야 한다(없으면 바로 문제)” → `index()`로 강하게 체크할 수 있습니다.\n"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "4c298b35",
   "metadata": {},
   "source": [
    "#### ✅ `find()`/`index()` 비교 예제 (8개)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "efbf4132",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"Hello Python\"\n",
    "print(\"find:\", s.find(\"Python\"))\n",
    "print(\"find(없음):\", s.find(\"Java\"))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "c10f061e",
   "metadata": {},
   "outputs": [],
   "source": [
    "s = \"Hello Python\"\n",
    "print(\"index:\", s.index(\"Python\"))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "c63aba43",
   "metadata": {},
   "outputs": [],
   "source": [
    "# index는 없으면 에러가 납니다(주석을 풀면 ValueError)\n",
    "# s = \"Hello Python\"\n",
    "# print(s.index(\"Java\"))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "bdf46aad",
   "metadata": {},
   "outputs": [],
   "source": [
    "# find는 없을 때 -1이므로 if로 처리 가능\n",
    "s = \"Hello Python\"\n",
    "pos = s.find(\"Java\")\n",
    "if pos == -1:\n",
    "    print(\"없습니다!\")\n",
    "else:\n",
    "    print(\"위치:\", pos)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "485149a2",
   "metadata": {},
   "outputs": [],
   "source": [
    "# index를 안전하게 쓰려면 try/except를 씁니다.\n",
    "s = \"Hello Python\"\n",
    "try:\n",
    "    pos = s.index(\"Java\")\n",
    "    print(\"위치:\", pos)\n",
    "except ValueError:\n",
    "    print(\"index: 찾지 못했습니다!\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "146b53f7",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 실전 예시: 이메일에서 @ 위치 찾기\n",
    "email = \"abc@gmail.com\"\n",
    "at = email.find(\"@\")\n",
    "print(\"at 위치:\", at)\n",
    "print(\"아이디:\", email[:at])\n",
    "print(\"도메인:\", email[at+1:])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "cc501b36",
   "metadata": {},
   "outputs": [],
   "source": [
    "# (헷갈림) find는 0도 가능한 값입니다!\n",
    "# 찾은 위치가 0이면 '찾았다'입니다. -1만 '못 찾았다'입니다.\n",
    "s = \"abc\"\n",
    "print(s.find(\"a\"))  # 0\n",
    "print(s.find(\"z\"))  # -1"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "57dd66e5",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 그래서 if pos: 같은 식으로 쓰면 안 됩니다(0이 False처럼 취급될 수 있음)\n",
    "s = \"abc\"\n",
    "pos = s.find(\"a\")  # 0\n",
    "if pos:\n",
    "    print(\"찾음(잘못된 판단 가능)\")\n",
    "else:\n",
    "    print(\"pos가 0이라서 else로 갑니다(실제로는 찾았는데!)\")\n",
    "\n",
    "# 올바른 판단:\n",
    "if pos != -1:\n",
    "    print(\"올바르게: 찾았습니다!\")"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "046a8b0c",
   "metadata": {},
   "source": [
    "## 5) Raw 문자열: `r'...'` (경로/정규표현식에서 특히 중요)\n",
    "\n",
    "문자열에는 “이스케이프 문자(escape)”가 있습니다.\n",
    "예:\n",
    "- `\\n` : 줄바꿈\n",
    "- `\\t` : 탭\n",
    "- `\\\\` : 역슬래시 자체를 의미\n",
    "\n",
    "문제는 “경로”에서 역슬래시 `\\`를 많이 쓴다는 점입니다(특히 Windows).\n",
    "\n",
    "예를 들어, 아래 문자열은 보기엔 경로 같지만 실제로는:\n",
    "- `\\n`이 줄바꿈으로 해석되어 문제가 생길 수 있습니다.\n",
    "\n",
    "그래서 Raw 문자열 `r'...'`를 쓰면:\n",
    "- 역슬래시를 특별하게 해석하지 않고 “그대로” 취급합니다.\n"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "b46bb461",
   "metadata": {},
   "source": [
    "#### ✅ Raw 문자열 예제 (8개)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "e44b93a2",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 일반 문자열: \\n이 줄바꿈으로 해석될 수 있습니다.\n",
    "path = \"C:\\new\\test\"\n",
    "print(path)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "052c9068",
   "metadata": {},
   "outputs": [],
   "source": [
    "# Raw 문자열: 역슬래시를 그대로 취급합니다.\n",
    "path = r\"C:\\new\\test\"\n",
    "print(path)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "70cdaf8f",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 비교를 위해 repr로 확인해 보기\n",
    "print(repr(\"C:\\new\\test\"))\n",
    "print(repr(r\"C:\\new\\test\"))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "a064b2e9",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 정규표현식에서도 자주 씁니다(정규표현식은 다음에 배워도 됨)\n",
    "pattern1 = \"\\d+\"   # 숫자 1개 이상(\\d) 같은 표현\n",
    "pattern2 = r\"\\d+\"   # raw로 쓰면 더 간단\n",
    "print(pattern1, pattern2)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "7a0709f5",
   "metadata": {},
   "outputs": [],
   "source": [
    "# (헷갈림) Raw 문자열이어도 문자열 끝을 \\로 끝내면 문제가 됩니다(고급)\n",
    "# r\"C:\\new\\\"  # 마지막이 \\로 끝나면 파이썬 문법상 애매해져서 에러가 날 수 있습니다.\n",
    "print(\"끝이 \\\\로 끝나는 raw 문자열은 주의가 필요합니다.\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "ed27048b",
   "metadata": {},
   "outputs": [],
   "source": [
    "# URL은 보통 /라서 raw가 꼭 필요하진 않지만, 특수문자 처리엔 도움이 될 수 있습니다.\n",
    "url = \"https://example.com/a/b\"\n",
    "print(url)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "b175f310",
   "metadata": {},
   "outputs": [],
   "source": [
    "# (헷갈림) \\t는 탭입니다.\n",
    "print(\"A\\tB\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "56be4277",
   "metadata": {},
   "outputs": [],
   "source": [
    "# raw로 쓰면 탭이 아니라 문자 그대로 \\t 입니다.\n",
    "print(r\"A\\tB\")"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "41bbcacc",
   "metadata": {},
   "source": [
    "## 6) 미니 프로젝트: “문장 정리기” 만들기\n",
    "\n",
    "### 목표\n",
    "사용자에게 문장을 입력받아, 아래를 출력하는 프로그램을 만드세요.\n",
    "\n",
    "1) 양쪽 공백 제거(앞뒤)\n",
    "2) 모두 소문자로 바꾸기\n",
    "3) 쉼표 `,`를 공백으로 바꾸기\n",
    "4) 단어 개수 출력 (힌트: split)\n",
    "5) 특정 단어(예: `\"python\"`)가 포함되어 있는지 확인 (대소문자 무시)\n",
    "\n",
    "아래 셀을 완성해 보세요.\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "46bc21d4",
   "metadata": {},
   "outputs": [],
   "source": [
    "text = input(\"문장을 입력하세요: \")\n",
    "\n",
    "# TODO 1: 공백 제거\n",
    "# TODO 2: 소문자 변환\n",
    "# TODO 3: 쉼표를 공백으로 바꾸기\n",
    "# TODO 4: 단어 리스트 만들기(split) + 단어 개수 출력\n",
    "# TODO 5: python 포함 여부 출력\n",
    "\n"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "abe7e6f2",
   "metadata": {},
   "source": [
    "---\n",
    "## (정답 예시) — 스스로 푼 뒤에만 보세요\n",
    "\n",
    "정답은 여러 방식이 있을 수 있습니다. 아래는 “가능한 예시”입니다.\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "b2d18713",
   "metadata": {},
   "outputs": [],
   "source": [
    "# 불변 + 재할당 예시\n",
    "s = \"python\"\n",
    "s = s[0].upper() + s[1:]\n",
    "print(s)  # Python\n",
    "\n",
    "# 슬라이싱 예시\n",
    "t = \"abcdef\"\n",
    "print(t[1:4])  # bcd\n",
    "print(t[::-1]) # fedcba\n",
    "\n",
    "# 전처리 예시\n",
    "line = \"  10, 20, 30  \"\n",
    "nums = [int(x.strip()) for x in line.strip().split(\",\")]\n",
    "print(nums, sum(nums))\n",
    "\n",
    "# find/index 예시\n",
    "email = \"abc@gmail.com\"\n",
    "at = email.find(\"@\")\n",
    "if at != -1:\n",
    "    print(email[:at], email[at+1:])\n",
    "\n",
    "# raw 문자열 예시\n",
    "path = r\"C:\\new\\test\"\n",
    "print(path)"
   ]
  },
  {
   "cell_type": "markdown",
   "id": "dc1de156",
   "metadata": {},
   "source": [
    "## 오늘 정리 체크리스트\n",
    "\n",
    "- [ ] 문자열은 불변(immutable)이라서, 바꾸려면 **새 문자열을 만들어 재할당**해야 합니다.  \n",
    "- [ ] 인덱싱/슬라이싱으로 부분 문자열을 정확히 뽑을 수 있습니다.  \n",
    "- [ ] `strip/lower/replace/split/join/count/find`를 전처리에 맞게 사용할 수 있습니다.  \n",
    "- [ ] `find`는 실패 시 -1, `index`는 실패 시 예외라는 차이를 알고 선택할 수 있습니다.  \n",
    "- [ ] Raw 문자열 `r'...'`는 역슬래시가 많은 경로/정규표현식에서 유용합니다.\n",
    "\n",
    "이제 1~3교시까지 배우면, 간단한 입력 처리와 문자열 전처리를 할 수 있게 됩니다.\n"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "name": "python3"
  },
  "language_info": {
   "name": "python",
   "version": "3.x"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}