# 📅 Class 2. Lexical Structure & Literal System

## 📋 학습 목표

1. Token의 4가지 종류를 구분하고 설명할 수 있다
2. 모든 종류의 `Literal`을 작성하고 활용할 수 있다
3. Python의 명명 규칙을 이해하고 PEP 8을 적용할 수 있다
4. `tokenize` 모듈을 사용하여 코드를 파싱할 수 있다


## 🕐 1. Token의 종류와 구분

### 1.1 Token복습

**Token**: 코드를 이루는 가장 작은 의미 있는 단위

**비유**:

```
자연어 문장을 단어로 나누듯이
"나는 파이썬을 공부한다" → [나는] [파이썬을] [공부한다]

프로그래밍 코드를 Token으로 나눔
"x = 10 + 5" → [x] [=] [10] [+] [5]
```

**Token의 역할**:

- Lexical Analysis(어휘 분석) 단계에서 생성
- Syntax Analysis(구문 분석)의 기본 단위
- 프로그램 구조를 이해하는 첫 단계


### 1.2 Token의 4가지 종류

```
┌─────────────────────────────────────┐
│          Token 분류                 │
├─────────────────────────────────────┤
│ 1. Keyword (키워드)                 │
│    - Python이 예약한 특별한 단어     │
│    - 예: if, for, def, class        │
├─────────────────────────────────────┤
│ 2. Identifier (식별자)              │
│    - 프로그래머가 만드는 이름        │
│    - 예: 변수명, 함수명, 클래스명    │
├─────────────────────────────────────┤
│ 3. Literal (리터럴)                 │
│    - 코드에 직접 쓰인 값            │
│    - 예: 42, "Hello", [1, 2, 3]     │
├─────────────────────────────────────┤
│ 4. Operator/Delimiter               │
│    - 연산과 구조를 나타내는 기호     │
│    - 예: +, -, =, (), [], {}        │
└─────────────────────────────────────┘
```


In [1]:
# Token 확인하기
import tokenize
import io

code = "x = 10 + 5"
tokens = tokenize.generate_tokens(io.StringIO(code).readline)

print("=== Token 분석 ===")
print(f"코드: {code}")
print("\nToken 목록:")

for token in tokens:
  if token.type not in [tokenize.ENCODING, tokenize.ENDMARKER]:
    print(f"  {tokenize.tok_name[token.type]:10} : '{token.string}'")

=== Token 분석 ===
코드: x = 10 + 5

Token 목록:
  NAME       : 'x'
  OP         : '='
  NUMBER     : '10'
  OP         : '+'
  NUMBER     : '5'
  NEWLINE    : ''


### 1.3 Keyword (예약어)

#### 📌 Keyword의 정의

**Keyword**: Python이 특별한 용도로 미리 정의한 단어

**특징**:

- 총 35개 (Python 3.10+)
- **변수명, 함수명으로 사용 불가**
- 대소문자 구분 (if는 키워드, If는 아님)


In [2]:
# Python의 모든 Keyword 확인
import keyword

print("=== Python Keywords ===")
print(f"총 개수: {len(keyword.kwlist)}개\n")

# 분류별로 출력
categories = {
    '제어 흐름': ['if', 'elif', 'else', 'for', 'while', 'break', 'continue', 'pass'],
    '함수/클래스': ['def', 'class', 'return', 'yield', 'lambda'],
    '논리 연산': ['and', 'or', 'not', 'is', 'in'],
    '예외 처리': ['try', 'except', 'finally', 'raise', 'assert'],
    '모듈': ['import', 'from', 'as'],
    '기타': ['del', 'global', 'nonlocal', 'with', 'async', 'await', 'True', 'False', 'None']
}

for category, keywords in categories.items():
  print(f"{category}:")
  for kw in keywords:
    print(f"  - {kw}")
  print()

=== Python Keywords ===
총 개수: 35개

제어 흐름:
  - if
  - elif
  - else
  - for
  - while
  - break
  - continue
  - pass

함수/클래스:
  - def
  - class
  - return
  - yield
  - lambda

논리 연산:
  - and
  - or
  - not
  - is
  - in

예외 처리:
  - try
  - except
  - finally
  - raise
  - assert

모듈:
  - import
  - from
  - as

기타:
  - del
  - global
  - nonlocal
  - with
  - async
  - await
  - True
  - False
  - None



#### 🆕 Hard Keyword vs Soft Keyword

**Hard Keyword** (강성 키워드):

- 어디서든 키워드로만 동작
- 변수명으로 절대 사용 불가
- 예: if, for, def

**Soft Keyword** (연성 키워드, Python 3.10+):

- 특정 문맥에서만 키워드
- 다른 곳에서는 변수명 가능
- 예: match, case, \_


In [None]:
# Keyword 확인
print("=== Keyword 체크 ===")
print(f"'if'는 키워드? {keyword.iskeyword('if')}")
print(f"'If'는 키워드? {keyword.iskeyword('If')}")
print(f"'print'는 키워드? {keyword.iskeyword('print')}")
print()

# Soft Keyword
print("=== Soft Keyword ===")
print(f"'match'는 키워드? {keyword.iskeyword('match')}")
print(f"'match'는 Soft 키워드? {keyword.issoftkeyword('match')}")
print()

# Soft Keyword는 변수명으로 사용 가능
match = "문자열 매칭"  # ✅ 가능
print(f"match 변수: {match}")
print()

# Hard Keyword는 불가능
# if = 10  # ❌ SyntaxError!
print("Hard Keyword는 변수명으로 사용 불가")

### 1.4 Identifier (식별자)

#### 🏷️ Identifier의 정의

**Identifier**: 프로그래머가 만드는 이름

**사용처**:

- 변수명: age, total_price
- 함수명: calculate, get_user_info
- 클래스명: Person, BankAccount
- 모듈명: utils, database


#### 📏 명명 규칙 (Rules - 필수)

**반드시 지켜야 하는 규칙**:

1. **사용 가능 문자**: 영문자(a-z, A-Z), 숫자(0-9), 언더스코어(\_)
2. **첫 글자**: 영문자 또는 \_ (숫자 불가)
3. **Keyword 금지**: 예약어 사용 불가
4. **대소문자 구분**: Name과 name은 다름
5. **특수문자 금지**: @, #, $, % 등 사용 불가


In [None]:
# 올바른 Identifier
print("=== 올바른 Identifier ===")

age = 25                  # ✅
user_name = "Alice"       # ✅
_temp = 100               # ✅
count2 = 5                # ✅
MyClass = type('MyClass', (), {})  # ✅

print(f"age: {age}")
print(f"user_name: {user_name}")
print(f"_temp: {_temp}")
print(f"count2: {count2}")
print()

# 잘못된 Identifier (주석 처리)
print("=== 잘못된 Identifier ===")
# 2age = 10          # ❌ 숫자로 시작
# user-name = "x"    # ❌ 하이픈 사용
# for = 10           # ❌ 키워드 사용
# my var = 20        # ❌ 공백 포함
print("위 예시들은 모두 SyntaxError 발생")

#### 🎨 명명 관례 (Convention - 권장)

**PEP 8 스타일 가이드**:

| 대상     | 관례       | 예시                          |
| -------- | ---------- | ----------------------------- |
| 변수명   | snake_case | user_age, total_count         |
| 함수명   | snake_case | calculate_total(), get_info() |
| 클래스명 | PascalCase | Person, BankAccount           |
| 상수     | UPPER_CASE | MAX_SIZE, PI                  |
| 모듈명   | snake_case | utils.py, database.py         |
| Private  | \_leading  | \_internal_var                |
| Magic    | **double** | \_\_init\_\_, \_\_str\_\_     |


In [None]:
# PEP 8 명명 관례
print("=== PEP 8 명명 관례 ===")
print()

# 변수 - snake_case
user_age = 25
total_price = 1000
print(f"변수: user_age={user_age}, total_price={total_price}")

# 함수 - snake_case


def calculate_total(price, quantity):
  return price * quantity


print(f"함수: calculate_total(100, 5) = {calculate_total(100, 5)}")

# 클래스 - PascalCase


class UserAccount:
  def __init__(self, name):
    self.name = name


user = UserAccount("Bob")
print(f"클래스: UserAccount, 인스턴스 이름: {user.name}")

# 상수 - UPPER_CASE
MAX_SIZE = 1000
PI = 3.14159
print(f"상수: MAX_SIZE={MAX_SIZE}, PI={PI}")

### 1.5 Operator와 Delimiter

#### ⚙️ Operator (연산자)

| 분류   | 연산자                   | 예시              |
| ------ | ------------------------ | ----------------- |
| 산술   | +, -, \*, /, //, %, \*\* | 2 + 3, 5 \*\* 2   |
| 비교   | ==, !=, >, <, >=, <=     | x > 5, a == b     |
| 논리   | and, or, not             | x and y, not flag |
| 할당   | =, +=, -=, \*=, /=       | x = 10, x += 5    |
| 비트   | &, \|, ^, ~, <<, >>      | 5 & 3, 1 << 2     |
| 멤버십 | in, not in               | 'a' in 'abc'      |
| 동일성 | is, is not               | x is None         |

#### 🔗 Delimiter (구분자)

| 구분자 | 용도            | 예시                  |
| ------ | --------------- | --------------------- |
| ()     | 함수 호출, 튜플 | print(), (1, 2)       |
| []     | 리스트, 인덱싱  | [1, 2, 3], arr[0]     |
| {}     | 딕셔너리, 집합  | {'a': 1}, {1, 2}      |
| :      | 코드 블록 시작  | if x:, def func():    |
| ,      | 요소 구분       | (1, 2, 3), func(a, b) |
| .      | 속성 접근       | obj.method()          |


In [None]:
# Operator와 Delimiter 예시
print("=== Operator 예시 ===")
x = 10  # = (할당)
y = x + 5  # + (산술)
is_positive = x > 0  # > (비교)
result = (x > 5) and (y < 20)  # and (논리)

print(f"x = {x}")
print(f"y = x + 5 = {y}")
print(f"x > 0 = {is_positive}")
print(f"(x > 5) and (y < 20) = {result}")
print()

print("=== Delimiter 예시 ===")
my_list = [1, 2, 3]  # [] 리스트
my_tuple = (4, 5, 6)  # () 튜플
my_dict = {'a': 1, 'b': 2}  # {} 딕셔너리, : 키-값 구분

print(f"list: {my_list}")
print(f"tuple: {my_tuple}")
print(f"dict: {my_dict}")
print(f"dict['a'] = {my_dict['a']}")

---

## 🕑 2. Literal 심화

### 2.1 Literal이란?

**Literal**: 코드에 직접 작성된 고정된 값

```python
x = 42      # 42는 Literal
name = "Alice"  # "Alice"는 Literal
pi = 3.14   # 3.14는 Literal
```

**Literal vs 변수**:

- Literal: 값 자체
- 변수: 값을 가리키는 이름


### 2.2 Numeric Literals

#### 🔢 Integer Literals

**표기법**:

- 10진수: 42, 1_000_000
- 2진수: 0b1010, 0b1111_0000
- 8진수: 0o12, 0o755
- 16진수: 0xA, 0xFF, 0x1A2B


In [None]:
# Integer Literals
print("=== Integer Literals ===")
print()

# 10진수
decimal = 42
large = 1_000_000  # 언더스코어로 가독성 향상
print(f"10진수: {decimal}, {large:,}")

# 2진수 (0b)
binary = 0b1010
print(f"2진수 0b1010 = {binary}")

# 8진수 (0o)
octal = 0o12
print(f"8진수 0o12 = {octal}")

# 16진수 (0x)
hexadecimal = 0xA
hex_ff = 0xFF
print(f"16진수 0xA = {hexadecimal}, 0xFF = {hex_ff}")
print()

# 진법 변환
number = 255
print(f"10진수 {number}를 다른 진법으로:")
print(f"  2진수: {bin(number)}")
print(f"  8진수: {oct(number)}")
print(f"  16진수: {hex(number)}")

#### 🔢 Float Literals

**표기법**:

- 일반: 3.14, 0.5, 5.0
- 과학적: 1e10, 1.5e-3, 2.5E6


In [None]:
# Float Literals
import math
print("=== Float Literals ===")
print()

# 일반 표기법
pi = 3.14
half = 0.5
five = 5.0
print(f"일반 표기: {pi}, {half}, {five}")

# 과학적 표기법
large = 1e10  # 1 × 10^10
small = 1.5e-3  # 1.5 × 10^-3
print(f"1e10 = {large}")
print(f"1.5e-3 = {small}")
print()

# 부동소수점 오차 주의!
print("부동소수점 오차:")
result = 0.1 + 0.2
print(f"0.1 + 0.2 = {result}")
print(f"0.1 + 0.2 == 0.3? {result == 0.3}")
print()

# 해결법
print(f"round(0.1 + 0.2, 1) == 0.3? {round(result, 1) == 0.3}")
print(f"math.isclose(0.1 + 0.2, 0.3)? {math.isclose(result, 0.3)}")

#### 🔢 Complex Literals

**표기법**:

- 1+2j, 3.14+0j, -5j
- complex(1, 2)


In [None]:
# Complex Literals
print("=== Complex Literals ===")
print()

c1 = 1+2j
c2 = complex(3, 4)
print(f"1+2j = {c1}")
print(f"complex(3, 4) = {c2}")
print()

# 복소수 연산
result = c1 + c2
print(f"{c1} + {c2} = {result}")
print()

# 복소수 속성
c = 3+4j
print(f"c = {c}")
print(f"  실수부: {c.real}")
print(f"  허수부: {c.imag}")
print(f"  켤레: {c.conjugate()}")
print(f"  절댓값: {abs(c)}")

### 2.3 String Literals

#### 📝 기본 표기법

- 작은따옴표: 'Hello'
- 큰따옴표: "Hello"
- 삼중따옴표: '''Hello''', """Hello"""


In [None]:
# String Literals 기본
print("=== String Literals ===")
print()

# 따옴표 종류
str1 = 'single'
str2 = "double"
str3 = '''triple
multi-line'''

print(f"작은따옴표: {str1}")
print(f"큰따옴표: {str2}")
print(f"삼중따옴표:\n{str3}")
print()

# 따옴표 혼용
str4 = "It's a beautiful day"
str5 = 'He said "Hello"'
print(f"혼용1: {str4}")
print(f"혼용2: {str5}")

#### 🔤 특수 문자열 접두사

1. **r-string (Raw)**: 이스케이프 무시
2. **f-string (Formatted)**: 변수 삽입
3. **b-string (Bytes)**: 바이트 문자열


In [None]:
# 특수 문자열 접두사
print("=== 특수 문자열 접두사 ===")
print()

# r-string (Raw)
normal = 'C:\\Users\\name'
raw = r'C:\Users\name'
print(f"일반: {normal}")
print(f"Raw: {raw}")
print()

# f-string (Formatted)
name = "Alice"
age = 25
greeting = f"이름: {name}, 나이: {age}"
print(f"f-string: {greeting}")
print(f"계산: 10 + 5 = {10 + 5}")
print()

# b-string (Bytes)
byte_str = b'Hello'
print(f"Bytes: {byte_str}")
print(f"타입: {type(byte_str)}")
print(f"디코드: {byte_str.decode('utf-8')}")

#### 🔡 Escape Sequences

| 시퀀스 | 의미       |
| ------ | ---------- |
| \n     | 줄바꿈     |
| \t     | 탭         |
| \\     | 백슬래시   |
| \'     | 작은따옴표 |
| \"     | 큰따옴표   |


In [None]:
# Escape Sequences
print("=== Escape Sequences ===")
print()

# 줄바꿈
print("첫 줄\n두 번째 줄\n세 번째 줄")
print()

# 탭
print("이름\t나이\t직업")
print("Alice\t25\t개발자")
print()

# 따옴표
print("He said \"Hello\"")
print('It\'s a beautiful day')

### 2.4 Boolean & None Literals

**Boolean**: True, False (첫 글자 대문자 필수)
**None**: 값이 없음을 나타냄


In [None]:
# Boolean & None
print("=== Boolean & None ===")
print()

# Boolean
is_active = True
is_valid = False
print(f"is_active: {is_active}")
print(f"is_valid: {is_valid}")
print()

# Truthy/Falsy
print("Truthy/Falsy:")
print(f"  bool(0) = {bool(0)}")
print(f"  bool(1) = {bool(1)}")
print(f"  bool('') = {bool('')}")
print(f"  bool('text') = {bool('text')}")
print()

# None
result = None
print(f"result = {result}")
print(f"result is None? {result is None}")
print(f"bool(None) = {bool(None)}")

### 2.5 Container Literals


In [None]:
# Container Literals
print("=== Container Literals ===")
print()

# List
my_list = [1, 2, 3]
print(f"List: {my_list}")

# Tuple
my_tuple = (1, 2, 3)
single = (42,)  # 1개 요소는 쉼표 필수!
print(f"Tuple: {my_tuple}")
print(f"1개 Tuple: {single}")

# Set
my_set = {1, 2, 3}
print(f"Set: {my_set}")

# Dict
my_dict = {'a': 1, 'b': 2}
print(f"Dict: {my_dict}")
print()

# 빈 컨테이너 주의!
empty_list = []
empty_tuple = ()
empty_set = set()  # {}는 딕셔너리!
empty_dict = {}

print("빈 컨테이너:")
print(f"  list: {empty_list}")
print(f"  tuple: {empty_tuple}")
print(f"  set: {empty_set}")
print(f"  dict: {empty_dict}")

---

## 🕒 3. Code Tokenization

### 3.1 tokenize 모듈 실전


In [None]:
# tokenize 모듈 실습
import tokenize
import io

code = "x = 42"
tokens = tokenize.generate_tokens(io.StringIO(code).readline)

print("=== Token 상세 분석 ===")
print(f"코드: {code}\n")

for token in tokens:
  print(f"Token:")
  print(f"  type: {tokenize.tok_name[token.type]}")
  print(f"  string: '{token.string}'")
  print(f"  start: {token.start}")
  print(f"  end: {token.end}")
  print()

In [None]:
# 복잡한 코드 분석
complex_code = """
def calculate(price, quantity):
    total = price * quantity
    return total
"""

print("=== 복잡한 코드 Token 분석 ===")
print("코드:")
print(complex_code)
print("\nToken 목록:")

tokens = tokenize.generate_tokens(io.StringIO(complex_code).readline)

for token in tokens:
  if token.type not in [tokenize.ENCODING, tokenize.ENDMARKER, tokenize.NL]:
    token_type = tokenize.tok_name[token.type]
    print(f"{token_type:12} : '{token.string}'")

### 3.2 PEP 8 스타일 가이드

#### 📏 주요 규칙

1. **들여쓰기**: 공백 4개
2. **한 줄 길이**: 최대 79자
3. **빈 줄**: 함수/클래스 사이 2줄
4. **공백**: 연산자 양쪽, 쉼표 뒤


In [None]:
# PEP 8 예시
print("=== PEP 8 스타일 ===")
print()

# ✅ 좋은 코드


def calculate_total(price, quantity):
  """총액 계산"""
  result = price * quantity
  return result


class UserAccount:
  """사용자 계정"""

  def __init__(self, name, age):
    self.name = name
    self.age = age


# 상수
MAX_SIZE = 1000
PI = 3.14159

print("PEP 8 준수 코드 작성 완료")

### 3.3 코드 스타일 도구

#### 🛠️ 추천 도구

1. **pylint**: 코드 품질 검사

   ```bash
   pylint my_script.py
   ```

2. **flake8**: PEP 8 검사

   ```bash
   flake8 my_script.py
   ```

3. **black**: 자동 포매팅
   ```bash
   black my_script.py
   ```


---

## 💻 실습 과제

### 과제 1: Keyword 마스터 (10점)


In [None]:
# 과제 1: Keyword 완전 정복
import keyword

# TODO: 모든 Keyword를 분류별로 정리하여 출력
# TODO: Hard/Soft Keyword 구분

pass

### 과제 2: Literal 종합 실습 (15점)


In [None]:
# 과제 2: 모든 Literal 작성

# TODO 1: Integer (10진, 2진, 8진, 16진)
integers = [10, 0b1010, 0o12, 0xA, 1_000_000]

# TODO 2: Float (일반, 과학적 표기)
floats = []

# TODO 3: String (일반, raw, f-string)
strings = []

# TODO 4: Container (list, tuple, set, dict)
containers = []

pass

### 과제 3: Token 분석기 (20점)


In [None]:
# 과제 3: Token 분석 프로그램
import tokenize
import io
from collections import Counter


def analyze_code(code):
  """코드를 분석하여 Token 통계 출력"""
  # TODO: Token 타입별 개수
  # TODO: Keyword 목록
  # TODO: Identifier 목록
  pass


test_code = """
def add(a, b):
    return a + b

result = add(10, 5)
"""

analyze_code(test_code)

### 과제 4: PEP 8 검사기 (15점)


In [None]:
# 과제 4: 간단한 PEP 8 검사기

def check_pep8(code):
  """PEP 8 위반 사항 검사"""
  issues = []

  # TODO: 줄 길이 체크 (79자)
  # TODO: 들여쓰기 체크 (4의 배수)
  # TODO: 명명 규칙 체크

  return issues


bad_code = """
def CalculateTotal(Price,Quantity):
   Total=Price*Quantity
   return Total
"""

check_pep8(bad_code)

---

## 🤔 토론 주제

### 1. Python은 왜 Keyword가 35개밖에 안 될까?

## **여러분의 생각:**

-

### 2. Soft Keyword의 장단점은?

## **장점:**

- **단점:**

-
-

### 3. f-string은 Literal인가 Expression인가?

## **여러분의 의견:**

-


---

## ✅ 체크리스트

- [ ] Token의 4가지 종류를 구분할 수 있다
- [ ] 모든 Keyword를 나열할 수 있다
- [ ] Hard/Soft Keyword를 구분할 수 있다
- [ ] Identifier 명명 규칙을 안다
- [ ] PEP 8 관례를 적용할 수 있다
- [ ] 모든 Literal을 작성할 수 있다
- [ ] 진법 변환을 할 수 있다
- [ ] f-string을 사용할 수 있다
- [ ] tokenize 모듈을 사용할 수 있다


---

## 📚 참고 자료

### 필수
- [Keywords](https://dsaint31.tistory.com/510)
- [Literal](https://dsaint31.tistory.com/462)
- [Type Summary](https://dsaint31.tistory.com/515)

### 권장
- [PEP 8](https://www.python.org/dev/peps/pep-0008/)
- [Naming Convention](http://ds31x.blogspot.com/2023/07/etc-naming-convention.html)

---

## 🎉 수고하셨습니다!

**다음 주 예고: Expression & Statement**
