# 📅 Class 2. Lexical Structure & Literal System

## 📋 학습 목표

1. Token의 4가지 종류를 구분하고 설명할 수 있다
2. 모든 종류의 Literal을 작성하고 활용할 수 있다
3. Python의 명명 규칙을 이해하고 PEP 8을 적용할 수 있다
4. `tokenize` 모듈을 사용하여 코드를 파싱할 수 있다


## 🕐 1. Token의 종류와 구분

### 1.1 Token 복습

**Token**: 코드를 이루는 가장 작은 의미 있는 단위

```
문장을 단어로 나누듯이
"나는 파이썬을 공부한다" → [나는] [파이썬을] [공부한다]

코드를 Token으로 나눔
"x = 10 + 5" → [x] [=] [10] [+] [5]
```


### 1.2 Token의 4가지 종류

```
┌─────────────────────────────────────┐
│          Token의 분류               │
├─────────────────────────────────────┤
│ 1. Keyword (키워드)                 │
│    - Python이 미리 정한 특별한 단어  │
│    - 예: if, for, def, class        │
├─────────────────────────────────────┤
│ 2. Identifier (식별자)              │
│    - 우리가 만드는 이름             │
│    - 예: 변수명, 함수명, 클래스명    │
├─────────────────────────────────────┤
│ 3. Literal (리터럴)                 │
│    - 코드에 직접 쓴 값              │
│    - 예: 10, 3.14, "Hello"          │
├─────────────────────────────────────┤
│ 4. Operator/Delimiter (연산자/구분자)│
│    - 연산/구조를 나타내는 기호      │
│    - 예: +, -, =, (), [], {}        │
└─────────────────────────────────────┘
```


In [2]:
# 예제 코드로 Token 종류 구분하기

def calculate_total(price, quantity):  # def, calculate_total, price, quantity 등
  total = price * quantity           # total, =, *, 등
  return total                       # return


result = calculate_total(100, 5)       # result, =, 100, 5 등
print(f"Total: {result}")              # print, "Total: ", result 등

# 각 Token이 어떤 종류인지 생각해보세요!

Total: 500


### 1.3 Keyword (키워드/예약어)

**Keyword**: Python이 특별한 용도로 미리 예약한 단어

- 언어의 핵심 기능을 구성
- **변수명/함수명으로 사용 불가** (대소문자 구분)
- (참고) 최신 버전에서 개수는 약간 달라질 수 있음


In [3]:
import keyword

print("=== Python Keyword 목록 ===")
print(f"총 개수: {len(keyword.kwlist)}개\n")

# 5개씩 깔끔하게 출력
for i in range(0, len(keyword.kwlist), 5):
  group = keyword.kwlist[i:i+5]
  print("  ".join(f"{kw:12}" for kw in group))

=== Python Keyword 목록 ===
총 개수: 35개

False         None          True          and           as          
assert        async         await         break         class       
continue      def           del           elif          else        
except        finally       for           from          global      
if            import        in            is            lambda      
nonlocal      not           or            pass          raise       
return        try           while         with          yield       


#### Hard Keyword vs Soft Keyword (3.10+)

- **Hard Keyword**: 어떤 문맥에서도 키워드 (예: `if`, `for`, `def`)
- **Soft Keyword**: 특정 문맥에서만 키워드, 그 밖에서는 식별자로 사용 가능 (예: `match`, `case`, `_`)


In [None]:
import keyword

print("=== Soft Keyword 체크 ===")
for w in ["match", "case", "_", "async", "await"]:
  print(f"{w:>6}  | iskeyword? {keyword.iskeyword(w)}  | issoftkeyword? {keyword.issoftkeyword(w)}")

# Soft keyword는 일반 문맥에서 변수명으로 사용 가능
match = "문자열 매칭"  # ✅ (match-case 문 밖)
case = "케이스"        # ✅
print("\n변수로 사용한 예:", match, case)

# match-case 문에서는 키워드로 동작
value = 2
match value:              # 여기서는 match / case 가 키워드
  case 1:
    print("값은 1")
  case 2:
    print("값은 2")
  case _:
    print("그 외")

### 1.4 Identifier (식별자)

**Identifier**: 프로그래머가 정의하는 이름 (변수/함수/클래스/모듈 등)

**규칙 (Rules)**

1. 사용 가능한 문자: 영문자/숫자/언더스코어 `_`
2. 첫 글자는 영문자 혹은 `_` (숫자 불가)
3. **Keyword 금지**
4. 대소문자 구분
5. 특수문자/공백 금지


In [None]:
# 올바른 식별자 예시
age = 25
user_name = "Alice"
total_price = 1000
_temp = 100
count1 = 5

print(age, user_name, total_price, _temp, count1)

# 잘못된 식별자는 주석으로만 예시
# 2age = 10        # ❌ 숫자로 시작
# user-name = "x"  # ❌ 하이픈
# for = 10         # ❌ 키워드
# my var = 10      # ❌ 공백

### 1.5 Operator & Delimiter 요약

- **산술**: `+ - * / // % **`
- **비교**: `== != < <= > >=`
- **논리**: `and or not`
- **할당**: `= += -= *= /=`
- **비트**: `& | ^ ~ << >>`
- **멤버십/동일성**: `in not in`, `is is not`
- **구분자**: `() [] {} : , . ;`


In [None]:
# Operator & Delimiter 예시
x = 10
y = x + 5
is_equal = (x == 10)
result = (x > 5) and (y < 20)

my_list = [1, 2, 3]
my_tuple = (4, 5, 6)
my_dict = {'a': 1, 'b': 2}

print(x, y, is_equal, result)
print(my_list, my_tuple, my_dict, my_dict['a'])

---

## 🕑 2. Literal 심화

**Literal**: 코드에 직접 작성된 '값 그 자체'  
예) `10`, `"Alice"`, `3.14`, `True`, `None`, `[1,2,3]`


### 2.2 Numeric Literals — Integers

**10진수/2진수/8진수/16진수** 및 언더스코어로 가독성 높이기


In [None]:
print("=== Integer Literals ===\n")

# 10진수
decimal = 42
large_number = 1_000_000
print(f"10진수: {decimal}")
print(f"큰 수 (언더스코어): {large_number}")
print()

# 2진수
binary = 0b1010
binary2 = 0b1111_0000
print(f"2진수 0b1010: {binary}")
print(f"2진수 0b1111_0000: {binary2}")
print()

# 8진수
octal = 0o12
octal2 = 0o755
print(f"8진수 0o12: {octal}")
print(f"8진수 0o755: {octal2}")
print()

# 16진수
hexadecimal = 0xA
hexadecimal2 = 0xFF
hexadecimal3 = 0x1A2B
print(f"16진수 0xA: {hexadecimal}")
print(f"16진수 0xFF: {hexadecimal2}")
print(f"16진수 0x1A2B: {hexadecimal3}")

In [None]:
# 진법 변환 도구
print("=== 진법 변환 ===\n")
number = 255
print(f"10진수: {number}")
print(f"2진수: {bin(number)}")
print(f"8진수: {oct(number)}")
print(f"16진수: {hex(number)}")
print()

print("=== 문자열 → 정수 변환 ===")
print(f"int('1010', 2): {int('1010', 2)}")
print(f"int('12', 8): {int('12', 8)}")
print(f"int('FF', 16): {int('FF', 16)}")

### Float / Scientific Notation


In [None]:
import math
print("=== Float Literals ===\n")
pi = 3.14
half = .5
five = 5.
print(pi, half, five)

print("\n=== 과학적 표기법 ===")
large = 1e10
small = 1.5e-3
medium = 2.5E6
print(large, small, medium)

print("\n=== 부동소수점 주의 ===")
print(0.1 + 0.2)
print((0.1 + 0.2) == 0.3)
print("round:", round(0.1 + 0.2, 1) == 0.3)
print("isclose:", math.isclose(0.1 + 0.2, 0.3))

### Complex Literals


In [None]:
print("=== Complex Literals ===\n")
c1 = 1+2j
c2 = 3.14+0j
c3 = -5j
c4 = complex(1, 2)
print(c1, c2, c3, c4)

print("\n연산/속성:")
a = 1+2j
b = 3+4j
print("a+b =", a+b, " a*b =", a*b)
c = 3+4j
print("real/imag:", c.real, c.imag, " conjugate:",
      c.conjugate(), " abs:", abs(c))

### 2.3 String Literals (문자열) — 기본/Raw/f-string/Bytes


In [None]:
print("=== String 기본 ===")
str1 = 'Hello, World!'
str2 = "Hello, Python!"
str3 = "It's a beautiful day"
str4 = 'He said "Hello"'
print(str1)
print(str2)
print(str3)
print(str4)

print("\n=== 여러 줄 (삼중따옴표) ===")
multiline = '''첫 번째 줄
두 번째 줄
세 번째 줄'''
print(multiline)

print("\n=== 특수 접두사 ===")
normal_path = 'C:\\Users\\name'
raw_path = r'C:\Users\name'
print("일반:", normal_path)
print("Raw :", raw_path)

normal_escape = "\\n은 줄바꿈"
raw_escape = r"\n은 줄바꿈"
print(normal_escape)
print(raw_escape)

name = "Alice"
age = 25
f_msg = f"이름: {name}, 나이: {age}, 2+3={2+3}"
print("\nf-string:", f_msg)

byte_str = b'Hello'
print("bytes:", byte_str, type(byte_str), "->", byte_str.decode("utf-8"))

#### Escape Sequences


In [None]:
print("=== Escape Sequences ===")
print("첫 줄\n둘째 줄")
print("이름\t나이\t직업")
print('He said \"Hi\" / It\'s OK')
print("경로: C:\\Users\\Documents")
print("Loading...\rDone!")

### 2.4 Boolean / 2.5 None


In [None]:
print("=== Boolean ===")
is_active = True
is_valid = False
print(is_active, is_valid, 10 > 5, 'a' == 'b')
print(True and False, True or False, not True)

print("\nTruthy/Falsy 예시")
print(bool(0), bool(1), bool(''), bool('x'), bool([]), bool([1]))

print("\n=== None ===")
result = None
print(result, type(None), bool(None))


def no_return():
  pass


print("함수 기본 반환:", no_return())
print("is None:", (result is None))

### 2.6 Container Literals — list/tuple/set/dict


In [None]:
print("=== List ===")
empty_list = []
numbers = [1, 2, 3, 4, 5]
mixed = [1, 'two', 3.0, True, None]
nested = [[1, 2], [3, 4], [5, 6]]
numbers[0] = 10
print(empty_list, numbers, mixed, nested)

print("\n=== Tuple ===")
empty_tuple = ()
coordinates = (10, 20)
single = (42,)
not_tuple = (42)
print(empty_tuple, coordinates, single, type(
    single), not_tuple, type(not_tuple))
rgb = 255, 128, 0
print("packing tuple:", rgb)

print("\n=== Set ===")
empty_set = set()
numbers = {1, 2, 3, 4, 5}
duplicates = {1, 2, 2, 3, 3, 3}
letters = {'c', 'a', 'b'}
a = {1, 2, 3}
b = {3, 4, 5}
print(empty_set, numbers, duplicates, letters)
print("합집합/교집합/차집합:", a | b, a & b, a-b)

print("\n=== Dict ===")
empty_dict = {}
person = {'name': 'Alice', 'age': 25, 'city': 'Seoul'}
mixed_keys = {'string_key': 1, 42: 'number_key', (1, 2): 'tuple_key'}
print(empty_dict, person, mixed_keys)
print(f"이름: {person['name']}")
print(f"나이: {person.get('age')}")

nested_dict = {'user1': {'name': 'Alice', 'age': 25},
               'user2': {'name': 'Bob', 'age': 30}}
print(f"중첩 딕셔너리: {nested_dict}")
print(f"user1 이름: {nested_dict['user1']['name']}")

---

## 🕒 3. 실습 - Code Tokenization

### 3.1 `tokenize` 모듈 기본/심화


In [None]:
# tokenize 모듈 기본 사용법
import tokenize
import io

code = "x = 42"
tokens = tokenize.generate_tokens(io.StringIO(code).readline)

print("=== Token 구조 분석 ===")
print(f"코드: {code}\n")

for token in tokens:
  print(f"Token 객체: {token}")
  print(f"  type: {token.type} ({tokenize.tok_name[token.type]})")
  print(f"  string: '{token.string}'")
  print(f"  start: {token.start}")
  print(f"  end: {token.end}\n")

In [None]:
# 더 복잡한 코드 분석
complex_code = """
def calculate_total(price, quantity):
    total = price * quantity
    return total
"""

print("=== 복잡한 코드의 Token 분석 ===")
print("코드:")
print(complex_code)
print("\nToken 분석 결과:")
print("=" * 70)

tokens = tokenize.generate_tokens(io.StringIO(complex_code).readline)

for token in tokens:
  if token.type not in [tokenize.ENCODING, tokenize.ENDMARKER]:
    token_type = tokenize.tok_name[token.type]
    print(f"{token_type:12} | '{token.string:20}' | 위치: {token.start}")

In [None]:
# Token 타입별 분류/통계
from collections import Counter


def analyze_tokens(code: str):
  """코드의 Token을 타입별로 분류하고 통계를 반환"""
  tokens = tokenize.generate_tokens(io.StringIO(code).readline)
  token_types = []
  token_strings = []
  for token in tokens:
    if token.type not in {
        tokenize.ENCODING, tokenize.ENDMARKER,
        tokenize.NEWLINE, tokenize.NL, tokenize.INDENT, tokenize.DEDENT
    }:
      token_types.append(tokenize.tok_name[token.type])
      token_strings.append(token.string)
  return token_types, token_strings


test_code = "result = (10 + 5) * 2"
types, strings = analyze_tokens(test_code)

print("=== Token 분석 결과 ===")
print(f"코드: {test_code}\n")
print("Token 목록:")
for t, s in zip(types, strings):
  print(f"  {t:10} : '{s}'")
print()
print("Token 타입 통계:")
for token_type, count in Counter(types).items():
  print(f"  {token_type:10} : {count}개")

### 3.2 Keyword 완전 정복


In [1]:
import keyword

print("=== Python Keyword 분류(예시) ===")
keyword_categories = {
    '제어 흐름': ['if', 'elif', 'else', 'for', 'while', 'break', 'continue', 'pass'],
    '함수/클래스': ['def', 'class', 'return', 'yield', 'lambda'],
    '논리/멤버십/동일성': ['and', 'or', 'not', 'is', 'in'],
    '예외 처리': ['try', 'except', 'finally', 'raise', 'assert'],
    '모듈': ['import', 'from', 'as'],
    '변수 범위': ['global', 'nonlocal'],
    '컨텍스트': ['with'],
    '비동기': ['async', 'await'],
    '리터럴': ['True', 'False', 'None'],
    '패턴매칭': ['match', 'case', '_']
}
for category, kws in keyword_categories.items():
  print(f"\n{category}:")
  for kw in kws:
    soft = " (Soft)" if keyword.issoftkeyword(kw) else ""
    print(f"  - {kw}{soft}")

=== Python Keyword 분류(예시) ===

제어 흐름:
  - if
  - elif
  - else
  - for
  - while
  - break
  - continue
  - pass

함수/클래스:
  - def
  - class
  - return
  - yield
  - lambda

논리/멤버십/동일성:
  - and
  - or
  - not
  - is
  - in

예외 처리:
  - try
  - except
  - finally
  - raise
  - assert

모듈:
  - import
  - from
  - as

변수 범위:
  - global
  - nonlocal

컨텍스트:
  - with

비동기:
  - async
  - await

리터럴:
  - True
  - False
  - None

패턴매칭:
  - match (Soft)
  - case (Soft)
  - _ (Soft)


In [None]:
# Keyword 사용 스니펫
print("=== Keyword 사용 예제 ===\n")

print("1) 제어 흐름 if/elif/else")
score = 85
if score >= 90:
  print(" A 학점")
elif score >= 80:
  print(" B 학점")
else:
  print(" C 이하")
print()

print("2) 함수/람다/클래스/return")
def greet(name): return f"Hello, {name}!"


def square(x): return x**2


print(greet("Python"), " / square(5) =", square(5))
print()

print("3) 논리/멤버십/동일성")
x = 10
print((x > 5) and (x < 15), 'a' in 'abc', None is None)
print()

print("4) 예외 처리")
try:
  r = 10/2
  print(" ok", r)
except ZeroDivisionError:
  print(" not ok")
finally:
  print(" always")

### 3.3 PEP 8 스타일 가이드 실전


In [None]:
print("=== PEP 8 핵심 규칙 ===")


def example_function():
  if True:
    print("공백 4개 들여쓰기")


long_string = (
    "이것은 매우 긴 문자열입니다. "
    "여러 줄로 나눠서 작성합니다."
)


class MyClass:
  def method1(self): pass
  def method2(self): pass


def my_function(): pass


print("규칙 예시 출력 완료")

In [None]:
print("=== PEP 8 명명 규칙 ===")
user_name = "Alice"
total_count = 100
is_active = True
def calculate_total(): return 100
def get_user_info(): return {}


class UserAccount:
    pass


class BankTransaction:
    pass


MAX_SIZE = 1000
DEFAULT_TIMEOUT = 30
PI = 3.14159
print("변수/함수/클래스/상수 예시 OK")

In [None]:
print("=== 공백 규칙 ===")
result = 10 + 5  # 연산자 양옆 공백
def func(a, b, c): return a + b + c


my_list = [1, 2, 3]
my_dict = {'a': 1, 'b': 2}
print("공백 규칙 예시 OK")

### 3.4 코드 스타일 체크 도구 (설치 필요)

- **pylint**: 코드 품질 검사
- **flake8**: PEP 8 위반 검사
- **black**: 자동 포매팅
- **autopep8**: PEP 8 자동 수정


In [None]:
print("=== 사용 예 (터미널) ===")
print("pylint my_script.py")
print("flake8 my_script.py")
print("black my_script.py")
print("autopep8 --in-place --aggressive my_script.py")

bad_code = """
def badFunction( x,y ):
    result=x+y
    return result
"""

good_code = """
def good_function(x, y):
    result = x + y
    return result
"""

print("\n[Bad]\n", bad_code)
print("[Good]\n", good_code)

---

## 💻 실습 과제


### 과제 1: Keyword 마스터 (10점)


In [None]:
import keyword

print("=== 과제 1: Keyword 목록/Soft 여부 출력 ===")
for kw in sorted(set(keyword.kwlist + ['match', 'case', '_'])):
  print(f"{kw:>8} | soft? {keyword.issoftkeyword(kw)}")


def check_keyword(word: str):
  """단어가 키워드/소프트키워드인지 체크"""
  print(f"{word:>8} | keyword={keyword.iskeyword(word)} | soft={keyword.issoftkeyword(word)}")


for w in ['if', 'If', 'print', 'match', 'def', 'function']:
  check_keyword(w)

### 과제 2: Literal 실습 (15점)


In [None]:
print("=== 과제 2-1: Integer Literal ===")
decimal_num = 100
binary_num = 0b1100100
octal_num = 0o144
hex_num = 0x64
large_num = 100_000_000
print(decimal_num, binary_num, octal_num, hex_num, f"{large_num:,}")

print("\n=== 과제 2-2: String Literal ===")
multiline = """여러 줄
문자열
입니다"""
file_path = r"C:\Windows\System32"
name, age = "Alice", 25
greeting = f"안녕하세요 {name}님, {age}살이시군요!"
formatted_text = "이름\t나이\nAlice\t25"
print(multiline, file_path, greeting, formatted_text, sep="\n")

print("\n=== 과제 2-3: Container Literal ===")
student = {"name": "Jay", "age": 23, "scores": [95, 88, 91]}
coordinates = (1.0, 2.5, -3.2)
unique_numbers = {1, 2, 2, 3, 4}
matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
print(student, coordinates, unique_numbers, matrix, sep="\n")

### 과제 3: Token 분석 프로젝트 (20점)


In [None]:
import tokenize
import io
from collections import Counter


def advanced_token_analyzer(code: str):
  tokens = list(tokenize.generate_tokens(io.StringIO(code).readline))
  total = len(tokens)
  types = [tokenize.tok_name[t.type] for t in tokens]
  type_counts = Counter(types)
  keywords = [t.string for t in tokens if t.type ==
              tokenize.NAME and t.string in __import__('keyword').kwlist]
  identifiers = [t.string for t in tokens if t.type ==
                 tokenize.NAME and t.string not in __import__('keyword').kwlist]
  literals = [t.string for t in tokens if t.type in (
      tokenize.NUMBER, tokenize.STRING)]
  print("총 Token 수:", total)
  print("타입별 개수:", dict(type_counts))
  print("키워드:", sorted(set(keywords)))
  print("식별자:", sorted(set(identifiers)))
  print("리터럴:", literals)


test_code = """
def calculate_area(radius):
    pi = 3.14159
    area = pi * radius ** 2
    return area

result = calculate_area(5)
print(f"Area: {result}")
"""
advanced_token_analyzer(test_code)

### 과제 4: PEP 8 코드 리팩토링 (15점)


In [None]:
bad_code = """
def CalculateTotal(Price,Quantity,discount):
    Total=Price*Quantity
    if discount>0:
        Total=Total-Total*discount/100
    return Total

class userAccount:
    def __init__( self,name,age ):
        self.Name=name
        self.Age=age
    def GetInfo(self):
        return self.Name,self.Age

MyUser=userAccount('alice',25)
name,age=MyUser.GetInfo()
PRICE=100
qty=5
total=CalculateTotal(PRICE,qty,10)
"""

good_code = """
def calculate_total(price, quantity, discount=0):
    total = price * quantity
    if discount > 0:
        total = total - total * discount / 100
    return total

class UserAccount:
    def __init__(self, name, age):
        self.name = name
        self.age = age

    def get_info(self):
        return self.name, self.age

my_user = UserAccount('alice', 25)
name, age = my_user.get_info()
PRICE = 100
QTY = 5
total = calculate_total(PRICE, QTY, 10)
"""

print("=== 수정 전 (Bad) ===\n", bad_code)
print("\n=== 수정 후 (Good) ===\n", good_code)

---

## 🤔 토론 주제

1. Python의 키워드 수가 비교적 적은 이유는? 장/단점은?
2. Soft Keyword의 장단점과 경험 공유
3. f-string은 Literal인가 Expression인가? (둘 다 관점 존재)


## ✅ 체크리스트

- [ ] Token의 4가지 종류 설명 가능
- [ ] 모든 Literal (Numeric/String/Boolean/None/Container) 작성 가능
- [ ] PEP 8 핵심 규칙 적용 가능
- [ ] `tokenize`로 코드 분해/통계 가능


## 📚 참고 자료

- PEP 8: https://www.python.org/dev/peps/pep-0008/
- Python Lexical Analysis: https://docs.python.org/3/reference/lexical_analysis.html
- `tokenize` 모듈: https://docs.python.org/3/library/tokenize.html
