In [None]:
# 딕셔너리 관련

In [1]:
a = {'name': 'pey', 'phone': '010-9999-1234', 'birth': '1118'}


In [2]:
a.keys()

dict_keys(['name', 'phone', 'birth'])

In [3]:
a.values()

dict_values(['pey', '010-9999-1234', '1118'])

In [4]:
list(a.keys())

['name', 'phone', 'birth']

In [5]:
list(a.values())

['pey', '010-9999-1234', '1118']

In [6]:
a.items()

dict_items([('name', 'pey'), ('phone', '010-9999-1234'), ('birth', '1118')])

In [7]:
a.get('name')

'pey'

In [9]:
a.pop('phone')

'010-9999-1234'

In [None]:
# ...existing code...
# Cell: 자료형 기본 예시
# list, tuple, dict, set 기본 연산
lst = [1, 2, 3]
tpl = (1, 2, 3)
dct = {'name': 'pey', 'phone': '010-9999-1234', 'birth': '1118'}
st = {1, 2, 3}

# 리스트: 가변, 순서 O(1) 인덱스, append 효율적
lst.append(4)
# 튜플: 불변
try:
    tpl[0] = 9
except TypeError as e:
    tpl_error = e
# 딕셔너리: 키->값, 빠른 조회/삽입
name = dct.get('name')
phone = dct.pop('phone')
# 셋: 중복제거, 포함 검사 빠름
st.add(4)
is_member = 3 in st

print("lst", lst)
print("tpl", tpl, "error:", tpl_error)
print("dct", dct)
print("st", st, "3 in set:", is_member)

# ...existing code...
# Cell: 간단 성능 비교 (멤버십 테스트)
import time, random

n = 100000
checks = 10000
data_list = list(range(n))
data_set = set(data_list)
data_dict = {i: i for i in data_list}
tests = [random.randint(0, n-1) for _ in range(checks)]

def time_check(container, check_func):
    t0 = time.perf_counter()
    for x in tests:
        check_func(container, x)
    return time.perf_counter() - t0

t_list = time_check(data_list, lambda c, x: x in c)
t_set = time_check(data_set, lambda c, x: x in c)
t_dict = time_check(data_dict, lambda c, x: x in c)  # dict membership checks keys

print(f"membership {checks=} list:{t_list:.4f}s set:{t_set:.4f}s dict:{t_dict:.4f}s")

# ...existing code...
# Cell: 대용량 데이터 읽기/쓰기 예시 (간단)
import pickle
import os
import numpy as np
import pandas as pd

tmp_dir = os.path.join(os.getcwd(), "tmp_data")
os.makedirs(tmp_dir, exist_ok=True)

# 1) 파이썬 객체 직렬화 (pickle) - 임의 객체 저장
obj_path = os.path.join(tmp_dir, "large_list.pkl")
with open(obj_path, "wb") as f:
    pickle.dump(data_list, f)
with open(obj_path, "rb") as f:
    loaded_list = pickle.load(f)

# 2) 수치 데이터: numpy로 바이너리 저장 (빠르고 공간 효율적)
arr = np.arange(n, dtype=np.int32)
np.save(os.path.join(tmp_dir, "arr.npy"), arr)
arr_loaded = np.load(os.path.join(tmp_dir, "arr.npy"))

# 3) 테이블형: pandas 사용 (CSV 또는 parquet 권장)
df = pd.DataFrame({'id': np.arange(10000), 'val': np.random.randn(10000)})
csv_path = os.path.join(tmp_dir, "df.csv")
parquet_path = os.path.join(tmp_dir, "df.parquet")
df.to_csv(csv_path, index=False)
df.to_parquet(parquet_path, index=False)

print("pickle len:", len(loaded_list), "numpy len:", arr_loaded.size, "pandas rows:", len(df))

# ...existing code...

lst [1, 2, 3, 4]
tpl (1, 2, 3) error: 'tuple' object does not support item assignment
dct {'name': 'pey', 'birth': '1118'}
st {1, 2, 3, 4} 3 in set: True
membership checks=10000 list:4.9377s set:0.0014s dict:0.0016s
pickle len: 100000 numpy len: 100000 pandas rows: 10000


In [12]:
# ...existing code...
# Cell: lambda 사용 예제
# 1) 기본 문법: lambda 인자: 표현식
double = lambda x: x * 2
print("double(4) =", double(4))

# 2) 즉시 호출
print("즉시 호출:", (lambda x, y: x + y)(3, 5))

# 3) map / filter / sorted와 함께
nums = [5, 2, 9, 1, 3]
print("map *2:", list(map(lambda x: x * 2, nums)))
print("filter 짝수:", list(filter(lambda x: x % 2 == 0, nums)))
print("sorted by str lower:", sorted(["Apple", "banana", "Cherry"], key=lambda s: s.lower()))

# 4) 클로저 생성 (람다로 함수 반환)
make_multiplier = lambda n: (lambda x: x * n)
times3 = make_multiplier(3)
print("times3(7) =", times3(7))

# 5) 반복문 내 람다의 늦은 바인딩 문제와 해결
funcs_bad = [lambda: i for i in range(3)]         # 모두 마지막 i 값 참조
print("bad:", [f() for f in funcs_bad])           # [2, 2, 2]
funcs_good = [lambda i=i: i for i in range(3)]    # 기본인자로 현재값 고정
print("good:", [f() for f in funcs_good])         # [0, 1, 2]

# 6) 주의: lambda는 문(statement)을 포함할 수 없음(한 표현식만)
# 복잡한 로직은 def로 함수 정의 권장

# ...existing code...

double(4) = 8
즉시 호출: 8
map *2: [10, 4, 18, 2, 6]
filter 짝수: [2]
sorted by str lower: ['Apple', 'banana', 'Cherry']
times3(7) = 21
bad: [2, 2, 2]
good: [0, 1, 2]
