날짜, 요일과 관련된 datetime, calender 모듈
튜플과 딕셔너리를 특별하게 만들어 주는 collection 모듈 
데이터를 보기 좋게 출력하는 pprint 모듈 

In [1]:
import datetime

day1 = datetime.date(2021,8,17)
day2 = datetime.date(2024,12,30)
delta = day2-day1
print(delta, delta.days + 1, sep='\n')

1231 days, 0:00:00
1232


In [6]:
day3 = datetime.datetime(2020,12,1,10,59,30)
print(day3, day3.hour, day3.day, day3.month, sep='\t')
print(day3.second, day3.minute)
print(day3.weekday(), day3.isoweekday())

2020-12-01 10:59:30	10	1	12
30 59
1 2


In [9]:
today = datetime.date.today()
now = datetime.datetime.now()
diff_days = datetime.timedelta(days=100, hours=10)
print(today, diff_days, today + diff_days, now + diff_days, sep='\n')

2024-12-30
100 days, 10:00:00
2025-04-09
2025-04-09 20:38:38.965780


In [10]:
print(datetime.datetime.now() + datetime.timedelta(hours=50))

2025-01-01 12:39:44.961391


collections 모듈의 deque 는 앞/뒤에서 데이터를 처리할 수 있는 양방향 자료형

In [4]:
from collections import deque

a = (1,2,3,4,5)
q = deque(a)  # 리스트를 데크 자료형으로.. 
q.rotate(2)
result = tuple(q)

print(result, q)

q.rotate(-2)
print(q)

(4, 5, 1, 2, 3) deque([4, 5, 1, 2, 3])
deque([1, 2, 3, 4, 5])


In [6]:
# 데크는 리스트와 유사한 메서드들을 사용 가능
d = deque([1,2,3,4,5])
d.append(6)
print(d)
d.appendleft(0)
print(d)
d.pop()
print(d)
d.popleft()
print(d)

deque([1, 2, 3, 4, 5, 6])
deque([0, 1, 2, 3, 4, 5, 6])
deque([0, 1, 2, 3, 4, 5])
deque([1, 2, 3, 4, 5])


튜플은 인덱스를 통해 데이터에 접근하지만, 네임드 튜플은 인덱스뿐 아니라 키(key)로 접근이 가능

In [6]:
from collections import namedtuple

data = [
    ('송범석', 32, '01025123860'),
    ('정양숙', 62, '01076593860'),
    ('송재성', 66, '01053024436'),
]

Employee = namedtuple('empolyee', 'name, age, cellphone') # Employee 라는 namedtuple 자료형 생성

print(Employee, type(Employee))

# data의 각 요소들을 tuple → namedtuple 자료형으로 변환. 
# 아래 두개 줄은 동일한 과정. _make() 를 이용해서 더 간편하게 만들 수 있음
data_ = [Employee(emp[0], emp[1], emp[2]) for emp in data]
data__ = [Employee._make(emp) for emp in data] 

<class '__main__.empolyee'> <class 'type'>


In [20]:
data__

[empolyee(name='송범석', age=32, cellphone='01025123860'),
 empolyee(name='정양숙', age=62, cellphone='01076593860'),
 empolyee(name='송재성', age=66, cellphone='01053024436')]

In [7]:
# namedtuple 자료형 조회. key로 조회 가능 
emp_0 = data__[0]
print(emp_0, emp_0.name, emp_0.age, type(emp_0))

# namedtuple → dictionary 자료형 변환
print(emp_0._asdict())

# tuple 은 immutable 하기 때문에 emp_0.name = ~  으로 속성을 변경할 수 없음. 
# ._replace()함수를 사용해서 새로운 객체를 만들어줘야함.  
emp_0 = emp_0._replace(name='김범석')
print(emp_0)


empolyee(name='송범석', age=32, cellphone='01025123860') 송범석 32 <class '__main__.empolyee'>
{'name': '송범석', 'age': 32, 'cellphone': '01025123860'}
empolyee(name='김범석', age=32, cellphone='01025123860')


리스트나 문자열과 같은 자료형에서 값이 같은 요소가 몇개인지를 확인하는 방법

In [23]:
from collections import Counter
import re

data = """
산에는 꽃 피네.
꽃이 피네.
갈 봄 여름 없이
꽃이 피네.

산에는 꽃 지네
꽃이 지네.
갈 봄 여름 없이
꽃이 지네.
"""

words = re.findall(r'\w+', data)
print(words)

counter = Counter(words)
print(counter)
print(counter.most_common(2))


['산에는', '꽃', '피네', '꽃이', '피네', '갈', '봄', '여름', '없이', '꽃이', '피네', '산에는', '꽃', '지네', '꽃이', '지네', '갈', '봄', '여름', '없이', '꽃이', '지네']
Counter({'꽃이': 4, '피네': 3, '지네': 3, '산에는': 2, '꽃': 2, '갈': 2, '봄': 2, '여름': 2, '없이': 2})
[('꽃이', 4), ('피네', 3)]


In [None]:
from collections import defaultdict

text = "Life is too short, You need python."

# 일반적인 방법 : 초기화 방어적 코드 사용 // 
d = dict()
for t in text:
    if t not in d:
        d[t] = 0
    d[t] += 1

print(d)

{'L': 1, 'i': 2, 'f': 1, 'e': 3, ' ': 6, 's': 2, 't': 3, 'o': 5, 'h': 2, 'r': 1, ',': 1, 'Y': 1, 'u': 1, 'n': 2, 'd': 1, 'p': 1, 'y': 1, '.': 1}


In [26]:
# defaultdict 를 사용하면 초기화를 대신해줌

d = defaultdict(int)
for t in text:
    d[t] += 1

print(d, dict(d), sep='\n')

defaultdict(<class 'int'>, {'L': 1, 'i': 2, 'f': 1, 'e': 3, ' ': 6, 's': 2, 't': 3, 'o': 5, 'h': 2, 'r': 1, ',': 1, 'Y': 1, 'u': 1, 'n': 2, 'd': 1, 'p': 1, 'y': 1, '.': 1})
{'L': 1, 'i': 2, 'f': 1, 'e': 3, ' ': 6, 's': 2, 't': 3, 'o': 5, 'h': 2, 'r': 1, ',': 1, 'Y': 1, 'u': 1, 'n': 2, 'd': 1, 'p': 1, 'y': 1, '.': 1}


우선순위 큐 구현 : 순위가 가장 높은 자료를 가장 먼저 꺼내는

In [None]:
import heapq

data = [
    (12.23, "강보람"),
    (12.31, "김지원"),
    (11.98, "박시우"),
    (11.99, "장준혁"),
    (11.67, "차정웅"),
    (12.02, "박중수"),
    (11.57, "차동현"),
    (12.04, "고미숙"),
    (11.92, "한시우"),
    (12.22, "이민석"),
]

h = [] # 힙으로 사용할 빈 리스트 생성
for score in data:
    heapq.heappush(h, score) # heapush 로 튜플을 추가할때는, 데이터 우선순위를 나타낼 항목이 튜플 내에서 첫번째 인덱스여야함 (기록,이름)
print(h) # 이때는 힙 트리의 내부 구조만 보여지기에, score 순서대로 보이지 않는다. pop으로 꺼내보면 순서대로 잘 꺼내짐.. 

for i in range(3):
    print(heapq.heappop(h))


[(11.57, '차동현'), (11.92, '한시우'), (11.67, '차정웅'), (11.98, '박시우'), (11.99, '장준혁'), (12.23, '강보람'), (12.02, '박중수'), (12.31, '김지원'), (12.04, '고미숙'), (12.22, '이민석')]
(11.57, '차동현')
(11.67, '차정웅')
(11.92, '한시우')


In [35]:
# 조금더 쉽게 힙 데이터를 생성하려면.. 
heapq.heapify(data)
print(data, type(data))

for i in range(3):
    print(heapq.heappop(data))

[(11.57, '차동현'), (11.67, '차정웅'), (11.98, '박시우'), (11.92, '한시우'), (12.22, '이민석'), (12.02, '박중수'), (12.23, '강보람'), (12.04, '고미숙'), (11.99, '장준혁'), (12.31, '김지원')] <class 'list'>
(11.57, '차동현')
(11.67, '차정웅')
(11.92, '한시우')


In [None]:
# 더 간단히 한번에 하려면 ?

print(heapq.nsmallest(3,data))

[(11.57, '차동현'), (11.67, '차정웅'), (11.92, '한시우')]


데이터를 보기 좋게 출력하는 방법 pprint (pretty print)

In [38]:
from pprint import pprint

data = [
    {"name": "강보람", "score": 12.23, "subjects": ["math", "science", "history"]},
    {"name": "김지원", "score": 12.31, "subjects": ["literature", "physics", "art"]},
    {"name": "박시우", "score": 11.98, "subjects": ["biology", "chemistry", "math"]},
    {"name": "이민석", "score": 12.22, "subjects": ["geography", "economics", "math"]},
]

# 일반적인 print 사용
print("Using print:")
print(data)

# pprint 사용
print("\nUsing pprint:")
pprint(data)

Using print:
[{'name': '강보람', 'score': 12.23, 'subjects': ['math', 'science', 'history']}, {'name': '김지원', 'score': 12.31, 'subjects': ['literature', 'physics', 'art']}, {'name': '박시우', 'score': 11.98, 'subjects': ['biology', 'chemistry', 'math']}, {'name': '이민석', 'score': 12.22, 'subjects': ['geography', 'economics', 'math']}]

Using pprint:
[{'name': '강보람', 'score': 12.23, 'subjects': ['math', 'science', 'history']},
 {'name': '김지원', 'score': 12.31, 'subjects': ['literature', 'physics', 'art']},
 {'name': '박시우', 'score': 11.98, 'subjects': ['biology', 'chemistry', 'math']},
 {'name': '이민석',
  'score': 12.22,
  'subjects': ['geography', 'economics', 'math']}]


이진 탐색 알고리즘 : 점수에 따른 학점 구하는 문제 등 

In [42]:
import bisect

result = []

for score in [33, 90, 77, 70, 89, 90, 100]:
    pos = bisect.bisect([60,70,80,90], score) # 점수를 삽입할 위치 (리스트내에서 몇번째 인덱스에 들어가는지) 반환  
    print(pos)  
    grade = 'FDCBA'[pos] # 그 인덱스에 맞는 문자열 배정 
    result.append(grade)

print(result)

# 70점이면 C가 아닌 D를 받아야 한다면? C의 기준이 70점 이상이 아니라 초과라면
# bisect.bisect_left 를 이용한다. 

# 정렬하여 삽입하기
a = [60,70,80,90]
bisect.insort(a, 85)
print(a)

0
4
2
2
3
4
4
['F', 'A', 'C', 'C', 'B', 'A', 'A']
[60, 70, 80, 85, 90]


위상 절열(topological sorting) : 순환하지 않는.. 선수과목 문제와 같은 그래프 규칙을 구현하는방법 

In [17]:
from graphlib import TopologicalSorter

ts = TopologicalSorter()

# 규칙1
ts.add('영어중급', '영어초급')  # 영어중급의 선수과목은 영어초급
ts.add('영어고급', '영어중급')  # 영어고급의 선수과목은 영어중급

# 규칙2
ts.add('영어문법', '영어중급')  # 영어문법의 선수과목은 영어중급
ts.add('영어고급', '영어문법')  # 영어고급의 선수과목은 영어문법

# 규칙3
ts.add('영어회화', '영어문법')  # 영어회화의 선수과목은 영어문법

print(list(ts.static_order()))  # 위상정렬한 결과를 출력


['영어초급', '영어중급', '영어문법', '영어고급', '영어회화']
