# 파이썬 프로그래밍 II 종합 실습

collections 모듈, comprehension, logging, 정규표현식, 멀티스레딩, 멀티프로세싱을 활용합니다.


과제 1: Collections 모듈 활용

EXAMPLE_SEQUENCE 값을 활용해보세요.

1. Deque: Deque를 생성하고, 요소를 추가하고 제거하는 작업을 해보세요.

2. Namedtuple: Namedtuple을 정의하고 인스턴스를 생성해보세요.

3. Defaultdict: Defaultdict를 사용해보세요. 키가 없을 때 기본값을 설정하세요.

4. Counter: Counter를 사용해 리스트에서 각 요소의 빈도를 세어보세요.

In [3]:
from collections import deque, namedtuple, defaultdict, Counter

EXAMPLE_SEQUENCE = ['dog', 'cat', 'mouse', 'parrot', 'frog']

# 1. Deque: Deque를 생성하고 요소를 추가하고 제거하는 작업
# Deque 생성
ex_deque = deque(EXAMPLE_SEQUENCE)
print("Initial deque:", ex_deque)

# 요소 추가 (append와 appendleft)
ex_deque.append('rabbit')
ex_deque.append('elephant')
print('After adding elements:', ex_deque)

# 요소 제거 (pop과 popleft)
ex_deque.pop()
ex_deque.popleft()
print('After removing elements:', ex_deque)

# 2. Namedtuple: Namedtuple을 정의하고 인스턴스를 생성
# Namedtuple 정의
Animal = namedtuple('Animal', 'name type')
# 인스턴스 생성
dog = Animal(name='Dog', type = 'Mammal')
cat = Animal(name='Cat', type = 'Mammal')
print("Namedtuple instances:", dog, cat)

# 3. Defaultdict: Defaultdict를 사용, 키가 없을 때 기본값 설정
# Defaultdict 정의
animal_dict = defaultdict(lambda: 'Unknown')
# 값 설정
animal_dict['dog'] = 'Mammal'
animal_dict['cat'] = 'Mammal'
print('Defaultdict with existing key:', animal_dict['dog'])
print('Defaultdict with non-existing key:', animal_dict['cat'])

# 4. Counter: Counter를 사용해 리스트에서 각 요소의 빈도 세기
# Counter 사용
animal_counter = Counter(EXAMPLE_SEQUENCE)
print('Counter result:', animal_counter)

Initial deque: deque(['dog', 'cat', 'mouse', 'parrot', 'frog'])
After adding elements: deque(['dog', 'cat', 'mouse', 'parrot', 'frog', 'rabbit', 'elephant'])
After removing elements: deque(['cat', 'mouse', 'parrot', 'frog', 'rabbit'])
Namedtuple instances: Animal(name='Dog', type='Mammal') Animal(name='Cat', type='Mammal')
Defaultdict with existing key: Mammal
Defaultdict with non-existing key: Mammal
Counter result: Counter({'dog': 1, 'cat': 1, 'mouse': 1, 'parrot': 1, 'frog': 1})


과제 2: Comprehension 활용

EXAMPLE_SEQUENCE 값을 활용해보세요.

1. 리스트 컴프리헨션: 숫자 리스트의 제곱값을 구하세요.

2. 딕셔너리 컴프리헨션: 키가 숫자이고 값이 그 숫자의 제곱인 딕셔너리를 생성하세요.

3. 집합 컴프리헨션: 중복된 값을 제거한 제곱값 집합을 생성하세요.

In [4]:
EXAMPLE_SEQUENCE = [1, 4, 12, 9, 22, 5, 1, 9]

# 1. 리스트 컴프리헨션: 숫자 리스트의 제곱값을 구하기
squared_list = [x**2 for x in EXAMPLE_SEQUENCE]
print("Squared list:", squared_list)

# 2. 딕셔너리 컴프리헨션: 키가 숫자이고 값이 그 숫자의 제곱인 딕셔너리 생성
squared_dict = {x: x**2 for x in EXAMPLE_SEQUENCE}
print("Squared dictionary:", squared_dict)

# 3. 집합 컴프리헨션: 중복된 값을 제거한 제곲값 집합 생성
squared_set = {x**2 for x in EXAMPLE_SEQUENCE}
print("Squared set:", squared_set)

Squared list: [1, 16, 144, 81, 484, 25, 1, 81]
Squared dictionary: {1: 1, 4: 16, 12: 144, 9: 81, 22: 484, 5: 25}
Squared set: {1, 484, 16, 144, 81, 25}


과제 3: Logging 활용

1. 기본 로깅 설정: 로깅을 설정하고 정보를 로깅하세요. 로그의 형태는 '시간 - 에러레벨 - 메시지' 입니다.

2. 예외 로깅: 예외가 발생했을 때 에러를 로깅하세요.

logging: 프로그램 실행 중 발생하는 이벤트나 상태 변화를 기록하는 과정

- 프로그램의 실행 흐름을 추적하고, 예외나 오류 발생 시 신속하게 원인 파악 가능 
- 로깅 사용 시 디버깅이 더 쉬워지며 문제 발생 시 정확하게 상황을 알 수 있어 유지보수가 용이해진다. 

In [6]:
import logging

# 1. 기본 로깅 설정
# 로그 포맷: '시간 - 에러레벨 - 메시지'
logging.basicConfig(
    level=logging.DEBUG, # 로깅 레벨 설정(DEBUG 레벨부터 모든 레벨 로그 기록

    # 로그 메시지 형식 지정
    # 로그가 기록된 시간 - 로그 레벨 - 로그 메시지
    format='%(asctime)s - %(levelname)s - %(message)s',
    # 시간 형식 지정
    datafmt='%Y-%m-%d %H:%M:%S' 
)

# 로깅 레벨 
# 개발 중 유용한 상세 정보
# 일반적인 정보 메시지
# 경고 메시지
# 오류 메시지
# 치명적인 오류 메시지

# 로그 메시지 기록
logging.debug('This is a debug message.') 
logging.info('This is an info message.') 
logging.warning('This is a warning message.') 
logging.error('This is an error message.') 
logging.critical('This is a critical message.') 


2024-07-08 14:29:10,755 - DEBUG - This is a debug message.
2024-07-08 14:29:10,756 - INFO - This is an info message.
2024-07-08 14:29:10,758 - ERROR - This is an error message.
2024-07-08 14:29:10,759 - CRITICAL - This is a critical message.


In [7]:
# 예외 로깅

import logging

# 1. 기본 로깅 설정 (이미 설정되어 있으면 생략 가능)
logging.basicConfig(
    level=logging.DEBUG,
    format='%(asctime)s - %(levelname)s - %(message)s',
    datefmt='%Y-%m-%d %H:%M:%S'
)

# 2. 예외 로깅
try:
    # 예외를 발생시키는 코드 (예: 0으로 나누기)
    result = 10 / 0
except ZeroDivisionError as e:
    logging.error('An error occurred: %s', e)

2024-07-08 14:32:43,885 - ERROR - An error occurred: division by zero


과제 4: 정규 표현식 사용

1. 기본 패턴 매칭: 이메일 주소를 추출하세요.

2. 기본 패턴 매칭: 비식별화를 진행하세요. ID를 앞 3글자 이외는 모두 '*'로 변경합니다.

3. 고급 패턴 매칭: HTML 태그를 제거하세요.

In [10]:
# 1. 기본 패턴 매칭: 이메일 주소 추출

import re

email = "MY name is Jhin, my email is kakaotech@goorm.io"

# 이메일 패턴 매칭
email_pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
email_matches = re.findall(email_pattern, email)

print("Extracted email:", email_matches)

Extracted email: ['kakaotech@goorm.io']


* r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
- 이메일 주소를 매칭하기 위한 패턴
- \b: 단어 경계

* [A-Za-z0-9._%+-]+
- 하나 이상의 알파벳, 숫자, '.', '_', '%', '+', '-'를 포함하는 부분

* @: '@' 문자.

* [A-Za-z0-9.-]+
- 하나 이상의 알파벳, 숫자, '.', '-'를 포함하는 부분

* \.[A-Z|a-z]{2,}
- '.' 뒤에 2글자 이상의 알파벳이 오는 부분

In [11]:
# 2. 기본 패턴 매칭: 비식별화

id_list = ["jhin.lee", "lovelove123", "세종대왕만세!!", "twin에너지123", "PostModern"]

# 비식별화 함수
def anonymize_id(id):
    return id[:3] + '*' * (len(id) - 3)

anonymize_ids = [anonymize_id(id) for id in id_list]

print("Anonymized IDs:", anonymize_ids)

Anonymized IDs: ['jhi*****', 'lov********', '세종대*****', 'twi*******', 'Pos*******']


In [12]:
# 고급 패턴 매칭: HTML 태그 제거

html = "<p>Hello, <b>World!</b></p>"

# HTML 태그 제거 패턴
html_tag_pattern = re.compile(r'<.*?>')
clean_text = re.sub(html_tag_pattern, '',html)

print("Clean text:", clean_text)

Clean text: Hello, World!


* re.compile(r'<.*?>')
- HTML 태그를 매칭하기 위한 패턴을 컴파일

* <.*?>
- <와 > 사이에 0개 이상의 문자를 비탐욕적으로 매칭

* re.sub()
- re.sub를 사용하여 HTML 태그를 빈 문자열로 대체

과제 5: 멀티스레딩과 멀티프로세싱

1. 스레딩: 한 개의 스레드를 생성하고 실행하는 함수를 작성해주세요.

2. 멀티스레딩: 두 개의 스레드를 생성하고 실행하세요.

3. 멀티프로세싱: 두 개의 프로세스를 생성하고 실행하세요.

* 스레딩이란?
- 하나의 프로세스 내에서 동시에 실행될 수 있는 여러 실행 흐름을 만드는 기술
- 스레드는 프로세스의 작업 단위로, 프로세스 내에서 독립적으로 수행될 수 있는 작은 실행 단위 
- 각 스레드는 동일한 메모리 공간을 공유하며, 프로세스 내에서 병렬로 작업을 수행할 수 있다. 

* 프로세스와 스레드의 차이
- 프로세스
    - 운영체제로부터 독립된 메모리 공간을 할당받아 실행되는 프로그램의 인스턴스
    - 각 프로세스는 별도의 주소 공간을 가지며, 서로 독립적으로 실행
- 스레드
    - 프로세스 내에서 독립적으로 실행되는 작업 단위
    - 같은 프로세스 내의 스레드는 메모리와 자원을 공유
    - 따라서 스레드 간의 통신이 빠르지만, 동시에 자원을 접근할 때 동기화 문제가 발생할 수 있다.

* 멀티스레딩
- 멀티스레딩은 하나의 프로세스 내에서 여러 스레드를 생성하여 병렬로 작업을 수행하는 기술
- 이를 통해 CPU 사용률을 높이고, 프로그램의 응답성을 향상시킬 수 있다.

* Python에서의 스레딩
- Python에서는 threading 모듈을 사용하여 스레드를 생성하고 관리할 수 있다.
- 각 스레드는 Thread 클래스를 통해 생성되며, start() 메서드를 호출하여 실행


In [1]:
# 1. 스레딩: 한 개의 스레드를 생성하고 실행하는 함수

import threading
import time

# 스레드에서 실행할 함수
def print_numbers():
    for i in range(5):
        print(f"Thread: {i}")
        time.sleep(1)

# 스레드 생성
thread = threading.Thread(target=print_numbers)

# 스레드 시작
thread.start()

# 메인 스레드가 끝날 때가지 기다림
thread.join()
print("Single thread execution completed")

Thread: 0
Thread: 1
Thread: 2
Thread: 3
Thread: 4
Single thread execution completed


1. 스레딩
- threading.Thread 클래스를 사용하여 새로운 스레드를 생성
- 스레드에서 실행할 함수는 target 인수로 전달
- start() 메서드를 호출하여 스레드를 시작
- join() 메서드를 호출하여 메인 스레드가 해당 스레드의 종료를 기다리게 한다. 


In [2]:
# 2. 멀티스레딩: 두 개의 스레드를 생성하고 실행
import threading
import time

# 스레드에서 실행할 함수
def print_numbers(name):
    for i in range(5):
        print(f"{name} Thread: {i}")
        time.sleep(1)

# 두 개의 스레드 생성
thread1 = threading.Thread(target=print_numbers, args=("First",))
thread2 = threading.Thread(target=print_numbers, args=("Second",))

# 스레드 시작
thread1.start()
thread2.start()

# 두 스레드가 끝날 때까지 기다림
thread1.join()
thread2.join()
print("Multithreading execution completed.")

First Thread: 0
Second Thread: 0
First Thread: 1Second Thread: 1

Second Thread: 2First Thread: 2

Second Thread: 3
First Thread: 3
Second Thread: 4
First Thread: 4
Multithreading execution completed.


2. 멀티스레딩
- 두 개의 스레드를 생성하고 각각 다른 이름을 인수로 전달하여 실행
- 각 스레드는 독립적으로 실행

In [3]:
# 3. 멀티프로세싱: 두 개의 프로세스를 생성하고 실행
import multiprocessing
import time

# 프로세스에서 실행할 함수
def print_numbers(name):
    for i in range(5):
        print(f"{name} Process: {i}")
        time.sleep(1)

# 두 개의 프로세스 생성
process1 = multiprocessing.Process(target=print_numbers, args=("First",))
process2 = multiprocessing.Process(target=print_numbers, args=("Second",))

# 프로세스 시작
process1.start()
process2.start()

# 두 프로세스가 끝날 때까지 기다림
process1.join()
process2.join()
print("Multiprocessing execution completed.")

Multiprocessing execution completed.


Traceback (most recent call last):
  File "<string>", line 1, in <module>
  File "/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12/multiprocessing/spawn.py", line 122, in spawn_main
    exitcode = _main(fd, parent_sentinel)
               ^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12/multiprocessing/spawn.py", line 132, in _main
    self = reduction.pickle.load(from_parent)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
AttributeError: Can't get attribute 'print_numbers' on <module '__main__' (<class '_frozen_importlib.BuiltinImporter'>)>
Traceback (most recent call last):
  File "<string>", line 1, in <module>
  File "/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12/multiprocessing/spawn.py", line 122, in spawn_main
    exitcode = _main(fd, parent_sentinel)
               ^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/Library/Frameworks/Python.framework/Versions/3.12/lib/python3.12/multiprocessing/spawn.py", 

3. 멀티프로세싱
- multiprocessing.Process 클래스를 사용하여 새로운 프로세스를 생성
- 프로세스에서 실행할 함수는 target 인수로 전달
- start() 메서드를 호출하여 프로세스를 시작
- join() 메서드를 호출하여 메인 프로세스가 해당 프로세스의 종료를 기다리게 한다.