# 8/2일 수업

# 딕셔너리

## 딕셔너리(dictionary)란?

딕셔너리는 파이썬의 자료형 중 하나로, 데이터를 키(key)와 값(value) 의 쌍으로 저장하는 구조입니다.  
쉽게 말해, 사전(dictionary)처럼 특정 키를 통해 해당 값을 빠르게 찾을 수 있는 자료형입니다.

---

#### 딕셔너리의 특징
1. **키와 값의 쌍으로 구성**  
    - 각 키는 고유하며, 중복될 수 없습니다.  
    - 값은 중복될 수 있습니다.
    - 예: `{"이름": "홍길동", "나이": 25}`

2. **변경 가능(mutable)**  
    - 딕셔너리는 생성 후에도 키-값 쌍을 추가, 수정, 삭제할 수 있습니다.

3. **순서 없음**  
    - 파이썬 3.7부터는 딕셔너리가 입력된 순서를 유지하지만, 기본적으로는 순서가 중요한 자료형이 아닙니다.

4. **빠른 검색**  
    - 키를 통해 값을 빠르게 검색할 수 있습니다.

---

#### 딕셔너리의 활용 예시
1. **영한 사전**  
    - 영어 단어(키)와 그 뜻(값)을 저장  
      ```python
      eng_kor_dict = {"apple": "사과", "banana": "바나나", "cherry": "체리"}
      print(eng_kor_dict["apple"])  # 출력: 사과
      ```

2. **개인 정보 저장**  
    - 한 사람의 정보를 딕셔너리로 표현  
      ```python
      person_info = {"이름": "이도원", "나이": "20대", "사는 곳": "부산"}
      print(person_info["이름"])  # 출력: 이도원
      ```

3. **전화번호부**  
    - 이름(키)과 전화번호(값)을 저장  
      ```python
      phone_book = {"홍길동": "010-1234-5678", "강감찬": "010-9876-5432"}
      print(phone_book["강감찬"])  # 출력: 010-9876-5432
      ```

---

#### 딕셔너리의 장점
- 데이터를 구조화하여 저장할 수 있음.
- 키를 통해 값을 빠르게 검색 가능.
- 다양한 데이터 저장 및 관리에 유용.

딕셔너리는 파이썬에서 매우 강력하고 유용한 자료형으로, 데이터를 효율적으로 관리하고 처리하는 데 자주 사용됩니다.

### 딕셔너리 사용법 -> 주소록을 만들어보자

- 전화번호부에 키에는 이름을 넣고 값에는 전화번호를 넣어서 전화번호부를 생성

In [None]:
# 딕셔너리 생성과 추가
phone_book = {} # 빈 딕셔너리 생성 -> 중괄호를 통해서 생성
phone_book['홍길동'] = "010-1234-5678" # 홍길동 이름과 홍길동의 전화번호를 빈 딕셔너리에 추가
print(phone_book)

{'홍길동': '010-1234-5678'}


In [None]:
# 딕셔너리 생성하면서 동시에 초기화(초기화란 빈 딕셔너리에 키-값 쌍들을 처음으로 채워넣는다)
phone_book = {"홍길동" : "010-1234-5678"}
print(phone_book)

{'홍길동': '010-1234-5678'}


In [None]:
# 딕셔너리에 항목을 추가하는 법
phone_book['강감찬'] = '010-1234-1234'
phone_book['이순신'] = '010-1111-1222'
print(phone_book)

{'홍길동': '010-0000-0000', '강감찬': '010-1234-5678', '이순신': '010-1111-1222'}


In [None]:
# 딕셔너리 탐색 ->딕셔너리에서 가장 중요한 과정, 영한 사전에서 모르는 단어를 찾듯이 딕셔너리에서는 키로 값을 찾을 수 있다.
print(phone_book['강감찬'])

010-1234-5678


In [None]:
# 만약에 딕셔너리의 키를 모르는 경우에는 다음과 같은 함수를 활용하여 전체 키를 알 수 있음
print(phone_book.keys())

In [None]:
# 딕셔너리에 사용되는 모든 값을 알고 싶다면 다음과 같은 함수를 활용하여 전체 값을 알 수 있음
print(phone_book.values())

In [None]:
# 딕셔너리 수정 -> 만약에 강감찬이 폰번호를 바꿧다? 그럼 수정을 해야함
phone_book['강감찬'] = '010-1234-3333'
print(phone_book['강감찬'])

010-1212-1212


In [None]:
# 딕셔너리 지정 항목 삭제 -> 지정된 딕셔너리 요소를 삭제하고 삭제한 요소의 값을 출력함
phone_book.pop('강감찬')

'010-1212-1212'

In [None]:
print(phone_book)

{'홍길동': '010-0000-0000', '이순신': '010-1111-1222'}


In [None]:
# 딕셔너리 항목 전체 삭제
phone_book.clear()

In [None]:
print(phone_book)

{}


# 집합
- **파이썬의 자료형 중 하나**  
- **중복을 허용하지 않음**  
- **순서가 없음**  
- **수학의 집합 개념과 유사**  -> **중학생 대상이기에 다루지 않을 예정**
- **집합 연산 지원** (합집합, 교집합, 차집합 등) -> **중학생 대상이기에 다루지 않을 예정**

---

#### 집합의 특징
1. **중복 제거**  
    - 중복된 데이터를 자동으로 제거.  
      예: `{1, 2, 2, 3}` → `{1, 2, 3}`

2. **순서 없음**  
    - 데이터의 순서가 중요하지 않음.  
      예: `{1, 2, 3}`과 `{3, 2, 1}`은 동일.

3. **변경 가능(mutable)**  
    - 집합에 원소를 추가하거나 삭제 가능.

4. **빠른 연산**  -> **중학생 대상이기에 다루지 않을 예정**
    - 합집합, 교집합, 차집합 등의 연산을 효율적으로 수행. 

---

#### 집합의 활용 예시
1. **중복 제거**  
    - 리스트나 튜플에서 중복된 데이터를 제거.  
      ```python
      data = [1, 2, 2, 3, 4, 4]
      unique_data = set(data)
      print(unique_data)  # 출력: {1, 2, 3, 4}
      ```

2. **교집합, 합집합, 차집합 연산**  -> **중학생 대상이기에 다루지 않을 예정**
    - 두 데이터 집합 간의 관계를 계산.  
      ```python
      set1 = {1, 2, 3}
      set2 = {3, 4, 5}
      print(set1 & set2)  # 교집합: {3}
      print(set1 | set2)  # 합집합: {1, 2, 3, 4, 5}
      print(set1 - set2)  # 차집합: {1, 2}
      ```

3. **데이터 필터링**  
    - 특정 조건에 맞는 데이터를 빠르게 필터링.  
      ```python
      allowed_values = {1, 2, 3}
      data = [1, 2, 4, 5]
      filtered_data = [x for x in data if x in allowed_values]
      print(filtered_data)  # 출력: [1, 2]
      ```

---

#### 집합의 장점
- 중복된 데이터를 자동으로 제거하여 데이터 정리.
- 수학적 집합 연산을 간단히 수행 가능.
- 데이터 검색 및 필터링에 유용.

---

#### 집합의 단점
- 순서가 없으므로 인덱싱이 불가능.
- 변경 불가능한 자료형(예: 리스트, 딕셔너리)은 집합의 원소로 사용할 수 없음.

### 집합 사용법

In [None]:
# 집합 생성
s = set()
# 집합 초기화(빈 자료 안에 처음 데이터를 넣는다.)
s = {1, 2, 5}

print(s)

In [None]:
# 집합 안의 또다른 원소를 추가
s.add(10)
print(s)

In [None]:
# 집합 안에는 중복된 데이터를 가질 수 없으므로 add(1)를 해서 원소 1을 추가를 해도 별 다를 바가 없다.
s.add(1)
print(s)

In [None]:
# 집합의 항목을 삭제할려면
s.discard(1)
print(s)

In [None]:
# 집합의 항목을 삭제할려면2
s.remove(10)
print(s)

In [None]:
# remove 와 discard의 차이는 뭘까요?
s.remove(1) # <- s변수에 1이 없어서 오류가 남
s.discard(1) # <- s 변수에 1이 없는데도 오류가 안남

In [None]:
# 전체 항목을 삭제하고 싶어요
s.clear()
print(s)

{100, 5}


# LAB

## 멘델의 유전 법칙 시뮬레이션
부모의 생김새가 자식에게 어떻게 전해지는지 알아보는 실험. 둥근 완두콩과 주름진 완두콩을 교배해 자식 완두콩의 모양을 확인.  
엄마와 아빠 완두콩에게는 각각 `R` 또는 `r` 유전자가 있으며, 이 두 유전자가 합쳐져 자식 완두콩의 모양이 결정됨.

- **`R` 유전자**: 둥근 완두콩을 만드는 유전자 (우성)  
- **`r` 유전자**: 주름진 완두콩을 만드는 유전자 (열성)  

랜덤으로 유전자를 생성해 후손의 유전자 조합을 만들고, 각 조합의 개수를 세어 비율을 계산.  
- **유전자 조합**  
    - `RR`: 둥근 완두콩  
    - `Rr` 또는 `rR`: 둥근 완두콩  
    - `rr`: 주름진 완두콩  
- **비율 계산**  
    - 둥근 완두콩 (`RR`, `Rr`, `rR`) 대 주름진 완두콩 (`rr`)의 비율을 계산.  
`r`만 두 개 있으면 완두콩은 주름짐.

In [5]:
# 랜덤으로 후손의 유전자를 생성하는 실험
import random

descendent = []  # 후손의 유전자 정보를 담는 리스트

# 후손의 유전자를 생성하는 함수
def make_descendent():
    # 0 = R, 1 = r 이다.
    h1 = random.randrange(0, 2)  # 첫 번째 유전자 (0[R] 또는 1[r])
    h2 = random.randrange(0, 2)  # 두 번째 유전자 (0[R] 또는 1[r])
    
    # 두 유전자를 합쳐서 후손의 유전자 조합 생성
    if h1 == 0 and h2 == 0:
        h = 'RR'
    elif h1 == 0 and h2 == 1:
        h = 'Rr'
    elif h1 == 1 and h2 == 0:
        h = 'rR'
    else:
        h = 'rr'

    descendent.append(h)  # 생성된 유전자를 리스트에 추가

# 후손들의 유전자 개수를 세는 함수
# d 라는 인자는 descendent 리스트를 정보를 받는 함수야.  
def count_descendent(d): 
    # d에 있는 첫번 째 유전자 정보가 'RR'
    d_dict = {}  # 유전자 개수를 담는 딕셔너리
    for n in d:
        # d에 있는 두번 째 유전자 정보도 'RR'
        if n in d_dict: # 
            d_dict[n] += 1
        else:
            d_dict[n] = 1 # d_dict['RR'] = 1 
    print(d_dict)  # 유전자 개수 출력
    cal_rate(d_dict)  # 비율 계산

# 유전자 비율을 계산하는 함수
# d는 앞서 유전자 개수를 딕셔너리로 담았잖아 이 딕셔너리를 받을 인수야
def cal_rate(d):
    # 주름진 완두콩 비율을 1로 두기 위해 둥근 완두콩의 개수를 총 더하고 그걸 주름진 완두콩으로 나눈다
    rate = (d['RR'] + d['Rr'] + d['rR']) / d['rr']  # 비율 계산
    print(rate, ": 1")  # 둥근 완두콩 대 주름진 완두콩 비율 출력

# 100번 후손 생성
for n in range(100):
    make_descendent()

# 생성된 후손들의 유전자 개수 세기
count_descendent(descendent)


{'rr': 29, 'Rr': 23, 'rR': 23, 'RR': 25}
2.4482758620689653 : 1


## 튜링상 수상자 데이터 분석
- **튜링상**: 컴퓨터 과학의 노벨상으로 불리며, 매년 컴퓨터 과학 분야에 큰 업적을 남긴 사람에게 시상.
- **목표**: 역대 튜링상 수상자들의 명단, 수상년도, 국적을 정리하는 프로그램 작성.

In [None]:
# 역대 수상자들의 정보를 담는 리스트
awards = []
# 역대 수상자들의 정보를 딕셔너리 형태로 리스트에 추가
awards.append({"이름" : "팀 버너스리", "수상년도" : 2016, "국적" : "영국", "대표업적" : "월드 와이드 웹의 하이퍼텍스트 시스템을 고안하여 개발"})
awards.append({"이름" : "리처드 해밍", "수상년도" : 1968, "국적" : "미국", "대표업적" : "오류 검출 부호 및 오류 정정 부호"})
awards.append({"이름" : "에츠허르 데이크스트라", "수상년도" : 1972, "국적" : "네덜란드", "대표업적" : "프로그래밍 언어 연구, 데이크스트라 알고리즘"})
awards.append({"이름" : "더글러스 엥겔바트", "수상년도" : 1997, "국적" : "미국", "대표업적" : "마우스의 발명, 대화형 컴퓨팅"})
awards.append({"이름" : "리처드 해밍", "수상년도" : 1983, "국적" : "미국", "대표업적" : "유닉스 운영 체제 개발, C언어 개발"})

# 역대 수상자들의 정보들을 출력
for award in awards :
    print(award)

# 역대 수상자들의 이름을 출력
print("==수상자 명단==")
for award in awards :
    print(award['이름'])

print()
# 수상년도가 1990년대 이전 수상자들의 이름과 수상년도를 출력
print("==수상자 명단과 수상년도==")
for award in awards :
    if award['수상년도'] <= 1990 :
        print(award['이름'], award['수상년도'])
print()
# 수상자들의 국가들을 출력, 이 때 set() 자료형을 이용해서 중복을 없앰 따라서 set() 자료형이 아니라면  미국인이 3명이라 '미국' 국적이 3개 출력되어야 하는데 set() 자료형 때문에 하나만 출력됨.
print("==수상자 국가==")
nationaliy = set()
for award in awards :
    nationaliy.add(award['국적'])

print(nationaliy)

{'이름': '팀 버너스리', '수상년도': 2016, '국적': '영국', '대표업적': '월드 와이드 웹의 하이퍼텍스트 시스템을 고안하여 개발'}
{'이름': '리처드 해밍', '수상년도': 1968, '국적': '미국', '대표업적': '오류 검출 부호 및 오류 정정 부호'}
{'이름': '에츠허르 데이크스트라', '수상년도': 1972, '국적': '네덜란드', '대표업적': '프로그래밍 언어 연구, 데이크스트라 알고리즘'}
{'이름': '더글러스 엥겔바트', '수상년도': 1997, '국적': '미국', '대표업적': '마우스의 발명, 대화형 컴퓨팅'}
{'이름': '리처드 해밍', '수상년도': 1983, '국적': '미국', '대표업적': '유닉스 운영 체제 개발, C언어 개발'}
==수상자 명단==
팀 버너스리
리처드 해밍
에츠허르 데이크스트라
더글러스 엥겔바트
리처드 해밍

==수상자 명단과 수상년도==
리처드 해밍 1968
에츠허르 데이크스트라 1972
리처드 해밍 1983

==수상자 국가==
{'미국', '네덜란드', '영국'}
