## 딕셔너리(dictionary)
- 단어 그대로 사전의 뜻
- dictionary는 Key와 Value를 한쌍으로 갖는 자료형
- 딕셔너리 타입 : immutable한 key와 mutable한 Value로 맵핑되어 있는<br> 순서(index)가 없는 집합
*  딕셔너리명 ={'Key' : 'Value', 'Key':'Value',....}
    - Key에는 변하지 않는 값을 사용하고
    - Value에는 변하는 값과 변하지 않는 값 모두 사용할 수 있음

#### cf) 자료형
|    데이터 타입    |  가변형 / 불변형  |
|:------------------:|:----------------:|
|       int         |      불변형       |
|       float       |      불변형       |
|       bool        |      불변형       |
|       str         |      불변형       |
|       tuple       |      불변형       |
|       frozenset   |      불변형       |
|       list        |       가변형      |
|       set         |       가변형      |
|       dict        |       가변형      |
| numpy.ndarray     |       가변형      |
| pandas.Series     |       가변형      |
| pandas.DataFrame  |       가변형      |

In [4]:
# 리스트는 가변형이므로 주소값 공유
list1 = [1, 2, 3]
list2 = list1
list2.append(4)

print(f"list1: {list1}, list2: {list2}")
print(f"list1 id: {id(list1)}, list2 id: {id(list2)}")

# 숫자는 불변형이므로 주소값 변경
num1 = 10
num2 = num1
num2 += 5

print(f"num1: {num1}, num2: {num2}")
print(f"num1 id: {id(num1)}, num2 id: {id(num2)}")

list1: [1, 2, 3, 4], list2: [1, 2, 3, 4]
list1 id: 2894628851008, list2 id: 2894628851008
num1: 10, num2: 15
num1 id: 140716975232072, num2 id: 140716975232232


In [5]:
# 리스트는 가변형 

# -> 원본데이터를 남겨두고 싶을 때 ,불변형처럼 주솟값을 다르게,독립적이게 하고싶을 때
#  .copy()
# 머신러닝에서 사용, 실무에서 많이 쓰임

list1 = [1, 2, 3]
list2 = list1.copy()
list2.append(4)

print(f"list1: {list1}, list2: {list2}")
print(f"list1 id: {id(list1)}, list2 id: {id(list2)}")


list1: [1, 2, 3], list2: [1, 2, 3, 4]
list1 id: 2894628843136, list2 id: 2894628835008


### 딕셔너리
- Key는 불변적, Value는 가변적
- 딕셔너리명={'key':'vlaue',...}
- 순서가 없지만 for문은 가능

In [9]:
# 딕셔너리 생성
dic1={"Key":"Value","name":"BG","age":28,"phone":"010-1234-1234"}
dic1

{'Key': 'Val', 'name': 'BG', 'age': 28, 'phone': '010-1234-1234'}

In [13]:
# 딕셔너리 값 추가 -> 딕셔너리는 순서가 없음

# dic["Key"] = Value
print(dic1["Key"]) # 딕셔너리 인덱싱
dic1["birth"]='01/01'
dic1

Val


{'Key': 'Val',
 'name': 'BG',
 'age': 28,
 'phone': '010-1234-1234',
 'birth': '01/01'}

In [15]:
# 딕셔너리 값 삭제
# del 딕셔너리명["Key"]
del dic1["age"]

In [16]:
dic1

{'Key': 'Val', 'name': 'BG', 'phone': '010-1234-1234', 'birth': '01/01'}

In [19]:
# 딕셔너리 값 가져오기1 -> 인덱싱
dic1["name"]

'BG'

In [18]:
# 딕셔너리 값 가져오기2 -> get()
dic1.get("name")

'BG'

- 인덱싱과 get()차이

In [21]:
print(dic1["age"])

KeyError: 'age'

In [22]:
print(dic1.get("age"))

None


In [28]:
dic1

{'Key': 'Val', 'name': 'BG', 'phone': '010-1234-1234', 'birth': '01/01'}

In [25]:
# keys() 함수 : 키 값들만 가져오기
list(dic1.keys())

['Key', 'name', 'phone', 'birth']

In [27]:
# values() 함수 : 벨류값듦나 가져오기
list(dic1.values())

['Val', 'BG', '010-1234-1234', '01/01']

![image.png](attachment:image.png)

In [29]:
# 딕셔너리는 순서가 없으나, for문의 활용이 가능하다!
for key in dic1.keys():
    print(key)

Key
name
phone
birth


In [34]:
# 딕셔너리는 순서가 없으나, for문의 활용이 가능하다!
# items() 함수 : (key,value) 튜플형태로 반환

for key  in dic1.items():
    print(key)
    
for key , value in dic1.items():
    print(key,value)

('Key', 'Val')
('name', 'BG')
('phone', '010-1234-1234')
('birth', '01/01')
Key Val
name BG
phone 010-1234-1234
birth 01/01


### 딕셔너리 예제
- 딕셔너리 for문 활용 예제

In [35]:
score_dict = {'이름':['이주희','조자연','양세영','김민수','정봉균'],
              'Python': [90,100,85,90,80],
              'Java': [85,80,100,95,85],
              'HTML,CSS': [75,70,90,80,90]}
score_dict

{'이름': ['이주희', '조자연', '양세영', '김민수', '정봉균'],
 'Python': [90, 100, 85, 90, 80],
 'Java': [85, 80, 100, 95, 85],
 'HTML,CSS': [75, 70, 90, 80, 90]}

In [40]:
# 1. python 점수의 평균 구하기 : sum함수
py_avg = sum(score_dict['Python'])/5
py_avg 

89.0

In [47]:
list(score_dict.keys())[1:]

['Python', 'Java', 'HTML,CSS']

In [48]:
py_avg ,j_avg , h_avg = 0,0,0
py_avg = sum(score_dict['Python'])/5
j_avg = sum(score_dict['Java'])/5
h_avg = sum(score_dict['HTML,CSS'])/5

print('Python 평균 :',py_avg)
print('Java 평균 :',j_avg)
print('HTML,CSS 평균 :',h_avg)

Python 평균 : 89.0
Java 평균 : 89.0
HTML,CSS 평균 : 81.0


In [51]:
# 2. 각 과목의 평균 구하기

for i in list(score_dict.keys())[1:]:
    avg = sum(score_dict[i])/5
    print(f'{i}의 평균:',avg)

Python의 평균: 89.0
Java의 평균: 89.0
HTML,CSS의 평균: 81.0


### 딕셔너리 값 전체 삭제
- 딕셔너리 모두 지우기 clear()

In [52]:
score_dict

{'이름': ['이주희', '조자연', '양세영', '김민수', '정봉균'],
 'Python': [90, 100, 85, 90, 80],
 'Java': [85, 80, 100, 95, 85],
 'HTML,CSS': [75, 70, 90, 80, 90]}

In [54]:
score_dict.clear()

In [55]:
score_dict

{}

### 집합 자료형
- 중복을 허용하지 않음
- 순서가 없음
- 서로 다른 자료형을 가질 수 있으나 가변형 데이터는 값으로 못가짐

* 사용 경우 -> ex) 데이터  중복되는 걸 없애는 경우, 교집합 차집합 여집합

In [29]:
# 집합 사용 방법1
s1 = set([1,2,3])
print(type(s1))

<class 'set'>


In [40]:
# 집합 사용 방법2
s1 = {1,2,3}
print(type(s1))

<class 'set'>


In [44]:
list1 = [1,2,3,3,3,4,4,4]
list1
set1 = {1,2,2,2,3,3,3,4,4,4}
set1

{1, 2, 3, 4}

In [31]:
# 집합 사용 예시1 - 리스트 데이터 중복 없애기
list1=[1,2,2,2,3,3,4]
list2 = list(set(list1)) # 집합은 중복 허용 하지 않는 특성 활용
list2

[1, 2, 3, 4]

In [56]:
# 집합 사용 예시2
"HELLO"

s1 = set("HELLO")
print(s1) # 결과 값을 보면 집합은 순서가 없다는 것을 알 수 있음

{'O', 'E', 'L', 'H'}


In [57]:
s1 = {"a",12,1.3} # 가능

s2 = {'a',12,[3,4]} # Error! 리스트(가변형) 
s3 = {'a',12,{3,4}} # Error! 집합(가변형)
s4 = {'a',12,{'name' : 'y'}} # Error! 딕셔너리(가변형)

TypeError: unhashable type: 'list'

In [33]:
# 집합 사용예사3 - 교집합
s1 = {1,2,3,4,5,6,7}
s2 = {4,5,6,7,8,9,10}
# 방법1
print(s1&s2)
# 방법2
print(s1.intersection(s2))

{4, 5, 6, 7}
{4, 5, 6, 7}


In [54]:
A = {1,3,7,10}
B = {3,6,10,7}

print(A&B)

{10, 3, 7}


In [34]:
# 집합 사용예시4 - 합집합
s1 = {1,2,3,4,5,6,7}
s2 = {4,5,6,7,8,9,10}
# 방법 1
print(s1|s2)
# 방법2
print(s1.union(s2))

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}


In [35]:
# 집합 사용예시4 - 차집합
s1 = {1,2,3,4,5,6,7}
s2 = {4,5,6,7,8,9,10}
# 방법1
print(s1-s2)
# 방법2
print(s1.difference(s2))

{1, 2, 3}
{1, 2, 3}


In [55]:
# 집합 사용예시5- 대칭 차집합
s1 = {1,2,3,4,5,6,7}
s2 = {4,5,6,7,8,9,10}
# 방법1
print(s1^s2)
# 방법2
print(s1.symmetric_difference(s2))

{1, 2, 3, 8, 9, 10}
{1, 2, 3, 8, 9, 10}


#### 집합 추가/삭제
- 추가
    - 값 1개 추가시 add()
    - 값 여러개 추가시 update()
- 삭제
    - 특정값 제거 remove()

In [36]:
# 값 1개 추가시 add()
s1 = set([1,2,3])
s1.add(4)
s1

{1, 2, 3, 4}

In [37]:
# 값 여러개 추가시 update()
s1.update([1,2,3,4,5,6]) # 기존 있던 것과 중복되는 건 제외하고 추가
s1

{1, 2, 3, 4, 5, 6}

In [38]:
# 특정값 제거 remove()
s1.remove(6)
s1

{1, 2, 3, 4, 5}