파이썬에서 set, list, tuple, dictionary는 모두 컨테이너 자료형
- list: [1, 2, 3], list('abc')
- tuple: (1, 2, 3), tuple('abc')
- set: {1, 2, 3}, set('abc')
- dict: {'a': 1, 'b': 2}

In [1]:
s = set('abc')
print(s)

{'a', 'c', 'b'}


In [None]:
# 기본 생성
a = [1, 2, 3]
b = list((4, 5, 6)) #(4,5,6)은 튜플
c = list('abc')      # ['a', 'b', 'c']
print(b)
# 빈 리스트
empty = []
#  순서 있음, 변경 가능 (append, pop, sort 등)

[4, 5, 6]


In [None]:
# tuple 기본 생성
a = (1, 2, 3)
b = tuple([4, 5]) # tuple() 함수는 iterable 객체를 인자로 받는 내장 함수
c = tuple('xyz')     # ('x', 'y', 'z')

# 빈 튜플
empty = ()

#순서 있음, 변경 불가, 단일 요소는 (1,)처럼 쉼표 필요
tup = tuple([1])
print(tup)

(1,)


In [3]:
# set 기본 생성
a = {1, 2, 3}
b = set([2, 4, 6])
c = set('apple')     # 중복 제거됨

# 빈 set
empty = set()   # ⚠️ `{}`는 dictionary임
print(empty)

# 중복 제거 용도
nums = [1, 2, 2, 3]
unique = set(nums)   # {1, 2, 3}
print(unique)
#   중복 없음, 순서 없음, 변경 가능, set 연산 가능 (교집합, 합집합 등)

set()
{1, 2, 3}


In [6]:
# 기본 생성
a = {'a': 1, 'b': 2}
b = dict([('x', 10), ('y', 20)]) #dict()는 key-value 쌍으로 구성된 iterable을 인자로 요구
c = dict(zip(['k1', 'k2'], [100, 200]))
print(b)
print(c)

# 빈 딕셔너리
empty = {}

# dict comprehension
squares = {x: x**2 for x in range(3)}  # {0: 0, 1: 1, 2: 4}
# key-value 구조, key는 중복 불가, 순서 유지 (Python 3.7+)

{'x': 10, 'y': 20}
{'k1': 100, 'k2': 200}


In [None]:
# 파이썬 딕셔너리 - 6.2.2 키-값 쌍 추가하기
person = {"name": "John", "age": 30}
person["city"]="busan"
person['color']='yellow'
print(person['color']) # dictionary 값 접근하기
print(person)

yellow
{'name': 'John', 'age': 30, 'city': 'busan', 'color': 'yellow'}


In [9]:
student={}
student['id']=1 # 키- 값 추가하기 
student['sname']='hong'
student['coding']='java'
print(student)
del student['coding'] #6.2.5 키-값 쌍 제거하기
print(student)
print(student['sname'])
print(student.get('name')) #6.2.7 get()으로 값 접근하기
student_city =student.get('city','도시 키 없음')
print(student_city)

{'id': 1, 'sname': 'hong', 'coding': 'java'}
{'id': 1, 'sname': 'hong'}
hong
None
도시 키 없음


In [22]:
model_params = {
    'learning_rate': 0.01,
    'batch_size': 32,
    'epochs': 100
}
# 용도: 모델 하이퍼파라미터 설정
# 형식: key: value로 구성

In [6]:
value = model_params.get('dropout', 0.5)
# .get() – 키가 없을 때 기본값 제공
print(value)

0.5


6.3 dictionary 순회하기 

.keys()	모든 키 조회	        my_dict.keys()

.values()	모든 값 조회	    my_dict.values()

.items()	(키, 값) 쌍 조회	my_dict.items()

.get(key, 기본값)	키가 없을 때 오류 대신 "없음" 반환	my_dict.get("gender", "없음")

.update()	다른 딕셔너리와 추가 + 갱신	my_dict.update(other_dict)

In [19]:
student={}
student['id']=1
student['sname']='hong'
student['coding']='java'
print(student)
for k,v in student.items():
    print("key = {}, value = {}".format(k, v))
print("=====")
for k in student.keys():
    print("key = {}".format(k))
    
for k in student.values():
    print("값 = {}".format(k))
    
for k in sorted(student.keys()):
    print("정렬::key = {}".format(k))  
    
student['skill']='java'
for v in set(student.values()):
    print("정렬::value = {}".format(v))  

{'id': 1, 'sname': 'hong', 'coding': 'java'}
key = id, value = 1
key = sname, value = hong
key = coding, value = java
=====
key = id
key = sname
key = coding
값 = 1
값 = hong
값 = java
정렬::key = coding
정렬::key = id
정렬::key = sname
정렬::value = 1
정렬::value = java
정렬::value = hong


In [20]:
my_dict = {'a': 1, 'b': 2}
other_dict = {'b': 3, 'c': 4}

my_dict.update(other_dict) #딕셔너리들을 결합

print(my_dict)


{'a': 1, 'b': 3, 'c': 4}


 dict comprehension으로 특성 스케일링

In [23]:
print(model_params)
for k, v in model_params.items():
    print(f"{k}: {v}")

{'learning_rate': 0.01, 'batch_size': 32, 'epochs': 100}
learning_rate: 0.01
batch_size: 32
epochs: 100


In [None]:
# 특성 값을 정규화할 때 사용
features = {'f1': 10, 'f2': 20, 'f3': 40}
max_val = max(features.values())

scaled = {k: v / max_val for k, v in features.items()} #dictionary comprehension
print(scaled)  # {'f1': 0.25, 'f2': 0.5, 'f3': 1.0}


{'f1': 0.25, 'f2': 0.5, 'f3': 1.0}


6.4.1 딕셔너리들의 리스트 

In [1]:
student0 = {'id':1, 'sname':'hong', 'coding':'java'}
student1 = {'id':2, 'sname':'김', 'coding':'javascript'}
student2 = {'id':3, 'sname':'hong', 'coding':'java'}
students = [student0,student1,student2]
for student in students:
    print(f"학생 = {student}")
    
for id in range(4,8):
    new_student = {'id':id, 'sname': 'lee', 'coding':'python'}
    students.append(new_student)
    
print(students)

for student in students[:3]:
    if student['sname']=='hong':
        student['coding'] = 'python'
    print("학생 = {}".format(student))

학생 = {'id': 1, 'sname': 'hong', 'coding': 'java'}
학생 = {'id': 2, 'sname': '김', 'coding': 'javascript'}
학생 = {'id': 3, 'sname': 'hong', 'coding': 'java'}
[{'id': 1, 'sname': 'hong', 'coding': 'java'}, {'id': 2, 'sname': '김', 'coding': 'javascript'}, {'id': 3, 'sname': 'hong', 'coding': 'java'}, {'id': 4, 'sname': 'lee', 'coding': 'python'}, {'id': 5, 'sname': 'lee', 'coding': 'python'}, {'id': 6, 'sname': 'lee', 'coding': 'python'}, {'id': 7, 'sname': 'lee', 'coding': 'python'}]
학생 = {'id': 1, 'sname': 'hong', 'coding': 'python'}
학생 = {'id': 2, 'sname': '김', 'coding': 'javascript'}
학생 = {'id': 3, 'sname': 'hong', 'coding': 'python'}


6.4.2 리스트를 담은 dictionary

Sklearn 예: GridSearchCV 파라미터 설정

In [None]:
from sklearn.model_selection import GridSearchCV
from sklearn.svm import SVC

# 머신러닝 예제
# 간단한 2차원 X_train (10개 샘플, 2개 특성)과 y_train (레이블 2개: 0, 1)
X_train = [[x, x + 1] for x in range(10)]
y_train = [0 if x < 5 else 1 for x in range(10)]
print(X_train)

# 하이퍼파라미터 그리드 정의
param_grid = {
    'C': [0.1, 1, 10],
    'kernel': ['linear', 'rbf']
}

# GridSearchCV로 SVM 학습
grid = GridSearchCV(SVC(), param_grid, cv=3)
grid.fit(X_train, y_train)

# 최적의 하이퍼파라미터 출력
print("Best parameters:", grid.best_params_)



[[0, 1], [1, 2], [2, 3], [3, 4], [4, 5], [5, 6], [6, 7], [7, 8], [8, 9], [9, 10]]
Best parameters: {'C': 1, 'kernel': 'rbf'}


In [30]:
student0 = {'id':1, 'sname':'hong', 'coding':['java','c','python']}
student1 = {'id':2, 'sname':'김', 'coding':['C++','c']}
student2 = {'id':3, 'sname':'hong', 'coding':['go','C++','javascript']}
students = [student0,student1,student2]
# 리스트의 딕셔너리 출력: for 문사용

    
for id in range(4,8):
    new_student = {'id':id, 'sname': 'lee', 'coding':['java','javascriptc','typescript']}
    students.append(new_student)
    
print(students)
# 리스트이 딕셔너리 객체에 대하여 items()사용하여 key, value을 구한다.
##key가 coding이면 각 value을 출력한다

# 리스트의 딕셔너리 출력 및 각 항목의 key, value 확인
for student in students:
    print("== 학생 정보 ==")
    for key, value in student.items(): ### 중요한 이유를 알아야 한다 -> (key, value)를 순회한다
        print(f"{key}: {value}")
        # coding 키에 대해서는 별도 출력
        if key == 'coding':
            print("-> 코딩 언어 목록:")
            for lang in value:
                print(f"   - {lang}")


[{'id': 1, 'sname': 'hong', 'coding': ['java', 'c', 'python']}, {'id': 2, 'sname': '김', 'coding': ['C++', 'c']}, {'id': 3, 'sname': 'hong', 'coding': ['go', 'C++', 'javascript']}, {'id': 4, 'sname': 'lee', 'coding': ['java', 'javascriptc', 'typescript']}, {'id': 5, 'sname': 'lee', 'coding': ['java', 'javascriptc', 'typescript']}, {'id': 6, 'sname': 'lee', 'coding': ['java', 'javascriptc', 'typescript']}, {'id': 7, 'sname': 'lee', 'coding': ['java', 'javascriptc', 'typescript']}]
== 학생 정보 ==
id: 1
sname: hong
coding: ['java', 'c', 'python']
-> 코딩 언어 목록:
   - java
   - c
   - python
== 학생 정보 ==
id: 2
sname: 김
coding: ['C++', 'c']
-> 코딩 언어 목록:
   - C++
   - c
== 학생 정보 ==
id: 3
sname: hong
coding: ['go', 'C++', 'javascript']
-> 코딩 언어 목록:
   - go
   - C++
   - javascript
== 학생 정보 ==
id: 4
sname: lee
coding: ['java', 'javascriptc', 'typescript']
-> 코딩 언어 목록:
   - java
   - javascriptc
   - typescript
== 학생 정보 ==
id: 5
sname: lee
coding: ['java', 'javascriptc', 'typescript']
-> 코딩 언어 목록:
   -

6.4.3 Nested dictionary(중첩 딕셔너리)

In [31]:
# 중첩 딕셔너리 예제: 여러 사용자의 정보
users = {
    "user1": {
        "name": "John",
        "age": 30,
        "city": "New York"
    },
    "user2": {
        "name": "Alice",
        "age": 25,
        "city": "Los Angeles"
    },
    "user3": {
        "name": "Bob",
        "age": 35,
        "city": "Chicago"
    }
}

# 특정 사용자 정보 접근
print("user1의 정보:", users["user1"])
print("user2의 이름:", users["user2"]["name"])

# 모든 사용자의 key, value에 대하여 "user2"의 "city"를 찾는 코드를 작성한다
for user_key, user_info in users.items():# 이 코드를 작성할 수 있는 코딩 능력이 요구된다 
    if user_key == "user2":
        print("user2의 city:", user_info["city"])


user1의 정보: {'name': 'John', 'age': 30, 'city': 'New York'}
user2의 이름: Alice
user2의 city: Los Angeles


In [None]:
model_scores = {
    'LogisticRegression': {'accuracy': 0.88, 'f1': 0.85},
    'RandomForest': {'accuracy': 0.92, 'f1': 0.91}
}

# 가장 높은 정확도 모델 찾기
best_model = max(model_scores, key=lambda k: model_scores[k]['accuracy'])
# => 여기서 k는 딕셔너리의 키값을 말함 어컬러씨는 벨류!
print(f"Best model: {best_model}")


Best model: RandomForest


max(iterable, key=함수) # key = 함수는 비교 기준

iterable에서 가장 큰 값의 요소를 반환하는 함수

key=람다식은 비교 기준을 지정

lambda k: model_scores[k]['accuracy']

k는 모델 이름 ('LogisticRegression', 'RandomForest')을 의미


model_scores[k]['accuracy']는 해당 모델의 정확도 값을 가져옴