# 2. 기초 문법 2: 리스트, 딕셔너리, 셋

## 문법 설명

### 1. 리스트 (List)

**정의**: 순서가 있는 데이터 모음입니다. 변경 가능(mutable)한 자료구조입니다.

**문법**:
```python
리스트명 = [요소1, 요소2, 요소3]
```

**특징**:
- 인덱스로 접근: `리스트[인덱스]` (0부터 시작)
- 슬라이싱: `리스트[시작:끝:증가분]`
- 다양한 타입 혼합 가능

**주요 메서드**:
| 메서드 | 설명 | 예시 |
|--------|------|------|
| `append(x)` | 끝에 추가 | `lst.append(1)` |
| `insert(i, x)` | i번 위치에 삽입 | `lst.insert(0, 1)` |
| `remove(x)` | 값으로 삭제 | `lst.remove(1)` |
| `pop([i])` | 인덱스로 삭제 (반환) | `lst.pop()` |
| `sort()` | 정렬 (원본 변경) | `lst.sort()` |
| `sorted()` | 정렬 (새 리스트 반환) | `sorted(lst)` |
| `reverse()` | 역순 | `lst.reverse()` |
| `index(x)` | 값의 위치 | `lst.index(1)` |
| `count(x)` | 값의 개수 | `lst.count(1)` |
| `extend(iterable)` | 리스트 확장 | `lst.extend([1,2])` |

---

### 2. 딕셔너리 (Dictionary)

**정의**: 키-값(key-value) 쌍으로 이루어진 자료구조입니다. 순서가 있습니다(Python 3.7+).

**문법**:
```python
딕셔너리명 = {"키1": 값1, "키2": 값2}
```

**특징**:
- 키는 불변(immutable) 타입만 가능 (str, int, tuple 등)
- 값은 모든 타입 가능
- 키는 중복 불가

**접근 방법**:
- `딕셔너리["키"]`: 키가 없으면 `KeyError`
- `딕셔너리.get("키", 기본값)`: 키가 없으면 기본값 반환

**주요 메서드**:
| 메서드 | 설명 | 예시 |
|--------|------|------|
| `keys()` | 모든 키 | `d.keys()` |
| `values()` | 모든 값 | `d.values()` |
| `items()` | 모든 키-값 쌍 | `d.items()` |
| `get(k, default)` | 값 가져오기 | `d.get("key", 0)` |
| `pop(k)` | 키 삭제 (값 반환) | `d.pop("key")` |
| `update(other)` | 딕셔너리 병합 | `d.update(d2)` |
| `in` 연산자 | 키 존재 확인 | `"key" in d` |

**집계 패턴**: `딕셔너리[키] = 딕셔너리.get(키, 0) + 1`

---

### 3. 셋 (Set)

**정의**: 중복을 허용하지 않는 순서 없는 집합입니다.

**문법**:
```python
셋명 = {요소1, 요소2, 요소3}
```

**특징**:
- 중복 자동 제거
- 순서 없음 (Python 3.7+에서는 삽입 순서 유지)
- 요소는 불변(immutable) 타입만 가능

**집합 연산**:
| 연산자 | 메서드 | 의미 | 예시 |
|--------|--------|------|------|
| `\|` | `union()` | 합집합 | `a \| b` |
| `&` | `intersection()` | 교집합 | `a & b` |
| `-` | `difference()` | 차집합 | `a - b` |

**주요 메서드**:
- `add(x)`: 요소 추가
- `remove(x)`: 요소 삭제 (없으면 에러)
- `discard(x)`: 요소 삭제 (없어도 에러 없음)
- `in` 연산자: 요소 존재 확인

---

### 4. 리스트 컴프리헨션 (List Comprehension)

**정의**: 리스트를 간결하게 생성하는 문법입니다.

**문법**:
```python
[표현식 for 항목 in 반복가능객체]
[표현식 for 항목 in 반복가능객체 if 조건]
[표현식1 if 조건 else 표현식2 for 항목 in 반복가능객체]
```

**예시**:
- 기본: `[i**2 for i in range(5)]` → `[0, 1, 4, 9, 16]`
- 조건부: `[i for i in range(10) if i % 2 == 0]` → `[0, 2, 4, 6, 8]`
- 삼항: `["짝수" if i%2==0 else "홀수" for i in range(5)]`
- 중첩: `[i*j for i in range(2) for j in range(3)]`

**딕셔너리/셋 컴프리헨션**:
- 딕셔너리: `{k: v for k, v in items}`
- 셋: `{x for x in iterable}`

---
## 실습 시작

아래 실습을 통해 위 문법들을 직접 사용해봅니다.

---

## 2.1 리스트 (List)

리스트는 순서가 있는 데이터 모음입니다. 대괄호 `[]`로 생성합니다.

In [1]:
# 리스트 생성
fruits = ["apple", "banana", "cherry"]
numbers = [1, 2, 3, 4, 5]
mixed = [1, "two", 3.0, True]  # 다양한 타입 혼합 가능

print(fruits)
print(type(fruits))

['apple', 'banana', 'cherry']
<class 'list'>


### 2.1.1 리스트 인덱싱과 슬라이싱

In [2]:
fruits = ["apple", "banana", "cherry", "date", "elderberry"]

# 인덱싱
print(fruits[0])    # apple (첫 번째)
print(fruits[-1])   # elderberry (마지막)
print(fruits[2])    # cherry (세 번째)

apple
elderberry
cherry


In [3]:
# 슬라이싱
print(fruits[1:3])   # ['banana', 'cherry']
print(fruits[:2])    # ['apple', 'banana']
print(fruits[2:])    # ['cherry', 'date', 'elderberry']
print(fruits[::2])   # ['apple', 'cherry', 'elderberry'] (2칸씩)

['banana', 'cherry']
['apple', 'banana']
['cherry', 'date', 'elderberry']
['apple', 'cherry', 'elderberry']


### 2.1.2 리스트 수정

In [4]:
numbers = [1, 2, 3, 4, 5]

# 요소 변경
numbers[0] = 100
print(numbers)  # [100, 2, 3, 4, 5]

# 슬라이스로 여러 요소 변경
numbers[1:3] = [200, 300]
print(numbers)  # [100, 200, 300, 4, 5]

[100, 2, 3, 4, 5]
[100, 200, 300, 4, 5]


### 2.1.3 리스트 주요 메서드

In [5]:
# append: 끝에 요소 추가
fruits = ["apple", "banana"]
fruits.append("cherry")
print(fruits)  # ['apple', 'banana', 'cherry']

['apple', 'banana', 'cherry']


In [6]:
# insert: 특정 위치에 삽입
fruits.insert(1, "apricot")
print(fruits)  # ['apple', 'apricot', 'banana', 'cherry']

['apple', 'apricot', 'banana', 'cherry']


In [7]:
# extend: 다른 리스트 확장
fruits.extend(["date", "elderberry"])
print(fruits)

['apple', 'apricot', 'banana', 'cherry', 'date', 'elderberry']


In [8]:
# remove: 값으로 삭제
fruits.remove("apricot")
print(fruits)

['apple', 'banana', 'cherry', 'date', 'elderberry']


In [9]:
# pop: 인덱스로 삭제 (삭제된 값 반환)
removed = fruits.pop()  # 마지막 요소
print(f"삭제됨: {removed}")
print(fruits)

삭제됨: elderberry
['apple', 'banana', 'cherry', 'date']


In [10]:
# pop: 특정 인덱스 삭제
removed = fruits.pop(1)  # 두 번째 요소
print(f"삭제됨: {removed}")
print(fruits)

삭제됨: banana
['apple', 'cherry', 'date']


In [11]:
# sort: 정렬
numbers = [3, 1, 4, 1, 5, 9, 2, 6]
numbers.sort()
print(numbers)  # 오름차순

numbers.sort(reverse=True)
print(numbers)  # 내림차순

[1, 1, 2, 3, 4, 5, 6, 9]
[9, 6, 5, 4, 3, 2, 1, 1]


In [12]:
# sorted: 원본 유지하며 정렬
original = [3, 1, 4, 1, 5]
sorted_list = sorted(original)
print(f"원본: {original}")
print(f"정렬: {sorted_list}")

원본: [3, 1, 4, 1, 5]
정렬: [1, 1, 3, 4, 5]


In [13]:
# reverse: 뒤집기
fruits = ["apple", "banana", "cherry"]
fruits.reverse()
print(fruits)

['cherry', 'banana', 'apple']


In [14]:
# index: 값의 위치 찾기
fruits = ["apple", "banana", "cherry", "banana"]
print(fruits.index("banana"))  # 1 (첫 번째 위치)

1


In [15]:
# count: 값의 개수
print(fruits.count("banana"))  # 2

2


In [16]:
# len: 리스트 길이
print(len(fruits))  # 4

4


### 2.1.4 리스트 복사 주의사항

In [17]:
# 잘못된 복사 (같은 객체 참조)
original = [1, 2, 3]
wrong_copy = original
wrong_copy[0] = 100
print(f"원본도 변경됨: {original}")  # [100, 2, 3]

원본도 변경됨: [100, 2, 3]


In [18]:
# 올바른 복사 방법들
original = [1, 2, 3]
copy1 = original.copy()
copy2 = original[:]
copy3 = list(original)

copy1[0] = 100
print(f"원본 유지: {original}")  # [1, 2, 3]
print(f"복사본 변경: {copy1}")   # [100, 2, 3]

원본 유지: [1, 2, 3]
복사본 변경: [100, 2, 3]


---
## 2.2 딕셔너리 (Dictionary)

딕셔너리는 키-값(key-value) 쌍으로 이루어진 자료구조입니다. 중괄호 `{}`로 생성합니다.

In [19]:
# 딕셔너리 생성
person = {
    "name": "홍길동",
    "age": 25,
    "city": "서울"
}
print(person)
print(type(person))

{'name': '홍길동', 'age': 25, 'city': '서울'}
<class 'dict'>


In [20]:
# 빈 딕셔너리 생성
empty_dict = {}
another_dict = dict()

### 2.2.1 딕셔너리 접근과 수정

In [21]:
person = {"name": "홍길동", "age": 25, "city": "서울"}

# 값 접근
print(person["name"])  # 홍길동
print(person["age"])   # 25

홍길동
25


In [22]:
# get 메서드 (키가 없어도 에러 안남)
print(person.get("name"))          # 홍길동
print(person.get("job"))           # None
print(person.get("job", "무직"))   # 무직 (기본값)

홍길동
None
무직


In [23]:
# 값 수정
person["age"] = 26
print(person)

# 새 키-값 추가
person["job"] = "개발자"
print(person)

{'name': '홍길동', 'age': 26, 'city': '서울'}
{'name': '홍길동', 'age': 26, 'city': '서울', 'job': '개발자'}


In [24]:
# 키 삭제
del person["city"]
print(person)

# pop으로 삭제 (삭제된 값 반환)
age = person.pop("age")
print(f"삭제된 값: {age}")
print(person)

{'name': '홍길동', 'age': 26, 'job': '개발자'}
삭제된 값: 26
{'name': '홍길동', 'job': '개발자'}


### 2.2.2 딕셔너리 주요 메서드

In [25]:
person = {"name": "홍길동", "age": 25, "city": "서울"}

# keys: 모든 키
print(person.keys())

# values: 모든 값
print(person.values())

# items: 모든 키-값 쌍
print(person.items())

dict_keys(['name', 'age', 'city'])
dict_values(['홍길동', 25, '서울'])
dict_items([('name', '홍길동'), ('age', 25), ('city', '서울')])


In [26]:
# 키, 값, 아이템 순회
for key in person.keys():
    print(f"키: {key}")

키: name
키: age
키: city


In [27]:
for value in person.values():
    print(f"값: {value}")

값: 홍길동
값: 25
값: 서울


In [28]:
for key, value in person.items():
    print(f"{key}: {value}")

name: 홍길동
age: 25
city: 서울


In [29]:
# 키 존재 여부 확인
print("name" in person)   # True
print("email" in person)  # False

True
False


In [30]:
# update: 딕셔너리 병합
person = {"name": "홍길동", "age": 25}
extra_info = {"city": "서울", "job": "개발자"}
person.update(extra_info)
print(person)

{'name': '홍길동', 'age': 25, 'city': '서울', 'job': '개발자'}


### 2.2.3 중첩 딕셔너리

In [31]:
# 중첩 딕셔너리
users = {
    "user1": {"name": "홍길동", "age": 25},
    "user2": {"name": "김철수", "age": 30},
    "user3": {"name": "이영희", "age": 28}
}

# 접근
print(users["user1"]["name"])  # 홍길동
print(users["user2"]["age"])   # 30

홍길동
30


In [32]:
# 중첩 딕셔너리 순회
for user_id, info in users.items():
    print(f"{user_id}: {info['name']} ({info['age']}세)")

user1: 홍길동 (25세)
user2: 김철수 (30세)
user3: 이영희 (28세)


---
## 2.3 셋 (Set)

셋은 중복을 허용하지 않는 순서 없는 집합입니다.

In [33]:
# 셋 생성
fruits = {"apple", "banana", "cherry"}
numbers = {1, 2, 3, 4, 5}
print(fruits)
print(type(fruits))

{'cherry', 'banana', 'apple'}
<class 'set'>


In [34]:
# 중복 자동 제거
duplicates = {1, 2, 2, 3, 3, 3, 4}
print(duplicates)  # {1, 2, 3, 4}

{1, 2, 3, 4}


In [35]:
# 리스트에서 셋 생성 (중복 제거)
my_list = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
unique = set(my_list)
print(unique)  # {1, 2, 3, 4}

{1, 2, 3, 4}


### 2.3.1 셋 연산

In [36]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

# 합집합 (Union)
print(a | b)  # {1, 2, 3, 4, 5, 6, 7, 8}
print(a.union(b))

{1, 2, 3, 4, 5, 6, 7, 8}
{1, 2, 3, 4, 5, 6, 7, 8}


In [37]:
# 교집합 (Intersection)
print(a & b)  # {4, 5}
print(a.intersection(b))

{4, 5}
{4, 5}


In [38]:
# 차집합 (Difference)
print(a - b)  # {1, 2, 3}
print(a.difference(b))

{1, 2, 3}
{1, 2, 3}


### 2.3.2 셋 주요 메서드

In [39]:
fruits = {"apple", "banana"}

# add: 요소 추가
fruits.add("cherry")
print(fruits)

{'cherry', 'banana', 'apple'}


In [40]:
# remove: 요소 삭제
fruits.remove("banana")
print(fruits)

{'cherry', 'apple'}


In [41]:
# add: 요소 추가
fruits.add("apple")
fruits.add("cherry")
print(fruits)

{'cherry', 'apple'}


In [42]:
# 요소 존재 확인
print("apple" in fruits)  # True
print("mango" in fruits)  # False

True
False


---
## 2.4 누적 집계 패턴 (빈도수 카운트)

딕셔너리를 활용한 가장 흔한 패턴 중 하나입니다.

### 2.4.1 기본 카운트 패턴

In [43]:
# 단어 빈도수 세기
words = ["apple", "banana", "apple", "cherry", "banana", "apple"]

# 패턴 1: get 메서드 활용
word_count = {}
for word in words:
    word_count[word] = word_count.get(word, 0) + 1

print(word_count)  # {'apple': 3, 'banana': 2, 'cherry': 1}

{'apple': 3, 'banana': 2, 'cherry': 1}


In [44]:
# 패턴 2: if-else 활용
word_count = {}
for word in words:
    if word in word_count:
        word_count[word] = word_count[word] + 1
    else:
        word_count[word] = 1

print(word_count)

{'apple': 3, 'banana': 2, 'cherry': 1}


### 2.4.2 카테고리별 집계

In [45]:
# 설문 응답 데이터
responses = [
    {"category": "제품", "score": 5},
    {"category": "서비스", "score": 4},
    {"category": "제품", "score": 3},
    {"category": "배송", "score": 5},
    {"category": "제품", "score": 4},
    {"category": "서비스", "score": 5},
    {"category": "배송", "score": 2},
]

# 카테고리별 개수 집계
category_count = {}
for response in responses:
    cat = response["category"]
    category_count[cat] = category_count.get(cat, 0) + 1

print("카테고리별 개수:", category_count)

카테고리별 개수: {'제품': 3, '서비스': 2, '배송': 2}


In [46]:
# 카테고리별 점수 합계
category_sum = {}
for response in responses:
    cat = response["category"]
    score = response["score"]
    category_sum[cat] = category_sum.get(cat, 0) + score

print("카테고리별 점수 합계:", category_sum)

카테고리별 점수 합계: {'제품': 12, '서비스': 9, '배송': 7}


In [47]:
# 카테고리별 평균 점수 계산
category_avg = {}
for cat in category_count:
    avg = category_sum[cat] / category_count[cat]
    category_avg[cat] = round(avg, 2)

print("카테고리별 평균 점수:", category_avg)

카테고리별 평균 점수: {'제품': 4.0, '서비스': 4.5, '배송': 3.5}


### 2.4.3 collections.Counter 활용

In [48]:
from collections import Counter

words = ["apple", "banana", "apple", "cherry", "banana", "apple"]

# Counter로 간단하게
word_count = Counter(words)
print(word_count)

Counter({'apple': 3, 'banana': 2, 'cherry': 1})


In [49]:
# 가장 흔한 항목
print(word_count.most_common(2))  # [('apple', 3), ('banana', 2)]

[('apple', 3), ('banana', 2)]


In [50]:
# 문자열에서 문자 빈도
text = "hello world"
char_count = Counter(text)
print(char_count.most_common(3))

[('l', 3), ('o', 2), ('h', 1)]


---
## 2.5 리스트 컴프리헨션 (List Comprehension)

리스트를 간결하게 생성하는 파이썬의 강력한 문법입니다.

### 2.5.1 기본 문법

In [51]:
# 일반 for 루프
squares = []
for i in range(1, 6):
    squares.append(i ** 2)
print(squares)

[1, 4, 9, 16, 25]


In [52]:
# 리스트 컴프리헨션
squares = [i ** 2 for i in range(1, 6)]
print(squares)

[1, 4, 9, 16, 25]


### 2.5.2 조건부 컴프리헨션

In [53]:
# 짝수만 필터링
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
evens = [n for n in numbers if n % 2 == 0]
print(evens)  # [2, 4, 6, 8, 10]

[2, 4, 6, 8, 10]


In [54]:
# 조건에 따라 변환
numbers = [1, 2, 3, 4, 5]
result = ["짝수" if n % 2 == 0 else "홀수" for n in numbers]
print(result)

['홀수', '짝수', '홀수', '짝수', '홀수']
