# Lists and Dictionaries

## Lists
<table>
    <tr>
        <th>
            순서가 지정된 임의 객체 컬렉션
        </th>
        <td>
            기능적인 관점에서, 리스트는 다른 객체를 그룹으로 처리하는 컬렉션이다. 리스트는 포함된 항목의 순서를 유지하는 시퀀스이다.
        </td>
    </tr>
    <tr>
        <th>
            오프셋
        </th>
        <td>
            문자열과 마찬가지로 리스트 내 객체의 오프셋으로 구성요소를 인덱싱할 수 있다. 리스트는 순서가 유지되므로 슬라이싱, 연결 등과 같은 작업이 가능하다.
        </td>
    </tr>
    <tr>
        <th>
            가변길이, 객체 저장, 중첩
        </th>
        <td>
            문자열과 달리 리스트는 길이가 고정적이지 한다. 또한 문자, 문자열, 리스트 등 다양한 객체를 저장할 수 있으며, 다른 리스트를 저장하는 등 중첩도 가능하다.
        </td>
    </tr>
    <tr>
        <th>
            가변 시퀀스
        </th>
        <td>
            리스트는 mutable sequence로서, 문자열과 같이 다양한 시퀀스 작업을 처리할 수 있다. 더불어 불변형 시퀀스인 문자열이 제공하지 않는 삭제, 인덱스 할당(삽입) 등을 제공한다.
        </td>
    </tr>
    <tr>
        <th>
            객체 참조 배열
        </th>
        <td>
            Python의 리스트는 포인터와 유사하게 다른 객체에 대한 참조가 0개 이상 포함되어 있다. 이는 C의 배열을 인덱싱 하는 것 만큼 빠르게 동작하도록 해준다.
        </td>
    </tr>
</table>

### Common list literals and operations
<table>
    <tr>
        <td><code>L = []</code></td>
        <td>빈 리스트</td>
    </tr>
    <tr>
        <td><code>L = [123, 'abc', 1.23, {}]</code></td>
        <td>-</td>
    </tr>
    <tr>
        <td><code>L = ['Bob', 40.0, ['dev', 'mgr']]</code></td>
        <td>리스트 중첩</td>
    </tr>
    <tr>
        <td><code>L = list('spam')</code><br />
        <code>L = list(range(-4, 4))</code></td>
        <td>iterable's item, 연속된 정수</td>
    </tr>
    <tr>
        <td><code>L[1]</code><br/>
        <code>L[1][j]</code><br/>
        <code>L[1:j]</code><br/>
        <code>len(L)</code><br/>
        </td>
        <td>인덱스, 다차원 인덱스, 슬라이스, 길이</td>
    </tr>
    <tr>
        <td><code>L1 + L2</code><br />
        <code>L * 3</code></td>
        <td>연결, 복사(repeat)</td>
    </tr>
    <tr>
        <td><code>for x in L : print(x)</code><br />
        <code>3 in L</code></td>
        <td>반복, 멤버십</td>
    </tr>
    <tr>
        <td><code>L.append(4)</code><br />
        <code>L.extend([5, 6, 7])</code><br />
        <code>L.insert(1, X)</code></td>
        <td>Method : 확장</td>
    </tr>
    <tr>
        <td><code>L.index(X)</code><br />
        <code>L.count(X)</code></td>
        <td>Method : 검색</td>
    </tr>
    <tr>
        <td><code>L.sort()</code><br />
        <code>L.reverse()</code><br />
        <code>L.copy()</code><br />
        <code>L.clear()</code><br /></td>
        <td>Method : 정렬, 복사(3.3+), 정리(3.3+)</td>
    </tr>
    <tr>
        <td><code>L.pop(1)</code><br />
        <code>L.remove(X)</code><br />
        <code>del L[1]</code><br />
        <code>del L[1:j]</code><br />
        <code>L[1:j] = []</code><br /></td>
        <td>Method : 꺼내기, 제거</td>
    </tr>
    <tr>
        <td><code>L[1] = 3</code><br />
        <code>L[1:j] = [4, 5, 6]</code><br /></td>
        <td>Method : 할당, 슬라이스 할당</td>
    </tr>
    <tr>
        <td><code>L = [x**2 for x in range(5)]</code><br />
        <code>list(map(ord, 'spam'))</code><br /></td>
        <td>List comprehension and map</td>
    </tr>
</table>

### Lists in Action

#### Basic List Operations

In [2]:
len([1, 2, 3])

3

In [3]:
[1, 2, 3, 4] + [5, 6, 7]

[1, 2, 3, 4, 5, 6, 7]

In [4]:
['N1'] * 4

['N1', 'N1', 'N1', 'N1']

#### List Iteration and Comprehensions

In [5]:
3 in [1, 2, 3]          # Membership

True

In [7]:
for x in [1, 2, 3]:     # Iteration
    print(x, end=' ')

1 2 3 

In [9]:
res = [c * 4 for c in 'SPAM']
res

['SSSS', 'PPPP', 'AAAA', 'MMMM']

In [10]:
# 위 한 줄의 코드를 기존의 for loop로 풀면 아래와 같다.
res = []
for c in 'SPAM':
    res.append(c * 4)
res

['SSSS', 'PPPP', 'AAAA', 'MMMM']

In [12]:
# 내장함수 map()을 사용할 수도 있다.
# map 내장함수는 자동으로 순서를 만들고, 새 리스트를 반환한다.
list(map(abs, [-1, -2, 0, 1, 2]))

[1, 2, 0, 1, 2]

#### 인덱싱, 슬라이싱, 행렬

In [16]:
L = ['spam', 'Spam', 'SPAM']    # Offset은 0부터 시작한다.
L[2]

'SPAM'

In [17]:
L[-2]       # Negative 인덱스는 끝(오른쪽)에서부터 인덱싱한다.

'Spam'

In [18]:
L[1:]       # 부분 슬라이싱

['Spam', 'SPAM']

- 행렬을 다루는 방법은 아래와 같다.

In [19]:
matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
matrix[1]

[4, 5, 6]

In [20]:
matrix[1][1]

5

---

## Dictionary
딕셔너리는 리스트와 함께 가장 유연하고 강력한 자료형이다. 리스트와 다른 점은, 딕셔너리는 순서를 갖지 않으며, 오프셋이 아닌 키로 구성 요소를 다룬다는 것이다. 리스트가 다른 언어의 배열과 유사한 역할을 수행한다면, 딕셔너리는 레코드, 검색 테이블, 다양한 집계를 다루는데 효과적이다.

예를 들어, 딕셔너리로 많은 검색 알고리즘과 자료구조를 대체할 수 있다. 파이썬의 딕셔너리는 키 인덱싱으로 매우 빠른 검색을 지원하고, 희소 자료구조, 구조체 및 기호 테이블 등의 작업을 수행할 수 있다.

<table>
    <tr>
        <th>
            키 인덱싱
        </th>
        <td>
            파이썬의 딕셔너리는 다른 언어의 연관배열 또는 해시와 유사하다. 리스트와는 달리 값들을 키와 연결해 관리하므로, 키를 사용해 구성요소에 접근할 수 있다.
        </td>
    </tr>
    <tr>
        <th>
            순서가 지정되지 않은 임의 객체 컬렉션
        </th>
        <td>
            리스트와 달리 딕셔너리에 저장된 요소는 순서를 보장하지 않는다. 딕셔너리는 빠른 검색을 지원하기 위해 요소를 자동으로 임의 정렬 처리 후 저장한다.
        </td>
    </tr>
    <tr>
        <th>
            가변길이, 객체 저장, 중첩
        </th>
        <td>
            리스트와 마찬가지로 딕셔너리 역시 새 복사본 없이 확장 및 축소할 수 있는 가변 자료형이며, 모든 타입을 저장할 수 있다. 또한, 리스트, 다른 딕셔너리를 저장해 중첩할 수 있다. 각 키는 연결된 값을 하나만 가질 수 있지만, 필요한 경우 해당 값을 여러 객체의 집합으로 지정할 수 있다.
        </td>
    </tr>
    <tr>
        <th>
            가변 매핑
        </th>
        <td>
            딕셔너리는 리스트와 달리 시퀀스가 아니라 매핑 범주에 속해 있다. 따라서 값을 바꿀 수는 있지만, 문자열이나 리스트와 같은 시퀀스 작업은 처리할 수 없다. 딕셔너리는 순서를 보장하지 않으므로 연결, 슬라이싱과 같은 인덱스에 의존하는 시퀀스 작업은 의미가 없다.
        </td>
    </tr>
    <tr>
        <th>
            해시 테이블
        </th>
        <td>
            리스트가 인덱스에 의존해 참조된 객체 요소에 접근할 수 있다면, 딕셔너리는 키 별로 참조된 객체 요소에 접근할 수 있는 일종의 테이블이다. 딕셔너리는 내부적으로 작은 크기로 생성되어, 확장되는 크기를 가지도록 구현된다. 또한 딕셔너리는 최적화된 해싱 알고리즘을 사용하므로 빠른 검색이 가능하다.
        </td>
    </tr>
</table>

### Common dictoinary literals and operations
<table>
    <tr>
        <td><code>D = {}</code></td>
        <td>빈 리스트</td>
    </tr>
    <tr>
        <td><code>D = {'name' : 'James', 'age' : 36}</code></td>
        <td>-</td>
    </tr>
    <tr>
        <td><code>D = {'cto' : {'name' : 'James', 'age' : 36}}<code></td>
        <td>리스트 중첩</td>
    </tr>
    <tr>
        <td><code>D = dict(name = 'James', age = 36)</code><br />
        <code>D = dict([('name', 'James'), ('age', 36)])</code><br />
        <code>D = dict(zip(keylist, valuelist))</code><br />
        <code>D = dict.fromkeys(['name', 'age'])</code><br /></td>
        <td>keywords, zip, key lists</td>
    </tr>
    <tr>
        <td><code>D['name']</code><br/>
        <code>E['cto]['age']</code><br/>
        </td>
        <td>키 인덱스</td>
    </tr>
    <tr>
        <td><code>'age' in D</code><br />
        <td>멤버십</td>
    </tr>
    <tr>
        <td><code>D.keys()</code><br />
        <td>Methods : 키 조회</td>
    </tr>
    <tr>
        <td><code>D.values</code><br />
        <td>Methods : 값 조회</td>
    </tr>
    <tr>
        <td><code>D.items</code><br />
        <td>Methods : 키, 값 조회</td>
    </tr>
    <tr>
        <td><code>D.copy()</code><br />
        <td>Methods : 복사</td>
    </tr>
    <tr>
        <td><code>D.clear()</code><br />
        <td>Methods : 비우기</td>
    </tr>
    <tr>
        <td><code>D.update(D2)</code><br />
        <td>Methods : 합치기</td>
    </tr>
    <tr>
        <td><code>D.get(key, default?)</code><br />
        <td>Methods : 구하기(키)</td>
    </tr>
    <tr>
        <td><code>D.pop(key, default?)</code><br />
        <td>Methods : 삭제(키)</td>
    </tr>
    <tr>
        <td><code>D.setdefault(key, default?)</code><br />
        <td>Methods : 구하기(키)</td>
    </tr>
    <tr>
        <td><code>D.popitem()</code><br />
        <td>Methods : 삭제(키, 값 반환)</td>
    </tr>
    <tr>
        <td><code>len(D)</code><br />
        <td>Methods : 길이 반환</td>
    </tr>
    <tr>
        <td><code>D[key] = 42</code><br />
        <td>Methods : 추가, 수정</td>
    </tr>
    <tr>
        <td><code>del D[key]</code><br />
        <td>키로 엔트리 제거</td>
    </tr>
    <tr>
        <td><code>list(D.keys())</code><br />
        <code>D1.keys() & D2.keys()</code><br />
        <code>D1.viewkeys(), D2.viewvalues()</code><br />
        <td>Methods : 딕셔너리 보기</td>
    </tr>
    <tr>
        <td><code>D = {x : x*2 for x in range(10)}</code><br />
        <td>comprehension</td>
    </tr>
</table>

### Dictionary in Action

In [30]:
D = {'spam' : 2, 'ham' : 1, 'eggs' : 3}
D['spam']

2

In [31]:
D

{'spam': 2, 'ham': 1, 'eggs': 3}

In [32]:
len(D)

3

In [33]:
'ham' in D      # 키 멤버십 테스트

True

In [34]:
list(D.keys())  # D의 키로 리스트 생성

['spam', 'ham', 'eggs']

#### Chainging Dictionaries in Place

In [35]:
D['ham'] = ['grill', 'bake', 'fry']
D

{'spam': 2, 'ham': ['grill', 'bake', 'fry'], 'eggs': 3}

In [36]:
del D['eggs']
D

{'spam': 2, 'ham': ['grill', 'bake', 'fry']}

In [37]:
D['brunch'] = 'Bacon'
D

{'spam': 2, 'ham': ['grill', 'bake', 'fry'], 'brunch': 'Bacon'}

In [39]:
D = {'spam' : 2, 'ham' : 1, 'eggs' : 3}
list(D.values())

[2, 1, 3]

In [40]:
list(D.items())

[('spam', 2), ('ham', 1), ('eggs', 3)]

In [45]:
D.get('spam')

2

In [46]:
print(D.get('toast'))   # missing key

None


In [47]:
D.get('toast', 88)

88

In [48]:
D

{'spam': 2, 'ham': 1, 'eggs': 3}

In [50]:
D2 = {'toast' : 4, 'muffin' : 5}
D.update(D2)
D

{'spam': 2, 'ham': 1, 'eggs': 3, 'toast': 4, 'muffin': 5}

In [51]:
D

{'spam': 2, 'ham': 1, 'eggs': 3, 'toast': 4, 'muffin': 5}

In [52]:
D.pop('muffin')

5

In [53]:
D.pop('toast')                  # delete and return from a key

4

In [54]:
D

{'spam': 2, 'ham': 1, 'eggs': 3}

In [55]:
L = ['aa', 'bb', 'cc', 'dd']    # delete and return from the end
L.pop()

'dd'

In [56]:
L.pop(1)                        # delete form a specific position
L

['aa', 'cc']

### Dictionary Usage Note
딕셔너리는 간단하면서도 강력한 자료형이지만, 사용할 때 주의해야 하는 부분이 있다.

- **딕셔너리는 시퀀스가 아니라 매핑이다** : 딕셔너리는 구성요소 간 순서를 보장하지 않기 때문에 연결, 슬라이싱과 같은 슬라이싱 작업을 처리할 수 없다.
- **존재하지 않는 인덱스(키)에 값을 할당하면 새로운 아이템이 추가된다** : 리터럴로 존재하지 않는 키 인덱스에 값을 할당하면 새로운 아이템이 추가된다.
- **모든 불변 객체는 키가 될 수 있다** : 딕셔너리는 정수, 실수, 문자, 문자열, 튜플 등 고정된 값을 가진 객체는 모두 키로 설정할 수 있다. 심지어 적절한 프로토콜 방법만 있다면 클래스 인스턴스를 키로 가질 수도 있다. 다만, 리스트 및 셋과 같은 가변형 객체는 값으로만 할당할 수 있다.

#### 딕셔너리로 유연한 리스트 구현하기
리스트는 존재하지 않는 인덱스에 접근을 불허한다. 딕셔너리로 이를 허용하는 보다 유연한 리스트를 구현할 수 있다.

In [58]:
L = []
L[99] - 'spam'

IndexError: list index out of range

딕셔너리의 키를 리스트의 인덱스처럼 사용해 이를 허용하는 유연한 리스트를 구현할 수 있다. 이때, 딕셔너리의 크기는 최소한의 크기로 시작하므로, 값이 없는 인덱스는 생성되지도 않아 용량을 줄일 수 있다.

In [59]:
D = {}
D[99] = 'spam'
D[99]

'spam'

이를 활용하면 동영상 데이터베이스에 연도별로 저장하는 테이블을 구성할 수 있다.

In [60]:
table = {1975 : 'Holly Grail',          # Integer Keys
         1979 : 'Life of Brian', 
         1983 : 'The Meaning of Life'}
table[1975]

'Holly Grail'

In [61]:
list(table.items())

[(1975, 'Holly Grail'), (1979, 'Life of Brian'), (1983, 'The Meaning of Life')]

#### 딕셔너리로 희소 자료 구조: 튜플 키 구현하기
유사한 방식으로, 딕셔너리를 활용해 희소 자료 구조(소수의 위치에만 값이 있는 다차원 배열)를 구현할 수 있다.

In [63]:
Matrix = {}
Matrix[(2, 3, 4)] = 88
Matrix[(7, 8, 9)] = 99

X = 2; Y = 3; Z = 4
Matrix[(X, Y, Z)]

88

In [64]:
Matrix

{(2, 3, 4): 88, (7, 8, 9): 99}

#### missing-key 에러 피하기
딕셔너리 사용 시 존재하지 않는 키에 인덱싱 하므로 발생하는 에러로 인해 프로그램이 종료될 수 있다. 이를 원치 않는 경우 `if`문을 사용하거나 `try`문을 사용해 예외를 명시할 수 있다.

In [65]:
if(2, 3, 6) in Matrix:
    print(Matrix[(2, 3, 6)])
else:
    print(0)

0


In [66]:
try:
    print(Matrix[(2, 3, 6)])
except KeyError:
    print(0)

0


In [68]:
Matrix.get((2, 3, 4), 0)

88

In [None]:
Matrix.get((2, 3, 6), 0)

0

#### 딕셔너리 중첩
위 과정에서 알 수 있는 것은 Python의 딕셔너리는 다른 언어의 *"구조"* 또는 *"레코드"*처럼 사용할 수 있다는 것이다.

In [69]:
rec = {}
rec['name'] = 'James'
rec['age'] = 36.5
rec['job'] = 'developer/cto'

print(rec['name'])

James


딕셔너리의 특성을 잘 살리면 위 리터럴을 더 보기 좋게 구조화 할 수 있다.

In [71]:
rec = {'name' : 'James', 
       'jobs' : ['developer', 'cto'], 
       'web' : 'www.james.org/James',
       'home' : {'state' : 'Overworked', 'zip' : 12345}}

print(rec['name'])
print(rec['jobs'][1])
print(rec['home']['zip'])

James
cto
12345


#### 딕셔너리를 만드는 다른 방법
Python의 딕셔너리는 너무 유용해서, 많은 Python 개발자들이 즐겨 사용해왔고, 이를 다루는 다양한 방법이 등장했다.

In [None]:
{'name' : 'Bob', 'age' : 40}            # Traditional literal

D = {}                                  # 동적 키 할당
D['name'] = 'Bob'
D['age'] = 40

dict(name='Bob', age=40)                # 키워드 매개변수형

dict([('name', 'Bob'), ('age', 40)])    # 키/값 튜플형

- **전통 리터럴 방식** : 딕셔너리에 저장할 모든 정보를 알고 있다면 편리
- **동적 키 할당** : 딕셔너리에 즉시 하나의 필드를 작성해야 하는 경우 유용
- **키워드 매개변수형** : 전통 리터럴 방식에 비해 타이핑이 줄어 편하지만, 문자열만 키가 될 수 있음
- **키/값 튜플형** : 런타임에 키와 값을 시퀀스로 입력할 경우 유용

한편, 키 압축을 활용하면 처음에 모든 키가 동일한 값을 가지도록 쉽게 생성할 수 있다. 키 리스트와 초깃값을 전달하기만 하면 된다.(기본값: None)

In [73]:
dict.fromkeys(['a', 'b'], 0)

{'a': 0, 'b': 0}

## Dictionary Vs. List
Python의 모든 자료형이 객체이고, 리스트와 딕셔너리의 다양한 기능과 활용성 때문에 자료형 선택에 어려움이 있을 수 있다. 두 자료형 모두 유연한 컬렉션이지만 리스트는 아이템을 위치에 할당하고 딕셔너리는 아이템을 키에 할당한다.

In [76]:
Li = ['Bob', 40.5, ['dev', 'mgr']]  # 리스트 기반 레코드
print(Li[0])
print(Li[1])
print(Li[2][1])

Bob
40.5
mgr


In [77]:
Di = {'name' : 'Bob', 'age' : 40.5, 'jobs' : ['dev', 'mgr']}
print(Di['name'])
print(Di['age'])                    # 딕셔너리 기반 레코드
print(Di['jobs'][1])                # 번호가 아닌 이름!

Bob
40.5
mgr


딕셔너리와 리스트 대신 셋을 고려해 볼 수도 있다.

In [78]:
Se = {}
Se['state1'] = True
'state1' in Se

True

In [79]:
Sett = set()
Sett.add('state1')
'state1' in Sett

True