In [1]:
import collections

# 리스트 컴프리헨션
# 홀수인 경우 2를 곱해 출력
[n * 2 for n in range(1, 11) if n % 2 == 1]

[2, 6, 10, 14, 18]

In [3]:
# 만약 리스트 컴프리헨션을 사용하지 않는다면, 다음과 같이 길게 풀어서 작성해야
a = []
for n in range(1, 11):
    if n % 2 == 1:
        a.append(n * 2)
a

[2, 6, 10, 14, 18]

In [4]:
# enumerate(): 열거하다
# 여러 가지 자료형(list, set, tuple 등)을 인덱스를 포함한 enumerate 객체로 리턴
a = [1, 2, 3, 2, 45]
a

[1, 2, 3, 2, 45]

In [5]:
enumerate(a)

<enumerate at 0x7feaf8f2a600>

In [6]:
# list()로 결과 추출 가능. 인덱스를 자동으로 부여해주기 때문에 매우 편리하게 활용 가능
list(enumerate(a))

[(0, 1), (1, 2), (2, 3), (3, 2), (4, 45)]

In [7]:
# 그렇다면 a =['a1', 'a2', 'a3']가 있을 때 이 리스트의 인덱스와 값을 함께 출력하려면?
a = ['a1', 'a2', 'a3']
for index, value in enumerate(a):
    print(index, value)

0 a1
1 a2
2 a3


In [8]:
# // 나눗셈 연산자: 동일한 정수형을 결과로 리턴하면서 내림 연산자 역할 수행(몫)
# % 나눗셈 연산자: 나머
5 // 3

1

In [9]:
 # 몫과 나머지를 동시에 구하려면 divmod() 함수 사용
divmod(5, 3)

(1, 2)

In [1]:
# 리스트

In [2]:
a = [1, 2, 3]
a

[1, 2, 3]

In [3]:
a.append(4)

In [4]:
a.insert(3, 5)

In [5]:
a

[1, 2, 3, 5, 4]

In [6]:
a.append('안녕')
a.append(True)

In [7]:
a

[1, 2, 3, 5, 4, '안녕', True]

In [8]:
a[3]

5

In [9]:
a[1:3]

[2, 3]

In [10]:
a[:3]

[1, 2, 3]

In [11]:
a[4:]

[4, '안녕', True]

In [12]:
# 인덱스 1,2,3 의 값
a[1:4]

[2, 3, 5]

In [13]:
a[1:4:2]  # 인덱스 1,3의 값 가져옴(인덱스 1부터 시작해 1에서 두칸 건너뛴 3까지의 값 가져옴)

[2, 5]

In [14]:
a[9]

IndexError: list index out of range

In [15]:
# IndexError는 인덱스가 리스트의 길이를 넘어설 때 발생
# try 구문으로 에러에 대한 예외처리 가능
try:
    print(a[9])
except IndexError:
    print('존재하지 않는 인덱스')

존재하지 않는 인덱스


In [16]:
# 리스트에서 요소 삭제하기
#- 인덱스로 삭제하기
#- 값으로 삭제하기

In [17]:
# 1. del 키워드: 인덱스의 위치에 있는 요소 삭제 가능
a

[1, 2, 3, 5, 4, '안녕', True]

In [18]:
del a[1]

In [19]:
a

[1, 3, 5, 4, '안녕', True]

In [20]:
# 2. remove 함수: 값에 해당하는 요소 삭제 가능
a.remove(3)
a

[1, 5, 4, '안녕', True]

In [25]:
# 3. pop() 함수: 스택의 팝 연산처럼 추출로 처리된다. 즉 삭제될 값을 리턴하고 삭제 진행
# a.pop(3) # True
a

[1, 5, 4]

# 딕셔너리
리스트와의 차이점
리스트는 인덱스를 숫자로만 지정할 수 있음
딕셔너리는 문자를 포함해 다양한 타입을 키로 사용 가능
특히 파이썬의 딕셔너리는 해시할 수만 있다면 숫자 뿐만 아니라, 문자, 집합까지 불변 객체를 모두 키로 사용 가능 -> 해싱(해시테이블을 이용해 자료 저장)
해시 테이블은 다양한 타입을 키로 지원하면서도 입력과 조회 모두 O(1)에 가능
물론 해시 테이블은 최악의 경우 O(n)이 될 수 있으나 대부분의 경우 훨씬 더 빨리 실행되며, 분할 상환 분석에 따른 시간복잡도는 O(1)

딕셔너리의 주요 연산 시간 복잡도
연산	시간 복잡도	설명
len(a)/	O(1)	요소의 개수를 리턴한다.
a[key]/	O(1)	키를 조회하여 값을 리턴한다.
a[key] = value/	O(1)	키/값을 삽입한다.
key in a/	O(1)	딕셔너리에 키가 존재하는지 확인한다


In [27]:
# 딕셔너리 활용 방법
a = dict()
a1 = {}

In [28]:
dic = {'key1': 'value1', 'key2': 'value2'}

In [29]:
dic

{'key1': 'value1', 'key2': 'value2'}

In [30]:
dic['key2'] = 'value3'

In [31]:
dic

{'key1': 'value1', 'key2': 'value3'}

In [33]:
del dic['key2']

In [36]:
dic['key2'] = 'value2'

In [37]:
dic['key3'] = 'value3'

In [38]:
# 딕셔너리에 있는 키/값은 for 반복문으로도 조회 가능
# 딕셔너리의 items() 메소드 사용 시 키와 값을 각각 꺼내오기 가능
for k, v in dic.items():
    print(k, v)

key1 value1
key2 value2
key3 value3


In [40]:
# 딕셔너리 모듈
# defaultdict 객체
# 존재하지 않는 키를 조회할 경우, 에러 메시지를 출력하는 대신 디폴트 값을 기준으로 해당 키에 대한 딕셔너리 아이템 생성
import collections
a = collections.defaultdict(int)
a['a']=4
a['b']=3
a

defaultdict(int, {'a': 4, 'b': 3})

In [41]:
a['c']+=1 # 원래 c는 존재하지 않는 키라 keyError가 발생해야 하겠지만, defaultdict 객체는 에러 없이 바로 +1 연산 가능, 이 경우 디폴트인 0을 기준으로 자동으로 생성 후 여기에 1을 더해 최종적으로 1이 만들어짐
a

defaultdict(int, {'a': 4, 'b': 3, 'c': 1})

In [43]:
# Counter 객체
# item 에 대한 개수를 계산해 딕셔너리로 리턴
a = [1,2,2,3,3,3,4,5,5,6,6]
b = collections.Counter(a) # key 에는 아이템 값이, 값에는 해당 아이템 <개수>가 들어간 딕셔너리 생성. 실제로는 다음과 같이 딕셔너리를 한번 더 wrapping한 collections.Counter 클래스 가짐.
b

Counter({1: 1, 2: 2, 3: 3, 4: 1, 5: 2, 6: 2})

In [46]:
# Counter 객체
# 개수를 자동으로 계산해주기 때문에 매우 편리하며, 여러 분야에서 다양하게 활용됨.
# Counter 객체에서 가장 빈도수가 높은 요소는 어떻게 추출할 수 있을까?
# most_common()을 사용!
b.most_common(4) # 가장 빈도가 높은 2개의 요소 추출

[(3, 3), (2, 2), (5, 2), (6, 2)]