# 데이터 구조

목차

- 문자열
- 리스트
- 세트
- 딕셔너리

![](img/datastructures.png)

- Niklaus Wirth
 - Algorithms + Data Structures = Programs
<br><br> 
- 프로그래밍 언어 파스칼 설계 (1969)
<br><br>
- 1984년 튜링상 수상

### 데이터 구조

- 데이터에 편리하게 접근하고, 변경하기 위해 데이터를 저장하거나 조작하는 법
 - '자료구조'라고도 함
<br><br>
- 순서가 있는 데이터 구조
 - 문자열(String)
 - 리스트(List)
<br><br>
- 순서가 없는 데이터구조
 - 세트(Set)
 - 딕셔너리(Dictionary)

### 문자열

- 문자들의 나열(sequence of characters)
- 문자열의 특징
 - 변경할 수 없고(Immutable)
 - 순서가 있고(Ordered)
 - 순회 가능한(Iterable)

- Immutable

In [1]:
a = 'my string?'
a[-1] = '!'

TypeError: 'str' object does not support item assignment

- Iterable

In [2]:
a = '123'
for char in a:
    print(char)

1
2
3


### 문자열 인덱스(Index)

In [3]:
- 파이썬에서 문자열은 아래와 같이 접근할 수 있음

SyntaxError: invalid syntax (Temp/ipykernel_2288/1516707766.py, line 1)

![](img/range.png)

### 문자열 자르기(Slicing)

- 파이썬에서 문자열은 아래와 같이 자를 수 있음

![](img/slicing2.png)

In [11]:
s = 'abcdefghi'

print(s[2:5])
print(s[-6:-2])
print(s[2:-4])

print(s[2:5:2])
print(s[-6:-1:3])
print(s[2:5:-1])
print(s[5:2:-1])

print(s[:3])
print(s[5:])

print(s[::]) # s[0:len(s):1]과 동일
print(s[::-1]) # s[-1:-(len(s)+1):-1]과 동일 => 뒤집기

cde
defg
cde
ce
dg

fed
abc
fghi
abcdefghi
ihgfedcba


#### 문자열 조회 / 탐색

#### <span style="color:green"> .find(x) </span>

- x의 첫번째 위치를 반환, 없으면 -1을 반환

In [12]:
'apple'.find('p')

1

In [13]:
'apple'.find('k')

-1

#### <span style="color:green"> .index(x) </span>

- x의 첫 번째 위치를 반환, 없으면, ValueError 일으킴

In [14]:
'apple'.index('p')

1

In [15]:
'apple'.index('k')

ValueError: substring not found

#### <span style="color:green"> .replace( old, new [ , count ] ) </span>    [ ]는 BNF; Backus-Naur Form에 따르면 '선택적'이라는 뜻이다

- 바꿀 대상 글자를 새로운 글자로 바꿔서 변환(복사본 반환)
- count를 지정하면, 해당 개수만큼만 시행

In [16]:
'coone'.replace('o', 'a')

'caane'

In [19]:
'wooooowoo'.replace('o', '!', 2)

'w!!ooowoo'

#### 문자열 변경

#### <span style="color:green"> .strip( [ chars ] ) </span>

- 특정한 문자들을 지정하면,
 - 양쪽을 제거하거나(strip), 왼쪽을 제거하거나(lstrip), 오른족을 제거(rstrip)
- 문자열을 지정하지 않으면 공백을 제거함

In [20]:
'     와우!\n'.strip()

'와우!'

In [21]:
'     와우!\n'.lstrip()

'와우!\n'

In [22]:
'     와우!\n'.rstrip()

'     와우!'

In [23]:
'안녕하세요?????????'.strip('?')

'안녕하세요'

#### <span style="color:green"> .split( sep = None ) </span>

- 문자열을 특정한 단위로 나눠 리스트로 반환

In [24]:
'a, b, c'.split('_')

['a, b, c']

In [26]:
'a b c'.split()

['a', 'b', 'c']

#### <span style="color:green"> 'separator'.join( iterable ) </span>

- 반복 가능한(iterable) 컨테이너 요소들을 separator(구분자)로 합쳐 문자열 반환

In [27]:
'!'.join('world')

'w!o!r!l!d'

In [28]:
' '.join(['3', '5'])

'3 5'

#### <span style="color:green"> .capitalize() </span> : 첫 문자를 대문자, 나머지는 소문자
#### <span style="color:green"> .title </span> : ' 나 공백 이후의 단어 첫 문자를 대문자로
#### <span style="color:green"> .upper </span> : 모두 대문자로
#### <span style="color:green"> .lower </span> : 모두 소문자로
#### <span style="color:green"> .swapcase() </span> : 대 <- -> 소 문자로 면경하여

In [29]:
msg = 'hi! Everyone, I\'m happy'

print(msg)
print(msg.capitalize())
print(msg.title())
print(msg.upper())
print(msg.lower())
print(msg.swapcase())

hi! Everyone, I'm happy
Hi! everyone, i'm happy
Hi! Everyone, I'M Happy
HI! EVERYONE, I'M HAPPY
hi! everyone, i'm happy
HI! eVERYONE, i'M HAPPY


### 문자열 관련 검증 메서드

#### <span style="color:green"> .isalpha </span> : 알파벳 문자 여부     *단순 알파벳이아닌 유니코드 상 Letter(한국어도 포함)
#### <span style="color:green"> .isupper </span> : 대문자 여부
#### <span style="color:green"> .islower </span> : 소문자 여부
#### <span style="color:green"> .istitle </span> : 타이틀 형식 여부

In [31]:
'abc'.isalpha()

True

In [32]:
'ㄱㄴㄷ'.isalpha()

True

In [33]:
'Ab'.isupper()

False

In [34]:
'ab'.islower()

True

In [36]:
'Title Title!'.istitle()

True

#### <span style="color:green"> .isdecimal() < .isdigit() < .isnumeric() </span>

![](img/isfunc.png)

In [37]:
'↉'.isdecimal()

False

In [38]:
'↉'.isdigit()

False

In [39]:
'↉'.isnumeric()

True

In [40]:
'⑨④'.isdecimal()

False

In [42]:
'⑨④'.isdigit()

True

In [43]:
'⑨④'.isnumeric()

True

### 리스트

- 순서가 있는 시퀀스, 인덱스로 접근
<br><br>
- 리스트의 특징
 - 변경 가능하고(Mutable)
 - 순서가 있고(Ordered)
 - 순회 가능한(Iterable)

#### 값 추가 및 삭제

#### <span style="color:green"> .append( x ) </span>

- 리스트의 끝에 값을 추가함

In [44]:
cafe = ['starbucks', 'tomntoms', 'hollys']
print(cafe)
cafe.append('banapresso')
print(cafe)

['starbucks', 'tomntoms', 'hollys']
['starbucks', 'tomntoms', 'hollys', 'banapresso']


#### <span style="color:green"> .extend( iterable ) </span>

- 리스트에 iterable의 항목을 추가함

In [47]:
cafe = ['starbucks', 'tomntoms', 'hollys']
print(cafe)
cafe.extend(['banapresso'])
print(cafe)

['starbucks', 'tomntoms', 'hollys']
['starbucks', 'tomntoms', 'hollys', 'banapresso']


In [48]:
cafe = ['starbucks', 'tomntoms', 'hollys']
print(cafe)
cafe += ['banapresso']
print(cafe)

['starbucks', 'tomntoms', 'hollys']
['starbucks', 'tomntoms', 'hollys', 'banapresso']


In [45]:
cafe = ['starbucks', 'tomntoms', 'hollys']
print(cafe)
cafe.extend('banapresso')
print(cafe)

['starbucks', 'tomntoms', 'hollys']
['starbucks', 'tomntoms', 'hollys', 'b', 'a', 'n', 'a', 'p', 'r', 'e', 's', 's', 'o']


#### <span style="color:green"> .insert( i, x ) </span>

- 정해진 위치 i에 값 x를 추가함

In [49]:
cafe = ['starbucks', 'tomntoms', 'hollys']
print(cafe)
cafe.insert(0, 'banapresso')
print(cafe)

['starbucks', 'tomntoms', 'hollys']
['banapresso', 'starbucks', 'tomntoms', 'hollys']


In [50]:
cafe = ['starbucks', 'tomntoms', 'hollys']
print(cafe)
cafe.insert(len(cafe), 'banapresso') # 리스트 길이보다 큰 경우 맨 뒤
print(cafe)

['starbucks', 'tomntoms', 'hollys']
['starbucks', 'tomntoms', 'hollys', 'banapresso']


In [52]:
cafe = ['starbucks', 'tomntoms', 'hollys']
print(cafe)
cafe.insert(1000, 'banapresso') # 리스트 길이보다 큰 경우 맨 뒤
print(cafe)

['starbucks', 'tomntoms', 'hollys']
['starbucks', 'tomntoms', 'hollys', 'banapresso']


#### <span style="color:green"> .remove( x ) </span>

- 리스트에서 값이 x인 첫번재 항목 삭제

In [53]:
numbers = [1, 2, 3, 'hi']
print(numbers)
numbers.remove('hi')
print(numbers)

[1, 2, 3, 'hi']
[1, 2, 3]


In [54]:
numbers.remove('hi') # 없는 경우 Error

ValueError: list.remove(x): x not in list

#### <span style="color:green"> .pop( i ) </span>

- 정해진 i에 있는 값을 삭제하고, 그 학목을 반환함
- i가 지정되지 않으면, 마지막 항목을 삭제하고 반환함

In [55]:
numbers = ['hi', 1, 2, 3]
print(numbers)
numbers.pop()
print(numbers)

['hi', 1, 2, 3]
['hi', 1, 2]


In [56]:
numbers = ['hi', 1, 2, 3]
print(numbers)
numbers.pop(0)
print(numbers)

['hi', 1, 2, 3]
[1, 2, 3]


#### <span style="color:green"> .clear( ) </span>

- 모든 항목을 삭제함

In [57]:
numbers = [1, 2, 3]
print(numbers)
numbers.clear()
print(numbers)

[1, 2, 3]
[]


#### 탐색 및 정렬

#### <span style="color:green"> .index( x ) </span>

- 첫번째 x값을 찾아 해당 index 값을 반환

In [59]:
numbers = [1, 2, 3, 4]
print(numbers)
print(numbers.index(3))
print(numbers.index(100)) # 없는 경우 Error

[1, 2, 3, 4]
2


ValueError: 100 is not in list

#### <span style="color:green"> .count( x ) </span>

- 원하는 값 x의 개수를 반환함

In [60]:
numbers = [1, 2, 3, 1, 1]
numbers.count(1)

3

In [61]:
numbers = [1, 2, 3, 1, 1]
numbers.count(100)

0

#### <span style="color:green"> .sort( x ) </span>

- 원본 리스트를 정렬함. None을 반환
- sorted 함수와 비교할 것

In [62]:
numbers = [3, 2, 5, 1]
result = numbers.sort()
print(numbers, result)

[1, 2, 3, 5] None


In [63]:
numbers = [3, 2, 5, 1]
result = sorted(numbers)
print(numbers, result)

[3, 2, 5, 1] [1, 2, 3, 5]


#### <span style="color:green"> .reverse( x ) </span>

- 순서를 반대로 뒤집음(정렬하는 것이 아님)

In [65]:
numbers = [3, 2, 5, 1]
result = numbers.reverse()
print(numbers, result)

[1, 5, 2, 3] None


#### 리스트 복사

- 리스트 복사 확인하기

In [66]:
original_list = [1, 2, 3]
copy_list = original_list
print(original_list, copy_list)

[1, 2, 3] [1, 2, 3]


In [68]:
copy_list[0] = 'hello'
print(original_list, copy_list) # 리스트의 복사는 같은 리스트의 주소를 참조

['hello', 2, 3] ['hello', 2, 3]


![](img/deepcopy.png)

#### 리스트 복사 - 얕은 복사(Shallow copy) 1

- slice 연산자를 활용하여 같은 원소를 가진 리스트지만 연산된 결과를 복사 (다른 주소)

In [69]:
a = [1, 2, 3]
b = a[:]
b[0] = 5
print(a, b)

[1, 2, 3] [5, 2, 3]


![](img/shallowcopy.png)

#### 리스트 복사 - 얕은 복사(Shallow copy) 2

- list( )를 활용하여 같은 원소를 가진 리스트지만 연산된 결과를 복사 (다른 주소)

In [70]:
a = [1, 2, 3]
b = list(a)
print(a, b)
b[0] = 5
print(a, b)

[1, 2, 3] [1, 2, 3]
[1, 2, 3] [5, 2, 3]


![](img/shallowcopy.png)

#### 리스트 복사 - 얕은 복사 주의사항

In [71]:
a = [1, 2, ['a', 'b']]
b = a[:]
print(a, b)
b[2][0] = 0
print(a, b)

[1, 2, ['a', 'b']] [1, 2, ['a', 'b']]
[1, 2, [0, 'b']] [1, 2, [0, 'b']]


![](img/shallowcau.png)

#### 리스트 복사 - 깊은 복사(Deep copy)

- 리스트 복사 확인하기

In [77]:
import copy

a = [1, 2, ['a', 'b']]
b = copy.deepcopy(a)
print(a, b)
b[2][0] = 0
print(a, b)

[1, 2, ['a', 'b']] [1, 2, ['a', 'b']]
[1, 2, ['a', 'b']] [1, 2, [0, 'b']]


![](img/deepcopy2.png)