표준 파이썬 기본 자료 구조
==

> ## 리스트
---

### 리스트 개요

 리스트는 여러 요소를 담을 수 있는 가변한 데이터 구조이다. (가변한 데이터 구조? -> 메모리 안에 담겨 있는 값이 변할 수 있는 객체)
 
 구성 요소는 항목 또는 원소라고 불림
 
 []로 표시되며 요소들은 ,로 구분된다

+ 첫 코드에서 변수 이름 lst를 list로 잘못 입력하지 않도록

In [1]:
lst = [10, 20, 30]
print(lst, type(lst))

[10, 20, 30] <class 'list'>


In [2]:
list(['java', 'python', 'R'])           # 인자로 리스트나 퓨틀을 사용함

['java', 'python', 'R']

In [3]:
print(list(range(5)))            #range(a) 매개변수가 1개일때, 0부터 a-1까지 나열
print(list(range(1, 10)))        #range(a,b) 매개변수가 2개일때, a부터 b-1까지 나열
print(list(range(1, 10, 2)))     #range(a,b,c) 매개변수가 3개 일때, c간격만큼 a부터 b-1까지 나열


[0, 1, 2, 3, 4]
[1, 2, 3, 4, 5, 6, 7, 8, 9]
[1, 3, 5, 7, 9]


### 첨자 인덱싱과 슬라이싱

In [4]:
lst = [1, 3.92, 3>4, 'list']
print(lst[0], lst[2])

1 False


In [5]:
lst[2:4]

[False, 'list']

In [6]:
print(lst[2:])
print(lst[:4])
print(lst[-1:-4:-1])

[False, 'list']
[1, 3.92, False, 'list']
['list', False, 3.92]


### 메소드 append() insert()

In [7]:
import math as m
a = [m.pi, 30, 10 > 4, 'list', lambda x: x**3]
a.append('py')
a

[3.141592653589793, 30, True, 'list', <function __main__.<lambda>(x)>, 'py']

In [8]:
def add2(x, y):
    return x + y

a.insert(1, add2)
a[1](10, 20)


30

In [9]:
a

[3.141592653589793,
 <function __main__.add2(x, y)>,
 30,
 True,
 'list',
 <function __main__.<lambda>(x)>,
 'py']

In [10]:
a.remove(30)

In [11]:
a.pop()

'py'

In [12]:
a

[3.141592653589793,
 <function __main__.add2(x, y)>,
 True,
 'list',
 <function __main__.<lambda>(x)>]

### 리스트 컴프리헨션

(expression for item in iterable if condition)
- 각 요소를 생성하는 표현식
- iterable 에서 가져온 요소
- 반복 가능한 객체 (예 리스트 튜플 범위 등)
- (선택사항): 요소를 선택하는 조건

In [13]:
my_list = [x for x in range(10)]


In [14]:
[x for x in range(10) if x%2 == 1]

[1, 3, 5, 7, 9]

In [15]:
['even' if i%2 == 0 else 'odd' for i in range(1, 11)]


['odd', 'even', 'odd', 'even', 'odd', 'even', 'odd', 'even', 'odd', 'even']

In [16]:
[[i for j in range(5)] for i in range(3)]

[[0, 0, 0, 0, 0], [1, 1, 1, 1, 1], [2, 2, 2, 2, 2]]

In [17]:
[[j for j in range(i, i+6)] for i in range(3)]

[[0, 1, 2, 3, 4, 5], [1, 2, 3, 4, 5, 6], [2, 3, 4, 5, 6, 7]]

> ## 사전

### 사전 개요와 생성

키와 값의 쌍을 저장하는 자료형
중괄호{}로 둘러싸여 있으며, 각 쌍 쉼표,로 구분되어 있다
- {key1: value1, key2:valre2, ...,keyn:valuen}

사전의 특성
- 데이터 조직화: 키와 값의 쌍을 사용하여 데이터를 구조화하고 관리할 수 있다.
- 빠른 검색: 키를 사용하여 값을 빠르게 찾을 수 있다
- 중복 제거: 사전은 키가 고유하므로 중복된 데이러를 쉽게 제거할 수 있다.

In [18]:
mart = {'라면':1200, '음료수':1500, '과자':800}
print(mart, type(mart))

{'라면': 1200, '음료수': 1500, '과자': 800} <class 'dict'>


In [19]:
print(mart['라면'])
print(mart['과자'])
print(mart['음료수'])

1200
800
1500


In [20]:
data = {1: '일', 3.14: 2.71, (1,2): '튜플', 'list': [1, 2, 3]}
data

{1: '일', 3.14: 2.71, (1, 2): '튜플', 'list': [1, 2, 3]}

In [21]:
data = {1: '일', 3.14: 2.71, [1, 2]: '리스트', 'list': [1, 2, 3]} #수정가능한 리스트는 키로 사용불가

TypeError: unhashable type: 'list'

In [5]:
f_cnt = dict((('apple', 2), ('banana', 5), ('orange', 3)))
f_cnt

{'apple': 2, 'banana': 5, 'orange': 3}

In [6]:
f_price = dict(apple=4000, banana=300, orange=200)
f_price

{'apple': 4000, 'banana': 300, 'orange': 200}

### 항목 추가와 메소드 items()

In [8]:
mart = {'라면': 1200, '음료수': 1500, '과자': 800}
mart['삼각김밥'] = 1700
mart

{'라면': 1200, '음료수': 1500, '과자': 800, '삼각김밥': 1700}

In [13]:
mart['과자'] = 900            #값을 저장하면 이전 값이 수정된다
mart

{'라면': 1200, '음료수': 1500, '과자': 900, '삼각김밥': 1700}

In [10]:
mart.keys() # 모든키를 자료형 dict_kets로 반환한다

dict_keys(['라면', '음료수', '과자', '삼각김밥'])

In [11]:
mart.values() #


dict_values([1200, 1500, 900, 1700])

In [12]:
mart.items()

dict_items([('라면', 1200), ('음료수', 1500), ('과자', 900), ('삼각김밥', 1700)])

> ### 튜플과 집합

+ 튜플 개요와 활용

- 불변성ㅇ
- 성능
- 해시 가능성(hashable)

In [2]:
tp1 = 1, 2, 3   
tp2 = (10, 20, 30)
print(tp1, tp2)

(1, 2, 3) (10, 20, 30)


In [4]:
tp3 = tuple((10, 20, 30))  # 튜플은 인자에 리스트나 튜플을 넣어 만들 수 있다
tp4 = tuple(['py', 'R'])
print(tp3, tp4)

(10, 20, 30) ('py', 'R')


In [5]:
tuple1 = (1, 2, 3)
tuple2 = (4, 5, 6)
concatenated_tuple = tuple1 + tuple2
concatenated_tuple

(1, 2, 3, 4, 5, 6)

### 집합 개요와 활용

집합은 중복된 원소가 없고, 순서가 없는 자료형이다.

{}안에 ,로 구분된 값을 넣어 생성한다

중복을 허용하지 않아. 맴버쉽 검사와 중복 제거에 주로 사용될 수 있으며 중복된 데이터를 제거하는 데 유용하다.

- { element0, element1, element2, ~ , elementn}
원소인 elemeni는 고유한 값으로 중복을 허용하지 않는다

원소의 순서는 의미가 없다

원소는 불변한 것이어야 한다 (int, float, str, tuple등)

In [6]:
basket = {'apple', 'orange', 'apple', 'pear'}         #apple이 중복됨
basket

{'apple', 'orange', 'pear'}

In [7]:
len(basket)

3

In [8]:
print('grape' in basket)
print('apple' in basket)

False
True


In [23]:
A = {1, 2, 3, 4}
B = {3, 4, 5, 6, 7}
print(A.union(B)) # 합집합
print(A.intersection(B)) # 교집합
print(A.difference(B)) #차집합
print(B.difference(A)) #차집합
print(A.symmetric_difference(B)) #여집합

{1, 2, 3, 4, 5, 6, 7}
{3, 4}
{1, 2}
{5, 6, 7}
{1, 2, 5, 6, 7}


In [25]:
A = {1, 2, 3, 4}
B = {3, 4, 5, 6, 7}
print(A | B) #합집합
print(A & B) #교집합
print(A - B) #차집합
print(B - A) #차집합
print(A ^ B) #여집합

{1, 2, 3, 4, 5, 6, 7}
{3, 4}
{1, 2}
{5, 6, 7}
{1, 2, 5, 6, 7}


In [26]:
basket = {'apple', 'orange', 'apple', 'pear'}

basket.add('banana')        # 집합 메소드 add()로 인자를 추가 삽입할 수 있다

basket

{'apple', 'banana', 'orange', 'pear'}

In [29]:
myset = {0}
print(myset)
myset.add([1, 2]) #[]와 같은 리스트는 수정가능하기 때문에 집합의 원소가 될 수가 없다.

{0}


TypeError: unhashable type: 'list'

In [30]:
myset = {0}
print(myset)
myset.add((1, 2))  #반대로()와 같은 튜플은 수정불가능 하기 때문에 집합의 원소가 될 수 있다.

{0}


In [31]:
myset.remove(0)     # 집합 메소드 remove()로 인자를 삭제할 수도 있다
myset 

{(1, 2)}

### 수정 불가능 immutable과 함수 hash() id()

immutable(불변) - int(정수) float(부동소수점) str(문자열) tuple(튜플)

생성한 후에 값을 변경할 수 없으며, 변경하려고 하면 새로운 객체가 생성된다

이 특성은 객체의 안전성과 불변성을 보장하여 예상치 못한 변경으로부터 보호한다

파이썬에서 해시 가능한 객체만 딕셔너리(dict)의 키나 집합(set)의 원소로 사용될 수 있다



hash()

내장함수 hash(obj)는 주어진 객체 obj의 해시 값을 반환한다

해시값은 정수로, 객체의 내용에 기반하여 생성된다.

해시함수는 같은 값을 입력하면 똑같은 값이 반환된다

데이터구조에서 빠른 검색 및 비교를 위한 핵심 요소 중 하나이다.


In [32]:
print(hash([1, 2, 3])) # 수정가능한 사전이나 리스트 또는 집합은 hash()함수의 값을 가질 수 없다

TypeError: unhashable type: 'list'

In [33]:
print(hash({'one':1}))

TypeError: unhashable type: 'dict'

In [35]:
print(hash('py'), hash((1, 2))) #수정불가능한 기본 자료형과 튜플은 고유한 hash()값이 있다    

-7944585253580205059 -3550055125485641917


In [36]:
help(id)        #함수 id는 파이썬에서 모든 객체의 고유 식별자를 반환한다. 이 식별자는 객체가 메모리 상에서의 위치를 나타내는 정수 값이다 따라서 id()함수를 사용하면 두개의 객체가 동일한 메모리 위치를 가리키는지 알 수 있다

Help on built-in function id in module builtins:

id(obj, /)
    Return the identity of an object.

    This is guaranteed to be unique among simultaneously existing objects.
    (CPython uses the object's memory address.)



In [38]:
x, y = 10, 10         # 수정 불가능한 객체와 함수 id()를 사용하면 두객체가 동일한 값을 가리키는지 확인할 수 있다.
print(id(x), id(y))

140715571219160 140715571219160
