# 리스트(List)

In [6]:
# 리스트(list)는 다른 프로그래밍 언어의 '배열(array)'과 비슷한 성질을 가는 데이터 타입
# 리스트(list) 인덱스는 0 부터 시작하며, 파이썬에서는 마이너스(-) 인덱스를 지원하여 리스트의 마지막부터 연순으로 값을 참조할 수 있음

In [7]:
a = [10, 20, 30, 40, 50]

In [8]:
# 0, 1, 2, ... 인덱스는 리스트 처음부터 시작
# -1, -2, ... 인덱스는 리스트 마지막부터 시작

print("a[0] ==", a[0], ", a[2] ==", a[2], ", a[4] ==", a[4])
print("a[-1] ==", a[-1], ", a[-2] ==", a[-2], ", a[-5] ==", a[-5])

a[0] == 10 , a[2] == 30 , a[4] == 50
a[-1] == 50 , a[-2] == 40 , a[-5] == 10


In [9]:
# 리스트(list) 각 요소의 데이터타입을 다르게 해서 생성할 수 있으며, 리스트 안에 또 다른 리스트를 포함할 수도 있음.

In [10]:
b = [10, 20, "Hello", [True, 3.14]]

In [11]:
# b[3] 또는 b[-1] 값은 [True, 3.14] 리스트 전체임

print("b[0] ==", b[0], ", b[2] ==", b[2], ", b[3] ==", b[3])
print("b[-1] ==", b[-1], ", b[-2] ==", b[-2], ", b[-4] ==", b[-4])

b[0] == 10 , b[2] == Hello , b[3] == [True, 3.14]
b[-1] == [True, 3.14] , b[-2] == Hello , b[-4] == 10


In [12]:
print("b[3][0] ==", b[3][0], ", b[3][1] ==", b[3][1])
print("b[-1][1] ==", b[-1][1], ", b[-1][-2] ==", b[-1][-2])

b[3][0] == True , b[3][1] == 3.14
b[-1][1] == 3.14 , b[-1][-2] == True


In [13]:
# 빈 리스트(list) 생성 후 append method를 이용하여 데이터 추가(머신러닝 코드에서 정확도 계산, 손실함수 값 저장하기 위해 사용)

In [16]:
c = []
c.append(100), c.append(200), c.append(300)
print(c)

[100, 200, 300]


In [15]:
# 파이썬 리스트(list)에는 콜론(:)을 이용하여 '슬라이싱' 기능이 있음. 슬라이싱을 이용하면 범위를 지정해 부분 리스트를 얻을 수 있음
# 머신러닝을 위해서는 반드시 알아야하는 기능임

In [24]:
a = [10, 20, 30, 40, 50]

In [25]:
# a[0:2] => 인덱스는 0부터 2-1 까지, a[1:] => 인덱스 1부터 끝까지
# a[:3] => 인덱스는 처음부터 3-1 까지, a[:-2] => 인덱스 처음부터 -2-1까지
# a[:] => 인덱스 처음부터 끝까지

print("a[0:2] ==", a[0:2], ", a[1:] ==", a[1:])
print("a[:3] ==", a[:3], ", a[:-2] ==", a[:-2])
print("a[:] ==", a[:])

a[0:2] == [10, 20] , a[1:] == [20, 30, 40, 50]
a[:3] == [10, 20, 30] , a[:-2] == [10, 20, 30]
a[:] == [10, 20, 30, 40, 50]


# 튜플(tuple)

In [17]:
# 튜플(tuple)은 리스트(list)와 거의 비슷하며 다른 점은 다음과 같음
# 리스트는 []으로 둘러 싸여 있지만 튜플은 ()으로 둘러싸여 있다.
# 리스트 내의 원소를 변경할 수 있지만 튜플은 변경할 수 없다.

In [26]:
a = (10, 20, 30, 40, 50)

In [27]:
print("a[0] ==", a[0], ", a[-2] ==", a[-2], ", a[:] ==", a[:])
print("a[0:2] ==", a[0:2], ", a[1:] ==", a[1:])

a[0] == 10 , a[-2] == 40 , a[:] == (10, 20, 30, 40, 50)
a[0:2] == (10, 20) , a[1:] == (20, 30, 40, 50)


In [29]:
a[0] = 100 # 튜플은 값을 수정할 수 없음

TypeError: 'tuple' object does not support item assignment

# 딕셔너리(dictionary)

In [18]:
# 딕셔너리(dictionary)는 다른 프로그래밍 언어의 '해시(hash)' 또는 '맵(map)'과 구조가 비슷.
# 딕셔너리 키(key)와 값(value)을 한 쌍으로 해서 데이터를 저장함.

In [30]:
score = {"KIM":90, "LEE":85, "JUN":95} # dictionary 생성

In [32]:
print('score["KIM"] ==', score['KIM']) # 원소 접근

score["KIM"] == 90


In [33]:
score["HAN"] = 100 # 새 원소 추가
# Python 3.6 이후부터 딕셔너리 역시 리스트와 마찬가지로 입력한 순서대로 데이터가 들어가도록 변경됨
print(score)

{'KIM': 90, 'LEE': 85, 'JUN': 95, 'HAN': 100}


In [35]:
# 딕셔너리 key, value, (key, value)

print("score key ==", score.keys())
print("score value ==", score.values())
print("score items ==", score.items())

print(type(score.keys()))
print(type(score.values()))
print(type(score.items()))

score key == dict_keys(['KIM', 'LEE', 'JUN', 'HAN'])
score value == dict_values([90, 85, 95, 100])
score items == dict_items([('KIM', 90), ('LEE', 85), ('JUN', 95), ('HAN', 100)])
<class 'dict_keys'>
<class 'dict_values'>
<class 'dict_items'>


# 스트링(string)

In [19]:
# 파이썬 문자열(string)은 홑따옴표('') 또는 쌍따옴표("")를 사용해서 생성
# 문자열 내의 각각의 값 또한 문자열로 인식되며, 
# 문자열을 분리하여 list로 변환하는 split() 함수는 머신러닝 코드에서 문자열 데이터 전처리 (pre-process) 하기 위해 사용됨

In [36]:
a = 'A73,CD'

In [37]:
a[1] # a[1] 은 숫자 7이 아닌 문자열 7

'7'

In [38]:
a = a + ', EFG' # + 연산자 사용
a

'A73,CD, EFG'

In [39]:
# split() 메소드는 특정 seperator를 기준으로 문자열을 분리하여 list 리턴

b = a.split(',')
print(b)

['A73', 'CD', ' EFG']


# type(), len()

In [20]:
# type(data)는 입력 data의 데이터타입을 알려주는 함수
# len(data)은 입력 데이터의 길이(요소의 개수)를 알려주는 함수

In [40]:
a = [10, 20, 30, 40, 50]
b = (10, 20, 30, 40, 50)
c = {"KIM":90, "LEE":80}
d = 'Seoul, Korea'
e = [[100, 200], [300, 400], [500, 600]]

print(type(a), type(b), type(c), type(d), type(e))
print(len(a), len(b), len(c), len(d), len(e))

<class 'list'> <class 'tuple'> <class 'dict'> <class 'str'> <class 'list'>
5 5 2 12 3


# list(), str(), int()

In [21]:
# list(data)는 입력 data를 리스트로 만들어 리턴하는 함수

In [41]:
a = "Hello"
b = {"KIM":90, "LEE":80}

print(list(a), list(b.keys()), list(b.values()), list(b.items()))

['H', 'e', 'l', 'l', 'o'] ['KIM', 'LEE'] [90, 80] [('KIM', 90), ('LEE', 80)]


In [22]:
# str(data)은 입력되는 data를 문자열로 변환하여 리턴하는 함수

In [42]:
str(3.14)

'3.14'

In [43]:
str('100')

'100'

In [44]:
str([1, 2, 3])

'[1, 2, 3]'

In [23]:
# int(data)는 문자열 형태로 입력되는 숫자나 소수점이 있는 숫자 등을 정수 형태로 리턴하는 함수

In [45]:
int('100')

100

In [47]:
int(3.14)

3