# 1. Python 소개


## 개요

- 기계학습, Deep Learning 

- 특히 TensorFlow는 Python 및 Pandas 활용 필수

## 특징

- 인터프리터 언어이나, 고성능 제공 (기본 기능 상당수는 C로 구현, cython이나 PyPy 등 성능 위주 구현체 존재)

- 쉬운 문법 : 기존 언어에 익숙하지 않은 분석가들에게 인기 

- 간결함 : 블럭 구조문 대신 들여쓰기(identation) 활용, List Comprehension, 람다 함수 등 

- 풍부한 라이브러리 제공 : 기본 제공 모듈 강력 (battery-included), 수많은 Third-Party 모듈

- 주요 ML, DL 라이브러리 기본 제공



## 이슈: Python 2 vs 3

- `Python 3` 이행 더뎠음 : 주요 라이브러리 2.x대에 오래 머물렀으며, 현재 리눅스 주요 배포판은 2.x만 설치됨

- 대부분 주요 라이브러리 컨버전 완료. 일관성/성능 고려 `Python 3` 기반 진행 예정

## 참고

> Read–Eval–Print Loop (REPL) :  interactive toplevel or language shell, is a simple, interactive computer programming environment 
> - takes single user inputs (i.e. single expressions)
> - evaluates them
> - and returns the result to the user
> - 처음에는 LISP 환경을 가리켰으나, 요즘은 대부분 스크립트 언어가 제공하는 CLI 환경을 가리킴

# 2. 변수 / 문자열

## 변수 (Variable)

- 변수: 객체(object)를 가리키는 Reference 역할

> - 별다른 형(type) 지정 없이 할당 가능
> - 모든 기본 자료형 (int, float, str) 모두 객체임 (Python 2.x와의 가장 큰 차이중 하나)

### 변수 할당 (Variable Allocation)

In [1]:
value = 10000
value # 마지막 행의 변수는 문자열로 변환, 화면 출력

10000

### 변수-객체 바인딩

> `id(변수명)` : 변수에 할당된 객체의 레퍼런스 ID 확인하는 내장 함수

#### 같은 객체에 바인딩된 경우

> 변수는 `pointer` / `reference` 와 유사
> 숫자, 문자열 등 모든 값은 파이썬 안에서 객체(object) 임

![객체 바인딩](https://wikidocs.net/images/page/2836/02.07.png)

- 같은 객체를 가리킬 때
- 자주 사용될 가능성 높은 정수값은 미리 객체화, 공유하여 메모리 절약 : `0` ... `256`

In [4]:
a = 10000
b = a
print(id(a), id(b))

# id() : 객체의 주소값 반환. 즉, 변수의 id 값이 같다는 것은 같은 객체에 바인딩되어 있다는 것

x = 100
y = 100
id(x) == id(y)

140033587991024 140033587991024


True

#### 다른 객체에 바인딩된 경우

In [5]:
x = 10000
y = 10000
id(x) == id(y)

False

## 문자열

In [6]:
mystring  = 'hello world'
mystring

'hello world'

- `len()` : 주어진 문자열 (또는 list, tuple, dict ) 의 글자 (원소) 갯수를 반환하는 내장함수

In [7]:
len(mystring)

11

### 문자열 Indexing / Slicing

- indexing : 인덱스값을 주고, 그 위치의 글자(원소)를 받아옴 

- slicing : 주어진 인덱스 범위의 문자열을 새로 만들어 반환 

> - zero-based index
> - 음수값 인덱스 가능 : 역방향, -1 이면 마지막 원소

#### 양수

![](https://wikidocs.net/images/page/2838/02.09.png)

#### 음수

![](https://wikidocs.net/images/page/2838/02.10.png)

In [8]:
# Indexing

print(mystring[1])
print(mystring[-2])

e
l


In [11]:
# Slicing

s1 = mystring[0:5]
s2 = mystring[6:11]
s3 = mystring[6:]

print(s1, s2, s3)
print(s2 == s3, id(s2) == id(s3)) # 값은 동일하나, 

hello world world
True False


In [10]:
mystring[:] # 전체 문자열 복사, 새로운 문자열로 반환

'hello world'

In [12]:
mystring[6:-1]

'worl'

### 문자열 나누기 / 합치기 (split / join)

#### 문자열 나누기 (split)

In [14]:
terms = 'Python is simple in string manipulation.'
terms_list = terms.split(' ')
print(terms_list, type(terms_list))

['Python', 'is', 'simple', 'in', 'string', 'manipulation.'] <class 'list'>


In [15]:
terms.split(' ')[-1]

'manipulation.'

#### 문자열 합치기 (join)

In [17]:
terms_with_underscore = '_'.join(terms_list)
print(terms_with_underscore)

Python_is_simple_in_string_manipulation.


In [18]:
terms_without_delimiter = ''.join(terms_list)
print(terms_without_delimiter)

Pythonissimpleinstringmanipulation.


## 기본 데이터 타입

![Python Data Types](https://wikidocs.net/images/page/2841/02.11.png)

### Type Check 

- `type()` 함수 사용

In [19]:
print(type(70000), type(3.14), type('abc'))

<class 'int'> <class 'float'> <class 'str'>


# 3. 기본 자료 구조 

## 리스트 (list)

### 생성

In [20]:
# 정수 리스트
daishin = [9130, 9150, 9150, 9300, 9400]

# 다른 type 포함 리스트도 가능!
mystock = ['Naver', 5000]

# 빈(empty) 리스트
mystock_empty = []

print(daishin, mystock, mystock_empty)

[9130, 9150, 9150, 9300, 9400] ['Naver', 5000] []


In [21]:
# 리스트 안에 리스트도 가능 (nested list)

[1,2,3,list(range(0,5)),4]

[1, 2, 3, [0, 1, 2, 3, 4], 4]

In [24]:
# 빈 리스트를 만드는 다른 방법

list()

[]

### Indexing / Slicing

> 문자열도 `char` type의 리스트이므로, Indexing / Slicing 방법 또한 동일!

![list indexing](https://wikidocs.net/images/page/2848/03.03.png)

In [25]:
print(daishin[0], daishin[1])
print(daishin[-1], daishin[-2])
print(daishin[1:3], daishin[:3])
print(daishin[3:], daishin[3:-1])

9130 9150
9400 9300
[9150, 9150] [9130, 9150, 9150]
[9300, 9400] [9300]


### 아이템 변경 / 추가 / 삭제

In [26]:
kospi_top10 = ['삼성전자', 'SK하이닉스', '현대차', '한국전력', '아모레퍼시픽', '제일모직', '삼성전자우', '삼성생명', 'NAVER', '현대모비스']
print(id(kospi_top10))
kospi_top10[6] = '삼성전자_우'
kospi_top10.append('SK텔레콤') #바인딩된 리스트 자체 업데이트, 반환값은 없음. 
print(kospi_top10, id(kospi_top10))

kospi_top11 = kospi_top10 # 새로운 객체를 만들지 않았음!
print(id(kospi_top11))
kospi_top11 = kospi_top11.copy() # 같은 항목을 가진 새로운 객체를 만들고, 그 객체와 바인딩
print(id(kospi_top11))

140033587604616
['삼성전자', 'SK하이닉스', '현대차', '한국전력', '아모레퍼시픽', '제일모직', '삼성전자_우', '삼성생명', 'NAVER', '현대모비스', 'SK텔레콤'] 140033587604616
140033587604616
140033587438664


In [27]:
print(kospi_top11[-1])

del kospi_top11[-1]
print(len(kospi_top11), kospi_top11)
print(len(kospi_top10), kospi_top10)

SK텔레콤
10 ['삼성전자', 'SK하이닉스', '현대차', '한국전력', '아모레퍼시픽', '제일모직', '삼성전자_우', '삼성생명', 'NAVER', '현대모비스']
11 ['삼성전자', 'SK하이닉스', '현대차', '한국전력', '아모레퍼시픽', '제일모직', '삼성전자_우', '삼성생명', 'NAVER', '현대모비스', 'SK텔레콤']


## 튜플 (tuple)

> 변경 불가능한 (immutable) 리스트

- 리스트는 '[' 와 ']'를 사용하는 반면 튜플은 '('와 ')'를 사용한다. 
- 리스트는 리스트 내의 원소를 변경할 수 있지만 튜플은 변경할 수 없다. 

In [28]:
t = ('Samsung', 'LG', 'SK')
print(t)
print(len(t), t[0])
t_sliced = t[0:2] ; print(id(t), id(t_sliced), t_sliced)

('Samsung', 'LG', 'SK')
3 Samsung
140033588021432 140033647155208 ('Samsung', 'LG')


In [30]:
list(t_sliced)

['Samsung', 'LG']

In [31]:
t[0] = 'Naver' # 변경 불가능하므로, Error 발생

TypeError: 'tuple' object does not support item assignment

## 딕셔너리 (dict)

- Key-Value 데이터 구조 (Java의 `Map`과 유사)
-  '{'와 '}' 기호를 사용

### Dict 생성 및 아이템 추가

In [32]:
cur_price = {}
print(type(cur_price))

cur_price['daeshin'] = 30000 ; print(cur_price)
cur_price['KAKAO'] = 80000 ; print(cur_price)

<class 'dict'>
{'daeshin': 30000}
{'daeshin': 30000, 'KAKAO': 80000}


In [33]:
cur_price2 = {'daeshin': 30000, 'KAKAO': 80000}
cur_price2

{'KAKAO': 80000, 'daeshin': 30000}

### Dict 아이템 삭제

In [34]:
cur_price = {'KAKAO': 80000, 'naver':800000, 'daeshin':30000}
del cur_price['daeshin']
print(cur_price)

{'naver': 800000, 'KAKAO': 80000}


### Key, Value 목록 구하기

In [35]:
cur_price = {'Daum KAKAO': 80000, 'naver':800000, 'daeshin':30000}
cur_price.keys()

dict_keys(['naver', 'Daum KAKAO', 'daeshin'])

In [36]:
cur_price.values()

dict_values([800000, 80000, 30000])

In [37]:
keys = list(cur_price.keys())
print(keys)

['naver', 'Daum KAKAO', 'daeshin']


In [38]:
'Samsung' in keys

False

In [39]:
'naver' in keys

True

In [40]:
cur_price['Samsung'] # Error!

KeyError: 'Samsung'