# 파이썬 인터프리터의 이해
- 파이썬에서 실행되는 모든 명령어는 인터프리터에서 실행됨을 기준으로 한다. 
- 파이썬을 이해한다는 것은, 인터프리터의 동작 과정을 이해하는 것과 동일한 개념
- 코드를 작성할 때, 다음과 같은 내용을 항상 생각하면서 작성할 수 있도록 연습해야 합니다. 

```
1. 내가 어떤 명령어를 실행하려고 하고 있고, 그 명령의 실행 결과로 어떠한 결과가 돌아오는지를 이해할 수 있어야 한다. 
2. 돌려받은 값을, 어떻게 처리할지 내가 명확히 이해하고 작성하고 있는지를 이해해야 한다. 
3. 돌려받은 값을 이해해야, 다음 스텝에서 어떤 명령어를 쓸지, 어떻게 처리할지가 정해집니다. 
4. 모든 코드는 정해진 답이 없습니다. 중요한 것은 내가 원하는대로 처리되고 있는지가 중요합니다. 
```

# 돌려준다(return)
- 파이썬 인터프리터는 기본적으로 실행한 명령의 결과를 화면에 출력하여 보여줍니다.
- 아래의 두 명령어는 동일한 값이 출력되지만 엄연히 다른 동작이다. 

- REPL(Read Eval Print Loop)
    - 읽고, 평가하고, 출력하는, 것의 반복
    - 주피터는 REPL 방식으로 동작하는 대표적인 파이썬 개발 도구이다. 

In [1]:
1 + 1

2

- 파이썬 인터프리터는 기본적으로 실행한 결과를 돌려주고 확인할 수 있도록 출력해줍니다.

In [2]:
print(1 + 1)

2


- 돌려받은 명령어의 실행 결과를 표준 출력으로 바꿔준다.
    - `1+1`을 수행한 결과를 돌려받아 표준 출력으로 출력해주는 두가지 명령이 합쳐진 것이다. 
- 즉, 인터프리터 내부에서 처리되는 것과 표준 출력은 엄연히 구분되는 동작으로 봐야 한다. 
- 환경과 상관없이 처리된 결과를 확인하려면 print를 통해 확인해주는 것이 제일 좋다. 

## redirection
- 방향 전환
- 내 의도대로 돌려받은 실행 결과의 방향을 바꿔줄 수 있다. 
- 표준출력, 메모리 등으로 방향을 바꿔줄 수 있다.

In [3]:
1 + 1

2

In [4]:
print(1 + 1)

2


In [5]:
var = 1 + 1

- 돌려받은 실행 결과를 표준출력으로 보낼 수 도 있고, 메모리에 저장할 수 도 있다.
- 중요한 것은, 내가 의도한대로 돌려받은 결과를 처리할 수 있다는 것이다. 
- 메모리에 저장한 경우, 처리 결과를 돌려주지 않는다. 
  - 처리 결과가 없기 때문이다. 
  - 메모리에 저장이 잘 되었는지, 안되었는지는 결과로 돌려주지 않는다.

In [6]:
var

2

- 처리 결과를 확인하려면 메모리의 값을 직접 확인하면 된다. 

> feedback: 메모리에 저장된 값은 언제 사라지는가?     
    - 한 번 생성된 메모리는 프로세스가 종료되기 전까지는 계속 남아 있게 된다.    
    - 프로세스가 종료되면, 프로세스가 사용한 메모리도 함께 정리가 된다.    

# 출력 제어
- 표준 라이브러리
    - 자주 사용하는 기능들을 미리 만들어서 제공
    - 함수, 명령어, 등의 이름으로 불리운다. 
    - print 함수는 파이썬에서 표준적으로 제공되는 라이브러리 함수중에 하나이며, built-in 함수라고도 표현
  
- print 함수의 원형
```
print(*objects, sep=' ', end='\n', file=sys.stdout, flush=False)
```

## 기본적인 사용법

In [7]:
'Hello, Python'

'Hello, Python'

- 기본적으로 주석(comment)를 제외한 모든 입력은 명령어 이다. 
- 입력받은 문자열을 그대로 다시 돌려준다.(REPL)

In [8]:
print('Hello, Python')

Hello, Python


- 표준 출력으로 문자열을 출력하는 명령이다. 
- 즉, 그대로 돌아온 'Hello, Python' 문자열을 표준 출력으로 출력하고 있는 것이다. 

In [9]:
var = 100

In [10]:
var

100

In [11]:
print(var)

100


- 메모리에 저장된 값 또한, 표준 출력으로 출력이 가능하다. 
- 메모리에 저장된 돌려받은 값을 표준 출력으로 출력하는 것이다. 

## 파라미터에 따른 변화

In [12]:
print('Hello, Python')
print('Hello, World')

Hello, Python
Hello, World


- 출력할 결과만 지정하면 파라미터들의 디폴트값에 따라서 동작한다. 

In [13]:
print('Hello, Python', end=' ')
print('Hello, World')

Hello, Python Hello, World


- 파라미터를 다른 값으로 지정하는 것도 가능하고, 지정된 값에 따라서, 결과는 다르게 보여지게 된다. 
- `end` 파라미터의 디폴트 값은 `뉴라인` 이다. 

In [14]:
print('Hello', 'Python')

Hello Python


- 콤마를 이용해 출력해야 하는 결과를 여러개 입력할 수 있다. 
- 이것은 print함수의 첫번째 인자가 가변형 이기 때문에 가능하다. 

In [15]:
print('Hello', 'Python', sep=' Seperated ')

Hello Seperated Python


- 이때, `sep` 파라미터를 다른 값으로 바꾸면 출력들 사이의 값을 변경할 수 있다. 

## 출력 제어(문자열 포맷팅)
- 문자열 포맷팅을 이용하면, 출력하려는 문자열의 모양을 미리 지정하여 원하는 모양대로 출력을 제어할 수 있게 된다. 
- 다음과 같이 출력하고 싶다고 가정 해보자   
`The sum of 1 + 2 is 3`

In [16]:
'The sum of 1 + 2 is 3'

'The sum of 1 + 2 is 3'

In [17]:
'The sum of 1 + 2 is 1 + 2'

'The sum of 1 + 2 is 1 + 2'

- `1+2`가 계산된 결과가 문자열에 출력되기 원하지만 문자열 내에서는 연산을 할 수가 없다. 

In [18]:
'The sum of 1 + 2 is {}'.format(1 + 2)

'The sum of 1 + 2 is 3'

- 파이썬의 문자열 포맷팅은 출력하려는 문자열의 형태를 미리 지정할 수 있다.
- 연산의 결과, 메모리 값 등을 충분히 편하게 표현할 수 있다. 

In [19]:
a = 1
b = 2
'The sum of {} + {} is {}'.format(a, b, a + b)

'The sum of 1 + 2 is 3'

In [20]:
'The sum of {} + {} is {}'.format(a + b, a, b)

'The sum of 3 + 1 is 2'

In [21]:
'The sum of {0} + {1} is {2}'.format(a, b, a + b)

'The sum of 1 + 2 is 3'

In [22]:
'The sum of {2} + {1} is {0}'.format(a, b, a + b)

'The sum of 3 + 2 is 1'

- 충분히 복잡한 표현도 편하게 사용할 수 있다. 
- 문자열 포맷팅을 사용하지 않고, 연산의 결과나 메모리 값 등을 표현하려면 아래와 같이 매우 복잡하게 표현된다. 

In [23]:
#print 함수를 이용하는 경우 
print('The sum of', a, '+', b, 'is', 1 + 2)

The sum of 1 + 2 is 3


In [24]:
# 문자열 연결 연산자를 이용하는 경우 (1)
'The sum of' + str(1) + '+' + str(2) + 'is' + str(1 + 2)

'The sum of1+2is3'

In [25]:
# 문자열 연결 연산자를 이용하는 경우 (2)
'The sum of ' + str(1) + ' + ' + str(2) + ' is ' + str(1 + 2)

'The sum of 1 + 2 is 3'

- 표현은 가능하지만, 사용하기가 매우 쉽지 않다.

# 문자열
- 문자열 이스케이프
    - 파이썬 인터프리터에서 용도가 정해진 문자를 사용할 경우 충돌이 발생한다.
    - 반대의 경우도 사용 가능(일반적인 문자를 특수한 용도로 변경)

In [26]:
print('\'Hello, Python\'')

'Hello, Python'


In [27]:
print('\\Hello, Python\\')

\Hello, Python\


In [28]:
print('Hello\nPython')

Hello
Python


In [29]:
print('Hello\t\t\t\t\tPython')

Hello					Python


In [30]:
print('Hello\bpython')

Hellpython


In [31]:
# 문자열 내에서는 숫자 표현이 불가능 하지만, 16진수는 표현이 가능하다.(1)
print('Hello\x0aPython')

Hello
Python


In [32]:
# 문자열 내에서는 숫자 표현이 불가능 하지만, 16진수는 표현이 가능하다.(2)
print('Hello\x0APython')

Hello
Python


In [33]:
print(0x0a == 0x0A) # 대/소문자의 개념이 아니다. 
print(0x0a == 10) # 표현이 다를 뿐, 같은 수 이다. 

True
True


- 16진수는 `수` 이므로, 대/소 문자의 개념이 없다. 
- 모두 동일한 수 이다. 

In [34]:
'a' == 'A'

False

In [35]:
'apple' == 'Apple'

False

In [36]:
'apple' == 'apple'

True

In [37]:
'apple\n' == 'apple'

False

- 문자열의 경우 대/소 문자를 엄밀하게 구별한다. 

## 문자열과 관련된 기능

In [38]:
'Lorem ipsum dolor sit amet.'

'Lorem ipsum dolor sit amet.'

## white space
 - 단어를 구별하는 기준
 - 공백(SP), 탭(tab), LF(newLine)

In [39]:
'Lorem ipsum dolor sit amet.'.split()

['Lorem', 'ipsum', 'dolor', 'sit', 'amet.']

- split은 주어진 문자열을 화이트 스페이스 기준으로 단어들을 분리해준다.

In [40]:
'Lorem ipsum dolor sit amet'.replace('Lorem', 'A')

'A ipsum dolor sit amet'

- 문자열 내에서 찾으려는 문자열이 존재하면 치환된 `새로운 문자열을 돌려준다`

In [41]:
'Lorem ipsum dolor sit amet'.find('Lorem')

0

In [42]:
'Lorem ipsum dolor sit amet'.find('A')

-1

- find 명령은 결과에 따라서 0, 양의정수 또는 음의정수를 결과로 돌려준다.

In [43]:
'      ABCD     '.strip()

'ABCD'

In [44]:
print('ABCD\n')
print('blarblar')

ABCD

blarblar


In [45]:
print('ABCD\n'.strip())
print('blarblar')

ABCD
blarblar


In [46]:
print('ABCD\n'.strip(), end='')
print('blarblar')

ABCDblarblar


In [47]:
'apple\n'.strip() == 'apple'

True

> 문자열 이란?   
    - 결굴, 모든 것은 `수` 이다.    
    - 보이는게 전부는 아니다(화면에 표현되지 못하는 문자들도 존재한다. )

# 타입
- 문자열, 숫자(정수, 실수), 불리언(bool)
- 불리언 타입도 숫자로 취급
- 프로그래밍 대상이 되는 자료의 형태
- 처리하고자 하는 대상(자료)의 형태는 문자열 아니면 숫자

In [48]:
type(10)

int

In [49]:
type(-10)

int

In [50]:
type(-0)

int

- 엄밀한 정의로는 -0은 정의되어 있지 않습니다. 
- 파이썬 인터프리터가 정수로서 처리

In [51]:
type(10.0)

float

In [52]:
type(10.)

float

In [53]:
type(.10)

float

- float는 부동소수점 형태를 뜻한다.
    - 움직이지 않는다는 뜻의 `부동`이 아닌, 그 반대의 의미이다.

In [54]:
True == 1

True

In [55]:
False == 0

True

In [56]:
True + True + True + False

3

- 파이썬에서 불리언은 숫자이다. 
- 때문에, 연산이 가능하다. 

## 논리연산(AND, OR, NOT)
- 다른 논리연산들은 결과적으로 이 세가지 논리 연산의 조합
- 그리고(AND), 또는(OR)

| A | B |AND | OR |
|:---:|:---:|:---:|:---:|
|T|T|T|T|
|T|F|F|T|
|F|T|F|T|
|F|F|F|F|

## 명제란?
- 참, 거짓으로 표현 가능
- 참, 거짓으로 돌려주는 형태의 명령어

In [57]:
10 + 100

110

- 명제가 될 수 없다.
- 논리식을 사용할 수 없다. 

In [58]:
10 + 100 == 100

False

- 명제가 될 수 있고, 논릭식을 사용할 수 있다. 

In [59]:
not(True == 1 or False == 100)

False

## 시퀀스 타입
- 여러자료(문자열, 숫자, 불리언)를 하나의 자료 형태로 관리
- 프로그래밍의 핵심은 여러자료를 일반화된 형태로 처리
- 즉, 리스트 안에 자료들을 어떻게 일반화 할 것인가?

### 리스트(list)
- 가장 많이 사용되는 타입
- 다른 언어에서는 배열이라고 표현
- 자료를 다루는 가장 기본적인 형태 이며, 기본적인 선형자료구조의 한 종류이다. 

#### 인덱싱

In [60]:
sample = [10, 20, 30, 40, 50]

In [61]:
sample[0] # 리스트의 첫번째 원소

10

In [62]:
sample[4] # 다섯번째 원소

50

In [63]:
sample[len(sample) - 1] # 리스트의 마지막 원소

50

In [64]:
sample[-1] # 리스트의 마지막 원소

50

In [65]:
sample[-5] # 리스트의 뒤에서부터 5번째 원소

10

In [66]:
sample[-len(sample)] # 리스트의 첫 번째 원소

10

#### 슬라이싱
    - 리스트 내의 특정 범위의 원소를 잘라낸다는 의미인데 ...
    - 멀티 인덱싱으로 해석해도 무방하다. 

In [67]:
sample[1:4]

[20, 30, 40]

In [68]:
sample[:]

[10, 20, 30, 40, 50]

- 범위에 해당하는 `새로운 리스트를 돌려준다.`
- 명령의 실행 결과로 새로운 리스트가 돌아온다는 것은 매우 중요한 개념이다. 

In [69]:
sample

[10, 20, 30, 40, 50]

In [70]:
other = sample

In [71]:
other[0] = 100

In [72]:
other

[100, 20, 30, 40, 50]

In [73]:
sample # other 메모리의 값을 변경하면, sample 메모리의 값도 같이 변경된다. 

[100, 20, 30, 40, 50]

- 다른 언어에서는 얕은 복사는 개념으로 설명한다. 
- sample 메모리의 값을 other라는 새로운 메모리로 복사하지 않는다. 
- 결과적으로 `sample` 메모리와 `other` 메모리는 동일한 메모리가 된다. 

In [74]:
other = sample[:]

- 범위에 해당하는 새로운 리스트가 만들어진 것
- 새로운 리스트가 만들어졌다는 것은 메모리에 새로 만들어졌음을 뜻하기도 한다. 

In [75]:
other[0] = 100

In [76]:
other

[100, 20, 30, 40, 50]

In [77]:
sample # other 메모리의 값을 변경해도 sample 메모리의 값은 변하지 않는다. 

[100, 20, 30, 40, 50]

#### 리스트내의 자료 검색(in)

In [78]:
10 in sample

False

In [79]:
20 in sample

True

#### 덧셈과 곱 연산
- 피 연산자의 타입에 따라서, 연산의 결과는 달라진다.

In [80]:
sample

[100, 20, 30, 40, 50]

In [81]:
sample + [60]

[100, 20, 30, 40, 50, 60]

In [82]:
print( sample * 3 )

[100, 20, 30, 40, 50, 100, 20, 30, 40, 50, 100, 20, 30, 40, 50]


- 피 연산자가 시퀀스 형인 경우 덧셈과 곱은 연산을 수행한 `새로운 리스트를 돌려준다. `

#### extend와 append
- 가변 타입의 시퀀스 형에서만 사용이 가능

In [83]:
sample

[100, 20, 30, 40, 50]

In [84]:
sample.extend([60])

In [85]:
sample.append(70)

In [86]:
sample

[100, 20, 30, 40, 50, 60, 70]

- 두 연산 모두, 연산을 수행한 결과를 돌려주지 않는다. 
- 결과를 돌려주지 않는 것은 돌려줄 결과가 없기 때문이다. 
    - 두 연산 모두 원본 리스트의 값을 바꿔주기 때문에 돌려줄 결과가 없다.

In [87]:
# sample = sample + [80]
sample += [80]

In [88]:
sample

[100, 20, 30, 40, 50, 60, 70, 80]

- extend는 정확하게는 두 리스트가 합쳐진 새로운 리스트를 돌려받아서 메모리의 값을 새로 만들어주는 명령이다. 

### 튜플(tuple)
- immutable(불가변)형 임을 제외하면 리스트와 동일하게 사용할 수 있다. 
- 자료의 값이 변하지 않는 것을 보장하기 때문에, 특별한 경우에 사용할 수 있다. 

In [89]:
type( (1,2,3,4,5) )

tuple

In [90]:
tuple_ = (1,2,3,4,5)

In [91]:
tuple_[0]

1

In [92]:
tuple_[-1]

5

In [93]:
tuple_[:]

(1, 2, 3, 4, 5)

- 멀티 인덱싱이 튜플에서도 가능한 것은 원본 자료를 변경하지 않기 때문이다. 
- 원본 자료를 변경시키지 않는 명령은 튜플에서도 동일하게 사용 가능하다고 보면 된다. 
- 인덱싱과, 멀티 인덱싱 방법은 기존 리스트와 동일하다. 

In [94]:
tuple_[0] = 10

TypeError: 'tuple' object does not support item assignment

- 불가변 자료형이므로, 해당 연산은 튜플에서는 유효하지 않다. 

### SET
- 집합 연산으로, 순서가 없고, 중복을 허용하지 않는 시퀀스 형이다. 
- 차집합 등의 연산이 가능하다. 

In [95]:
A = {1,1,1,1,1,2,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,}
A

{1, 2, 3, 4, 5}

In [96]:
B = {4,4,4,4,4,5,5,5,5,6,6,7,7,7,7,7,9}
B

{4, 5, 6, 7, 9}

In [97]:
A - B

{1, 2, 3}

### DICT
- Key:value 형태의 시퀀스 자료 형으로, set과는 동일하게 '{'기호를 사용한다. 
- set과의 차이점은 자료가 `key:value`의 쌍으로 되어 있다는 것이다. 

In [98]:
dict_sample = {
    'first': 1,
    'second': 2, 
    'third': 3
}

In [99]:
dict_sample

{'first': 1, 'second': 2, 'third': 3}

In [100]:
dict_sample[0] # 자동으로 인덱스가 생성되지 않는다. 

KeyError: 0

In [101]:
dict_sample['first']

1

> 사소한 것의 차이   
    - 파이썬에서 자료의 타입은 어떤 기호를 사용하느냐에 따라 결정된다.     
    - ', "인 경우 문자열을 뜻하며,     
    - [ 인 경우 리스트를, ( 인 경우 튜플을, { 인 경우 set을, {key:value} 형태이면 dict 타입으로 결정이 된다.    
    - 아주 사소하지만, 자료의 타입을 결정하는 매우 중요한 요소인데, 사소해서 간과하기 쉽다는 문제가 있다.     
    - 아무런 기호를 사용하지 않으면, 메모리 이거나, 숫자이다. 
    
__파이썬에서 표현되는 코드들은 이런 사소한 표현 하나하나에서 갈리는 경우가 매우 많이 있다.__    
__중요한 것은 파이썬 인터프리터는 이런 사소한 기호들을 이용해 명령들을 해석한다는 것이다__

# 입출력
- 표준 입출력
- 파일 입출력
- 네트워크 입출력

## 표준 입출력
- 표준 입력과 표준 출력장치를 이용한 입출력
- 표준 입력과 표준 출력은 이미 정해져 있다. 

In [102]:
input()

 hello


'hello'

- 사용자로부터 입력받은 값을 그대로 `돌려준다`

In [103]:
# 때문에, 돌려받은 값을 이용해 메모리에 저장하는 것도 가능하다. 
mem = input()

 hello


- 돌려준 값을 메모리로 저장했기 때문에 돌려주는 값이 없다.

In [104]:
mem # 직접 확인해보자

'hello'

In [105]:
input()

 10


'10'

In [106]:
input()

 0x0a \x0a \n


'0x0a \\x0a \\n'

- 입력받은 모든 값은 문자열 형태로 돌려준다. 
- 입력으로 이스케이프된 문자나, 숫자는 입력받을 수 없다. 

## 파일 입출력

- 표준 입력과 출력의 대상이 표준 장치가 아닌 파일로 바뀐 것이다. 
- 입력과 출력의 대상이 정해져 있지 않기 때문에, 직접 정해줘야 한다. 

In [107]:
!pwd # 현재 작업중인 디렉터리(폴더)의 경로 확인

/workspace/origin/lectures/lectures on python


- 파일의 이름은 경로를 포함한다. 

In [108]:
open('/etc/passwd', mode='r')

<_io.TextIOWrapper name='/etc/passwd' mode='r' encoding='UTF-8'>

- 입력과 출력의 대상이 되는 파일에 대한 객체를 얻어와야 한다. 

In [109]:
file = open('/root/sample.txt', mode='w')

In [110]:
file.write('Hello')

5

- 얻어온 파일 객체를 통해 파일로 내용을 출력(쓴다라고 표현)할 수 있다. 
- print대신, write를 사용했고, 실행의 결과로 정수를 돌려줌을 알 수 있다. 

In [111]:
file.close()

In [112]:
file = open('/root/sample.txt', mode = 'r')

In [113]:
file.read()

'Hello'

- input 대신 read를 통해 파일로부터 내용을 입력(읽어온다라고 표현)받을 수 있다. 
- 즉, 입력과 출력이 되는 대상이 달라지는것 외에는 동일한 입출력의 하나로 볼 수 있다. 

In [114]:
file.close()

In [115]:
with open('/root/sample.txt', mode = 'r') as file:
    print( file.read() )

Hello


- `with` 문법은 입출력의 대상이 되는 파일의 오픈과 클로즈를 자동으로 해주기 때문에, 추천하는 방법이다. 