# 파이썬 문과 기본 자료형
파이썬의 전체적인 면을 간략하게 알아본다. 
> *개발 경험이 많은 개발자라면 본 챕터만 봐도 프로그램을 작성할 수 있을 것이다.*

***

## 변수 이름 짓기

### 규칙
* 유니코드 문자나 밑줄(_)로 시작해야 한다.
* 이름에 공백이 없어야 한다.
* 아스키코드의 특수 문자는 사용할 수 없다.
* 예약어가 아니어야 한다.

#### 가능한 변수 이름
```{.python}
a, a123, my_name, MyName, _private, __b
```

#### 규칙을 어긋난 변수 이름들을 사용시 에러

In [1]:
# 숫자를 변수명을 시작했을때 
1abc = 'hello world' 

SyntaxError: invalid syntax (<ipython-input-1-ef42fedc3d6c>, line 2)

In [2]:
# 변수명에 공백이 있을시
ab c = 'hello world' 

SyntaxError: invalid syntax (<ipython-input-2-99dfeffdb70a>, line 2)

In [3]:
# 이모티콘을 사용시
😀 = 'hello world' 

SyntaxError: invalid character in identifier (<ipython-input-3-0aba25d81ead>, line 2)

In [4]:
# 예약어 사용시
if = 'hello world'

SyntaxError: invalid syntax (<ipython-input-4-2f1bce231ecf>, line 2)

#### 한글 변수 이름 사용이 가능

In [5]:
수학 = 70
국어 = 85
영어 = 30
평균 = (수학 + 국어 + 영어) / 3
print('평균 점수는 %d 점 입니다.' % (평균))

평균 점수는 61 점 입니다.


***"한글 변수 사용에 대한 의견은 개발자 마다 의견이 다르다. 아래는 본인이 한글로 만든 코드와 커뮤니티에 올린 후의 반응들이다."***
![한글코드](pics/korean_var_name.jpg) 
> *"재미삼아 해보는 것까지야 문제 없겠지만.. 장난이상으로 하지는 마시길.."*

> *"누가 보고 따라할까 두렵습니다 ㄷㄷ"*

> *"굳이 안될 것도 없지 싶어요 ㅎㅎㅎ"*

> *"그냥 중국어로 된 코드나 , 태국어, 또는 아랍어로 된 코드를 보시는 느낌이 어떨지 생각해 보시면 됩니다. ;;"*

> *"명확해서 좋아보이는군요."*

> *"테스트 코드에 한글 많이 쓰고 있습니다. 현실적으로 (이를테면 커밋 메시지나 이슈 트래커, 위키, 메일까지 모두 영어로 커뮤니케이션 하는 회사가 아니라면) 어설픈 영어 표현이나 애매한 네이밍보다 충분히 효율적인 경우가 많다고 보고요."*

### 파이썬에서 이미 사용하고 있는 예약어를 확인해 보는 방법
아래 코드의 결과물로 나오는 키워드들은 변수나 함수명으로 사용할 수 없다.

In [6]:
import keyword
print(keyword.kwlist) # 키워드 목록을 보여준다 

['False', 'None', 'True', 'and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']


### 변수 이름이 이미 사용중인 내장 함수의 이름이나 모듈 이름일 경우
사용중인 내장 함수는 해당 객체가 지워저기 전까지 사용할 수 없게 된다.

In [7]:
str(20140416) # str() 함수는 정수를 문자열로 변환한다.

'20140416'

In [8]:
str = 'hello world' # 이제 str은 함수가 아니라 '문자열 변수'이다.
str(20140416) #  현재 str은 문자열 변수 이다.

TypeError: 'str' object is not callable

In [9]:
del str # 문자열 변수 str을 제거한다.
str(20140406) # 원래의 str 함수를 사용할 수 있게 되었다.

'20140406'

---
## 파이썬 기초문

### 주석
주석(Comment)은 코드를 설명하는 내용이나 참고할 사항 등을 코드 내에 기술하기 위해 사용. 프로그램의 실행에는 전혀 영향을 미치지 않는다.

파이썬 PEP08 코드 스타일 가이드에서 주석문에 관한 내용을 몇 가지 뽑아봤다.

> 코드의 내용과 동떨어진 주석이 있는 것보다는 아예 주석이 없는 편이 낫
다.  주석은 항상 코드의 변경에 맞추어 최신의 상태를 유지하도록 한다.

>> *아래는 몇 년전, 본인이 작성한 '주석이 코드 내용과 동떨어진, 아예 없는 편이 낫다.'의 경우*
>> ![한글코드](pics/bad_comment.jpg) 

> 인라인 주석문은 아껴서 사용한다.

> 인라인 주석문은 코드와 동일한 행에 기술되는 주석문이다.  인라인 주석
문은 코드에서 최소한 두 개 이상의 공백으로 분리되어 있어야 한다.  주
석문은 # 문자와 한 개의 공백으로 시작해야 한다.

> 뻔한 내용의 인라인 주석문은 불필요하며, 사실 방해물이라 할 수 있다.
이런 주석문은 피하자::

> `x = x + 1                 # x의 증가`

> 하지만 이런 주석문은 유용할 때가 있다::

> `x = x + 1                 # 경계값에 대한 보상`


### 여러 줄을 한 줄로 잇기
코드를 한 줄에 적어야 하지만 그렇게 하지 못하는 경우 \ 를 사용한다.

In [10]:
a = 1
b = 3
if (a == 1) and \
(b == 3):
    print('connected lines')

connected lines


#### 한 줄 잇기가 제대로 되지 않았을 경우의 에러

In [11]:
a = 1
b = 3
if (a == 1) and 
(b == 3):
    print('connected lines')

SyntaxError: invalid syntax (<ipython-input-11-309eab9bb383>, line 3)

#### 괄호로 함께 묶여져 있는 경우

In [12]:
a = 1
b = 3
if ((a == 1) and
    (b == 3)):
    print('connected lines')

connected lines


### 치환문 또는 대입문
= 가 사용된 문은 ***오른쪽의 객체나 식을 왼쪽의 변수*** 이름에 할당 하는 것.
* C/C++ 또는 Java 처럼 미리 선언할 필요가 없다.
* 필요한 시점에서 치환하면 변수는 생성된다.
* 변수의 자료형은 = 오른쪽 자료형에 의해 결정된다.

In [13]:
a = 1  # 즉시 정수형 객체를 생성한다.
b = a  
print(b)

1


#### 잘못된 구문 작성시 에러
치환문은 = 왼쪽에 치환할 변수 이름이 놓여야 한다.

In [14]:
1 + 3 = a

SyntaxError: can't assign to operator (<ipython-input-14-3aa35fdab4b7>, line 1)

= 는 등호가 아니다. 치환 연산자이다. 오른쪽의 값을 왼쪽에 갖다 놓으라는 뜻이다.

In [15]:
a = 1
a = a + 1
print(a)

2


#### 여러 값을 한 줄에서 치환하는 방법

In [16]:
c, b = 3, 4  # 여러 개를 한꺼번에 치환
x = y = z = 0  # 여러 개를 같은 값 0으로 치환
e = 3.5; f = 5.6  # 세미콜론으로 문들을 구분
e, f = f, e  # 값을 교환
a, b = (1, 2)  # 언패킹(unpacking). 오른쪽에 묶인 값들을 왼쪽 변수로 풀어내는 것
a, *b = [1, 2, 3, 4, 5]  # 확장된 언패킹. b에는 할당되고 남은 값들이 들어감

print('a: ', a)
print('b: ', b)

a:  1
b:  [2, 3, 4, 5]


In [17]:
*a, b = [1, 2, 3, 4, 5]
print('a: ', a)

a:  [1, 2, 3, 4]


변수가 이미 있을 경우, 변수에 새 값을 할당하면 **기존의 값은 잃어버리고 새 값으로 치환**된다.

In [18]:
a = 1
print('before: ', type(a))

a = 'hello world'
print('after: ', type(a))

before:  <class 'int'>
after:  <class 'str'>


### 확장 치환문
산술과 관계 연산자를 치환문과 함께 사용할 수 있다.

`+=, -=, *=, /=, //=, %=, **=, >>=, <<=, &=, ^=, &=, |=`

x op= y의 의미는 x = x op (y)와 같다.

In [19]:
a = 0
a += 2
print(a)

2


다음은 a에 어떤 값이 들어가는지 생각해보자.

In [20]:
a = 2
a *= 2 + 3  # a의 값은 무엇인가?

### 이름과 값 객체
파이썬은 변수의 이름과 값 객체가 분리되어 있다.
`a = 1`
* 위 구문에서 숫자 1이 변수 a에 저장되는 것이 아니다.
* a는 **이름**이라 부른다.
* 숫자 1은 값 **객체**라고 한다 
* 두 개념은 분리되어 있다.
* 변수의 이름 'a'는 값이 1인 객체를 가리키게 된다.

### 객체의 치환
파이썬에서 객체의 치환은 대부분 참조에 의해 이루어진다.

In [21]:
X = [1, 2, 3]
Y = [10, X, 20]
Z = ['a', X, 'b']

print('X: ', X)
print('Y: ', Y)
print('Z: ', Z)

X:  [1, 2, 3]
Y:  [10, [1, 2, 3], 20]
Z:  ['a', [1, 2, 3], 'b']


Y와 Z는 각각 객체 X를 내부 항목으로 지정했다. **X객체에 대한 참조**만 Y와 Z에 삽입된다.

X가 공유되는지 확인해보자.

In [22]:
print('X: ', X)

X[1] = 'hello'  # X[1]에는 숫자 2가 들어있었다.
print('X: ', X)
print('Y: ', Y)
print('Z: ', Z)

X:  [1, 2, 3]
X:  [1, 'hello', 3]
Y:  [10, [1, 'hello', 3], 20]
Z:  ['a', [1, 'hello', 3], 'b']


---
## 콘솔 입·출력
표준 입력 장치 즉, 키보드에서 데이터를 입력받고 표준 출력 장치인 화면으로 데이터를 출력

### input()를 이용한 콘솔 입력
* 키보드로부터 데이터를 입력받기 위해서 사용하는 함수는 input()이다.
* input() 함수의 인수는 키보드 입력을 알려주는 프롬프트(메세지)이다.
* Enter를 누를 때까지 입력 받았던 **문자열**을 반환한다.

In [23]:
name = input('name > ')
print(name)

name > hello
hello


문자열이 아닌 정수나 실수 값이 필요하다면, 입력받은 문자열을 형변환을 통하여 원하는 형으로 변환 할 수 있다.

In [24]:
data = input('data > ')
print(type(data))  # 현재는 문자열 데이터이다.

data = int(data)  # 수치형 데이터로 형변환을 했다.
print(type(data))  # 현재는 수치형 데이터이다.

data > 13
<class 'str'>
<class 'int'>


### 콘솔 출력
#### print() 함수를 이용한 콘솔 출력
* 화면으로 데이터를 출력할 때 가장 보편적으로 사용하는 함수이다.
* 여러 값을 쉼표(comma)로 구분할 수 있다.
* 출력할 때 각각의 값 사이에 공백 한 개가 추가 된다.
* 기본적으로 마지막에 줄 바꾸기를 한다.
* 인수 end 값을 변경하여 마지막 출력 값을 바꿀 수 있다.
* 인수 sep을 사용하면 항목 간의 출력 문자도 변경할 수 있다.
* 인수 file을 사용하면 **파일 객체로 출력하도록 전환**할 수 있다.

In [25]:
print('hello world')
print(1,2,3,4,5)
print(1,2, end=' '); print(3, 4)
print(1,2,3,4,5, sep=', ')
print(1,2,3,4,5, sep='')

hello world
1 2 3 4 5
1 2 3 4
1, 2, 3, 4, 5
12345


In [26]:
with open('data.txt', 'w') as f:
    print('hello world', file=f)
open('data.txt').read()

'hello world\n'

### 서식출력
format() 함수를 이용하여 데이터 한 개에 대해 서식을 지정해서 출력할 수 있다.
`format(value, format_spec)`
* 인수 value를 인수 format_spec에 지정된 서식의 **문자열로 변환**하여 출력
* **문자열 객체의 format 메서드**를 사용하면 좀 더 세련된 서식 출력이 가능하다.
* 자릿수를 고정하고 싶으면 {}안에 위치 매개 매개 변수 다음에 콜론(:)을 입력하고 서식 지정을 한다.

In [27]:
print(format(1.234567, '1.3f'))

data = 'Name: {0}, Phone: {1}'.format('아이유', 20140416)
print(data)

print('')
import math
for k in range(1, 5):
    print('sqrt({0}) = {1}'.format(k, math.sqrt(k)))

print('')
for k in range(1, 5):
    print('sqrt({0}) = {1:1.2f}'.format(k, math.sqrt(k)))

1.235
Name: 아이유, Phone: 20140416

sqrt(1) = 1.0
sqrt(2) = 1.4142135623730951
sqrt(3) = 1.7320508075688772
sqrt(4) = 2.0

sqrt(1) = 1.00
sqrt(2) = 1.41
sqrt(3) = 1.73
sqrt(4) = 2.00


## 자료형의 종류
* 자료형이란 컴퓨터로 표현할 수 있는 데이터의 종류를 의미한다.
* 파이썬은 다양한 정보를 저장할 수 있는 고수준의 내장 자료형을 미리 준비해 놓고 있다.
* 대부분 별다른 자료 구조 설계 없이도 파이썬에서 제공하는 자료형만으로 작업이 가능하다.

### bool
* True와 False를 나타내는 자료형이다.
* 부울 값은 정수로 간주하기도 한다.
    * True 는 1
    * False 는 0
* 식에서 부울 값을 알고 싶으면 bool() 함수를 사용한다.
* True, False 두 값을 가진다.

In [28]:
a = 1
print(a < 0)
print(a > 0)

print('3: ', bool(3))
print('[]: ', bool([]))

False
True
3:  True
[]:  False


### int, float, complex
* 정수와 실수, 복소수 등 숫자를 표현하는 자료형이다.
* 123, 1.43, 5+4j

### str
* 문자열은 문자들(텍스트)을 표현하는 자료형이다.
* 문자열은 작은따옴표(' ')나 큰따옴표(" ")에 묶인 문자들의 모임이다.
* 인덱싱(Indexing)으로 각각의 문자를 취할 수 있다.
* 슬라이싱(slicing)으로 문자열 중 일부를 취할 수 있다.
* 문자열은 연결(+)과 반복(\*) 연산도 가능하다.
* 문자열의 값은 변경되지 않는다.
* 문자열의 값을 변경하려면 슬라이싱과 연결하기를 사용하여 새로운 문자열 객체를 만든다.
* 다양한 메서드를 지원한다.
    * upper() 대문자로 전환
    * split() 공백을 기준으로 리스트 형태로 분리
    * find() 부분 문자열의 위치를 검색
    * startswith() 시작하는 부분 문자열을 확인
    * endswith() 종료하는 부분 문자열을 확인    

In [29]:
a = 'Hello World'
b = "안녕 세계"
print(a, b)

Hello World 안녕 세계


In [30]:
print(a[0], a[6], b[3], b[-1])

print('a[:5] - ', a[:5])
print('a[6:] - ', a[6:])
print('a[::2] - ', a[::2])

H W 세 계
a[:5] -  Hello
a[6:] -  World
a[::2] -  HloWrd


In [31]:
print(a + b)
c = a[:5] + b[2:] 
print(c)

Hello World안녕 세계
Hello 세계


In [32]:
print(a)
print(a.upper())
print(a.split())
print(a.find('World'))
print(a.startswith('Hello'))
print(a.endswith('dl'))

Hello World
HELLO WORLD
['Hello', 'World']
6
True
False


### Bytes
* 바이트는 0~255 사이 코드의 열이다.
* 바이트도 문자열에서 사용하는 연산을 대부분 지원한다.

In [33]:
b = b'Hello World'
print(b, type(b))

b'Hello World' <class 'bytes'>


In [34]:
print(b[1:5])  # 인덱싱과 슬라이싱을 모두 지원
print(b'th' in b)  # 멤버 검사
print(b.upper())  
print(b.split())
print(b.startswith(b'Hel'))
print(b.endswith(b'ld'))

b'ello'
False
b'HELLO WORLD'
[b'Hello', b'World']
True
True


#### 문자열과 유니코드의 차이점
* 문자열은 유니코드를 기본으로 한다.
* 바이트는 1바이트로 표현되는 문자만 표현할 수 있다.
* 바이트와 문자열의 연산은 지원되지 않는다.

In [35]:
s = '잊지않겠습니다.'
c = b'잊지않겠습니다.'

SyntaxError: bytes can only contain ASCII literal characters. (<ipython-input-35-836d839852a7>, line 2)

In [36]:
b'May the force be with ' + 'you'

TypeError: can't concat bytes to str

* 바이트를 문자열로 변환하려면 decode() 메서드를 사용한다.
* 문자열을 바이트로 변경하려면 encode() 메서드를 사용한다.

In [37]:
print(b.decode())  # 기본값으로 UTF-8을 사용한다.
print(b.decode('cp949'))  # 직접 인코딩을 지정할 수 있다.

s = "잊지않겠습니다."
print(s.encode())

Hello World
Hello World
b'\xec\x9e\x8a\xec\xa7\x80\xec\x95\x8a\xea\xb2\xa0\xec\x8a\xb5\xeb\x8b\x88\xeb\x8b\xa4.'


* 변경이 가능한 바이트를 원하면 bytearray 자료형을 사용

In [38]:
ba = bytearray(b)  # 자료형을 bytes에서 bytearry로 형변환
ba[7] = ord('A')  
print(ba)

print(bytes(ba))  # 다시 자료형을 bytes로 변환
print(ba.decode())  # 문자열로 변환

bytearray(b'Hello WArld')
b'Hello WArld'
Hello WArld


### 리스트
* 리스트는 대괄호 []를 이용하여 임의의 객체를 저장하는 집학적인 자료형이다.
* 리스트는 순서가 있다.

In [39]:
L = [1,2,3]
print(len(L))  # 데이터의 개수 확인

3


In [40]:
print(L[1], L[-1], L[1:3])

2 3 [2, 3]


In [41]:
L + L

[1, 2, 3, 1, 2, 3]

In [42]:
L * 3

[1, 2, 3, 1, 2, 3, 1, 2, 3]

In [43]:
L = list(range(10))
L

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [44]:
L[::2]

[0, 2, 4, 6, 8]

In [45]:
L[::-1]

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

In [46]:
4 in L

True

* 리스트는 다양한 메서드를 지원한다.

In [52]:
L = [1,2,3]
L.append(4)
L

[1, 2, 3, 4]

In [53]:
del L[0]
L

[2, 3, 4]

In [54]:
L.reverse()  # 순서를 바꾼다.
L

[4, 3, 2]

In [55]:
L.sort()  # 오름차순으로 정렬한다.
L

[2, 3, 4]

### 튜플
* 튜플과 리스트의 차이라면, 튜플은 값을 변경할 수 없고, 리스트는 변경할 수 있다.
* 튜플은 검색관련 메서드만 지원한다.

In [56]:
t = (1,2,3)
t[0] = 100

TypeError: 'tuple' object does not support item assignment

### 사전
* 오프셋이 아닌 키를 사용하여 값을 얻는 자료형이다.
* 사전에 a라는 **키**를 주면 **값**을 돌려받는다.
* 키에 대응하는 값을 저장할 수 있다.
* 사전은 중괄호 {}를 사용한다.

In [58]:
d = {'one': 1, 'two': 2, 'three': 3}
d

{'one': 1, 'three': 3, 'two': 2}

In [60]:
d = dict(one = 1, two = 2, three = 3)  # dict() 함수를 사용하여 만들 수 있다.
d

{'one': 1, 'three': 3, 'two': 2}

In [62]:
d['one']  # 키 값에 의해 값을 추출한다.

1

In [64]:
d['four'] = 4  # 세 항목을 삽입
d

{'four': 4, 'one': 1, 'three': 3, 'two': 2}

In [65]:
d['four'] = 5  # 기존 항목의 값을 변경
d

{'four': 5, 'one': 1, 'three': 3, 'two': 2}

In [66]:
'one' in d  # 키에 대한 멤버 검사

True

* 사전은 순서에 따라 요소를 저장하지 않는다.
* 사전을 리스트나 튜플로 변환할 수 있다.

In [69]:
d = dict(one='하나', two='둘', three='셋')
print(d.keys())  # 키 값만 추출
print(d.values())  # 값만 추출
print(d.items())  # 키와 값을 튜플 항목으로 변환

dict_keys(['two', 'one', 'three'])
dict_values(['둘', '하나', '셋'])
dict_items([('two', '둘'), ('one', '하나'), ('three', '셋')])


 ### 집합
 * 집합은 중복되지 않으며, 순서가 없는 데이터를 저장하는 자료형
 * 멤버 검사와 중복된 항목을 제거할 때 유용하다.

In [71]:
s1 = {1, 2, 3}  # 중괄호를 이용하여 set객체를 생성한다.
print(s1, type(s1))

{1, 2, 3} <class 'set'>


In [72]:
s2 = set()  # 공집합 생성
s2

set()

In [73]:
L = [1,2,4,3,2,4,3,2,2,4,3]
s = set(L)  # 중복된 항목 제거
s

{1, 2, 3, 4}

In [74]:
3 in s  # 멤버 검사

True

In [75]:
s = {1,2,3}
t = {3,4,5,6}
print(s.union(t))  # 합집합
print(s.intersection(t)) # 교집합

print(s - t)  # 차집합
print(s | t)  # 합집합
print(s & t)  # 교집합

s = {1,2,3}
s.add(4)  # 집합은 변경이 가능한 자료형이다.
print(s)

s.discard(4)
print(s)

{1, 2, 3, 4, 5, 6}
{3}
{1, 2}
{1, 2, 3, 4, 5, 6}
{3}
{1, 2, 3, 4}
{1, 2, 3}
