# Source Code Encoding
> To declare an encoding other than the default one, a special comment line should be added as the first line of the file. The syntax is as follows:

In [5]:
# -*- coding: encoding -*-

# 파이썬 개요

## 파이썬 계산기로 쓰기!

In [80]:
2+2

4

In [81]:
50-5*6

20

In [82]:
(50-5*6)/4

5.0

In [83]:
8/5

1.6

정수(e.g. 2, 4, 20)는 int 자료형이고, 실수는 (e.g. 5.0, 1.6) float 자료형이다.

In [84]:
17/2 # Classic division returns a float

8.5

In [85]:
17//3 # Floor division discards the fractional part

5

In [86]:
17%3 # The % operator returns the remainder of the division

2

In [87]:
5*3+2 # # Floored quotient times divisor plus remainder

17

별 두개 (**)는 파이썬에서 제곱 기호이다.

In [88]:
5**2

25

In [89]:
2**7

128

등호(=)는 할당 연산자이다.
<br>할당 연산자는 기본적으로 출력을 하지 않는다.

In [90]:
width=20
height=5*9
width*height

900

값이 할당되지 않은(정의되지 않은) 변수를 호출하면 오류가 난다.

In [91]:
n  # try to access an undefined variable

NameError: name 'n' is not defined

정수와 실수 피연산자들을 섞어서 쓰면 실수로 결과가 나온다.

In [92]:
4*3.75-1

14.0

인터렉티브 모드(콘솔 창)에선 마지막 계산 결과가 언더스코어(_)에 자동 저장된다.

In [93]:
_

14.0

In [94]:
tax=12.5/100

In [95]:
price=100.50

In [96]:
price*tax

12.5625

In [97]:
price+_

113.0625

In [98]:
round(_,2)

113.06

## 파이썬의 기본 문자 처리

In [99]:
'spam eggs'

'spam eggs'

In [100]:
"Paris rabbit got your back :)! Yay!"

'Paris rabbit got your back :)! Yay!'

In [101]:
'1975'

'1975'

### 인용 기호(따옴표)를 문자열에 넣기 위해선, \\를 사용해 이스케이프 문자열로 만들어야 한다. 아니면 그냥 다른 따옴표를 사용해도 된다.
|따옴표 종류|기호|
|----------|----|
|작은따옴표|'text'|
|큰따옴표|"text"|
|큰따옴표 세 개|"""text"""|
|작은따옴표 세 개|'''text'''|

In [28]:
'doesn\'t'

"doesn't"

In [29]:
"doesn't"

"doesn't"

In [30]:
'"Yes," they said.'

'"Yes," they said.'

In [31]:
"\"Yes,\" they said."

'"Yes," they said.'

In [32]:
'"Isn\'t," they said.'

'"Isn\'t," they said.'

print()함수는 자동으로 문자열 처리를 도우는 함수로, 문자열을 닫는(문자열을 정의하는) 인용 기호를 제거하고 이스케이프 문자열과 특수문자를 출력해 준다.

In [102]:
s="First line.\nSecond line."
s

'First line.\nSecond line.'

In [103]:
print(s)

First line.
Second line.


\기호를 특수문자로 처리하고 싶지 않을 경우, 인용구 시작 지점의 따옴표에 r을 붙여서 raw string형태로 출력할 수 있다.

In [104]:
print("C:\some\name")

C:\some
ame


  print("C:\some\name")


In [105]:
print(r"C:\some\name")

C:\some\name


문자열은 여러 줄로 출력될 수 있다. 한 방법은 세 개의 따옴표를 사용하는 것이다: """...""" 이나 '''...'''. 줄바꿈이 원래 자동으로 출력 결과에 반영되지만, \를 줄 끝에 추가하여 줄 바꿈을 안 할 수도 있다. 예시:

In [106]:
print("""\
Usage: thingy [OPTIONS]
     -h                        Display this usage message
     -H hostname               Hostname to connect to
""")

Usage: thingy [OPTIONS]
     -h                        Display this usage message
     -H hostname               Hostname to connect to



문자열에 +를 사용하면 연이어서 결합되고, *(곱셈 기호)를 사용하면 반복할 수 있다:

In [107]:
3*"un"+"ium"

'unununium'

연이어 입력한 복수의 문자열은 자동 결합된다.

In [108]:
"Py" "Torch"

'PyTorch'

In [109]:
text=("Put several strings within parenthese "
      "to have tem joined together")
text

'Put several strings within parenthese to have tem joined together'

하지만 이건 순수 문자열에만 가능하고, 변수에 할당된 문자열이나 +, * 등의 기호가 들어간 수식에는 사용할 수 없다.

In [110]:
prefix="Py"
prefix "thon"

SyntaxError: invalid syntax (3011270258.py, line 2)

In [111]:
("un"*3)"ium"

SyntaxError: invalid syntax (1197186915.py, line 1)

In [112]:
prefix+"Torch"

'PyTorch'

문자열은 인덱싱으로 일부만 참조할 수 있는데, 첫 번째 문자의 인덱스는 0이다. 파이썬에선 단일 문자형(character type)이 없고, 크기가 1인 문자열(string type)만 있다.

In [113]:
word="scikit-learn"
print(word[0])
print(word[5])

s
t


In [114]:
print(word[-1])
print(word[-2])
print(word[-6])

n
r
-


In [115]:
word[0:2]

'sc'

In [116]:
word[2:5]

'iki'

In [117]:
print(word[:2])
print(word[4:])
print(word[-2:])

sc
it-learn
rn


In [118]:
print(word[-len(word):])

scikit-learn


시작점은 항상 포함되고, 끝점은 항상 제외된다. <br>
이러면 st[a : ]+st[ : a]가 항상 st로 나오게 된다.

In [119]:
print(word[:2]+word[2:])
print(word[:5]+word[5:])

scikit-learn
scikit-learn


In [None]:
 +---+---+---+---+---+---+
 | P | y | t | h | o | n |
 +---+---+---+---+---+---+
 0   1   2   3   4   5   6
-6  -5  -4  -3  -2  -1

최대/최소 길이를 벗어난 인덱싱은 오류를 발생시킨다.

In [120]:
word[42]

IndexError: string index out of range

하지만 슬라이싱은 가능하다!

In [123]:
word[4:42]

'it-learn'

In [124]:
word[42:]

''

파이썬 문자열은 immutable 자료형으로, 내부의 원소를 수정할 수 없다. 따라서, 일부를 참조해 거기에 새 문자를 넣으면 오류가 난다.

In [125]:
word[0]="J"

TypeError: 'str' object does not support item assignment

In [126]:
word[2:]="py"

TypeError: 'str' object does not support item assignment

수정을 원하면 완전히 새로운 문자열을 생성해야 한다. 기존 변수에 할당할 수도 있지만, 새 변수를 생성하여 아래와 같이 작업할 수도 있다.

In [127]:
"J"+word[1:]

'Jcikit-learn'

In [73]:
word[:3]+"py"

'scipy'

In [128]:
파이썬의 기본 내장 함수 len()은 문자열의 길이를 측정하여 반환한다.

SyntaxError: invalid syntax (837349187.py, line 1)

In [129]:
s = 'supercalifragilisticexpialidocious'
len(s)

34

## 리스트
파이썬은 여러 값을 묶는 군집자료형을 다룰 수 있다. <br>
가장 자주 쓰이는 것은 리스트(list)로, 대괄호([ ])에 콤마로 값을 구분해 작성할 수 있다([val_1, val_2]). <br>
리스트에는 서로 다른 자료형의 값이 들어갈 수 있지만, 보통 같은 자료형을 가진 값을 넣는다.

In [75]:
squares=[1,4,9,16,25]
squares

[1, 4, 9, 16, 25]

In [76]:
print(squares[0])
print(squares[-1])
print(squares[-3:])

1
25
[9, 16, 25]


문자열과는 달리 리스트는 mutable한 자료형이다. 쉽게 말해 내부의 원소를 인덱싱과 슬라이싱으로 직접 접근해 수정할 수 있다.

In [130]:
cubes=[1,8,27,65,125]
4**3

64

In [131]:
cubes[3]=64
cubes

[1, 8, 27, 64, 125]

list.append() 메소드는 리스트 객체 내부에 내장된 함수로서, 괄호 안의 값을 리스트 객체의 맨 끝에 추가한다.

In [79]:
cubes.append(6**3)
cubes.append(7**3)
cubes

[1, 8, 27, 64, 125, 216, 343]

변수를 변수에 할당할 경우, 우리의 직관과는 달리 파이썬은 자료를 복사해서 할당해주지 않는다.<br>
리스트 변수를 새 변수에 할당하면, 그 변수는 이미 존재하는 리스트를 참조한다.<br>
만약 그렇게 리스트 변수들을 만들었으면, 하나만 바꿔도 나머지 변수들이 다 동일하게 바뀐다. 

In [138]:
rgb=["Red","Green","Blue"]
rgba=rgb
id(rgb)==id(rgba) # 같은 객체 참조

True

In [139]:
rgba.append("Alph") # rgba 변수를 수정
rgb # rgb 변수도 변화

['Red', 'Green', 'Blue', 'Alph']

하지만 모든 슬라이싱 연산은 요청된 요소들을 담은 새로운 리스트 객체를 반환한다.<br>
그러니까 슬라이싱은 리스트를 복사해서 주는 것이고, 따라서 슬라이싱해서 할당하면 서로 다른 객체를 참조하는 두 변수를 만들 수 있다.

In [142]:
correct_rgba=rgba[:]
correct_rgba[-1]="Alpha"
correct_rgba

['Red', 'Green', 'Blue', 'Alpha']

In [143]:
rgba

['Red', 'Green', 'Blue', 'Alph']

슬라이싱된 리스트 객체에 새 값을 할당하는 것도 가능하다.<br>
그리고 이 연산은 리스트의 크기와 상관없이 가능하기 때문에 리스트가 더 커지거나 작아질 수도 있고, 아예 빈 리스트로 만들 수도 있다.

In [144]:
letters=["a","b",'c','d','e','f','g']
letters

['a', 'b', 'c', 'd', 'e', 'f', 'g']

In [145]:
letters[2:5]=["C","D","E"]
letters

['a', 'b', 'C', 'D', 'E', 'f', 'g']

In [146]:
letters[2:5]=[]
letters

['a', 'b', 'f', 'g']

In [147]:
# Clear all!
letters[:]=[]
letters

[]

len() 함수는 리스트에도 사용 가능하다.

In [148]:
letters=["a","b","c","d"]
len(letters)

4

중첩 리스트 객체를 만드는 것도 가능하다.

In [149]:
a=["a","b","c"]
n=[1,2,3]
x=[a,n]
x

[['a', 'b', 'c'], [1, 2, 3]]

In [150]:
x[0]

['a', 'b', 'c']

In [151]:
x[0][1] # x의 첫 번째 값 중 두 번쨰 값

'b'

# 파이썬의 기초 프로그래밍

In [158]:
# 피보나치 수열
a, b = 0, 1
while a<10:
    print(a)
    a, b=b, a+b

0
1
1
2
3
5
8


print 함수는 출력 형식을 자동으로 보기 좋게 만들어 주고, 보다 세밀한 조정도 가능하다.

In [155]:
i=256*256
print("The value of i is",i)

The value of i is 65536


print 함수의 키워드 선언인 end= 는 출력 후 자동 개행되는 것을 막을 수 있고, 출력의 마지막에 다른 문자를 삽입하도록 할 수도 있다.

In [161]:
a,b=0,1
while a<1000000:
    print(a,end=",")
    a,b=b,a+b

0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,1597,2584,4181,6765,10946,17711,28657,46368,75025,121393,196418,317811,514229,832040,