# Python Tutorial

https://github.com/kuleshov/cs228-material/blob/master/tutorials/python/cs228-python-tutorial.ipynb 을 기반으로 수정함

## 파이썬 소개

1. 1991년에 귀도 반 로섬(Guido van Rossum)이 개발한 대화형 프로그래밍 언어
2. 초보자가 배우기에 적합
3. 현재 가장 대중화된 프로그래밍 언어
4. 머신러닝, 딥러닝, 데이터 분석에 최적화된 언어

## Python 기초

다음은 퀵소트(quicksort algorithm)를 파이썬으로 구현한 예제임 - 나중에 천천히 이해해 볼 것:

In [1]:
def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)

print(quicksort([3,6,8,10,1,2,1]))

[1, 1, 2, 3, 6, 8, 10]


### Python 버전

2 버전과 3 버전이 있으며 서로 호환되지 않음. 한 때 2 버전이 많이 쓰였으나, 지금은 대부분 3 버전을 사용

파이썬 버전을 확인하고 싶으면 도스 모드에서 다음 명령어를 실행: `python --version`.

### 기본 데이터 타입(Basic data types)

#### 숫자(Numbers)

다른 언어와 마찬가지로 숫자는 정수, 실수로 구분됨

In [2]:
x = 3
print(x, type(x))

3 <class 'int'>


In [3]:
print(x + 1)   # Addition;
print(x - 1)   # Subtraction;
print(x * 2)   # Multiplication;
print(x ** 2)  # Exponentiation;

4
2
6
9


In [4]:
x += 1
print(x)  # Prints "4"
x *= 2
print(x)  # Prints "8"

4
8


In [5]:
print(7 % 3, '나머지 연산')
print(7 // 3, '몫')

1 나머지 연산
2 몫


In [6]:
# 1000초는 몇 분 몇 초일까
minutes = 1000 // 60
seconds = 1000 % 60
print('1000 초는', minutes, '분', seconds, '초')

1000 초는 16 분 40 초


In [7]:
y = 2.5
print(type(y)) # y의 타입을 출력
print(y, y + 1, y * 2, y ** 2) # Prints "2.5 3.5 5.0 6.25"

<class 'float'>
2.5 3.5 5.0 6.25


#### 불리안(Booleans)

자바 등의 다른 언어에서 기호를 사용 (`&&`, `||`, etc.) 하는 대신 파이썬은 영단어(and, or, not)를 사용:

In [8]:
t, f = True, False
print(type(t)) # 변수의 type을 출력

<class 'bool'>


Now we let's look at the operations:

In [9]:
print(t and f) # Logical AND;
print(t or f)  # Logical OR;
print(not t)   # Logical NOT;
print(t != f)  # Logical XOR;

False
True
False
True


#### 문자열

문자열을 다루는 것은 매우 중요하므로 반드시 명확히 이해하고 숙지해야 함

In [10]:
hello = 'hello'   # String literals can use single quotes
world = "world"   # or double quotes; it does not matter.
print(hello, len(hello))

hello 5


In [11]:
hw = hello + ' ' + world  # 문자열 합치기
print(hw)  # prints "hello world"

hello world


In [12]:
hw12 = '%s %s %d' % (hello, world, 12)  # 문자열 포맷팅, % 다음에 변수들을 tuple 형태로 씀
print(hw12)  # prints "hello world 12"

hello world 12


다양한 문자열 함수

In [13]:
s = "hello"
print(s.capitalize())  # 문자열의 첫글자만 대문자로 변환
print(s.upper())       # 모든 알파벳을 대문자로 변환
print(s.rjust(7))      # 문자열을 오른쪽으로 밀고 공백을 채워서 7자가 되도록 함
print(s.center(7))     # 문자열 가운데 맞춤
print(s.replace('l', '(ell)'))  # 문자열 단어를 치환
print('  world '.strip())  # 문자열 앞뒤의 화이트 스페이스를 제거

Hello
HELLO
  hello
 hello 
he(ell)(ell)o
world


#### 문자열 포맷팅(Sting formatting)을 더 자세히:

%s - 문자열 (or any object with a string representation, like numbers)

%d - 정수

%f - 실수

%.<number of digits>f - 실수의 소숫점 이하 자리 수를 지정.

%x/%X - 정수를 16진수 형태로 변환 (소문자/대문자)

In [14]:
name = 'John'
age = 21
height = 174.2345
print("%s is %d years old and %.1fcm tall" % (name, age, height))

John is 21 years old and 174.2cm tall


더 많은 문자열 함수는 다음을 참조 [documentation](https://docs.python.org/2/library/stdtypes.html#string-methods).

### 컨테이너(Containers)

두 개 이상의 값을 저장

파이썬 내장 컨테이너 타입: 리스트(lists), 사전(dictionaries), 집합(sets), and 뉴플(tuples).

#### 리스트(Lists)

리스트는 배열과 유사하나, 크기가 가변이고 서로 다른 타입의 데이터를 저장하는 것이 가능:

In [15]:
xs = [3, 1, 2]   # 리스트 생성
print(xs, xs[2])  #인덱싱은 0부터 시작, 따라서 xs[2]는 xs 리스트의 세번째 값
print(xs[-1])     # 음수는 뒤에서부터 인덱싱, -1은 뒤에서 첫째 요소

[3, 1, 2] 2
2


In [16]:
xs[2] = 'foo'    # 서로 다른 타입의 데이터를 하나의 리스트에 넣을 수 있음
print(xs)

[3, 1, 'foo']


In [17]:
xs.append('bar') # 요소를 추가하고 싶을 때
print(xs)

[3, 1, 'foo', 'bar']


In [18]:
x = xs.pop()     # 리스트의 마지막 요소를 반환하고 리스트에서 삭제
print(x, xs)

bar [3, 1, 'foo']


리스트에 대한 더 상세한 내용은 다음을 참조 [documentation](https://docs.python.org/2/tutorial/datastructures.html#more-on-lists).

#### 슬라이싱(Slicing)

슬라이싱은 리스트에서 서브 리스트(리스트의 일부)를 꺼내기 위한 방법:

In [19]:
nums = list(range(5))    # range를 이용해 연속된 숫자 리스트를 생성
print(nums)         # 만든 리스트를 출력 [0, 1, 2, 3, 4]
print(nums[2:4])    # 2부터 4 이전까지, 인덱스는 0부터 시작하고 4는 포함되지 않음
print(nums[2:])     # 2부터 마지막까지
print(nums[:2])     # 처음부터 2 이전까지
print(nums[:])      # 처음부터 끝까지
print(nums[:-1])    # 처음부터 -1 이전까지, -1은 마지막 요소의 인덱스
nums[2:4] = [8, 9] # 2부터 4 이전까지의 요소를 각기 8, 9로 바꿈
print(nums)         # 최종 nums 출력

[0, 1, 2, 3, 4]
[2, 3]
[2, 3, 4]
[0, 1]
[0, 1, 2, 3, 4]
[0, 1, 2, 3]
[0, 1, 8, 9, 4]


더 복잡한 slicing

In [20]:
nums = list(range(10))
print(nums)
print(nums[::2])    # 처음부터 2씩 건너뛰면서 출력 -> 결과적으로 짝수만 출력
print(nums[1::2])   # 1번째부터 2씩 건너뛰면서 출력 -> 결과적으로 홀수만 출력
print(nums[::-1])   # 뒤에서부터 거꾸로 출력
print(nums[:-3:-1]) # nums의 -3 인덱스 (7) 이전까지 뒤에서부터 거꾸로 출력

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 2, 4, 6, 8]
[1, 3, 5, 7, 9]
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
[9, 8]


#### 순환/반복(Loops)

순환은 일반적으로 for 문을 이용

In [21]:
animals = ['cat', 'dog', 'monkey']
for animal in animals: # animals의 모든 요소에 대하여 - 매 순환마다 요소를 animal에 assign
    print(animal)

cat
dog
monkey


`enumerate` 함수를 이용하면 각 요소와 요소의 인덱스를 함께 사용할 수 있음:

In [22]:
animals = ['cat', 'dog', 'monkey']
for idx, animal in enumerate(animals):
    print('#%d: %s' % (idx + 1, animal))

#1: cat
#2: dog
#3: monkey


문자열과 관련한 중요한 함수

In [23]:
text = 'Hi how are you'
text_split = text.split() #문자열을 space 기준으로 분리
print(text_split)
text_again = ','.join(text_split) #문자열 리스트를 병합, join 앞의 문자열을 중간에 끼워 넣음
print(text_again)
print(text_again.split(',')) #,를 기준으로 문자열을 분리하고 싶다면?

['Hi', 'how', 'are', 'you']
Hi,how,are,you
['Hi', 'how', 'are', 'you']


#### 리스트 컴프리헨션(List comprehensions):

일반적으로 리스트의 모든 값에 대해 동일한 연산을 해서 그 결과를 다시 리스트로 만들고 싶으면 아래와 같이 `for` 문을 사용할 수 있음:

In [24]:
nums = [0, 1, 2, 3, 4]
squares = []
for x in nums:
    squares.append(x ** 2)
print(squares)

[0, 1, 4, 9, 16]


list comprehension을 사용하면 아래와 같이 축약하여 표현할 수 있음:

In [25]:
nums = [0, 1, 2, 3, 4]
squares = [x ** 2 for x in nums]
print(squares)

[0, 1, 4, 9, 16]


List comprehension에 아래와 같이 조건절을 추가하는 것이 가능:

In [26]:
nums = [0, 1, 2, 3, 4]
even_squares = [x ** 2 for x in nums if x % 2 == 0]
print(even_squares)

[0, 4, 16]


#### 딕셔너리(Dictionaries)

dictionary는 (key, value) 쌍으로 구성됨:

In [27]:
d = {'cat': 'cute', 'dog': 'furry'}  # 딕셔너리 생성
print(d['cat'])       # 키가 "cute"인 쌍의 value를 출력
print('cat' in d)     # dictionary에 'cat'키가 존재하는지 확인하고 싶을 때

cute
True


In [28]:
d['fish'] = 'wet'    # 딕셔너리에 key, value 쌍을 추가
print(d['fish'])      

wet


In [29]:
print(d['monkey'])  # 키 중에 monkey가 없으므로 에러가 발생

KeyError: 'monkey'

In [30]:
print(d.get('monkey', 'N/A'))  # 위와 같이 에러가 발생하지 않도록 하고 싶으면 get 함수를 사용, key가 없을 때의 default value를 지정
print(d.get('fish', 'N/A'))    # fish는 값이 있으므로 N/A가 출력되지 않고 해당 값을 출력

N/A
wet


In [31]:
del(d['fish'])        # dictionary에서 key가 'fish'인 쌍을 제거
print(d.get('fish', 'N/A')) # 지워졌는지 확인

N/A


더 상세한 내용은 다음을 참조 [documentation](https://docs.python.org/2/library/stdtypes.html#dict).

dictionary의 모든 값에 대해 순환하고 싶을 때:

In [32]:
d = {'person': 2, 'cat': 4, 'spider': 8}
for animal in d: # animal에는 key가 assign됨
    legs = d[animal]
    print('A %s has %d legs' % (animal, legs))

A person has 2 legs
A cat has 4 legs
A spider has 8 legs


key와 value에 대해 함께 순환을 하고 싶다면 `items` 함수를 사용:

In [33]:
d = {'person': 2, 'cat': 4, 'spider': 8}
for animal, legs in d.items():
    print('A %s has %d legs' % (animal, legs))

A person has 2 legs
A cat has 4 legs
A spider has 8 legs


Dictionary comprehensions: 리스트와 마찬가지로 아래와 같이 축약하여 생성이 가능함:

In [34]:
nums = [0, 1, 2, 3, 4]
even_num_to_square = {x: x ** 2 for x in nums if x % 2 == 0}
print(even_num_to_square)

{0: 0, 2: 4, 4: 16}


딕셔너리를 이용해 갯수 세기

In [35]:
nums = [1, 1, 2, 3, 1, 5, 3, 5, 6, 7, 3, 3, 5]
count = {}
for i in nums:
    if i in count: # i가 이미 딕셔너리에 있으면
        count[i] += 1 
    else: # i를 아직 센 적이 없다면
        count[i] = 1
print(count)

{1: 3, 2: 1, 3: 4, 5: 3, 6: 1, 7: 1}


value을 기준으로 dictionary의 key를 정렬하고 싶을 때: (참고로 dictionary는 순서가 의미가 없으므로 인덱싱, 슬라이싱이 되지 않음)

In [36]:
sorted_count = sorted(count, key=count.get, reverse=True)
print(sorted_count)
for k in sorted_count:
    print(k, ':', count[k])

[3, 1, 5, 2, 6, 7]
3 : 4
1 : 3
5 : 3
2 : 1
6 : 1
7 : 1


#### 집합(Sets)

집합은 중복이 없고, 순서가 의미 없는 리스트라고 할 수 있음:

In [37]:
animals = {'cat', 'dog'}
print('cat' in animals)   # animals 집합에 'cat'이 포함되어 있는지 알고 싶을 때
print('fish' in animals)  # prints "False"

True
False


In [38]:
s1 = set([1, 1, 1, 2, 2, 3]) # 중복된 리스트에서 set을 생성하고 결과를 봄
print(s1)

{1, 2, 3}


In [39]:
animals.add('fish')      # 새로운 값을 추가
print('fish' in animals)
print(len(animals))       # 요소의 수;

True
3


In [40]:
animals.add('cat')       # 이미 있는 값을 추가한다면?
print(len(animals))       
animals.remove('cat')    # 특정 값을 삭제
print(len(animals))       

3
2


<b>반복(_Loops_)</b>: 리스트와 유사, 단 set은 순서가 의미가 없음:

In [41]:
animals = {'cat', 'dog', 'fish'}
for idx, animal in enumerate(animals):
    print('#%d: %s' % (idx + 1, animal))
# Prints "#1: fish", "#2: dog", "#3: cat"

#1: cat
#2: fish
#3: dog


Set comprehensions: 리스트와 유사:

In [42]:
from math import sqrt
print({int(sqrt(x)) for x in range(30)})

{0, 1, 2, 3, 4, 5}


#### 튜플(Tuples)

튜플은 리스트와 유사하나, 값을 변경할 수 없다는 점이 다름. 그 외에도 튜플은 딕셔너리의 키로 사용 가능하고, 집합의 요소로 사용될 수 있으나 리스트는 안 됨:

In [43]:
d = {(x, x + 1): x for x in range(10)}  # 튜플을 키로 갖는 딕셔너리 생성
t = (5, 6)       # 튜플 생성
print(type(t))
print(d[t])       
print(d[(1, 2)])

<class 'tuple'>
5
1


In [44]:
t[0] = 1 # t는 튜플이므로 값을 변경할 수 없음

TypeError: 'tuple' object does not support item assignment

### 함수(Functions)

파이썬 함수는 `def` 를 이용하여 생성:

In [45]:
def sign(x):
    if x > 0:
        return 'positive'
    elif x < 0:
        return 'negative'
    else:
        return 'zero'

for x in [-1, 0, 1]:
    print(sign(x))

negative
zero
positive


매개변수에 디폴트 값을 줄 수 있으며, 디폴트 값이 있는 경우 함수 호출 시 값을 생략할 수 있음:

In [46]:
def hello(name, loud=False):
    if loud:
        print('HELLO, %s' % name.upper())
    else:
        print('Hello, %s!' % name)

hello('Bob')
hello('Fred', loud=True)

Hello, Bob!
HELLO, FRED


람다(무명) 함수: 일회용으로 사용하는 이름이 없는 함수

In [47]:
#주어진 값의 제곱을 구하는 함수
sq = lambda x: x*x
print(sq(7))

49


In [48]:
# 각 문자열에 대해 다양한 문자가 더 많이 사용된 순서로 정렬하는 예제
strings = ['foo', 'card', 'bar', 'aaaa', 'abab']
strings.sort(key=lambda x: len(set(list(x))), reverse=True)
strings

['card', 'bar', 'foo', 'abab', 'aaaa']

map: 시퀀스 자료형에 대해 주어진 함수를 각각 적용시켜 나온 결과의 리스트를 반환

In [49]:
l1 = [1, 2, 3, 4, 5]
# x의 모든 값에 대해 제곱을 구하고 싶다면
l2 = map(lambda x: x*x, l1)
print(list(l2)) # map의 결과는 iterator이므로 바로 출력할 수 없음 -> range()와 동일

[1, 4, 9, 16, 25]


filter: 시퀀스 자료형에 대해 주어진 함수를 만족하는 결과만 리스트로 반환

In [50]:
print(list(filter(lambda x: x > 3, l1)))
print(list(filter(lambda x: x % 2 == 0, l1)))

[4, 5]
[2, 4]


### 클래스(Classes)

아래와 같이 클래스를 선언하고 사용할 수 있음:

In [51]:
class Greeter:

    # 생성자(Constructor)
    def __init__(self, name):
        self.name = name  # 인스턴스 변수 생성

    # 인스턴스 메소드
    def greet(self, loud=False):
        if loud:
            print('HELLO, %s!' % self.name.upper())
        else:
            print('Hello, %s' % self.name)

g = Greeter('Fred')  # 생성자를 이용하여 Greeter 클래스의 인스턴스를 생성
g.greet()            # 인스턴스 메소드 호출
g.greet(loud=True)   

Hello, Fred
HELLO, FRED!
