# python

---

`numpy`, `pandas`, `matplotlib` 같은 라이브러리 덕분에 `python` 은 데이터분석에 좋은 도구로 사용되고 있습니다.  
위와 같은 라이브러리들을 통해 데이터 분석을 하신 분들도 계시겠지만,  
그렇지 않은 분들을 위해 이번 강의에서는 간단한 `python` 사용법과 활용에 대해서 알아보겠습니다.

뿐만아니라 이미 `python` 에 익숙하신 분들을 위한 꿀팁을 알려드리니 참고해주시면 감사하겠습니다 :)  
심화내용은 🔥 표시되어 있으며 초심자분들께서는 이런 게 있구나! 하고 넘어주셔도 됩니다!

# In this tutorial...

- Basic of python : 파이썬의 기초에 대해 배웁니다.
- Container : 여러 값들을 한 곳에 담아 관리할 수 있는 유용한 객체들에 대해 배웁니다.
- Condition : 조건문을 통해 여러 조건으로 분기하는 법에 대해 배웁니다.
- Function : 중복되거나 복잡한 기능을 모아 편리하게 사용할 수 있게 하는 함수에 대해 배웁니다. 
- Class : 객체들의 설계도 역할을 하는 클래스에 대해 배웁니다.
- Import : 다른 패키지에서 만든 클래스나 함수를 들고 올 수 있는 방법에 대해 배웁니다.
- Environment : 파이썬을 개발하고 실행할 수 있는 환경에 대해서 배웁니다.
- Misc. : 프로젝트를 진행하며 도움이 될만한 꿀팁들을 배웁니다.

# Basic of python

`python` 은 고수준, 동적 타입, 멀티패러다임 컴퓨터 언어입니다.  
`python` 은 컴퓨터 언어라기 보다 인간의 언어의 형태를 띄기 때문에 가독성이 뛰어나고, 적은 양의 코드 만으로 아주 강력한 기능을 만들 수도 있습니다.

## Python version

2020 년 1월 1일 부터 `python` 단체에서는 [공식적으로 `python2` 지원을 종료](https://www.python.org/doc/sunset-python-2/)했습니다. '21.9월 기준 python 은 3.9 까지 나와있으며 사용 중인 `python` 버전은 아래 코드로 확인 가능합니다.  

주요 라이브러리가 3.6 버전이상을 지원하는 경우가 많기 때문에 python 3.6 버전이상을 사용하는 것을 추천드립니다.

In [1]:
import sys

# 현재 사용중인 python 버전 출력
# colab 에서는 3.7 버전을 사용 중 입니다('21.9.11 기준)
# 아래 출력은 실행 중인 python 버전에 따라 결과가 달라질 수 있습니다.
print(sys.version)

3.8.5 (default, Sep  3 2020, 21:29:08) [MSC v.1916 64 bit (AMD64)]


## Basic data type

기본적으로 사용되는 기반 데이터 타입(자료 형식)에 대해서 알아보겠습니다.  
데이터 타입이란 데이터(값)이 어떤 유형인지를 말합니다.

### Number

수를 나타내는 자료 형식에는 정수를 나타내는 `int` 와 소수를 나타내는 `float` 이 있습니다.

#### int

In [2]:
x = 3

print(x)

3


In [3]:
print(x+1)  # 더하기
print(x-1)  # 빼기
print(x*2)  # 곱하기
print(x/2)  # 나누기
print(x**2)  # 거듭제곱

4
2
6
1.5
9


#### float

In [4]:
y = 2.5

print(y+1)
print(y-1)
print(y*2)
print(y/2)
print(y**2)

3.5
1.5
5.0
1.25
6.25


`int` 메서드를 이용해서 정수형식으로 변환할 수 있습니다.

In [5]:
print(int(y))

2


### Boolean

참과 거짓을 나타내는 논리 자료형인 `boolean` 에 대해 알아봅시다.

In [6]:
t = True
f = False

print(t)  # True
print(f)  # False

True
False


논리연산을 아래와 같이 사용할 수 있습니다.

In [7]:
# 둘 다 참이여야 참
## True and True
print(t and t)  # = True
## True and False
print(t and f)  # = False

# 둘 중 하나만 참이면 참
## True or False
print(t or f)  # = True
## False or False
print(False or False)  # = False

# NOT(논리반전) 연산
print(not t)  # = False
print(not f)  # = True

True
False
True
False
False
True


### String

문자열을 나타내는 자료형인 `str` 을 알아보겠습니다.

In [8]:
h = 'hello'  # 사용하고자 하는 문자열을 single quotation(작은따옴표) 로 감싸서 사용할 수 있다.
w = "world"  # double quotation(큰따옴표) 로도 사용할 수 있다.

print(h)

hello


In [9]:
hw = h + "  " + w  # '+' 연산자로 여러 문자열을 합칠 수 있다

print(hw)

hello  world


In [10]:
e = "!!!"

print(e * 10)  # '*' 연산자로 문자열을 반복 시킬 수 있다.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!


`str` 자료형은 유용한 여러 메서드를 가지고 있습니다.

In [11]:
s = "hello"

print(s.capitalize())  # 첫 글자만 대문자로 변경합니다.
print(s.upper())       # 모든 글자를 대문자로 변경합니다.
print(s.rjust(9))      # 주어진 숫자(9)보다 문자열의 길이가 작을 경우 왼쪽에 공백을 추가하여 오른쪽 정렬합니다.
print(s.center(9))     # 양 옆에 공백을 추가하여 중앙 정렬합니다.
print(s.replace('l', '*'))  # 첫번째 주어진 문자를 두번째 주어진 문자로 변경합니다. (l -> *)
print('  world '.strip())  # 양 끝 공백을 제거 합니다.
print(len(s))  # 문자열의 길이를 반환합니다.

Hello
HELLO
    hello
  hello  
he**o
world
5


더 많은 문자열 메서드는 [공식 문서](https://docs.python.org/3.7/library/stdtypes.html#string-methods)에서 확인 가능합니다!

`[]` 안에 원하는 인덱스를 지정해주어서 원하는 위치의 글자를 선택할 수 있습니다.

In [12]:
s = "parkdoyoung"

print(s[6])  # 6 번째 글자가 선택되어 출력됩니다.  # 인덱스는 0 부터 시작합니다.

y


`str` 메서드를 이용하여 값의 자료형식을 문자열로 변환가능합니다.

In [12]:
i = 2

# 숫자 형식일 때
print(i + 1)  # 2 + 1 = 3
# 문자열 형식일 때
print(str(i) + str(1))  # "2" + "1" = "21"

3
21


### type

값이 어떤 자료형식인지 알고 싶을 때 `type` 메서드를 사용할 수 있습니다.

In [13]:
x = 1

print(type(x))
print(type(1))
print(type(1.1))
print(type("문자열!"))

<class 'int'>
<class 'int'>
<class 'float'>
<class 'str'>


#### 🔥 f-string

문자열을 형식을 지정(`formatting`) 하여 원하는 형식(`template`)으로 출력할 수 있습니다.  
`f-string` 은 python 3.6 부터 추가된 기능입니다. 이전 버전에서는 사용할 수 없습니다.

자세한 내용이 알고 싶으면 [공식문서](https://www.python.org/dev/peps/pep-0498/)를 참고해주세요.

In [14]:
s = "park"

# my name is park 을 출력하고 싶다면...
## 1. string concatenation
print("my name is " + s)

## 2. f-string
### 사용법
### 1. 문자열을 지정하는 ""(따옴표) 앞에 f 를 추가한다.
### 2. 변수를 {} 안에 넣어준다.
print(f"my name is {s}")

my name is park
my name is park


In [15]:
# 형식에 포함하려는 변수가 여러개 라면...?

name = "young"
age = 25
hometown = "busan"

# my name is young, 25 years old, hometown is busan 을 출력하고 싶다면...
## 1. string concatenation
print("my name is " + name + ", " + str(age) + " years old, hometown is " + hometown)

## 2. f-string
print(f"my name is {name}, {age} years old, hometown is {hometown}")  # 간결하다...!

my name is young, 25 years old, hometown is busan
my name is young, 25 years old, hometown is busan


기타 서식 기능도 제공합니다.

In [16]:
print(f"{1000000:,}")  # :, 로 천자리 구분자를 나타낼 수 있습니다.
print(f"{0.001:%}")  # :% 로 백분율 표시를 할 수 있습니다.
print(f"{0.001:.2f}")  # :.2f 로 소수점 2 자리 까지 나타낼 수 있습니다.
print(f"{0.001:.2%}")  # :.2% 로 소수점 2 자리 백분율을 나타낼 수 있습니다.

1,000,000
0.100000%
0.00
0.10%


# Container

`container` 란 기본자료 구조들을 담을 수 그릇 역할을 하는 자료구조를 말합니다.  
`python` 에는 여러 `built-in` container 자료구조를 제공합니다: `list`, `set`, `dictionary`, `tuple`

## List

`list` 란 입력한 순서가 유지되는 배열입니다.  
- 타 프로그래밍 언어와 달리 자동으로 크기를 늘리거나 줄일 수 있고(resizable)  
- 어떠한 자료형태(data type)의 데이터도 한 리스트 안에 담을 수 있습니다.

In [17]:
xs = [3, 2, 4]

print(xs)

# 값의 위치를 나타내는 index(순번) 는 0 부터 시작하여 해당 리스트의 길이-1 까지 존재합니다.
print(xs[1])  # 대괄호([]) 안에 index(순번)을 넣어 원하는 위치의 값만 선택가능합니다.
print(xs[-1])  # -1 을 index 로 지정하여 가장 마지막 값만 선택가능합니다.

[3, 2, 4]
2
4


In [18]:
xs[1] = "yeah!"  # 인덱스를 지정하고 해당 인덱스에 넣을 값을 지정하여 값을 변경할 수 있습니다.

print(xs)  # 한 리스트안에 여러 다른 자료형태를 담을 수 있습니다.

[3, 'yeah!', 4]


In [19]:
print(xs)  # before: [3, "yeah!", 4]
xs.append(5)  # 가장 뒤에 원소를 하나 추가합니다.
print(xs)  # after: [3, "yea!", 4, 5]

[3, 'yeah!', 4]
[3, 'yeah!', 4, 5]


In [20]:
print(xs)  # before: [3, "year!", 4, 5]
print(len(xs))  # before: 4  # 리스트의 길이를 반환합니다.
xs.pop()  # 가장 마지막 원소를 삭제합니다.
print(xs)  # after: [3, "year!", "4"]
print(len(xs))  # after: 3

[3, 'yeah!', 4, 5]
4
[3, 'yeah!', 4]
3


In [21]:
# list() 또는 [] 로 빈 리스트를 선언할 수 있습니다.
l = list()  # 또는 l = []

l.append("zero")
l.append("four")
l.append("two")
l.append("four")

print(l)

['zero', 'four', 'two', 'four']


더 많은 `list` 메서드는 [공식 문서](https://docs.python.org/3.7/tutorial/datastructures.html#more-on-lists)에서 확인 가능합니다!

## Set

`set` 은 중복을 허용하지 않아 유일한 원소를 가지며 순서를 보장하지 않는 집합을 말합니다.

In [22]:
animals = {"cat", "dog"}  # {} 로 선언할 수 있습니다.

print(animals)
print("dog" in animals)  # animals 집합(set)에 "dog" 가 있는 지 검사합니다.
print("fish" in animals)  # animals 집합에 "fish" 가 있는 지 검사합니다.

{'dog', 'cat'}
True
False


In [23]:
animals.add("fish")  # add 메서드로 집합에 원소를 추가할 수 있습니다.
print("fish" in animals)  # animals 집합에 "fish" 가 있는지 검사합니다.

True


In [24]:
animals.add("cat")  # "cat" 을 추가해도 추가되지 않습니다. 중복된 원소는 허용하지 않습니다.
print(animals)

animals.remove("cat")  # 집합에서 원소를 제거할 수 있습니다.
print(animals)

{'dog', 'fish', 'cat'}
{'dog', 'fish'}


In [25]:
s = set()  # set() 으로 빈 집합을 선언할 수 있습니다.

s.add("empty")
s.add("set")
s.add("set")  # 중복된 원소는 더해지지 않습니다.

# len 메서드로 집합의 크기를 알 수 있습니다.
print(len(s))
print(s)

2
{'set', 'empty'}


In [26]:
l = ["cat", "cat", "dog", "cat"]  # 중복된 원소가 있는 리스트를 선언합니다.

# 집합 생성자에 리스트를 전달하여 중복을 집합으로 변환합니다.
# 집합으로 변경되었기 때문에 중복된 원소는 하나만 남습니다.
print(set(l))

# set(l) 로 중복된 원소를 제거한 후
# list() 로 다시 list 형식으로 변환합니다.
print(list(set(l)))

{'dog', 'cat'}
['dog', 'cat']


## Dictionary

마치 사전처럼 `dictionary` (key, value) 쌍으로 데이터를 저장하는 자료구조 입니다.  
- key 에 해당하는 value 를 손쉽게 찾을 수 있습니다.  
- 입력한 순서를 보장하지 않습니다.

In [27]:
d = {"dog": "강아지", "cat": "고양이"}
print(d["dog"])  # "dog" 에 해당하는 key 의 value 를 불러옵니다: "강아지"
print("cat" in d)  # d 안에 "cat" 이라는 key 가 있는 지 검사합니다.

강아지
True


In [28]:
d["fish"] = "물고기"  # "fish" 라는 key 를 추가하고 "물고기" 라는 value 를 추가(이미 존재한다면 수정)합니다.
print(d["fish"])

물고기


In [29]:
print(d["monkey"])  # 존재하지 않는 key 를 검색하면 KeyError 가 발생합니다

KeyError: 'monkey'

In [None]:
# Error 가 발생하지 않도록 key 를 검색하려면 .get() 메서드를 사용합니다.  
# .get([key], [key가 존재하지 않을 때 반환할 값(기본값=None)])

print(d.get("monkey"))  # key가 존재하지 않아 기본값인 None 를 반환합니다
print(d.get("left-hand-black-dragon", "키가 존재하지 않음"))  # key가 존재하지 않아 지정된 문자를 반환합니다

In [None]:
d.pop("dog")  # pop 메서드를 이용해서 key 를 제거할 수 있습니다.

del d["cat"]  # 또는 del 키워드를 사용해서 키를 제거할 수도 있습니다.

print(d)

`dict`에 대한 더 자세한 내용은 [공식 문서](https://docs.python.org/3/tutorial/datastructures.html#dictionaries)에서 확인 가능합니다.

## Tuple

튜플은 순서를 보장하는 값들의 배열입니다. 불변한다는 특성을 가지기 때문에 한 번 생성된 튜플의 원소를 추가/삭제하는 것이 불가능합니다.

In [None]:
t = (2, 5)

print(t[0])  # index 를 통해 값을 불러올 수 있습니다.

In [None]:
t[0] = 1  # 불변(immutable)하기 때문에 값을 수정하는 것은 불가능 합니다.

🔥 `tuple` 은 `list` 와 비슷하지만 큰 차이점이 있습니다. `tuple` 만이 `set` 과 `dict` 의 key 로써 사용할 수 있다는 것입니다.

In [None]:
s = {["리", "스", "트"], ["리스트"]}  # list 는 set 의 원소로 사용할 수 없습니다.

print(s)

In [None]:
# tuple 은 set 의 원소로 사용할 수 있습니다.
# 하나의 원소를 가지는 tuple 를 생성하기 위해서는 () 안에 , 를 명시적으로 적어주어야 합니다.
s = {("튜", "플"), ("튜플",)}

print(s)

## Slicing

`python` 에서는 `list` 의 특정한 부분(sublist)에 접근할 수 있는 문법을 제공합니다.  

[start:end:step] 의 형식을 가집니다. start 는 시작할 인덱스, end 는 마지막 인덱스 (포함하지 않습니다), step 은 index 증가값을 말합니다.

In [None]:
nums = [0, 1, 2, 3, 4]
print(nums)         # [0, 1, 2, 3, 4]
print(nums[2:4])    # [2, 3]; index 2 to 4 (마지막 미포함=exclusive) 부분리스트 반환
print(nums[2:])     # [2, 3, 4]; index 2 to the end
print(nums[:2])     # [0, 1]; from start to index 2 (exclusive) 
print(nums[:])      # [0, 1, 2, 3, 4]; 전체 리스트를 반환
print(nums[:-1])    # [0, 1, 2, 3]; slice 는 음수도 될 수 있습니다

문자열(`str`)타입의 특정한 부분(substring)에 접근할 수도 있습니다.

In [10]:
s = "hello, world"
print(s)         # "hello, world"
print(s[1:5])    # "ello"; index 1 to 5 (마지막 미포함=exclusive) 부분리스트 반환
print(s[7:])     # "world"; index 7 to the end
print(s[:2])     # "he"; from start to index 2 (exclusive) 
print(s[:])      # "hello, world"; 전체 문자열을 반환
print(s[:-1])    # "hello, worl"; slice 는 음수도 될 수 있습니다
print(s[::-1])   # "dlrow ,olleh"; step 을 음수로 전달해서 거꾸로 뒤집을 수 있습니다.

hello, world
ello
world
he
hello, world
hello, worl
dlrow ,olleh


## Loop

container 자료구조들은 기본적으로 `for` 구문을 통해 반복(순회)가능합니다.

In [30]:
animals = ['cat', 'dog', 'monkey']
for animal in animals:  # animals list 를 하나씩 순회하며 animal 이라는 변수(변수이름은 아무거나 사용가능)에 할당합니다
    print(animal)

cat
dog
monkey


In [31]:
names = {"park", "lee", "young"}
for name in names:  # set 은 순서를 보장하지 않기 때문에 순회결과는 달라질 수 있습니다.
    print(name)

young
park
lee


In [32]:
animals_in_my_house = {"cat": "고양이", "dog": "강아지", "dragon": "용"}

for each in animals_in_my_house:  # dict 는 기본적으로 key 만 순회합니다.
    print(each)

cat
dog
dragon


In [33]:
for each in animals_in_my_house.values():  # values() 메서드를 이용해서 value 만 순회할 수 있습니다.
    print(each)

고양이
강아지
용


In [34]:
for each in animals_in_my_house.items():  # items() 메서드를 이용해서 (key, value) 튜플을 순회할 수 있습니다.
    print(each)

('cat', '고양이')
('dog', '강아지')
('dragon', '용')


### range

built-in 함수로써 지정된 범위내 `int` 의 나열을 생성합니다.

In [35]:
r = range(5)  # 0부터 "5"까지(미포함) 숫자의 나열을 생성합니다.

print(list(r))

[0, 1, 2, 3, 4]


In [36]:
r = range(1, 5)  # "1"부터 "5"까지(미포함) 숫자의 나열을 생성합니다.

print(list(r))

[1, 2, 3, 4]


In [37]:
r = range(1, 5, 2)  # "1"부터 "5"까지(미포함) "2" 단위로 생성합니다.

print(list(r))

[1, 3]


`for` 문에 사용하여 `range` 내부의 값들을 순회할 수 있습니다.

In [38]:
for index in range(5):
    print(index)

0
1
2
3
4


### 🔥 Enumerate

container 의 값들과 순회 중인 index 를 함께 얻고자 할 때 `enumerate` 를 사용할 수 있습니다.

In [39]:
l = ["good", "b", "y", "e"]

for each in enumerate(l):  # each 에는 (순회index, 순회원소) 의 tuple 이 할당됩니다.
    print(each)

(0, 'good')
(1, 'b')
(2, 'y')
(3, 'e')


In [40]:
for each in enumerate(l, 15):  # 시작할 index 를 지정해줄 수도 있습니다.
    print(each)

(15, 'good')
(16, 'b')
(17, 'y')
(18, 'e')


### 🔥 zip

`zip` 은 여러 순회가능한 container 들이 있을 때, 같은 index 에 있는 원소들을 하나의 `tuple` 로 반환하여 순회가능할 수 있도록 합니다.

In [41]:
person_ids = [4, 3, 2, 17, 2]
genders = ["female", "male", "male", "female", "female"]

for each in zip(person_ids, genders):
    print(each)

(4, 'female')
(3, 'male')
(2, 'male')
(17, 'female')
(2, 'female')


In [42]:
numbers = [1, 2, 3]
letters = ["a", "b", "c", "d", "e", "f"]

for each in zip(numbers, letters):  # 둘 중 길이가 적은 container 를 기준으로 작동합니다.
    print(each)

(1, 'a')
(2, 'b')
(3, 'c')


## 🔥 Comprehension

프로그래밍을 하다보면 흔히 우리는 container 들을 다른 형태로 변환하게 됩니다. 이를 위해 `python` 에서는 `comprehension` 문법을 지원합니다.

예로 아래 주어진 리스트들의 값들을 제곱하여 새로운 리스트를 만드려 합니다.

In [43]:
# 쉬운 방법으로는 전통적인 for 문을 사용할 수 있습니다.
l = [2, 6, 12, 1]

new_list = []
for each in l:
    new_value = each ** 2
    new_list.append(new_value)
    
print(new_list)

[4, 36, 144, 1]


In [44]:
# 더 pythonic 한 방법으로는 comprehension 을 사용할 수 있습니다.
sample_comprehension = [each**2 for each in l]

print(sample_comprehension)

[4, 36, 144, 1]


뿐만아니라 `range` 등 과 같이 사용하여 손쉽게 원하는 값을 만들 수도 있습니다.  
만약 ["1월", "2월", "3월", ..., "12월] 이라는 리스트를 얻고자 한다면 아래 방법을 사용할 수 있습니다.

In [45]:
# 전통적인 for 문을 사용하여 원하는 문제를 해결합니다.
r = range(1, 13)  # 숫자로 1~12를 가지는 range 를 생성합니다.

l = []
for month in r:
    l.append(str(month) + "월")
    
print(l)

['1월', '2월', '3월', '4월', '5월', '6월', '7월', '8월', '9월', '10월', '11월', '12월']


In [46]:
# comprehension 과 f-string 을 이용하여 생성합니다.
months = [f"{month}월" for month in range(1, 13)]

print(months)

['1월', '2월', '3월', '4월', '5월', '6월', '7월', '8월', '9월', '10월', '11월', '12월']


다른 container 객체에서도 `comprehension` 을 사용할 수 있습니다.

In [47]:
# 원래의 값을 key 로, 제곱된 값을 value 로 가지는 dict 를 생성하고자 합니다.
# ex) {1: 1, 2: 4, 3: 9, 4: 16}
l = [1, 2, 3, 4]

d = {each: each**2 for each in l}

print(d)

{1: 1, 2: 4, 3: 9, 4: 16}


## sort

`sorted` 를 이용하여 container 안의 값들을 사전순 정렬할 수 있습니다.

In [48]:
l = [54, 32, 124]

print(l)  # 정렬 전
print(sorted(l))  # 정렬 후

print(l)  # sorted 는 정렬을 한 새로운 list 를 반환하는 것이기 때문에 기존 리스트는 정렬되지 않은 상태 그대로 입니다.

[54, 32, 124]
[32, 54, 124]
[54, 32, 124]


정렬된 새로운 리스트를 반화하는 것이 아니라 기존 리스트를 정렬시키고 싶다면 `list`의 `sort()` 메서드를 사용할 수 있습니다.

In [49]:
l.sort()

print(l)  # list l 의 원본이 정렬되었습니다.

[32, 54, 124]


역방향으로 정렬하고 싶다면 `reverse=True` 옵션을 줄 수 있습니다.

In [50]:
letters = ["b", "l", "a", "c", "k"]

print(sorted(letters, reverse=True))

['l', 'k', 'c', 'b', 'a']


## reversed

container 를 역방향으로 만들고자 한다면 `reversed` 를 이용할 수 도 있습니다.

In [51]:
numbers = list(range(10))

print(numbers)  # 기존 
print(list(reversed(numbers)))  # reversed 를 사용하고 list로 만들어주어야 사용가능합니다.
print(numbers[::-1])  # 또는 slice 를 이용하여 역방향 정렬도 가능합니다.

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]


아래 예처럼 거꾸로 순회하고자 할 때 사용할 수 있습니다.

In [52]:
for each in reversed(range(5)):
    print(each)

4
3
2
1
0


## useful methods

- max : container 중 가장 큰 값을 구하는 함수입니다.
- min : container 중 가장 작은 값을 구하는 함수입니다.
- sum : container 의 원소들의 합을 구합니다.

In [53]:
l = [1, 3, 5, 7, 9]

print(max(l))
print(min(l))
print(sum(l))

9
1
25


# Condition

`if`, `elif`, `else` 키워드를 이용하여 조건문을 작성할 수 있습니다.

In [54]:
n = 5

if n > 0:
    print("n is positive")
elif n < 0:
    print("n is negative")
else:
    print("n is zero")

n is positive


# Function

자주 사용되거나 반복되는 코드를 함수로 정의하고 여러 곳에서 편하게 사용가능합니다.  
함수의 정의는 `def` 키워드를 사용합니다.

In [55]:
# 어떤 숫자 n 이 0이 아니면 n 을, 0이면 "zero!" 를 출력하는 함수를 정의합니다.
def sample_function(n):
    if n != 0:
        print(n)
    else:
        print("zero!")

In [56]:
sample_function(10)  # 0이 아니기 때문에 n인 10을 출력합니다.
sample_function(0)  # 0 일때는 zero! 를 출력합니다.

sample_function()  # n 을 전달하지 않으면 오류가 발생합니다.

10
zero!


TypeError: sample_function() missing 1 required positional argument: 'n'

In [57]:
# 기본값을 정의한 함수를 정의할 수도 있습니다.
# 인자가 전달되지 않으면 지정된 기본값(=0)가 전달된 것 처럼 작동합니다.
def sample_function_with_default_value(n=0):
    if n != 0:
        print(n)
    else:
        print("zero!")

In [58]:
sample_function_with_default_value(10)   # 0이 아니기 때문에 n인 10을 출력합니다.
sample_function_with_default_value(0)  # 0 일때는 zero! 를 출력합니다.

sample_function_with_default_value()  # 아무값도 전달하지 않았기 때문에 0 이 전달된 것처럼 작동합니다.

10
zero!
zero!


### None

몇 안되는 `python` 의 내장상수 중 하나이며, 값의 부재를 나타낼 때 사용됩니다.
- [내장상수](https://docs.python.org/ko/3/library/constants.html)란 ?

함수의 반환값이 없을 때는 `None` 을 반환합니다.

In [59]:
def return_nothing():
    print("hello? in function...")

In [60]:
# 함수안에서 출력을 하고
# 함수의 반환값이 없기 때문에(None) 함수의 반환값을 출력하면 None 이 출력됩니다.
print(return_nothing())

hello? in function...
None


In [61]:
# 바로 위 셀의 내용과 동일합니다.
return_value = return_nothing()
print(return_value)

hello? in function...
None


반환값이 있는 경우는 아래와 같습니다.

In [62]:
def return_anything():
    return "hello! i'm return value"

In [63]:
print(return_anything())  # 함수에서 문자열("hello...")을 반환했고 그 값을 출력합니다.

# same as above
return_value = return_anything()
print(return_value)

hello! i'm return value
hello! i'm return value


### 🔥 Lambda

임시적으로 사용될 함수를 선언하기 위해 `def` 키워드를 사용하지 않고 `lambda` 로 함수를 만들 수 있습니다.

In [64]:
# x 를 입력으로 받아 x+1 를 반환하는 함수를 simple_function 이라는 이름으로 선언합니다.
simple_function = lambda x: x+1

print(simple_function(1))  # 1+1 인 2 를 반환합니다.
print(simple_function(10))  # 10+1 인 11 를 반환합니다.

2
11


### 🔥 map

순회가능한 값(`iterable`*) 를 특정한 함수를 거쳐 변환하여 반환합니다.  
반환된 값은 `map` 형식이기 때문에 `list()` 등으로 변환해주어야 합니다.

\* 이 강의에서는 container 로 명명합니다.

In [65]:
f = lambda x: x+1
l = [1, 10, 100]

# 함수, 변환하고자하는 container 를 전달합니다.
result = list(map(f, l))
print(result)

# 줄여쓰면 아래와 같이 사용가능합니다.
print(list(map(lambda x: x+1, [1, 10, 100])))

[2, 11, 101]
[2, 11, 101]


`lambda` 뿐만아니라 복잡한 함수도 전달가능합니다.

In [66]:
def complex_function(n):
    if n == 0:
        return "hello"
    return n ** 2

In [67]:
l = [1, 0, 2, 3, 0]

print(list(map(complex_function, l)))

[1, 'hello', 4, 9, 'hello']


### 🔥 filter

순회가능한 값에서 특정한 함수를 만족(결과값이 True)하는 값만 남기고 필터링합니다.  
반환된 값은 `filter` 형식이기 때문에 `list()` 등으로 변환해주어야합니다.

In [68]:
f = lambda x: x > 0
l = [-2, -1, 0, 1, 2]  # =list(range(-2, 3))

result = list(filter(f, l))  # 전달된 f 에 따라 0 초과인 값들만 남습니다.
print(result)

[1, 2]


### 🔥 Packing·Unpacking

여러 값들을 하나의 변수에 모으거나 하나의 변수를 여러개의 변수에 할당할 수 있습니다.

#### packing

여러 값들을 하나의 변수에 모읍니다.

In [69]:
l = [1, 2, 3, 4, 5]

first, second, *rest = l  # "*" 를 사용해서 두번째 이후 변수들을 rest 에 모읍니다.

print(first)
print(second)
print(rest)

1
2
[3, 4, 5]


In [70]:
# 여러 변수들을 받아서 하나의 변수로 만듭니다.
def pack(*args):
    print(args)

In [71]:
pack(1, 2, 3)  # 1, 2, 3 이 따로 전달되었지만 하나의 변수로 합쳐졌습니다.

(1, 2, 3)


#### unpacking

하나의 변수를 여러 개의 변수에 나눠 할당합니다.

In [72]:
t = (3, 4)

first, second = t  # 하나의 튜플을 두 개의 변수에 나눠 담습니다.

print(first)
print(second)

3
4


In [73]:
# 두 변수를 받아 그 합을 출력하는 함수입니다.
def unpack(a, b):
    print(a+b)

In [74]:
t = (1, 6)

unpack(*t)  # 튜플 하나를 "*" 를 이용해 unpack 해서 두 개의 변수로 만듭니다.

7


`dict` 를 pack/unpack 하여 함수의 인자로 전달할 수 있습니다.

In [75]:
def print_song(artist, title):
    print(f"{title} - {artist}")

In [76]:
print_song("the weeknd", "save your tears")  # 일반적인 사용 방법

d = {"artist": "blackpink", "title": "pretty savage"}
print_song(**d)  # unpacking 을 사용한 방법

save your tears - the weeknd
pretty savage - blackpink


# Class

객체지향 프로그래밍의 기본이 되는 클래스에 대해 알아보겠습니다.  
어떤 개념을 나타내기 위한 설계도를 클래스라 할 수 있습니다. 클래스(설계도)를 통해 객체(인스턴스) 만들 수 있습니다.  
앞서서 사용했던 `list`, `set` 뿐만아니라 심지어 `int`, `str` 등 도 모든 것이 클래스를 통해 만들어진 객체입니다.

더 자세한 설명은 [점프 투 파이썬](https://wikidocs.net/28)에서 볼 수 있습니다.

In [77]:
class Greeter:

    # 생성자
    # 이 클래스를 객체로써 생성하기 위한 특별한 함수를 정의합니다.
    def __init__(self, name):
        self.name = name  # 인스턴스 변수를 생성합니다.
        self.greet_count = 0

    # 인스턴스 메서드(함수)
    def greet(self, loud=False):
        if loud:
            print(f"HELLO, {self.name.upper()}!")
        else:
            print(f"Hello, {self.name}!")
        self.greet_count = self.greet_count + 1
        
    # 인스턴스 메서드
    # 지금까지 greet() 메서드를 호출한 횟수를 출력합니다.
    def print_greet_count(self):
        print(self.greet_count)

In [78]:
g = Greeter("young")  # Greeter 클래스의 instance(객체)를 생성합니다.
g.greet()  # greet 메서드를 실행합니다.
g.greet(loud=True)  # greet 메서드를 실행합니다.
g.print_greet_count()  # print_greet_count 메서드를 실행합니다.

Hello, young!
HELLO, YOUNG!
2


# Import

직접 함수나 클래스를 정의하고 사용할 수도 있지만, 다른 이들이 만들어 놓은 함수와 클래스를 들고와서 사용할 수 있습니다.

In [79]:
# math 모듈을 불러옵니다.
# math 모듈에 있는 함수나 클래스를 사용할 수 있습니다.
import math  

print(math.sqrt(3))  # 제곱근을 구해주는 sqrt 함수를 사용하여 3의 제곱근을 구합니다.

1.7320508075688772


### as

모듈을 들고올 때 모듈 별칭을 지정하여 들고 올 수 있습니다.

In [80]:
import math as math_util  # math 모듈을 math_util 이라는 이름으로 들고옵니다.

print(math_util.sqrt(3))  # 제곱근을 구해주는 함수를 사용합니다.

1.7320508075688772


### from

모듈 내에서 필요한 함수나 클래스만을 들고 올 수 있습니다.

In [81]:
from math import sqrt, ceil  # math 모듈에서 sqrt, ceil 함수를 들고옵니다.

print(sqrt(3))  # math 모듈에서 들고온 sqrt 함수를 사용합니다.
print(ceil(3.6))  # math 모듈에서 들고온 ceil 함수를 사용합니다. ceil 함수는 가장 가까운 정수로 올림하는 함수입니다.

1.7320508075688772
4


In [82]:
from math import *  # "*" 를 명시하여 해당 모듈의 모든 함수나 클래스를 들고 올 수도 있습니다.

print(floor(3.6))  # math 모듈 안 floor 함수를 사용합니다. floor 함수는 가장 가까운 정수로 내림하는 함수입니다.

3


#### Library ?
공통으로 사용될 수 있는 기능을 모듈화한 것을 말합니다. `python` 은 많은 유용한 라이브러리를 기본적으로 제공합니다.

In [83]:
# 로또 번호 추첨기를 기본적으로 제공하는 라이브러리를 사용하여 간단히 만들어 볼 수 있습니다.
from random import choices  # random 모듈에서 무작위로 k 개의 선택지를 고르는 choices 함수를 들고옵니다.

numbers = list(range(1, 46))  # 1~45 까지 숫자를 생성합니다.
print(choices(numbers, k=6)) # 6 개의 숫자를 고릅니다.  # 무작위로 선택된 값이기 때문에 실행할 때 마다 값이 달라집니다.

[12, 9, 13, 5, 7, 38]


### PIP

기본으로 제공되는 내장 라이브러리 말고도 외부에서 제공하는 라이브러리를 다운받고 싶다면 `pip` 모듈을 사용할 수 있습니다.  

In [85]:
!pip install art  # pip install [패키지명] 으로 패키지를 다운 받을 수 있습니다. 인터넷이 연결되어있어야 합니다.

In [112]:
from art import tprint  # 다운받은 art 라이브러리에서 tprint 함수를 불러옵니다.

tprint("hello?")  # 귀여운 글씨체로 출력합니다.

 _            _  _         ___ 
| |__    ___ | || |  ___  |__ \
| '_ \  / _ \| || | / _ \   / /
| | | ||  __/| || || (_) | |_| 
|_| |_| \___||_||_| \___/  (_) 
                               



# Environment

`python` 을 개발하고 실행하는 환경에 대해서 알아보겠습니다.

### IPython

기존 `python` 실행환경인 `python shell` 은 코드를 입력하면 코드의 실행 결과를 바로 확인할 수 있고(`REPL`) 이전 코드의 실행 결과를 모두 기억하고 있어서 간단한 코드를 작성할 수 있었습니다. 이를 개선하여 다양한 부가기능을 이용해 코드를 편하게 작성하고 실행할 수 있는 `IPython(Interactive Python)` 이 개발되었습니다. `IPython` 은 자동완성, 코드 하이라이팅, 객체 정보 보기, 단축키,` magic command` 등 의 다양한 부가기능을 추가해 사용성을 개선되었습니다.

## Jupyter notebook

`IPython` 에 출력물을 관리하고 문서화를 시키고 웹 어플리케이션의 형태로 사용가능 하도록 만든 프로그램이 `Jupyter notebook` 입니다. `Jupyter notebook` 은 코드 작성과 실행을 서버-클라이언트 모델로 분리하였습니다. 즉, 사용자가 웹 브라우저(클라이언트)에서 코드를 작성하면, 코드는 서버로 전송되어 실행되고, 그 결과가 다시 웹 브라우저로 전달되어 사용자에게 보여지는 것 입니다.  
이 때 서버에서 실제로 코드를 실행하는 핵심 컴포넌트를 `커널(kernel)` 이라고 합니다. `Jupyter notebook` 은 기본적으로 `IPython` 을 `커널`로 사용합니다. 초창기에는 `IPython` 만 `커널`로써 사용 가능 했지만, 이후에는 `javascript`, `c++`, `ruby` 등의 다른 프로그래밍 언어도 지원하게 되었습니다.  

![jupyter-notebook-structure](https://heekangpark.github.io/assets/img/etc/jupyterlab-jupyter-notebook-architecture.png)

- https://heekangpark.github.io/etc/jupyter-lab
- https://jupyter.org/

### magic

`IPython`, `Jupyter notebook` 에는 마법같은 기능을 제공해주는 `magic command` 가 내장되어 있습니다. 많은 `magic command` 가 있지만 모두 자주 사용되는 것은 아니지만 그 중 몇몇은 많이 쓰이기도 하고 유용하기도 합니다.

In [124]:
%lsmagic  # 사용할 수 있는 모든 magic 들을 표시합니다.

Available line magics:
%alias  %alias_magic  %autoawait  %autocall  %automagic  %autosave  %bookmark  %cd  %clear  %cls  %colors  %conda  %config  %connect_info  %copy  %ddir  %debug  %dhist  %dirs  %doctest_mode  %echo  %ed  %edit  %env  %gui  %hist  %history  %killbgscripts  %ldir  %less  %load  %load_ext  %loadpy  %logoff  %logon  %logstart  %logstate  %logstop  %ls  %lsmagic  %macro  %magic  %matplotlib  %mkdir  %more  %notebook  %page  %pastebin  %pdb  %pdef  %pdoc  %pfile  %pinfo  %pinfo2  %pip  %popd  %pprint  %precision  %prun  %psearch  %psource  %pushd  %pwd  %pycat  %pylab  %qtconsole  %quickref  %recall  %rehashx  %reload_ext  %ren  %rep  %rerun  %reset  %reset_selective  %rmdir  %run  %save  %sc  %set_env  %store  %sx  %system  %tb  %time  %timeit  %unalias  %unload_ext  %who  %who_ls  %whos  %xdel  %xmode

Available cell magics:
%%!  %%HTML  %%SVG  %%bash  %%capture  %%cmd  %%debug  %%file  %%html  %%javascript  %%js  %%latex  %%markdown  %%perl  %%prun  %%pypy  %%python 

In [155]:
%whos  # 현재 선언된 변수들을 모두 표시합니다.

In [200]:
%%!  # 현재 jupyter notebook 이 실행되고 있는 서버의 shell 에 명령어를 실행합니다.
echo hello, server

['hello, server']

### Jupyter Lab

`jupyter notebook` 을 더 개선한 형태가 `jupyter lab` 이다. `jupyter lab` 은 기존 `jupyter notebook` 에 다중 탭 지원, 수려한 UI, 다양한 확장 기능 등을 추가해 만든 웹 어플리케이션입니다.

## Colab

구글에서 제공하는 `jupyter` 기반 서버입니다. `jupyter notebook` 과 매우 유사한 UI, UX 를 가집니다. 서버를 구글에서 제공해주기 때문에 별도의 설정이나 구성이 필요하지 않고 브라우저만 설치되어있다면 편리하게 `python` 코드를 작성하고 실행해볼 수 있는 점이 이점입니다.

- https://colab.research.google.com/notebooks/intro.ipynb

### Runtime

런타임이란 현재 연결되어 있으며 실행되고 있는 커널을 말합니다. `colab` 을 실행하면 우선 커널을 연결하고 그 다음 초기화(시작)하여 커널을 실행시키고 그 커널에서 작업을 진행합니다. 만약 문제가 생겼다면 `런타임 > 런타임 다시 시작` 을 실행하여 커널에 있는 모든 변수를 초기화하고 새롭게 시작할 수 있습니다.

### Cell

`jupyter notebook` 에서 사용되는 가장 기본되는 작성의 단위입니다. `cell` 은 `코드 셀` 과 `텍스트 셀` 로 나누어집니다.  
`코드 셀` 은 `python` 등 프로그램 코드가 쓰이는 곳을 말하며 실행가능 합니다. `텍스트 셀` 은 문서화를 위한 주석 등이 쓰이는 셀을 말하며 실행되지 않습니다.

#### 삽입

`cell` 을 삽입하기 위해서는 `삽입 > 코드 셀 or 텍스트 셀` 을 클릭합니다. 또는 마우스를 `cell` 을 삽입하고자 하는 곳에 대고 코드 또는 텍스트를 클릭합니다. 또는 `ctrl m b` 단축키를 사용하여 코드 셀을 삽입할 수 있습니다.

#### 삭제

삭제하고자 하는 셀을 클릭하고 `수정 > 선택된 셀 삭제` 를 누릅니다. 또는 셀 우측에 보이는 휴지통을 클릭합니다. 또는 `ctrl m d` 단축키를 사용하여 선택된 셀을 삭제할 수 있습니다.

#### 실행

`런타임 > 초점이 맞춰진 셀 실행` 을 클릭하여 현재 선택된 셀을 실행하거나 `ctrl enter` 를 단축키로 실행할 수 있습니다.  

만약 선택된 셀 이전 모든셀을 실행, 선택된 셀 이후 모든셀을 실행, 모든 셀을 실행하고 싶다면 `런타임` 메뉴에서 해당 버튼을 클릭하여 실행합니다.

# Misc.

프로젝트를 진행하며 도움이 될 수 있는 잡다한 내용들을 담았습니다.

## PEP

`Python Enhancement Proposal` 의 약어로, `Python` 커뮤니티로의 정보전달을 위한 일종의 설계 문서가 될 수도 있고, 파이썬의 새로운 기능을 설명하는 문서가 될 수도 있습니다. 간단히 말해 개선 제안서를 의미합니다. 이 중 중요한 문서에 대해 간단히 언급합니다.

### PEP8

수 많은 `PEP` 중 코드를 작성하는 규칙인 `Coding Convention` 을 정의한 문서가 `PEP8` 입니다. 보통 이름을 지정하는 `Naming Rule` 이나 `Class/Method/Variable` 선언에 대한 규칙을 많이 참고합니다.

`PEP8` 을 한국어로 변역해놓은 좋은 [참고자료](https://spoqa.github.io/2012/08/03/about-python-coding-convention.html)입니다.
영어 원문은 https://www.python.org/dev/peps/pep-0008/ 를 참고하시면 됩니다.

## _

`python` 에서 `_(underscore)` 는 특별합니다. 여러 사용법이 있지만 3가지만 알아보겠습니다.

- 인터프리터(Interpreter)에서 마지막 값을 저장할 때
- 값을 무시하고 싶을 때 (흔히 "I don't care" 라고 부릅니다.)
- 숫자 리터럴값의 자릿수 구분은 위한 구분자로써 사용할 때

In [202]:
# 인터프리터에서 마지막 값을 "_" 에 저장합니다. 이를 간단히 불러올 수 있습니다.
print(_)

In [207]:
# 값을 무시하기 위해서 쓸 수 있습니다.

## 단순히 5번 반복하기 위한 코드에서 반복 index 는 필요없습니다. 이를 명시적으로 underscore 를 사용하여 나타냈습니다.
for _ in range(5): 
    print("hello")
    
## unpacking 시 필요없는 변수를 묶을 수 있습니다.    
t = (1, 2, 100, 101, 102)
first, second, *_ = t  # 3 번째 변수부터는 필요없다는 의미로 underscore 를 사용했습니다.
print(first)
print(second)

hello
hello
hello
hello
hello
1
2
[100, 101, 102]


In [210]:
# 숫자 리터럴의 자릿수 구분을 위해 사용할 수 있습니다.
huuuuge_number = 100_000_000_000_000  # 너무 긴 숫자의 구분자로 사용할 수 있습니다.

print(huuuuge_number)

100000000000000


## Path

컴퓨터 안의 어떤 자원(폴더, 파일)의 위치를 명시하기 위해서 경로를 사용할 수 있습니다. 경로는 절대경로와 상대경로로 나누어집니다.  
절대 경로란 최초의 시작점으로 경유한 경로를 전부 기입하는 방식입니다. 윈도우라면 드라이브명(C:\ 등) 리눅스계열이라면 루트 디렉터리(\\) 부터 모든 경로를 적은 것입니다.  
상대 경로란 말 그대로 상대적으로 경로를 나타낸 것이며, 주피터 노트북에서 프로그래밍을 할 때, 기준점은 노트북 파일이 기준이 됩니다. 상대 경로에서 상위 디렉터리를 명시할때는 `..` 을 사용할 수 있습니다.

In [2]:
# 현재 노트북 파일이 어느 경로에서 실행 중 인지 확인해보겠습니다.
%pwd

colab 환경에서는 샘플로 사용할 수 있는 데이터를 제공합니다. 좌측 폴더 아이콘을 클릭하면 sample_data/ 라는 폴더가 보입니다. 이를 절대경로와 상대경로로 각각 지정해보겠습니다.

절대경로

In [6]:
## 현재 디렉터리
current_directory = "/content"  
## sample_data 디렉터리
sample_data_directory = "/content/sample_data/"  
## sample_data 내의 README.md 파일
readme_path = "/content/sample_data/README.md"  

상대경로

In [8]:
## . 은 현재 디렉토리를 말합니다.
current_directory = "."  

## sample_data 디렉터리
sample_data_directory = "./sample_data"  
sample_data_directory = "sample_data"  # 또는 이렇게 표현할 수도 있습니다.
sample_data_directory = "sample_data/"  # 또는 이렇게 표현할 수도 있습니다.

## sample_data 내의 README.md 파일
readme_path = "./sample_data/README.md"

문자열을 합해서 경로를 지정할 수도 있습니다.

In [12]:
sample_data_directory = "sample_data"
readme_filename = "README.md"

readme_path = sample_data_directory + "/" + readme_filename
print(readme_path)

sample_data/README.md


### Join

위와 같이 문자열을 더해서 경로를 지정할 때, 가독성이 좋지 않기 때문에 `\\` 를 중복해서 쓰거나 누락할 가능성이 있습니다. 이를 편하게 하기 위해 `os.path` 모듈 안에 `join` 이라는 함수가 있습니다.

In [17]:
from os.path import join

readme_path = join(sample_data_directory, readme_filename)
print(readme_path)

sample_data/README.md


두 개 이상의 경로도 이어 붙일 수 있습니다.

In [19]:
example_path = join("example", "very", "very", "deep", "directory")

print(example_path)

example\very\very\deep\directory


## glob

가끔가다 해당 경로내의 모든 파일들, 또는 이름 중 특정 조건을 가진 모든 파일들을 지정하고 싶을 때가 있습니다. 이럴 때 유용하게 사용할 수 있는 함수를 `glob` 모듈 에서 제공합니다.

In [20]:
from os.path import join
from glob import glob

sample_data_directory = "sample_data/"
pattern = join(sample_data_directory, "*")  # "*", 즉 모든 파일을 지정합니다.

print(glob(pattern))

In [21]:
pattern = join(sample_data_directory, "*.csv")  # "*.csv" 로 지정하여 .csv 로 끝나는 모든 파일명들을 지정합니다.

print(glob(pattern))

## 🔥 Deletion

기본적으로 파이썬은 변수를 메모리상에서 알아서 관리해주지만 메모리부족이나 변수명 겹침 등으로 인해 명시적으로 제거 요청을 해주어야 할 때가 있습니다. 이 때 사용하는 것이 `del` 키워드 입니다.

앞서 dict 의 key 를 삭제해 줄 때도 사용했습니다.

In [22]:
d = {"a": 1, "b": 2}

print(d)  # 삭제 전
del d["a"]  # key "a" 를 삭제
print(d)  # 삭제 후

{'a': 1, 'b': 2}
{'b': 2}


변수명을 지정해주어서 아예 삭제도 가능합니다. 예를 들어 위에서 선언한 `dict` d 가 필요없는데 메모리를 많이 쓰고 있는 변수라면 아래와 같이 제거 요청 가능합니다.

In [24]:
del d  # d 를 제거 요청합니다.

print(d)  # d 라는 변수는 선언되지 않은 상태입니다. (제거되었으므로)

NameError: name 'd' is not defined

## File type

파일을 나타내는 여러가지 방법이 있습니다. 이에 따라 저장되는 형식, 확장자또한 달라집니다. 대표적인 데이터들에 대해서 알아보겠습니다.

### csv

`comma-separated values` 의 약어로 직역하면 콤마(,)로 불리된 값들입니다. 실제로 파일이 저장될때 각 열의 값들이 콤마로 불리되어 저장됩니다. 예를 들어 이름과 나이를 관리하는 데이터셋일 때 아래와 같습니다.

name, age  
kim, 12  
lee, 15  
park, 11  

실제 데이터를 확인해보겠습니다.

In [25]:
# caution! 아래 코드는 colab 에서만 작동합니다.
from os.path import join

filename = join("sample_data", "california_housing_test.csv")
values = open(filename).read()

print(values)

### excel

확장자명은 `xlsx` 또는 `xls` 로 저장되며 마이크로소프트 오피스 프로그램 엑셀에서 사용되는 파일 형식입니다. 파일 내용은 엑셀 프로그램을 통해서 여는 것이 아니라면 알아볼 수 없는 문자열들로 이루어져 있습니다. 그 문자열들을 파이썬에서 해석하기 위해서는 `openpyxl` 이나 `pandas` 를 사용해야 합니다.

In [2]:
# caution! 아래 코드는 colab 에서만 작동합니다.
from google.colab import files

uploaded = files.upload()

for filename in uploaded:
    content = uploaded[filename]
    print(content)

## 🔥 Profile

실행시간을 기록하거나 성능 비교/분석을 위해서 코드의 실행시간을 측정하는 기능이 필요할 수 있습니다. 주피터 노트북에서는 이를 `time` 과 `timeit` 매직 키워드를 통해 제공합니다.

### time

`%%time` 셀 매직 커맨드는 해당 셀의 실행시간을 측정하여 출력합니다. 사용법은 간단히 시간을 측정하고자 하는 셀의 위에 선언해주고 코드를 작성하면 됩니다.

- wall time, user time 이란? : https://serverfault.com/questions/48455/what-are-the-differences-between-wall-clock-time-user-time-and-cpu-time

In [12]:
%%time  # 아래 작성된 코드의 실행시간을 측정합니다. Wall time 이 실제 수행시간입니다

r = range(1000)
print(sum(r))  # 0~999 까지의 합을 구하여 출력합니다.

Wall time: 0 ns


499500

### timeit

`%%timeit` 셀 매직 커맨드는 해당 셀의 실행시간을 여러 번 측정하여 더 정확한 실행시간을 알 수 있습니다.

- https://docs.python.org/ko/3/library/timeit.html

In [14]:
%%timeit

r = range(1000)
sum(r)  # 출력이 너무 많아져서 출력은 하지 않았습니다.

28.7 µs ± 544 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
