# Appendix: Python Language Essentials

In [None]:
from __future__ import division
from numpy.random import randn
import numpy as np
import os
import matplotlib.pyplot as plt
np.random.seed(12345)
plt.rc('figure', figsize=(10, 6))
from pandas import *
import pandas
np.set_printoptions(precision=4)


## The Python interpreter

```
$ python
Python 2.7.2 (default, Oct  4 2011, 20:06:09)
[GCC 4.6.1] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> a = 5
>>> print (a) # python 3에서는 print가 함수로 바뀌어서 ()안에다 써주어야함.
5
```

In [None]:
%%writefile hello_world.py
print 'Hello world'

```
$ ipython
Python 2.7.2 |EPD 7.1-2 (64-bit)| (default, Jul  3 2011, 15:17:51)
Type "copyright", "credits" or "license" for more information.

IPython 0.12 -- An enhanced Interactive Python.
?         -> Introduction and overview of IPython's features.
%quickref -> Quick reference.
help      -> Python's own help system.
object?   -> Details about 'object', use 'object??' for extra details.

In [1]: %run hello_world.py
Hello world

In [2]:
```

## The Basics

### Language Semantics

#### Indentation, not braces

#### Everything is an object    모든 것들은 객체다

#### Comments       주석   ###

In [None]:
results = []
for line in file_handle:
    # keep the empty lines for now
    # if len(line) == 0:
    #   continue
    results.append(line.replace('foo', 'bar'))

#### Function and object method calls

In [None]:
result = f(x, y, z)
g()

In [None]:
obj.some_method(x, y, z)

In [None]:
result = f(a, b, c, d=5, e='foo')

#### Variables and pass-by-reference

In [None]:
a = [1, 2, 3]

In [None]:
b = a       # a가 가르키는 메모리 주소값이 저장됨.!!!

In [None]:
a.append(4)       # 그래서 a에 4를 추가했으나, b에도 동일하게 저장이 됨.
b

In [None]:
def append_element(some_list, element):
    some_list.append(element)

In [None]:
data = [1, 2, 3]

append_element(data, 4)

In [4]: data
Out[4]: [1, 2, 3, 4]

In [None]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all'

#### Dynamic references, strong types

In [None]:
a = 5
type(a)
a = 'foo'
type(a)

In [None]:
'5' + 5

In [None]:
a = 4.5
b = 2
# String formatting, to be visited later
print 'a is %s, b is %s' % (type(a), type(b))
a / b

In [None]:
a = 5
isinstance(a, int)

In [None]:
a = 5; b = 4.5
isinstance(a, (int, float))
isinstance(b, (int, float))

#### Attributes and methods

In [None]:
dir(a)

In [None]:
isiterable('a string')
isiterable(5)

#### "Duck" typing

In [None]:
def isiterable(obj):
    try:
        iter(obj)
        return True
    except TypeError: # not iterable
        return False

In [None]:
isiterable('a string')
isiterable([1, 2, 3])
isiterable(5)

#### Imports

In [None]:
# some_module.py
PI = 3.14159

def f(x):
    return x + 2

def g(a, b):
    return a + b

In [None]:
import some_module
result = some_module.f(5)
pi = some_module.PI

In [None]:
from some_module import f, g, PI ###############33
result = g(5, PI)

In [None]:
import some_module as sm                          ######## 모듈의 이름을 써줌 sm으로
from some_module import PI as pi, g as gf               # PI, g 바꿔주고.    as

r1 = sm.f(pi)
r2 = gf(6, pi)

#### Binary operators and comparisons

In [None]:
5 - 7             ## 이항연산자 / 비교연산자. 
12 + 21.5
5 <= 2

In [None]:
a = [1, 2, 3]
b = a
# Note, the list function always creates a new list
c = list(a)
a is b             # 같은 것을 가리킴
a is not c
a is c

In [None]:
a == c       # 값이 같음.

In [None]:
a = None
a is None

#### Strictness versus laziness

In [None]:
a = b = c = 5
d = a + b * c

In [None]:
print (a,b,c,d)

#### Mutable and immutable objects      ##immutable 바꿀 수 없음

In [None]:
a_list = ['foo', 2, [4, 5]]
a_list[2] = (3, 4)
a_list[1] = 'abc'
a_list                          #

In [None]:
a_tuple = (3, 5, (4, 5))        # 튜플은 immutable 객체다.
a_tuple[1] = 'four'

### Scalar Types

#### Numeric types

In [None]:
ival = 17239871
ival ** 6

In [None]:
fval = 7.243
fval2 = 6.78e-5

In [None]:
fval
fval2

In [None]:
3 / 2

In [None]:
from __future__ import division

In [None]:
3 / float(2)

In [None]:
3 // 2

In [None]:
cval = 1 + 2j
cval * (1 - 2j)

#### Strings

In [None]:
a = 'one way of writing a string'
b = "another way"

In [None]:
c = """
This is a longer string that
spans multiple lines
"""

In [None]:
a = 'this is a string'
a[10] = 'f'      # ctrl, shift -    => 분리됨.

In [None]:
b = a.replace('string', 'longer string')
b

In [None]:
a = 5.6
s = str(a)
s

In [None]:
s = 'python'
list(s)
s[:3]

In [None]:
s = '12\\34'
print (s)        # () 쳐줘야함.

In [None]:
s = r'this\has\no\special\characters'
s

In [None]:
a = 'this is the first half '
b = 'and this is the second half'
a + b

In [None]:
template = '%.2f %s are worth $%d'

In [None]:
template % (4.5560, 'Argentine Pesos', 1)

#### Booleans

In [None]:
True and True
False or True

In [None]:
a = [1, 2, 3]
if a:
    print ('I found something!')

b = []
if not b:
    print('Empty!')

In [None]:
bool([]), bool([1, 2, 3])
bool('Hello world!'), bool('')
bool(0), bool(1)

#### Type casting

In [None]:
s = '3.14159'
fval = float(s)
type(fval)
int(fval)
bool(fval)
bool(0)

#### None

In [None]:
a = None
a is None
b = 5
b is not None

In [None]:
def add_and_maybe_multiply(a, b, c=None):
    result = a + b

    if c is not None:
        result = result * c

    return result

In [None]:
add_and_maybe_multiply(1,2)

In [None]:
add_and_maybe_multiply(1,2,3)

#### Dates and times

In [None]:
from datetime import datetime, date, time
dt = datetime(2011, 10, 29, 20, 30, 21)
dt.day
dt.minute

In [None]:
dt.date()
dt.time()

In [None]:
dt.strftime('%m/%d/%Y %H:%M')
dt.strftime('%Y-%m-%d')
dt.strftime('%y-%m-%d')

In [None]:
datetime.strptime('20091031', '%Y%m%d')


In [None]:
dt.replace(minute=0, second=0)

In [None]:
dt2 = datetime(2011, 11, 15, 22, 30)
delta = dt2 - dt
delta
type(delta)

In [None]:
dt
dt + delta    # dt2 가 되버림.    # 시간 날짜의 계산

### Control Flow

#### If, elif, and else

In [None]:
if x < 0:
    print ('''It's negative''')

In [None]:
if x < 0:
    print ("It's negative")
elif x == 0:
    print ('Equal to zero')
elif 0 < x < 5:
    print ('Positive but smaller than 5')
else:
    print ('Positive and larger than 5')

In [None]:
a = 5; b = 7
c = 8; d = 4
if a < b or c > d:
    print ('Made it')

#### For loops

In [None]:
for value in collection:
    # do something with value

In [None]:
sequence = [1, 2, None, 4, None, 5] # 6개의 원소로 구성되어있음.
total = 0
for value in sequence:   # 원소 하나하나를 값으로 봄 / in 하나하나씩 값으로 넣어줌.
    if value is None:             
        continue
    total += value       # 정수값  + None => None값

In [None]:
total

In [None]:
sequence = [1, 2, 0, 4, 6, 5, 2, 1]
total_until_5 = 0
for value in sequence:
    if value == 5:
        break
    total_until_5 += value

In [None]:
for a, b, c in iterator:
    # do something

In [None]:
values=[(1,2), (3,4),(10,20)]

In [None]:
for value in values:
    print(value)

In [None]:
for(k,y) in values:
    print("key : %d, value : %d"%(k,y))

#### While loops

In [None]:
x = 256
total = 0
while x > 0:
    if total > 500:
        break
    total += x
    x = x // 2         # 256을 계속 2로 나누면서 

In [None]:
print(x)
print(total)

#### pass

In [None]:
if x < 0:
    print 'negative!'
elif x == 0:
    # TODO: put something smart here
    pass                               # 아무일도 안하는 문장 . if문 다음 걸로 넘어감.
else:
    print 'positive!'

In [None]:
def f(x, y, z):
    # TODO: implement this function!
    pass


#### Exception handling

In [None]:
float('1.2345')
float('something')

In [None]:
def attempt_float(x):
    try:
        return float(x)
    except:
        return x

In [None]:
attempt_float('dsgsgsdgsff')
attempt_float('123456')

In [None]:
attempt_float('1.2345')
attempt_float('something')

In [None]:
float((1, 2))

In [None]:
def attempt_float(x):
    try:
        return float(x)
    except ValueError:
        return x

In [None]:
attempt_float((1, 2))

In [None]:
def attempt_float(x):
    try:
        return float(x)
    except (TypeError, ValueError):
        return x

In [None]:
attempt_float(path,4)

In [None]:
f = open(path, 'w')

try:
    write_to_file(f)
finally:
    f.close()

In [None]:
f = open(path, 'w')

try:
    write_to_file(f)
except:
    print 'Failed'
else:
    print 'Succeeded'
finally:
    f.close()

#### range and xrange

In [None]:
range(10)

In [None]:
range(0, 20, 2)    # 2씩 건너뛰어라
# 2.7 버전은 이 값을 다 보여주는데, 3.6은 range() 그대로 보여줌.

In [None]:
seq = [1, 2, 3, 4]
for i in range(len(seq)):         # len => length  길이 출력
    val = seq[i]

In [None]:
sqe = [1,2,3,4]
len(sqe)

In [None]:
sum = 0
for i in xrange(10000):
    # % is the modulo operator
    if i % 3 == 0 or i % 5 == 0:
        sum += i


#### Ternary Expressions

In [None]:
x = 5
value = 'Non-negative' if x >= 0 else 'Negative'

## Data structures and sequences

### Tuple

In [None]:
tup = 4, 5, 6
tup

In [None]:
type(tup)

In [None]:
one_tuple=1;
one_tuple

In [None]:
type(one_tuple)

In [None]:
one1_tuple=1,
one1_tuple

In [None]:
type(one1_tuple)

In [None]:
nested_tup = (4, 5, 6), (7, 8)
nested_tup

In [None]:
type(nested_tup)

In [None]:
tuple([4, 0, 2])
tup = tuple('string')
tup

In [None]:
tuple([4,0,2],)

In [None]:
tup[0]

In [None]:
tup = tuple(['foo', [1, 2], True])     # 꼭 같은 타입 일 필요는 없음.
tup[2] = False   # tuple은 값을 바꿀 수 없는데, 값을 바꾸려고 해서 에러가 남.

In [None]:
# however
tup[1].append(3)                        # 원소 리스트에 append 값을 추가했기 때문에 에러없이 가능함.
tup

In [None]:
(4, None, 'foo') + (6, 0) + ('bar',)

In [None]:
('foo', 'bar') * 4

#### Unpacking tuples            # 튜플을 푸는 것

In [None]:
tup = (4, 5, 6)
a, b, c = tup
b

In [None]:
tup = 4, 5, (6, 7)
a, b, (c, d) = tup
d

In [None]:
tup = 4, 5, (6, 7)
a, b, d = tup
d

#### Tuple methods

In [None]:
a = (1, 2, 2, 2, 3, 4, 2)      # ctrl shift -

In [None]:
dir(a)

In [None]:
a.count(2)         # 2가 몇 개 있느냐?    
a.index(3)         # 그 값의 색인 값을 보여줌
a.index(4)
a.index(2)
a.index(1)

### List

In [None]:
a_list = [2, 3, 7, None]

tup = ('foo', 'bar', 'baz')
b_list = list(tup)
b_list
b_list[1] = 'peekaboo'         # 원소값을 바꿀 수 있으나, 문자열안에 있는 값을 직접적으로 바꿀 순 없다.
b_list

#### Adding and removing elements

In [None]:
b_list.append('dwarf')       # 뒤에서 붙인다.
b_list                                

In [None]:
b_list.insert(1, 'red')    # 1 자리에 넣고 나머지를 뒤로 미룸
b_list

In [None]:
b_list.pop(2)         # 2번째 값을 뽑아내고(없애고) 출력이 됨.
b_list

In [None]:
b_list.append('foo')    # foo를 추가하고
b_list
b_list.remove('foo')    # foo를 지운다.
b_list

In [None]:
'dwarf' in b_list         # dwarf 값이 있느냐?   T / F

#### Concatenating and combining lists

In [None]:
[4, None, 'foo'] + [7, 8, (2, 3)]


In [None]:
x = [4, None, 'foo']
x.extend([7, 8, (2, 3)])         # extend 하게 되면, + 한 것과 같은 결과를 보여준다.
x

In [None]:
everything = []
for chunk in list_of_lists:         #    list_of_lists 가 없음.
    everything.extend(chunk)


In [None]:
everything = []
for chunk in list_of_lists:
    everything = everything + chunk  # 위의 두개가 서로 같으나, 위의 방식이 더 나음.

#### Sorting

In [None]:
a = [7, 2, 5, 1, 3]
a.sort()                    # 리스트를 정렬한다.
a

In [None]:
list (reversed(a))

In [None]:
b = ['saw', 'small', 'He', 'foxes', 'six']
b.sort(key=len)
b

#### Binary search and maintaining a sorted list

In [None]:
import bisect
c = [1, 2, 2, 2, 3, 4, 7]
bisect.bisect(c, 2)             # bisect   c 리스트에 색인 값을 리턴해줌. 
bisect.bisect(c, 5)             # ???????
bisect.insort(c, 6)            # 6이라는 값을 넣어줌.
c

#### Slicing

In [None]:
seq = [7, 2, 3, 7, 5, 6, 0, 1]
seq[1:5]

In [None]:
prod_code = '20180417비트코인'
prod_date = prod_code[:8]
prod_name = prod_code[8:]
prod_date
prod_name

In [None]:
seq[3:4] = [6, 3]
seq

In [None]:
seq[:5]
seq[3:]

In [None]:
seq[-4:]     # -하면 역순으로 감.
seq[-6:-2]

In [None]:
seq[::2]

In [None]:
seq[::-1]

### Built-in Sequence Functions

#### enumerate   

In [None]:

i = 0
for value in collection:
   # do something with value
   i += 1

In [None]:
sum=0

          # enumerate에 의해서 인덱스 값과 값이 같이 나옴.
   # do something with value
for i, value in enumerate(b): 

In [None]:
sum = 0
for i, value in eunmerate(b):
    print(i,value)

In [None]:
i = 0
for value in b:
    print(i,value)
    i+=1;

In [None]:
some_list = ['foo', 'bar', 'baz']
mapping = dict((v, i) for i, v in enumerate(some_list))        # foo 키값은 0 / bar 키값은 1 ....
mapping

#### sorted

In [None]:
sorted([7, 1, 2, 6, 0, 3, 2])
sorted('horse race')

In [None]:
x = [7, 1, 2, 6, 0, 3, 2]
sorted(x)                            # sorted 내장 메소드 / 일반 메소드 ... 
x

In [None]:
sorted(set('this is just some string'))    # set 집합을 만드는 메서드 / 집합은 중복되지 않아서 대표값 한 개씩만 출력함. 알파벳 순으로 정렬해줌.

#### zip

In [None]:
seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three']
z1= zip(seq1, seq2)                   # 필요할 때만 계산하자.


In [None]:
list(z1)

In [None]:
seq3 = [False, True]
z2 = zip(seq1, seq2, seq3)          # 
list(z2)

In [None]:
for i, (a, b) in enumerate([('foo', 'one'), ('bar', 'two'), ('baz', 'three')]):
    print('%d: %s, %s' % (i, a, b))      
          # 0: foo, one 

In [None]:
for i, (a, b) in enumerate(zip(seq1, seq2)):      # i는 enumerate 0,1,2 / a,b는 집합, foo 
    print('%d: %s, %s' % (i, a, b))               # 정수 / 문자열 / 문자열

In [None]:
pitchers = [('Nolan', 'Ryan'), ('Roger', 'Clemens'),
            ('Schilling', 'Curt')]
first_names, last_names = zip(*pitchers)    # * 때문에 하나로 분류가 됨.  - 573 페이지
first_names
last_names

In [None]:
zip(seq[0], seq[1], ..., seq[len(seq) - 1])

#### reversed

In [None]:
list(reversed(range(10)))

### Dict

In [2]:
empty_dict = {}
d1 = {'a' : 'some value', 'b' : [1, 2, 3, 4]}
d1   # 키값은 바꿀수 없고, unique 해야된다. key : value  
    # /key, value 타입은 서로 달라도 된다.

{'a': 'some value', 'b': [1, 2, 3, 4]}

In [3]:
d1[7] = 'an integer'
d1
d1['b']
d1[7]

'an integer'

In [4]:
'b' in d1

True

In [11]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all'


from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all'

In [12]:
d1[5] = 'some value'            # 사전[]에 키값 넣어주고, = 붙여줌.
d1['dummy'] = 'another value'
d1
del d1[5]  # 키값이 5인 것을 지움    # pop은 지우고 리턴하지만, del은 지우기만 함.
d1
ret = d1.pop('dummy') #dummy키 값을 찾아서 pop드러내라
ret

{'a': 'some value',
 'b': [1, 2, 3, 4],
 7: 'an integer',
 5: 'some value',
 'dummy': 'another value'}

{'a': 'some value',
 'b': [1, 2, 3, 4],
 7: 'an integer',
 'dummy': 'another value'}

'another value'

In [13]:
d1.keys()           # 리스트로 키 값과 밸류 값이 나타남.
d1.values()

dict_keys(['a', 'b', 7])

dict_values(['some value', [1, 2, 3, 4], 'an integer'])

In [None]:
d1.update({'b' : 'foo', 'c' : 12})    # 없으면 추가
d1

#### Creating dicts from sequences

In [None]:
mapping = dict(zip(range(5), reversed(range(5))))    # zip     
mapping        #[0,1,2,3,4]   # [4,3,2,1,0]

#### Default values

In [None]:
if key in some_dict:            # 디폴트 값을 
    value = some_dict[key]
else:
    value = default_value         

In [None]:
value = some_dict.get(key, default_value)

In [None]:
mapping[7] # key error

In [None]:
mapping.get(7,-111)          # 키 값이 없다면... -1 (디폴트 값을 넣어줌)
mapping.get(4,-111)          #          있다면... 원래 값 출력

In [14]:
words = ['apple', 'bat', 'bar', 'atom', 'book', 'cycle']
by_letter = {}

for word in words:               # 단어 집합에서 단어 한개씩 뽑아오겠다.
    letter = word[0]             # word의 0 => apple의 a /  letter에는 a가 들어가있음.
    if letter not in by_letter:    # a가 by_letter에 없다면 T
        by_letter[letter] = [word]  # a가 by_letter에 들어감.             
    else:
        by_letter[letter].append(word)
                                # 두번째 bat의 b => T => b가 등록됨
                                # 세번째 bar의 b => F => b에 추가로 등록이 됨.
by_letter

{'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book'], 'c': ['cycle']}

In [15]:
type(words)

list

In [16]:
words = ['apple', 'bat', 'bar', 'atom', 'book']
by_letters = {}
for word in words:
    letter = word[0]
by_letters.setdefault(letter, []).append(word)  

#by_letters.setdefault(letter, []).
#apple          # letter가 a가 없으면, 비어있는 리스트가 도출됨. 
          # [].append(apple) => {'a': ['apple]}
#atom           # ['a': ['apple]'].append(atom) => {'a': ['apple', 'atom']}
        
by_letters

{'b': ['book']}

In [17]:
from collections import defaultdict
by_letter = defaultdict(list)              # 리스트를 만들어서 추가함.
for word in words:
    by_letter[word[0]].append(word)


In [18]:
counts = defaultdict(lambda: 4)           # 람다 함수 : 카운트가 4가 들어오게끔.

In [19]:
counts[1]
dict(counts)

4

{1: 4}

In [20]:
counts[2] = 10
counts[10]              # 디폴트값 4가 생성됨.
counts[7]
dict(counts)

4

4

{1: 4, 2: 10, 10: 4, 7: 4}

#### Valid dict key types

In [None]:
hash('string')
hash((1, 2, (2, 3)))        # 리스트는 값이 바뀔 수 있기 때문에 에러가 남.
hash((1, 2, [2, 3]))        # fails because lists are mutable

In [None]:
d = {}
d[tuple([1, 2, 3])] = 5         # 튜플로 만들어서 사전으로 만들면 잘 들어감.
d

### Set

In [None]:
set([2, 2, 2, 1, 3, 3])       # 사전이 되는데..
{2, 2, 2, 1, 3, 3}

In [None]:
a = {1, 2, 3, 4, 5}             # 직접 중괄호로 묶어서 set로 만들 수 있음.
b = {3, 4, 5, 6, 7, 8}          # 리스트 형으로 된 것은 set써서 만들어주고
a | b  # union (or)                  
a & b  # intersection (and)
a - b  # difference
a ^ b  # symmetric difference (xor)

In [None]:
a_set = {1, 2, 3, 4, 5}
{1, 2, 3}.issubset(a_set)         # set의 메소드로, a_set가  (is subset)  부분 집합이냐?
a_set.issuperset({1, 2, 3})       # {1,2,3}이 superset 냐?

In [None]:
{1, 2, 3} == {3, 2, 1}

### List, set, and dict comprehensions

In [None]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
[x.upper() for x in strings if len(x) > 2]        # 리스트가 내포가 됨.
# 리스트가 되겠구나 / x의 upper() 메소드를 쓰겠구나. 
# 많은 리스트가 있을 때는 내포 쓰는 것이 더 빠르게 처리 됨.
# x는 strings의 것을 하나씩 가져와서  x.의 upper 메소드를 실행해라 / len(x) 2보다 큰 것

In [None]:
result = []
for x in strings:
    if len(x) > 2:
        result.append(x.upper())
result

In [None]:
unique_lengths = {len(x) for x in strings}
unique_lengths

In [None]:
loc_mapping = {val : index for index, val in enumerate(strings)}
loc_mapping

In [None]:
loc_mapping = dict((val, idx) for idx, val in enumerate(strings))
loc_mapping

#### Nested list comprehensions

In [21]:
all_data = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven', 'Joe'],        # 중첩 리스트
            ['Susie', 'Casey', 'Jill', 'Ana', 'Eva', 'Jennifer', 'Stephanie']]     #all_data 에 넣어줌.


In [22]:
names_of_interest = []
for names in all_data:           # 탐 빌리 제퍼슨이 한개씩 들어감.
    enough_es = [name for name in names if name.count('e') >= 2]      # 조건이 충족된 것만 name으로 들어감. #tom의 2의 갯수 = 0개 / 2개 초과가 아니므로 해당안됨.
    names_of_interest.extend(enough_es)       # 합쳐짐.
names_of_interest # names_of_interest += enough_es (위와 똑같으나 위의 것이 더 빠름)
# for loop 안에 리스트 가 존재하는 형식임..


['Jefferson', 'Wesley', 'Steven', 'Jennifer', 'Stephanie']

In [None]:
# 중첩 리스트 내포를 사용하지 않고 순수하게 중첩 for loop를 사용한 예제

names_of_interest = []
for names in all_data:           
    enough_es = []
    
    for name in names:
        if name.count('e') >=2:
            enough_es.append(name)
            
    names_of_interest.extend(enough_es)
    # names_of_interest += enough_es  
    
names_of_interest

In [None]:
#names_of_interest
result = [name for names in all_data for name in names 
       # for 2번 / 순서대로 보면 됨. all_data에서 리스트 한개를 가져옴 + 그 받아온 리스트 한개를 names에서 name 으로 옮겨줌.
          if name.count('e') >= 2]     # 필터조건은 끝에 위치함.
result

In [None]:
some_tuples = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]   # 튜플의 리스트
flattened = [x for tup in some_tuples for x in tup]      # flattened 평탄화 - 리스트 안에 튜플이 존재함. 
                                                        #=> 1,2,3이 tup으로 들어옴 / x는 1,2,3 각각 하나씩 / 
                                                         # 튜플이 하나씩 풀림.
flattened

In [23]:

flattened = []

for tup in some_tuples:
    for x in tup:
        flattened.append(x)
        
flattened

NameError: name 'some_tuples' is not defined

In [None]:
In [229]: [[x for x in tup] for tup in some_tuples] #리스트 안에 리스트
    # [x] 리스트의 리스트가 만들어짐 / 바깥 [] 먼저 실행 -> 안 []이 다음으로 실행됨.

## Functions

In [None]:
def my_function(x, y, z=1.5):       # 파라미터 / 디폴드 값이 있는 것 z / 아닌 것 x y
    if z > 1:
        return z * (x + y)
    else:
        return z / (x + y)

In [None]:
my_function(5, 6, z=0.7)                 
my_function(3.14, 7, 3.5)                 

### Namespaces, scope, and local functions

In [None]:
def func():
    a = []
    for i in range(5):
        a.append(i)

In [None]:
a       # a 호출시 에러발생함.
func()

In [None]:
a = []                   
def func():
    for i in range(5):              
        a.append(i)            # 매서드 호출 / 전역 변수에 직접 넣어줌
func()
a

In [24]:
a = None
def bind_a_variable():
    global a                  # a는 전역변수라고 선언해줌! / 함수 실행 시 a를 전역변수로 엮어줌.
    a = []                   # 여기선 로컬변수 a가 생김 => 함수 종료시 스코프가 종료되었기 때문에 a가 사라짐. 
                             # global로 지정해줌으로서 전역변수 선언과 초기화 시켜줌.
bind_a_variable() 
print (a)

[]


In [None]:
def outer_function(x, y, z):
    def inner_function(a, b, c):
        pass
    pass

### Returning multiple values

In [None]:
def f():
    a = 5
    b = 6
    c = 7
    return a, b, c

a, b, c = f()

In [None]:
print(a,b,c)

In [None]:
x = 1,2,3
print(x)

In [None]:
return_value = f()
return_value

In [None]:
def f():
    a = 5
    b = 6
    c = 7
    return {'a' : a, 'b' : b, 'c' : c}

d = f()
print(d)
print(d['a'])

### Functions are objects

In [None]:

states = ['   Alabama ', 'Georgia!', 'Georgia', 'georgia', 'FlOrIda',
          'south   carolina##', 'West virginia?']

In [None]:
import re  # Regular expression module

def clean_strings(strings):
    result = []
    for value in strings:
        value = value.strip()
        value = re.sub('[!#?]', '', value)    # remove punctuation
        value = value.title()
        result.append(value)
    return result
lean_strings(states)

In [None]:
clean_strings(states)

In [25]:
def remove_punctuation(value):
    return re.sub('[!#?]', '', value)

clean_ops = [str.strip, remove_punctuation, str.title]       # str 함수 호출함. 

def clean_strings(strings, ops):
    result = []
    for value in strings:
        for function in ops:
            value = function(value)           # remove punctuation 안씀 
        result.append(value)
    return result

clean_strings(states, clean_ops)

NameError: name 'states' is not defined

In [26]:
clean_ops2(str.strip, remove_punctuation)

NameError: name 'clean_ops2' is not defined

In [27]:
In [22]: clean_strings(states, clean_ops)
Out[22]:
['Alabama',
 'Georgia',
 'Georgia',
 'Georgia',
 'Florida',
 'South Carolina',
 'West Virginia']

SyntaxError: invalid syntax (<ipython-input-27-b3984255fad0>, line 2)

In [28]:
In [23]: map(remove_punctuation, states)
Out[23]:
['   Alabama ',
 'Georgia',
 'Georgia',
 'georgia',
 'FlOrIda',
 'south   carolina',
 'West virginia']

SyntaxError: invalid syntax (<ipython-input-28-01017c7ccdec>, line 2)

In [29]:
map(remove_punctuation, states)

NameError: name 'states' is not defined

In [30]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all'

In [31]:
m = map(remove_punctuation, states)
list(m)
tuple(m)

NameError: name 'states' is not defined

### Anonymous (lambda) functions

In [None]:
def short_function(x):
    return x * 2

equiv_anon = lambda x: x * 2     # lambda x, y : 
# short_function 처럼 equivq_anon 

In [None]:
def apply_to_list(some_list, f):
    return [f(x) for x in some_list]        # list 내포됨

ints = [4, 0, 1, 5, 6]
apply_to_list(ints, short_function) # 함수도 1급 시민이니까 short_function이 f가 됨.
apply_to_list(ints, lambda x: x * 2)   # 여기서 딱 한번만 쓰게 될 경우에는 여러번 쓰는 함수를 만들기 보단 람다로 처리하는게 더 나음


In [32]:
strings = ['foo', 'card', 'bar', 'aaaa', 'abab']

In [33]:
strings.sort(key=len)       # 키의 길이 순서대로 정렬
strings

['foo', 'bar', 'card', 'aaaa', 'abab']

In [None]:
strings.sort(key=lambda x: len(set(list(x))))        # 정렬할 떄 딱 한번만 쓴다면 lambda를 사용함.
                          # 단어를 구성하는 알파벳이 다양하면 길게 나옴
strings       # 1개, 2개, 2개, 3개, 4개

### Closures: functions that return functions    # 함수에 의해서 리턴되는 함수

In [None]:
gv = 10
def print_gv(x):
    gv = 100
    print(x * gv)
    
print_gv(2)
print(gv)         # gv는 새로운 로컬변수 였다가 사라짐.

In [None]:
def make_closure(a):     

    def closure():        # 로컬함수 정의 
        print('I know the secret: %d' % a)   # a를 입력받아서 화면에 출력
        
    return closure    # 로컬함수를 리턴함. 

cl = make_closure(5)     # 리턴되는 closure 가 cl로 들어감
                         # 5가 a로 들어감.

In [None]:
cl

In [None]:
cl()

In [43]:
def make_watcher():
    have_seen = {}
                            
    def has_been_seen(x):     # 자기가 정의 안했지만 쓸 수 있는....?
        if x in have_seen:    # havs_seen 사전에 키 중에 한개이냐?    - 처음에는 false -> key 를 만들고 true를 만들게됨 
                               #- 사전에 값이 하나 추가됨.
            return True       # 사전에 추가 xx
        else:
            have_seen[x] = True
            return False  
    print(have_seen)
    return has_been_seen
    

In [44]:
watcher = make_watcher()        # watcher를 클로저 라고 봐도 됨.
vals = [5, 6, 1, 5, 1, 6, 3, 5]   # 정수의 리스트
[watcher(x) for x in vals]         # 왓쳐 x를 호출  
#  - 처음에 5가 함수 왓처로 들어감 / make_watcher(5) ->  else -> {5:true} - 처음 나왔으니까   [false]
# 6 -> else -> {6:true} 추가됨 => [false, false]     

{}


[False, False, False, True, True, True, False, True]

In [None]:
# 만약 클로저를 사용하지 안으면 어떻게 될까요?
# 클로저를 호출할 때마다 have_seen 사전이 초기화되므로 제대로된 결과를 볼 수 없다. 
def make_watcher2():
                            
    def has_been_seen(x):     
        have_seen = {}             # 지역변수로서 
        if x in have_seen:    
            return True       
        else:
            have_seen[x] = True
            return False  

    return has_been_seen

In [None]:
watcher2 = make_watcher2()       
vals = [5, 6, 1, 5, 1, 6, 3, 5]         # have_seen 을 외부에서 직접 접근 할 수 없기 때문에 계속 새로운 것으로 판단함.  
[watcher2(x) for x in vals]             # 

In [None]:
# 클로저에서 외부 함수의 변수를 일반 변수를 사용한 카운터           
def make_counter():                   
    count = [0]             # 바깥 함수의 변수가 리스트 형식으로 처리됨.     가져다가만 쓸거면 위의 make_closure 쓰고 
    def counter():
                              # increment and return the current count
        count[0] += 1
        return count[0]
    return counter

counter = make_counter()

In [None]:
counter()

In [None]:
counter()
counter()

In [None]:
def make_counter1():
    count = 0
    
    def counter1():
        # increment and return the current count
        count = 0
        count +=1
        return count0
    return counter

counter1 = make_counter1()

In [None]:
counter1()

In [None]:
def format_and_pad(template, space):
    
    def formatter(x):
        return (template % x).rjust(space)        #x는 자기것 / space, template - 외부에서 넘어옴 / rjust 우측 정렬 / 리턴 값의 우측정렬

    return formatter

In [None]:
fmt = format_and_pad('%.4f', 15)       # '%.4f 소수점 네번쨰자리까지 표시 / x로 들어감
fmt(1.756)     
fmt(3.141592)

### Extended call syntax with *args, **kwargs

In [None]:
a, b, c = args
d = kwargs.get('d', d_default_value)
e = kwargs.get('e', e_default_value)

In [45]:
def say_hello_then_call_f(f, *args, **kwargs):       # argument 로 받은 것들은 값을 받아올 수 있음 . # 값으로 / 사전으로
    print('args is', args)   # 3개 파라미터
    print('kwargs is', kwargs)
    print("Hello! Now I'm going to call %s" % f)  # 문자열로 출력해라.
    return f(*args, **kwargs)

def g(x, y, z=1):
    return (x + y) / z

In [46]:
say_hello_then_call_f(g, 1, 2, z=5.)   # f는 g를 / * 입력되는 것을 튜플로 받음 / ** 사전으로 받음.
                         #튜플 /사전
    #3/5

args is (1, 2)
kwargs is {'z': 5.0}
Hello! Now I'm going to call <function g at 0x000002A541F95950>


0.6

In [47]:
x = (2,4)
y = {'z':3}

In [48]:
say_hello_then_call_f(g, 1, 2,3,4, z=5, x=10) 

args is (1, 2, 3, 4)
kwargs is {'z': 5, 'x': 10}
Hello! Now I'm going to call <function g at 0x000002A541F95950>


TypeError: g() got multiple values for argument 'z'

### Currying: partial argument application

In [None]:
def add_numbers(x, y):
    return x + y

In [None]:
add_five = lambda y: add_numbers(5, y) #add_five를 람라도 만들고, 

In [None]:
add_five(10)

In [None]:
from functools import partial
add_five = partial(add_numbers, 5)

In [None]:
add_five(10)

In [None]:
# compute 60-day moving average of time series x     # 이동평균을 구할 때, 60일로 고정시키고 싶다.
ma60 = lambda x: pandas.rolling_mean(x, 60)

# Take the 60-day moving average of of all time series in data
data.apply(ma60)

### Generators

In [None]:
some_dict = {'a': 1, 'b': 2, 'c': 3}  # 사전
for key in some_dict:                 # 값을 하나씩 하나씩 꺼내오는 메커니즘 / 값이 다 나올 때까지...
    print (key,)

In [None]:
dict_iterator = iter(some_dict)     # 이터레이터를 넘겨줌
dict_iterator

In [None]:
list(dict_iterator) # 리스트로
dict_iterator = iter(some_dict)      # 한번 쓰면 사라지기 때문에, 한번 더 써줌.
tuple(dict_iterator) # 튜플로

In [None]:
def squares2(n=10):
    for i in range(1, n + 1):
        print ('Generating squares from 1 to %d' % (n ** 2))
        return i ** 2

In [None]:
def squares(n=10):
    for i in range(1, n + 1):
        print ('Generating squares from 1 to %d' % (n ** 2))
        yield i ** 2

In [None]:
gen = squares()     # i ** 2      #yield를 주게되면 함수 자체가 리턴됨 - 제너레이트 / 
gen

In [None]:
gen2 = squares2()    # i ** 2     #return  - 결과값 바로 리턴
gen2

In [None]:
for i in gen:  # generater에서 값이 끝날 때까지 squares()  아무것도 안줘서 디폴트값 n이 10이 들어감. 위에서 gen = squares() 에서 준비만 해줌
    print(i)   # 제너레이터 쓸 때는 yield를 써서 해줌.  

In [None]:
# 재귀 : 함수에서 호출하고 호출하고 호출하고..... 저장, 저장, 저장 .... 해야하니 but 코드가 간편해지고, 
def make_change(amount, coins=[1, 5, 10, 25], hand=None):
    hand = [] if hand is None else hand
    if amount == 0:
        yield hand
    for coin in coins:
        # ensures we don't give too much change, and combinations are unique
        if coin > amount or (len(hand) > 0 and hand[-1] < coin):
            continue

        for result in make_change(amount - coin, coins=coins,
                                  hand=hand + [coin]):
            yield result       # yield 를 쓰면 제너레이트 / 필요로 할 때 값을 만들어 냄...!!

In [None]:
for way in make_change(100, coins=[10, 25, 50]):   # 동전의 조합으로 100 만들기의 조합 : 6개를 찾아줌.
    print (way)
len(list(make_change(100)))       # 원소의 갯수를 구하기... 

#### Generator expresssions

In [None]:
gen = (x ** 2 for x in range(100))     #generator object        <genexpr>
gen

In [None]:
#list comprehesion
list_comp = [ x ** 2 for x in range(100)]
list_comp

In [None]:
def _make_gen():       # 
    for x in range(100):
        yield x ** 2     #x^2
gen = _make_gen()

In [None]:
list(gen)
list(gen2)

In [None]:
sum(x ** 2 for x in range(100))  # 값이 여러개 만들어지고, 합계를 냄.
dict((i, i **2) for i in range(5))  # 사전으로 만들어 줌.

#### itertools module

In [None]:
import itertools
first_letter = lambda x: x[0]

names = ['Alan', 'Adam', 'Wes', 'Will', 'Albert', 'Steven']

for letter, names in itertools.groupby(names, first_letter):
    print letter, list(names) # names is a generator

## Files and the operating system

In [None]:
path = 'ch13/segismundo.txt'
f = open(path)  # 어떤 파일을 열었는지 알 수 없을 수도 있음.

In [None]:
for line in f:   # 한 줄씩 입력됨.
    print(line)

In [None]:
lines = [x.rstrip() for x in open(path)]
lines

In [None]:
with open('tmp.txt', 'w') as handle:               # with open   두번째 인자로 r -읽기/ w - 수정/     위 파일을 핸들에 넣겠다.
    handle.writelines(x for x in open(path) if len(x) > 1)   # writelines 라인을 여러개 써라. 파일 path를 열어서 하나씩 넣겠다. 
     # 문장의 길이가 2개 이상인 라인들만!

open('tmp.txt').readlines()        # 파일 만들어줌. 파일핸들을 readlines() 메서드를 호출

In [None]:
import os   # import 해주어야함.
os.remove('tmp.txt')   # os 디렉토리, 파일 삭제 생성 등...