## Efficient Code란?  
### 1. Minimal Runtime
### 2. Small Memory Foorprint

### 코드 시간측정.  
#### 1. IPython에서 %timeit magic method 이용.

In [1]:
import numpy as np
%timeit rand_nums = np.random.rand(1000)

31 µs ± 1.02 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


#### Specifying number of runs/loops  
Setting the number of runs(-r) and/or loops(-n)  
%timeit 뒤에 -r, -n플래그 뒤에 각각 runs, loops수를 정할 수 있다

In [2]:
# Set number of runs to 2 (-r2)
# Set number of loops to 10 (-n10)

%timeit -r2 -n10 rand_nums = np.random.rand(1000)

153 µs ± 57.2 µs per loop (mean ± std. dev. of 2 runs, 10 loops each)


In [3]:
# Single line of code

%timeit nums = [x for x in range(10)]

2.33 µs ± 389 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [22]:
# Multiple lines of code. 흠 왜 안되지?? 이상하네..
%%timeit

nums = []
for x in range(10):
    nums.append(x)

SyntaxError: invalid syntax (<ipython-input-22-202214983d9c>, line 2)

In [19]:
%lsmagic

Available line magics:
%alias  %alias_magic  %autocall  %automagic  %autosave  %bookmark  %cd  %clear  %cls  %colors  %config  %connect_info  %copy  %ddir  %debug  %dhist  %dirs  %doctest_mode  %echo  %ed  %edit  %env  %gui  %hist  %history  %killbgscripts  %ldir  %less  %load  %load_ext  %loadpy  %logoff  %logon  %logstart  %logstate  %logstop  %ls  %lsmagic  %macro  %magic  %matplotlib  %mkdir  %more  %notebook  %page  %pastebin  %pdb  %pdef  %pdoc  %pfile  %pinfo  %pinfo2  %popd  %pprint  %precision  %profile  %prun  %psearch  %psource  %pushd  %pwd  %pycat  %pylab  %qtconsole  %quickref  %recall  %rehashx  %reload_ext  %ren  %rep  %rerun  %reset  %reset_selective  %rmdir  %run  %save  %sc  %set_env  %store  %sx  %system  %tb  %time  %timeit  %unalias  %unload_ext  %who  %who_ls  %whos  %xdel  %xmode

Available cell magics:
%%!  %%HTML  %%SVG  %%bash  %%capture  %%cmd  %%debug  %%file  %%html  %%javascript  %%js  %%latex  %%markdown  %%perl  %%prun  %%pypy  %%python  %%python2  %%py

#### Saving the output to a variable (-o)

In [8]:
times = %timeit -o rand_nums = np.random.rand(1000)
print(type(times))
print(times)

25.4 µs ± 1.2 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
<class 'IPython.core.magics.execution.TimeitResult'>
25.4 µs ± 1.2 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [9]:
print(times.timings)
print(times.best)
print(times.worst)

[2.4560123246573085e-05, 2.322666264329314e-05, 2.5502331400679167e-05, 2.6057495224813466e-05, 2.524963897416228e-05, 2.624142082526646e-05, 2.728175000282249e-05]
2.322666264329314e-05
2.728175000282249e-05


### Comparing times
list(), dict(), tuple()과 같은 formal name으로 생성하거나,  
[], {}, ()과 같은 literal syntax로 자료구조를 생성할 수 있다. 생성되는 시간을 비교해보자.

In [11]:
f_time = %timeit -o formal_dict = dict()
l_time = %timeit -o literal_dict = {}

diff = (f_time.average - l_time.average) * (10**9)
print('l_time better than f_time by {} ns'.format(diff))

1.37 µs ± 358 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
106 ns ± 6.56 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
l_time better than f_time by 1262.865737977675 ns


literal syntax로 생성하는 것이 훨씬 빠르다!! **3배이상!!!**

In [12]:
%timeit nums_list_comp = [num for num in range(51)]

5.02 µs ± 566 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [13]:
%timeit nums_unpack = [*range(51)]

1.7 µs ± 285 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


**unpack해서 리스트 만드는게 훨씬 빠르다!!**

In [24]:
import sys
sys.version

'3.6.3 |Anaconda custom (64-bit)| (default, Nov  8 2017, 15:10:56) [MSC v.1900 64 bit (AMD64)]'

### Code profiling for runtime
- Detailed stats on frequency and duration of function calls.  
- Line-by-line analyses  
- Package used: line_profiler.  (pip install line_profiler)

http://free-lunch.github.io/python-profiler/ 블로그도 참고.  
`내 코드가 어느 부분이 느린지, 확인을 하고 튜닝을 하는 것이다. 이때 어느 부분이 성능상 느린지 확인할 때 사용하는 것이 프로파일링이다.`

#### cProfile
일단 python에 기본 내장되어 있는 cProfile을 사용해보자. 사용밥은 간단하다.  

In [25]:
import cProfile

def test():
    for i in range(5):
        print(i)

cProfile.run('test()')

0
1
2
3
4
         136 function calls in 0.001 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.001    0.001 <ipython-input-25-30e731937997>:3(test)
        1    0.000    0.000    0.001    0.001 <string>:1(<module>)
       11    0.000    0.000    0.001    0.000 iostream.py:180(schedule)
       10    0.000    0.000    0.000    0.000 iostream.py:284(_is_master_process)
       10    0.000    0.000    0.000    0.000 iostream.py:297(_schedule_flush)
       10    0.000    0.000    0.001    0.000 iostream.py:342(write)
       11    0.000    0.000    0.000    0.000 iostream.py:87(_event_pipe)
       11    0.000    0.000    0.000    0.000 threading.py:1062(_wait_for_tstate_lock)
       11    0.000    0.000    0.000    0.000 threading.py:1104(is_alive)
       11    0.000    0.000    0.000    0.000 threading.py:506(is_set)
        1    0.000    0.000    0.001    0.001 {built-in method builtins.exec}
   

위 코드와 같이 run에 체크를 원하는 함수를 스트링으로 넣으면 된다.    
이마저 귀찮다 한다면 작성한 코드를 console로 실행하면 된다.  
python -m cProfile test.py  
  
- ncalls : 실행횟수
- tottime : sub function의 실행시간이 제외한 전체 실행시간
- percall : sub function을 제외한 1회 실행시간
- cumtime : sub function을 포함한 전체 실행시간
- percall : sub function을 포함한 1회 실행시간

function 단위보다 라인단위로 보고 싶을 때 line_profile 사용!

---

In [2]:
import numpy as np

heroes = ['Batman', 'Superman', 'Wonder Woman']

hts = np.array([188.0, 191.0, 183.0])
wts = np.array([95.0, 101.0, 74.0])

def convert_units(heroes, heights, weights):
    
    new_hts = [ht * 0.39370 for ht in heights]
    new_wts = [wt * 2.20462 for wt in weights]
    
    hero_data = {}
    
    for i, hero in enumerate(heroes):
        hero_data[hero] = (new_hts[i], new_wts[i])
        
    return hero_data

print(convert_units(heroes, hts, wts))

{'Batman': (74.015599999999992, 209.43889999999999), 'Superman': (75.196699999999993, 222.66661999999997), 'Wonder Woman': (72.0471, 163.14187999999999)}


%timeit은 전체 수행시간만 보여주지만 **각 라인의 수행시간을 보기 위해서 line_profiler을 사용**한다.

Using line_profiler package.  
    
    %load_ext line_profiler
    
Magic command for line-by-line times

    %lprun -f convert_units convert_units(heroes, hts, wts)

In [3]:
# 1. load하기.
%load_ext line_profiler

In [6]:
# 2. 매직 커맨드 이용.  (-f는 function을 검사한다는 뜻?)
%lprun -f convert_units convert_units(heroes, hts, wts)

Line #: 줄 번호  
Hits: 실행된 횟수  
Time: 수행시간.   
Per Hit: Hit당 수행시간. (micro seconds!)  
% Time: 전체 수행시간에서 차지하는 비율  
Line Contents: 각 줄의 내용을 표시.  

 `10   1   43.0   43.0   43.9    new_hts = [ht * 0.39370 for ht in heights]`  
 얘가 제일 시간 많이 잡아먹는다. 어떻게 하면 더 효율적으로 짤까?

**numpy array는 Broad cast가 가능**하다! 함수를 다시 써보자

In [7]:
def convert_units_broadcast(heroes, heights, weights):

    # Array broadcasting instead of list comprehension
    new_hts = heights * 0.39370
    new_wts = weights * 2.20462

    hero_data = {}

    for i,hero in enumerate(heroes):
        hero_data[hero] = (new_hts[i], new_wts[i])

    return hero_data

In [18]:
%lprun -f convert_units_broadcast convert_units_broadcast(heroes, hts, wts)

`4   1   32.0   32.0   37.6    new_hts = heights * 0.39370` 조금 줄긴 한다

나중에는 for loop 최적화도 배울것..

하지만 line_profile은 항상 global하게 깔린 python을 바라보도록 되어있기 때문에 가상환경에서 사용할 수 없다.  
pprofile을 이용하면 된다. 

## 코드 메모리 사용 Profile

#### 1. sys 이용
빠르고 쉽고.. dirty.

In [19]:
import sys
nums_list = [*range(1000)]
print(sys.getsizeof(nums_list))

nums_np = np.array(range(1000))
print(sys.getsizeof(nums_np))

9112
4096


#### 2. memory_profiler package 사용.
- Line-by-line analyses
- Detailed stats on memory consumption

In [20]:
# 1. 불러오기
%load_ext memory_profiler

# 2. 사용.
%mprun -f convert_units convert_units(heroes, hts, wts)

ERROR: Could not find file <ipython-input-2-278162497ff1>
NOTE: %mprun can only be used on functions defined in physical files, and not in the IPython environment.



**단점**  
1. Functions must be imported when using memory_profiler
2. IPython Session에서 안됨..
  
검사할 함수를 독립된 파이썬 파일로 저장한 후 불러와서 사용해야함.  
위 함수를 hero_funcs.py에 저장했다면
from hero_funcs import convert_units 이렇게 import해서 사용해야함..  

In [22]:
from hero_funcs import convert_units

%mprun -f convert_units convert_units(heroes, hts, wts)




    Filename: C:\Users\상우\Desktop\Python\백준\Study\DataCamp\hero_funcs.py

    Line #    Mem usage    Increment   Line Contents
    ================================================
         1     42.1 MiB     42.1 MiB   def convert_units(heroes, heights, weights):
         2                                 
         3     42.1 MiB      0.0 MiB       new_hts = [ht * 0.39370 for ht in heights]
         4     42.1 MiB      0.0 MiB       new_wts = [wt * 2.20462 for wt in weights]
         5                                 
         6     42.1 MiB      0.0 MiB       hero_data = {}
         7                                 
         8     42.1 MiB      0.0 MiB       for i, hero in enumerate(heroes):
         9     42.1 MiB      0.0 MiB           hero_data[hero] = (new_hts[i], new_wts[i])
        10                                     
        11     42.1 MiB      0.0 MiB       return hero_data


Line #: 줄 번호  
Mem usage: 현재 줄이 실행 된 후 메모리 사용량  
Increment: 전 줄에 비해 증가한 양.    
Line Contents: 소스코드..  

1. memory 단위는 MiB. Mebibyte != Megabyte 하지만 비슷.
    - https://ko.wikipedia.org/wiki/%EB%A9%94%EB%B9%84%EB%B0%94%EC%9D%B4%ED%8A%B8
2. Data used in this example is a random sample of 35,000 heroes. (Not original 480 superheroes dataset.
    - Small data로 하면 너무 작아서 랜덤 샘플링 해서 사용함.
3. Inspects memory by querying the operating system
    - Python Interpreter가 실제로 사용하는 메모리 양과 다를 수 있다. 
    - 따라서 플랫폼, run마다 다를 수 있다. 그래도 의미하는 바는 달라지지 않음.

memory면에서도 list comprehension보다 numpy의 index를 사용하는 것이 더 좋다.!  

## Efficiently combining, counting, and iterating


두 배열을 하나로 묶어 저장하고 싶을 때. zip을 사용하자!

In [23]:
names = ['Bulbassaur', 'Charmander', 'Squirtle']
hps = [45, 39, 44]

# 기본적 방법
combined = []

for i, pokemon in enumerate(names):
    combined.append((pokemon, hps[i]))
    
print(combined)

# zip을 이용한 방법
combined_zip = zip(names, hps)
print(type(combined_zip))

combined_zip_list = [*combined_zip]
print(combined_zip_list)

[('Bulbassaur', 45), ('Charmander', 39), ('Squirtle', 44)]
<class 'zip'>
[('Bulbassaur', 45), ('Charmander', 39), ('Squirtle', 44)]


#### collections module
- Specialized container datatypes
    - Alternatives to general purpose dict, list, set, and tuple
- Notable:
    - namedtuple: tuple subclasses with named fields
    - deque: list-like container with fast appends and pops
    - Counter: dict for counting hashable objects
    - OrderedDict: dict that retains order of entries
    - defaultdict: dict that calls a factory function to supply missing values

어떤 리스트의 원소들의 수를 세서 dictionar의 저장하는 경우, Counter를 사용하는 것이 훨씬 빠르다.

#### itertools module
- Functional tools for creating and using iteratos
- Notable:
    - Infinite iterators: count, cycle, repeat
    - Finite iterators: accumulate, chain, zip_longest, etc.
    - **Combination generators**: product, permutations, combinations

In [25]:
# Combinations with loop
poke_types = ['Bug', 'Fire', 'Ghost', 'Grass', 'Water']
combos = []

for x in poke_types:
    for y in poke_types:
        if x == y:
            continue
        if ((x, y) not in combos) & ((y, x) not in combos):
            combos.append((x, y))
print(combos)

[('Bug', 'Fire'), ('Bug', 'Ghost'), ('Bug', 'Grass'), ('Bug', 'Water'), ('Fire', 'Ghost'), ('Fire', 'Grass'), ('Fire', 'Water'), ('Ghost', 'Grass'), ('Ghost', 'Water'), ('Grass', 'Water')]


두 논리값을 비교하는 거니까 and가 아니라 &로도 가능.. 

In [26]:
# itertools.combinations()
from itertools import combinations
combos_obj = combinations(poke_types, 2)
combos = [*combos_obj]
print(combos)

[('Bug', 'Fire'), ('Bug', 'Ghost'), ('Bug', 'Grass'), ('Bug', 'Water'), ('Fire', 'Ghost'), ('Fire', 'Grass'), ('Fire', 'Water'), ('Ghost', 'Grass'), ('Ghost', 'Water'), ('Grass', 'Water')]


itertools 쓰는 게 훨씬 빠르다.

if you provide zip() with objects of differing lengths, it will only combine until the smallest lengthed object is exhausted.  
zip에 길이가 안맞는 애들을 넣으면 짧은애에 맞춰짐.  

### Set theory
- Branch of Mathematics applied to collections of objects
- Python built-in set datatype.
    - intersection(): all elements that are in both sets
    - difference(): all elements in one set but not the other
    - symmetric_difference(): all elements in exactly one set
    - union(): all elements that are in either set
    - Fast membership testing.
        - Check if a value exists in a sequence or not using the 'in' operator

In [27]:
# 비효율적 코드
list_a = ['Bulbasaur', 'Charmander', 'Squirtle']
list_b = ['Caterpie', 'Pidgey', 'Squirtle']

in_common = []

for pokemon_a in list_a:
    for pokemon_b in list_b:
        if pokemon_a == pokemon_b:
            in_common.append(pokemon_a)
            
print(in_common)

['Squirtle']


In [28]:
# Set을 이용하여 빠르게 풀기.
set_a = set(list_a)
set_b = set(list_b)

print(set_a.intersection(set_b))

{'Squirtle'}


훨씬 빠르다.. 특히 검색!! hash이용

### Eliminating loops
- Looping patterns:
    - for loop: iterate over sequence piece-by-piece
    - while loop: repeat loop as long as condition is met
    - "nested" loops: use one loop inside another loop
    - Costly!!
    
거의 모든 loop는 piece-by-piece로 evaluated되기 때문에 자주 비효율적이게 된다.  
#### Benefits of eliminating loops
- Fewer lines of code
- Better code readability
    - "Flat is better than nested"
- Efficienc gains.

In [30]:
poke_stats = [
    [90, 92, 75, 60],
    [25, 20, 15, 90],
    [65, 130, 60, 75]
]

# For loop approach
totals = []
for row in poke_stats:
    totals.append(sum(row))
    
# List Comprehension
totals_comp = [sum(row) for row in poke_stats]

# Built-in map() function
totals_map = [*map(sum, poke_stats)]

List Comprehension이나 map이용하는게 빠르다.  
또 Numpy array가 갖고있는 method를 이용하면 훨씬 좋음.  

In [32]:
import numpy as np
a = np.array([[1,2,3,4,5],
              [3,4,5,6,7]])

In [33]:
print(a.sum(axis=0))    # column별로..
print(a.sum(axis=1))    # row별로..

[ 4  6  8 10 12]
[15 25]


### Writing better loops
- Understand what is being done with each loop iterations  
- Move one-time calculations outside (above) the loop
- Use holistic conversions outside (below) the loop
- Anything that is done once should be outside the loop

In [35]:
names = ['Absol', 'Aron', 'Jynx', 'Natu', 'Onix']
attacks = np.array([130, 70, 50, 50, 45])
for pokemon, attack in zip(names, attacks):
    total_attack_avg = attacks.mean()    # 얘는 한번만 하면 된다.
    if attack > total_attack_avg:
        print(f"{pokemon}'s attack: {attack} > average: {total_attack_avg}!")

Absol's attack: 130 > average: 69.0!
Aron's attack: 70 > average: 69.0!


#### Using holistic conversion outside the loop

In [36]:
names = ['Pikachu', 'Squirtle', 'Articuno']
legend_status = [False, False, True]
generations = [1, 1, 1]
poke_data = []
for poke_tuple in zip(names, legend_status, generations):
    poke_list = list(poke_tuple)
    poke_data.append(poke_list)
print(poke_data)

[['Pikachu', False, 1], ['Squirtle', False, 1], ['Articuno', True, 1]]


루프 안에서 변환하는 것은 안좋다.

In [37]:
names = ['Pikachu', 'Squirtle', 'Articuno']
legend_status = [False, False, True]
generations = [1, 1, 1]
poke_data_tuples = []
for poke_tuple in zip(names, legend_status, generations):
    poke_data_tuples.append(poke_tuple)

poke_data = [*map(list, poke_data_tuples)]
print(poke_data)

[['Pikachu', False, 1], ['Squirtle', False, 1], ['Articuno', True, 1]]


이 방식이 더 빠름!!

### Intro to pandas DataFrame iteration
- Library used for data analysis
- Main data structure is the DataFrame
    - Tabular data with labeled rows and columns
    - Built on top of the NumPy array structure

얘도 마찬가지로 for문으로 도는거 말고 자체 메소드를 이용.

In [38]:
import pandas as pd

#### 1. df.iterrows() Method
각 row번호와 그 row의 정보 순서대로 접근가능.  
.iloc[]으로 loop돌지 말고 얘로 돌면 된다.

#### 2. Another iterator method: .itertuples()


.iterrows()는 pandas series type. []로 접근해야함.  
.itertuples()는 namedtuple type. 얘는 attribute look up으로 접근 가능.  (namedtuple.attributename 이런식으로)  
  
얘가 훨씬 빠르다!!!!


#### pandas alternative to looping
루프를 피하면 더 효율적!

#### 1. .apply() method
- Takes a function and applies it to a DataFrame
    - Must specify an axis to apply(0 for columns, 1 for rows)
- Can be used with anonymous functions(lambda functions)

루프 안쓰는게 훨씬훨씬 빠르다!!!!!

#### Optimal pandas iterating
#### Pandas internals
- Eliminating loops applies to using pandas as well
- pandas is built on Numpy.  
  
pandas도 broadcasing(vectorizing) 쓰면 매우매우매우 좋다.