# Basic3: 에러와 디버깅
- (1) 예외 제어: %xmode
- (2) 디버깅: %debug, %pdb, %ipdb
- (3) 시간측정: %time, %timeit, %%time, %%timeit
- (4) 프로파일링: %prun, %lprun
- (5) 메모리 사용 프로파일링: %memit, %mprun



### (1) 예외 제어: %xmode

In [1]:
def func1(a,b):
    return a/b

def func2(x):
    a = x
    b = x-1
    return func1(a/b)

In [2]:
func2(1)

ZeroDivisionError: division by zero

In [3]:
#간단한 설명
%xmode Plain

Exception reporting mode: Plain


In [4]:
func2(1)

ZeroDivisionError: division by zero

In [5]:
# 원래의 설명
%xmode Context

Exception reporting mode: Context


In [6]:
func2(1)

ZeroDivisionError: division by zero

In [3]:
# 호출함수의 인수를 포함한 추가적 정보보
%xmode Verbose

Exception reporting mode: Verbose


In [4]:
func2(1)

ZeroDivisionError: division by zero

### (2) 디버깅: %debug, %pdb, %ipdb

콘다 가상환경에 패키지 설치하는 방법
- anaconda prompt 실행 > conda env list 입력하여 존재하는 가상환경 확인 > activate (가상환경 이름) (가상환경 활성화)
- conda list (설치된 패키지 확인) > conda install -n (가상환경 이름) (패키지1) (패키지2).... (패키지 설치)
- https://cocobi.tistory.com/160

%debug가 통하지 않을 시, 경로 설정이 제대로 되지 않은 경우임
- 커맨드 창 (ctrl shift p)을 열어 select interpreter를 선택 -> 현재 사용중인 파이썬 환경을 선택해준 뒤 %debug를 실행해본다

In [None]:
import pdb
 
def divide(a, b):
    pdb.set_trace()  # 실행 중단점 설정
    return a / b
 
result = divide(10, 0)

> [1;32mc:\users\chels\appdata\local\temp\ipykernel_24564\664284626.py[0m(4)[0;36mdivide[1;34m()[0m



In [3]:
import sys
print(sys.stdin.isatty())

False


In [2]:
import sys
import os

# 터미널 입력으로 복구
sys.stdin = open('/dev/tty') if os.name != 'nt' else open('CON', 'r')
sys.stdout = open('/dev/tty') if os.name != 'nt' else open('CON', 'w')

In [None]:
import pdb
 
def divide(a, b):
    pdb.set_trace()  # 실행 중단점 설정
    return a / b
 
result = divide(10, 0)

> [1;32mc:\users\chels\appdata\local\temp\ipykernel_7864\664284626.py[0m(4)[0;36mdivide[1;34m()[0m



In [2]:
%debug

> [1;32mc:\users\chels\appdata\local\temp\ipykernel_32672\2483606204.py[0m(1)[0;36m<module>[1;34m()[0m



In [5]:
%debug?

[1;31mDocstring:[0m
::

  %debug [--breakpoint FILE:LINE] [statement ...]

Activate the interactive debugger.

This magic command support two ways of activating debugger.
One is to activate debugger before executing code.  This way, you
can set a break point, to step through the code from the point.
You can use this mode by giving statements to execute and optionally
a breakpoint.

The other one is to activate debugger in post-mortem mode.  You can
activate this mode simply running %debug without any argument.
If an exception has just occurred, this lets you inspect its stack
frames interactively.  Note that this will always work only on the last
traceback that occurred, so you must call this quickly after an
exception that you wish to inspect has fired, because if another one
occurs, it clobbers the previous one.

If you want IPython to automatically do this on every exception, see
the %pdb magic for more details.

.. versionchanged:: 7.3
    When running code, user variables are no

In [6]:
%pdb?

[1;31mDocstring:[0m
Control the automatic calling of the pdb interactive debugger.

Call as '%pdb on', '%pdb 1', '%pdb off' or '%pdb 0'. If called without
argument it works as a toggle.

When an exception is triggered, IPython can optionally call the
interactive pdb debugger after the traceback printout. %pdb toggles
this feature on and off.

The initial state of this feature is set in your configuration
file (the option is ``InteractiveShell.pdb``).

If you want to just activate the debugger AFTER an exception has fired,
without having to type '%pdb on' and rerunning your code, you can use
the %debug magic.
[1;31mFile:[0m      c:\users\chels\anaconda3\envs\emerald_city\lib\site-packages\ipython\core\magics\execution.py

In [7]:
%pdb on

Automatic pdb calling has been turned ON


In [1]:
def func1(a,b):
    return a/b

def func2(x):
    a = x
    b = x-1
    return func1(a/b)

func2(1)

ZeroDivisionError: division by zero

### (3) 시간측정: %time, %timeit, %%time, %%timeit

In [1]:
# 코드 조각 반복 실행하여 시간 측정
%timeit sum(range(100))

915 ns ± 93.3 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)


In [2]:
# 셀 반복 실행하여 시간 측정
%%timeit
total = 0
for i in range(1000):
    for j in range(1000):
        total += i * (-1) **j

243 ms ± 8.51 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [3]:
# 반복 작업 중 왜곡 발생하는 경우도 있음 
# iteration 과정에서 한번 정렬된 목록을 재정렬할 때 시간이 적게 소모됨 >> 평균치를 냈을 때 훨씬 빠른 것처럼 결과가 나온다

import random
L = [random.random() for i in range(100000)]
%timeit L.sort()

2.03 ms ± 155 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [None]:
# 위와 같은 경우 %time이 더 정확하게 시간 측정을 할 수 있다
# %time으로 측정한 %timeit으로 측정한 시간보다 훨씬 길다 (시간 측정에 영향을 줄 수 있는 미사용 파이썬 객체를 정리하는 작업을 못하게 막음)
L = [random.random() for i in range(100000)]
print("정렬되지 않은 리스트를 정렬")
%time L.sort()

정렬되지 않은 리스트를 정렬
CPU times: total: 46.9 ms
Wall time: 70.8 ms


In [10]:
# 이미 L이 정렬된 상태에서 재정렬하니 거의 시간이 들지 않음 (왜곡이 발생하는 이유가 된다다)
print("이미 정렬된 리스트를 정렬")
%time L.sort()

이미 정렬된 리스트를 정렬
CPU times: total: 0 ns
Wall time: 4.07 ms


In [None]:
%%time
total = 0 # %%time 셀 매직 # %%time은 반드시 셀의 맨 위 쪽에 단독으로 나와 있어야 인식됨...
for i in range(1000):
    for j in range(1000):
        total += i * (-1) **j 

CPU times: total: 391 ms
Wall time: 405 ms


### (4) 프로파일링: %prun, %lprun
- 전체 스크립트 프로파일링: %prun
- 라인 단위 프로파일링: %lprun

In [9]:
def sum_of_lists(N):
    total = 0
    for i in range(5):
        L = [j^(j>>i) for j in range(N)]
        total += sum(L)
        return total

In [10]:
%prun sum_of_lists(1000000)

 

         150 function calls (149 primitive calls) in 0.201 seconds

   Ordered by: internal time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.117    0.117    0.122    0.122 2767362457.py:1(sum_of_lists)
        1    0.049    0.049    0.049    0.049 {method 'execute' of 'sqlite3.Connection' objects}
      2/1    0.015    0.007    0.124    0.124 {built-in method builtins.exec}
        2    0.012    0.006    0.012    0.006 {method '__exit__' of 'sqlite3.Connection' objects}
        1    0.005    0.005    0.005    0.005 {built-in method builtins.sum}
        1    0.002    0.002    0.124    0.124 <string>:1(<module>)
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}
        1    0.000    0.000    0.061    0.061 history.py:833(_writeout_input_cache)
        1    0.000    0.000    0.000    0.000 inspect.py:3120(_bind)
        1    0.000    0.000    0.000    0.000 threading.py:315(_acquire_restore)
        

In [6]:
%prun?

[1;31mDocstring:[0m
Run a statement through the python code profiler.

**Usage, in line mode:**

  %prun [options] statement

**Usage, in cell mode:**

  %%prun [options] [statement]

  code...

  code...

In cell mode, the additional code lines are appended to the (possibly
empty) statement in the first line.  Cell mode allows you to easily
profile multiline blocks without having to put them in a separate
function.

The given statement (which doesn't require quote marks) is run via the
python profiler in a manner similar to the profile.run() function.
Namespaces are internally managed to work correctly; profile.run
cannot be used in IPython because it makes certain assumptions about
namespaces which do not hold under IPython.

Options:

-l <limit>
  you can place restrictions on what or how much of the
  profile gets printed. The limit value can be:

     * A string: only information for function names containing this string
       is printed.

     * An integer: only these many lin

In [7]:
%load_ext line_profiler

In [15]:
%lprun -f sum_of_lists(5000)

Timer unit: 1e-07 s

### (5) 메모리 사용 프로파일링
- 메모리 사용 프로파일링: %memit
- 라인 단위 메모리 사용 프로파일링: %mprun

In [19]:
%load_ext memory_profiler

In [20]:
%memit sum_of_lists(1000000)

peak memory: 101.22 MiB, increment: 9.71 MiB


In [5]:
%%file mprun_demo.py
def sum_of_lists(N):
    total = 0
    for i in range(5):
        L = [j^(j>>i) for j in range(N)]
        total += sum(L)
        del L # L 참조 삭제
    return total

# 메모리에 대한 라인 단위의 설명을 보려면 %mprun 매직을 사용하면 됨
# %mprun 매직을 사용하기 위해서는 별도의 모듈에 정의된 함수에만 동작하기 때문에
# 먼저 %%file 매직을 이용해 sum_of_lists 함수를 포함하는 mprun_demo.py라는 모듈을 생성
# %%file이 무조건 첫번째 줄에 단독으로 있어야 함

Writing mprun_demo.py


In [7]:
%load_ext memory_profiler

In [None]:
# 프로그램이 어디서 가장 많은 시간을 보내는지 알 수 있음
# 이 정보를 이용해 스크립트를 수정하여 원하는 작업의 성능을 개선할 수 있음
from mprun_demo import sum_of_lists
%mprun -f sum_of_lists sum_of_lists(1000000)




Filename: c:\workplace\python-data-science-handbook\01_IPython\mprun_demo.py

Line #    Mem usage    Increment  Occurrences   Line Contents
     1     78.3 MiB     78.3 MiB           1   def sum_of_lists(N):
     2     78.3 MiB      0.0 MiB           1       total = 0
     3     83.4 MiB     -0.2 MiB           6       for i in range(5):
     4    118.1 MiB -56905496.8 MiB     5000005           L = [j^(j>>i) for j in range(N)]
     5    118.1 MiB      0.0 MiB           5           total += sum(L)
     6     83.4 MiB   -147.3 MiB           5           del L # L 참조 삭제
     7     83.4 MiB      0.0 MiB           1       return total