<a href='https://github.com/SeWonKwon' ><div> <img src ='https://slid-capture.s3.ap-northeast-2.amazonaws.com/public/image_upload/6556674324ed41a289a354258718280d/964e5a8b-75ad-41fc-ae75-0ca66d06fbc7.png' align='left' /> </div></a>


###### Ch 04 구조와 모듈

# 4.1 모듈

파이썬에서 **모듈**module은 `def`를 사용하여 정의한다. `def`가 실행되면, 함수의 객체와 참조가 같이 생성된다.  반환값을 정의하지 않으면, 파이썬은 자동으로 `None`을 반환한다. C 언어와 마찬가지로, 아무런 값을 반환하지 않는 함수는 프로시져<sub>procedure</sub> 라고 부른다. 

## 4.1.1 스택과 활성화 레코드

함수가 호출될 때마다 **활성화 레코드**<sub>activation record</sub> 가 생성된다. 활성화 레코드에는 함수의 정보(반환값, 매개변수, 지역 변수, 반환값, 반환 주소 등)가 기록되며, 이를 **스택**stack에 저장한다. 활성화 레코드는 다음과 같은 순서로 처리된다. 

1. 함수의 실제 매개변수를 스택에 저장push한다.
2. 반환 주소를 스택에 저장한다.
3. 스택의 최상위 인덱스를 함수의 지역 변수에 필요한 총량만큼 늘린다. 
4. 함수로 건너뛴다.jump

활성화 레코드를 풀어내는<sub>unwiding</sub> 절차는 다음과 같다. 

1. 스택의 최상위 인덱스는 함수에 소비된 총 메모리야(지역 변수)만큼 감소한다.
2. 반환 주소를 스택에서 빼낸다.pop
3. 스택의 최상위 인덱스는 함수의 실제 매개변수만큼 감소한다. 

## 4.1.2 모듈의 기본값

모듈을 생성할때, 함수 또는 메서드에서 가변 객체를 기본값으로 사용해선 안된다. 

나쁜 예

In [1]:
def append_num(number, number_list=[]):
    number_list.append(number)
    return number_list

In [2]:
append_num(5) # 예상 결과 [5] 

[5]

In [3]:
append_num(7) # 예상 결과 [7]

[5, 7]

좋은 예

In [4]:
def append_num(number, number_list=None):
    if number_list is None:
        number_list= []
    number_list.append(number)
    return number_list

In [5]:
append_num(5) # 예상 결과 [5] 

[5]

In [6]:
append_num(7) # 예상 결과 [7]

[7]

## 4.1.3 `__init__.py` 파일

**패키지**package는 모듈과 `__init__.py` 파일이 있는 디렉터리이다.  파이썬은 `__init__.py` 파일이 있는 디렉터리를 패키지로 취급한다. 모듈 검색 경로 중 string과 같이 흔한 이름의 디렉터리에 유효한 모듈이 들어 있는 경우 이러한 모듈이 검색되지 않는 문제를 방지하기 위해서 이다.

```{python}

import 폴더이름.파일모듈명
```

`__init__.py` 파일은 빈 파일일 수도 있지만, 패키지의 초기화 코드를 실행하거나, __all__ 변수를 정의 할 수도 있다. 

```
__all__ =['파일1', ...]
```

실제 파일 이름은 확장자가 `.py`겠지만, 여기서 작성할 때는 `.py`를 붙이지 않는다.

```{python}

from 폴더이름 import *
```

위의 코드는 이름이 `__`로 시작하는 모듈을 *제외한* 모듈의 모든 객체를 불러온다.  
`__all__` 변수가 있는 경우, 해당 리스트의 객체를 불러온다. 

터미널에서 특정 모듈이 있는지 간단하게 확인하려면, `python -c import 모듈` 사용하면 된다. 

In [7]:
!python -c "import seaborn"

In [8]:
!python -c "import astin"

Traceback (most recent call last):
  File "<string>", line 1, in <module>
ModuleNotFoundError: No module named 'astin'


## 4.1.4 `__name__` 변수

파이썬은 모듈을 임포트import할 때마다 `__name__` 이라는 변수를 만들고, 모듈 이름을 저장한다. 이해를 돕기 위해 다음과 같이 먼저 `hello.py` 파일을 저장한 후, 그 위치에서 대화식 인터프리터를 실행하여 `hello`모듈을 임포트해보자.

In [9]:
%%writefile hello.py
hello = 'hello~'

def world():
    return "world"

if __name__ == "__main__":
    print("{0} excuted".format(__name__))
else:
    print("{0} imported".format(__name__))

Overwriting hello.py


In [10]:
import hello

hello imported


In [11]:
hello.hello

'hello~'

In [12]:
hello.world()

'world'

In [13]:
hello.__name__

'hello'

In [14]:
__name__

'__main__'

대화식 인터프리터 또는 `.py` 파일을 직접 실행하면 파이썬은 `__name__`을 `__main__`으로 설정하므로, 위 코드 조건문에서 참에 해당하는 코드를 실행한다. 이번에는 `hello.py`를 직접 실행해보자. 차이를 알수 있을것이다. 

In [15]:
!python hello.py

__main__ excuted


## 4.1.5 컴파일된 바이트코드 모듈

컴파일러가 사용하는 **바이트 컴파일 코드**byte-compiled code는 표준 모듈을 많이 사용하는 프로그램의 시작 시간(로딩 시간)을 줄이기 위한 것이다. 

In [16]:
!python --help

usage: python [option] ... [-c cmd | -m mod | file | -] [arg] ...
Options and arguments (and corresponding environment variables):
         and comparing bytes/bytearray with str. (-bb: issue errors)
-B     : don't write .pyc files on import; also PYTHONDONTWRITEBYTECODE=x
-c cmd : program passed in as string (terminates option list)
-d     : debug output from parser; also PYTHONDEBUG=x
-E     : ignore PYTHON* environment variables (such as PYTHONPATH)
-h     : print this help message and exit (also --help)
-i     : inspect interactively after running script; forces a prompt even
         if stdin does not appear to be a terminal; also PYTHONINSPECT=x
-I     : isolate Python from the user's environment (implies -E and -s)
-m mod : run library module as a script (terminates option list)
-O     : remove assert and __debug__-dependent statements; add .opt-1 before
         .pyc extension; also PYTHONOPTIMIZE=x
-OO    : do -O changes and also discard docstrings; add .opt-2 before
         

## 4.1.6 sys 모듈

`sys.path`는 인터프리터가 모듈을 검색할 경로를 담은 문자열 리스트다. `sys.path`변수는 `PYTHONPATH` 환경변수 또는 내장된 기본값 경로로 초기화된다. 환경변수를 수정하면 모듈 경로를 추가하거나 임시로 모듈 경로를 추가할 수 있다. 

In [17]:
import sys

sys.path

['C:\\Users\\bigne\\OneDrive\\WorkJ\\Python_from_scratch\\Python_Algorithm',
 'C:\\Users\\bigne\\anaconda3\\python38.zip',
 'C:\\Users\\bigne\\anaconda3\\DLLs',
 'C:\\Users\\bigne\\anaconda3\\lib',
 'C:\\Users\\bigne\\anaconda3',
 '',
 'C:\\Users\\bigne\\AppData\\Roaming\\Python\\Python38\\site-packages',
 'C:\\Users\\bigne\\anaconda3\\lib\\site-packages',
 'C:\\Users\\bigne\\anaconda3\\lib\\site-packages\\locket-0.2.1-py3.8.egg',
 'C:\\Users\\bigne\\anaconda3\\lib\\site-packages\\win32',
 'C:\\Users\\bigne\\anaconda3\\lib\\site-packages\\win32\\lib',
 'C:\\Users\\bigne\\anaconda3\\lib\\site-packages\\Pythonwin',
 'C:\\Users\\bigne\\anaconda3\\lib\\site-packages\\IPython\\extensions',
 'C:\\Users\\bigne\\.ipython']

In [18]:
# sys.path.append('모듈_디렉토리_경로')

`sys.ps1`과 `sys.ps2` 변수는 파이썬 대화식 인터프리터의 기본 및 보조 프롬프트prompt 문자열을 정의한다.(기본값은 각 `>>>` 및 `...`이다).

이미 앞에서도 사용했지만, `sys.argv` 변수를 사용하면 명령 줄에 전달된 인수를 프로그램 내에서 사용할 수 있다. 

In [19]:
%%writefile sys_example.py
import sys

def main():
    for arg in sys.argv[1:]:
        print(arg)
        
if __name__ == "__main__":
    main()

Overwriting sys_example.py


In [20]:
!python sys_example.py 우리 그리고 너

우리
그리고
너


`dir()` 내장 함수는 모듈이 정의하는 모든 유형의 이름(모듈, 변수, 함수)을 찾는데 사용된다. 이름 기준으로 정렬된 문자열 리스트를 반환한다.

In [21]:
import sys
for i in dir(sys):
    print(i, end=' ,')

__breakpointhook__ ,__displayhook__ ,__doc__ ,__excepthook__ ,__interactivehook__ ,__loader__ ,__name__ ,__package__ ,__spec__ ,__stderr__ ,__stdin__ ,__stdout__ ,__unraisablehook__ ,_base_executable ,_clear_type_cache ,_current_frames ,_debugmallocstats ,_enablelegacywindowsfsencoding ,_framework ,_getframe ,_git ,_home ,_xoptions ,addaudithook ,api_version ,argv ,audit ,base_exec_prefix ,base_prefix ,breakpointhook ,builtin_module_names ,byteorder ,call_tracing ,callstats ,copyright ,displayhook ,dllhandle ,dont_write_bytecode ,exc_info ,excepthook ,exec_prefix ,executable ,exit ,flags ,float_info ,float_repr_style ,get_asyncgen_hooks ,get_coroutine_origin_tracking_depth ,getallocatedblocks ,getcheckinterval ,getdefaultencoding ,getfilesystemencodeerrors ,getfilesystemencoding ,getprofile ,getrecursionlimit ,getrefcount ,getsizeof ,getswitchinterval ,gettrace ,getwindowsversion ,hash_info ,hexversion ,implementation ,int_info ,intern ,is_finalizing ,maxsize ,maxunicode ,meta_path ,mo

# 4.2 제어문

## 4.2.1 if문

파이썬 if문은 다른 언어의 switch문 또는 case문을 대체한다. 

In [22]:
# x = int(input('숫자를 입력해주세요.'))
x = int(0)
if x < 0:
    x = 0
    print('음수를 입력하여 x를 0으로 변경했습니다.')
elif x == 0:
    print('0이 입력되었습니다.')
elif x ==1:
    print('1이 입력되었습니다.')
else:
    print('2 이상의 숫자가 입력되었습니다.')

0이 입력되었습니다.


## 4.2.2 for문

파이썬 foransdms C나 파스칼 언어와 다르다. 파스칼처럼 숫자의 산술 진행을 반복하거나, C처럼 사용자가 반복 단계와 조건을 모두 정의할 수 있도록 하는 대신, 파이썬의 for문은 모든 시퀀스 항목(리스트, 문자열 등)을 순서대로 순회한다.

In [23]:
names = ['a','b','ccc','dddd']
for name in names:
    print(name)

a
b
ccc
dddd


## 4.2.3 참과 거짓

**거짓**`False`은 사전 정의된 상수 `False` 또는 숫자 `0`, 특수 객체 `None`, 빈 컬렉션 시퀀스(빈 문자열 '', 빈 리스트 `[]`, 빈 튜플 `()`,  빈 딕셔너리 `{}`)에 의해 정의된다.

여기에 속하지 않은 값은 모두 **참**`True`이다. 

In [24]:
str1, str2, str3 = '', '사람', '닝겐'
non_null = str1 or str2 or str3
non_null

'사람'

암묵적인implicit `False` 사용에 대한 기준(구글 파이썬 스타일 가이드)

* `==` 또느`!=` 연산자를 사용하여 내장 변수 `None` 같은 싱글턴singleton을 비교하지 않는다. 대신 is 또는 is not을 사용한다.     
  
  
* `if x is not None`과 `if x`를 잘 구분해서 사용한다.


* `==`를 사용하여 불리언 변수를 `False`와 비교하지 않는다. 대신 `if not x`를 사용한다. `None`과 `False`를 구별할 필요가 있는 경우, `if not x and x is not None`과 같은 연결 표현식을 사용한다. 



* 시퀀스(문자열, 리스트, 튜플)의 경우, 빈 시퀀스는 `False`다. `if len(시퀀스)` 또는 `if not len(시퀀스)`보다는 `if not 시퀀스` 또는 `if 시퀀스`를 사용하는 것이 좋다. 



* 정수를 처리할 때 뜻하지 않게 `None`을 `0`으로 잘못 처리하는 것처럼, 암묵적 `False`를 사용하는 것은 위험하다. 

좋은 예

```{python}

if not users:
    print('사용자가 없습니다.')
    
if foo == 0:
    handle_zero()
    
if i % 10 == 0:
    handle_multiple_of_ten()
    
```

나쁜 예

```{python}

if len(users) == 0:
    print('사용자가 없습니다.')
   
if foo is not None and not foo:
    handel_zero()
    
if not i % 10:
    handle_multiple_of_ten()
```

## 4.2.4 return 대 yield

파이썬에서 **제너레이터**generator는 **이터레이터**iterator를 작성하는 편리한 방법이다. 객체에 `__iter__()`와 `__next__()` 메서드를 둘 다 정의하면 이터레이터 프로토콜을 구현한 셈이다. 이때 `yield` 키워드를 사용하면 편리하다. 


호출자가 메서드를 호출할 때, `return` 키워드는 반환값을 반환하고 메서드를 종료한 후, 호출자에게 제어를 반환한다.  반면 `yield` 키워드는 각 반환값을 호출자에게 반환하고, 반환값이 모두 소진되었을 때에만 메서드가 종료된다. 

이터레이터는 파이썬의 강력한 기능이다. 이터레이터는 이터레이터 프로토콜을 구현하는 컨테이너 객체라고 할수 있는데, 컨테이너의 다음 값을 반환하는 `__next__()` 메서드와 이터레이터 자신을 반환하는 `__iter__()`메서드를 기반으로 한다. 

`yield` 키워드는 제너레이터 맥락에서 이터레이터를 만드는 아주 강력한 도구다. 제너레티어는 최종값을 반환하지만, 이터레이터는 `yield` 키워드를 사용하여 코드 실행 중에 값을 반환한다. 즉, `__next__()` 메서드를 호출할 때마다 어떤 값을 하나를 추출한 후 해당 `yield` 표현식의 값을 반환한다. 이렇게 이터레이터는 `StopIteration` 예외가 발생할 때까지 값을 반환한다.

`__next__`

In [25]:
a = [1, 2, 3]
def f(a):
    while a:
        yield a.pop()

In [26]:
next(f(a))

3

In [27]:
next(f(a))

2

`__iter__`

In [28]:
a = 0
def g(a):
    while a < 10:
        a += 1
        yield a

In [29]:
iter(g(a))

<generator object g at 0x0000016353D8AC80>

In [30]:
for i in iter(g(a)):
    print(i)

1
2
3
4
5
6
7
8
9
10


피보나치 수열 제너레이터

In [31]:
def fib_generator():
    a, b = 0, 1
    while True:
        yield b
        a, b = b, a + b

In [32]:
fib = fib_generator()
print(next(fib))
print(next(fib))
print(next(fib))
print(next(fib))
print(next(fib))
print(next(fib))

1
1
2
3
5
8


## 4.2.5 break 대 continue

반복분(for 또는 while) 에서 break 키워드를 만나면, 바로 반복문을 빠져나간다. 반복문에서 continue 키워드를 만나면, 반복문의 다음 단계로 전환한다.(반복문의 다음 반복을 계속한다.)

반복문에는 else 절을 사용할 수 있는데, 이는 반복문이 종료되었을 때 (for 문에서 리스트의 항목을 모두 순회했거나, while문에서 조건이 False가 되었을 때) 실행된다. 다만 break문으로 반복문이 종료되는 경우에는 실행되지 않는다. 

In [33]:
for i in range(10):
    if i == 4 :
        break
    print(i)
else:
    print('반복문 종료')

0
1
2
3


In [34]:
for i in range(10):
    if i % 2 == 0 :
        continue
    print(i)
else:
    print('반복문 종료')

1
3
5
7
9
반복문 종료


## 4.2.6 range()

`range()` 메서드는 숫자 리스트를 생성한다. 숫자 시퀀스를 순회할 때 유용하다.

In [35]:
range(10)

range(0, 10)

In [36]:
[x for x in range(10)]

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

## 4.2.7 enumerate()

`enumerate()` 메서드는 반복 가능한 객체의 인덱스 값과 항목 값의 튜플을 반환한다. 예를 들어 파일을 가져와서 특정 단어가 나타나는 위치를 출력하는 나만의 grep 함수를 만들수 있다. 명령 줄에서 실행 시 단어와 파일을 모두 지정해야한다. 

In [37]:
%%writefile 3_grep_word_from_files.py
import sys

def grep_word_from_files():
    word = sys.argv[1]
    for filename in sys.argv[2:]:
        with open(filename) as file:
            for lino, line in enumerate(file, start=1):
                if word in line:
                    print("{0}:{1}:{2:.40}".format(filename, lino, line.rstrip()))

if __name__ == '__main__':
    if len(sys.argv) < 2:
        print("Usage: python {0} [word] [file ...]".format(sys.argv[0]))
        sys.exit()
        
    else:
        grep_word_from_files()

Writing 3_grep_word_from_files.py


In [38]:
!python 3_grep_word_from_files.py  for  3_grep_word_from_files.py

3_grep_word_from_files.py:5:    for filename in sys.argv[2:]:
3_grep_word_from_files.py:7:            for lino, line in enumerate(
3_grep_word_from_files.py:9:                    print("{0}:{1}:{2:.4
3_grep_word_from_files.py:13:        print("Usage: python {0} [word] 


In [39]:
import os
os.remove('3_grep_word_from_files.py')

## 4.2.8 zip()

`zip()` 메서드는 2개 이상의 시퀀스를 인수로 취하여, 짧은 길이의 시퀀스를 기준으로 각 항목이 순서대로 1:1 대응하는 새로운 튜플 시퀀스를 만든다.

In [40]:
a = ['1','2','3']
b = ['a','b','c']
zip(a,b)

<zip at 0x16353db7e00>

In [41]:
list(zip(a,b))

[('1', 'a'), ('2', 'b'), ('3', 'c')]

## 4.2.9 filter()

`filter()`메서드는 시퀀스의 항목들 중 함수 조건이 참(`True`)인 항목만 추출해서 구성된 시퀀스를 반환한다. 다음 코드를 살펴보자.

In [42]:
def f(x): return x % 2 != 0 and x % 3 != 0
f(33)

False

In [43]:
f(17)

True

In [44]:
list(filter(f, [33, 17]))

[17]

In [45]:
list(filter(f, range(2, 33)))

[5, 7, 11, 13, 17, 19, 23, 25, 29, 31]

In [46]:
def f(x): return x % 2 != 0 and x % 3 != 0 and x % 5 != 0 and x % 7 !=0 

In [47]:
list(filter(f, range(2, 50)))

[11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47]

## 4.2.10 map()

`map(function, list)` 메서드는 시퀀스의 모든 항목에 함수를 적용한 결과 리스트를 반환한다. 

In [48]:
list(map(f, range(1, 10)))

[True, False, False, False, False, False, False, False, False]

In [49]:
def cube(x): return x*x*x
list(map(cube, range(1, 11)))

[1, 8, 27, 64, 125, 216, 343, 512, 729, 1000]

## 4.2.11 lambda 함수

**람다**lambda함수를 쓰면 코드 내에서 함수를 간결하게compact 동적으로 사용할 수 있다. 

`lambda 변수 : 리턴값`

In [50]:
area = lambda b, h: 0.5 * b * h
area(5, 4)

10.0

람다 함수는 `defaultdict`에서 키 생성 시 매우 유용하다(누락된 키에 대한 기본 값 설정시).

In [51]:
import collections

minus_one_dict = collections.defaultdict(lambda: -1)
point_zero_dict = collections.defaultdict(lambda: (0, 0))
message_dict = collections.defaultdict(lambda: "No message")

In [52]:
minus_one_dict

defaultdict(<function __main__.<lambda>()>, {})

# 4.3 파일 처리

파이썬에서 파일 처리는 매우 쉽고 편하다. 파일을 읽어서 모든 빈 줄을 제거하는 코드를 살펴보자.

In [53]:
%%writefile 4_remove_blank_lines.py
import sys

def read_data(filename):
    lines = []
    fh = None
    try:
        fh = open(filename)
        for line in fh:
            if line.strip():
                lines.append(line)
    except (IOError, OSError) as err:
        print(err)
    finally:
        if fh is not None:
            fh.close()
    return lines

def write_data(lines, filename):
    fh = None
    try:
        fh = open(filename, 'w')
        for line in lines:
            fh.write(line)
    except (EnvironmentError) as err:
        print(err)
    finally:
        if fh is not None:
            fh.close()
            
def remove_blank_lines():
    if len(sys.argv) < 2:
        print("Usage: python {0} [file ...]".format(sys.argv[0]))
    lines = ['# no blank','\n']
    for filename in sys.argv[1:]:
        lines += read_data(filename)
        if lines:
            write_data(lines, filename)
            
if __name__ == "__main__":
    remove_blank_lines()

Overwriting 4_remove_blank_lines.py


'4.1.4 __name__'에서 사용 `hello.py`를 사용해보자.

In [54]:
!type hello.py

hello = 'hello~'

def world():
    return "world"

if __name__ == "__main__":
    print("{0} excuted".format(__name__))
else:
    print("{0} imported".format(__name__))


In [55]:
!python 4_remove_blank_lines.py hello.py

In [56]:
!type hello.py

# no blank
hello = 'hello~'
def world():
    return "world"
if __name__ == "__main__":
    print("{0} excuted".format(__name__))
else:
    print("{0} imported".format(__name__))


file은 열었으면open 항상 닫아줘야한다close.   대신에 `with`를 사용할 수 있다.

In [57]:
%%writefile 5_remove_blank_lines.py
import sys

def read_data(filename):
    lines = []
    fh = None

    with open(filename) as fh:
        for line in fh:
            if line.strip():
                lines.append(line)
    return lines

def write_data(lines, filename):
    fh = None
    with open(filename, 'w') as fh:
        for line in lines:
            fh.write(line)

            
def remove_blank_lines():
    if len(sys.argv) < 2:
        print("Usage: python {0} [file ...]".format(sys.argv[0]))
    lines = ['# no blank with @with@','\n']
    for filename in sys.argv[1:]:
        lines += read_data(filename)
        if lines:
            write_data(lines, filename)
            
if __name__ == "__main__":
    remove_blank_lines()

Overwriting 5_remove_blank_lines.py


In [58]:
!python 5_remove_blank_lines.py hello.py

In [59]:
!type hello.py

# no blank with @with@
# no blank
hello = 'hello~'
def world():
    return "world"
if __name__ == "__main__":
    print("{0} excuted".format(__name__))
else:
    print("{0} imported".format(__name__))


## 4.3.1 파일 처리 메서드

### `open()`

`open(filename, mode, encoding)` 메서드는 파일 객체를 반환한다. 모드(mode)와 인코딩(encoding) 인수는 옵션이며, 생략하면 텍스트 읽기 모드와 시스템 기본 형식 인코딩이 적용된다. 모드는 문자열로 지정하며 종류는 다음과 같다. 

* `r`:읽기read 모드  

* `w`:쓰기write 모드(동명 파일이 이미 있다면, 그 파일을 지운 후 내용을 새로 쓴다.)  

* `a`:추가append 모드(동명 파일이 이미 있다면, 그 파일 끝에 내용을 추가한다. )  

* `r+`:읽기과 쓰기 모드  

* `t`:텍스트text 모드  

* `b`:바이너리binary 모드



In [60]:
filename = 'hello.py'

fin = open(filename, encoding='utf8')
fout = open(filename, 'w', encoding='utf8')

### `read()`

`read(size)` 메서드는 파일에서 size만큼의 내용을 읽고 문자열로 반환한다. 

(파이썬 3에서는 텍스트 모드의 경우 문자열을 반환하고, 바이너리 모드의 경우 바이트 객체를 반환한다.)

size는 정수로 지정하며 선택적 인수다. 인수가 생략되거나 음수이면, 전체 파일의 내용을 읽고 반환한다. 파일의 끝에 도달하면 read() 메서드는 빈 문자열을 반환한다. 

In [61]:
!type hello.py

In [62]:
fin.read()

''

### `readline()`

파일에서 한 줄을 읽는다. 개행 문자는 문자열의 끝에 남으며, 파일의 마지막 행에서만 생략된다. 이 때문에 반환 값이 모호해지는 문제가 있다. 

`readlines()`

파일의 모든 데이터 행을 포함한 리스트를 반환한다. `readlines(size)` 메서드에 size를 지정하면, 파일에서 해당 바이트 수만큼 읽고, 한 행을 완성하는 데 필요한 만큼 더 읽어서 반환한다. `readlines()` 메서드는 메모리에 전체 파일을 불러올 필요 없이 줄 단위로 효율적으로 읽을 수 있으며, 완전한 행을 반환한다. 

In [63]:
fin.readlines()

[]

### `write()`

데이터를 파일에 쓰고, None을 반환한다. 바이너리 모드에서는 바이트 또는 바이트 배열 객체를 쓰고, 텍스트 모드에서는 문자열 객체를 쓴다. 

In [64]:
fout.write('테스트\n')

4

### `tell()`,`seek()`

`tell()` 메서드는 파일의 현재 위치를 나타내는 정수를 반환한다. 파일의 위치는 시작 부분에서 바이트 단위로 측정된다. 

`seek(offset, from-what)` 메서드는 파일 내 탐색 위치를 변경할 때 사용한다. 파일 위치는 기준이 되는 참조 포인트 `from-what`에 오프셋 `offset`을 더한 값으로 계산된다. `from-what` 인수를 0으로 지정하면 기준이 파일의 처음 위치가 되고, 1은 파일의 현재 위치, 2는 파일의 마지막 위치를 기준으로 삼게 된다.

`close()`

파일을 닫고, 열린 파일이 차지하는 시스템 자원을 해제한다.free up, 파일을 성공적으로 닫으면 True를 반환한다.

`input()`

`input()` 함수는 사용자의 입력을 받는다. 콘솔에 출력될 문자열을 선택적으로 지정할 수 있다. 사용자가 텍스트를 입력하고 엔터enter(또는 리턴return)를 누를때까지 기다린다. 

사용자가 텍스트를 입력하지 않고 엔터 키만 누르면, 빈 문자열을 반환한다. 텍스트를 입력하고 엔터 키를 누르면, 사용자가 입력한 내용이 담긴 문자열(엔터 키 제외)을 반환한다.

In [65]:
def get_int(msg):
    while True:
        try:
            i = int(input(msg))
            return i 
        except ValueError as err:
            print(err)

In [76]:
age = get_int('Enter your age:')

Enter your age:1


In [67]:
age

21

`peek()`

`peek(n)` 메서드는 파일 포인터 위치를 이동하지 않고, n바이트를 반환한다.(반환된 바이트 수는 요청한 것보다 적거나 많을 수 있다.)

`fileno()`

파일 서술자descriptor 를 반환한다.(파일 서술자를 가진 파일 객체에서만 사용 가능하다.)

## 4.3.2 shutil 모듈

shutil 모듈은 시스템에서 파일을 조작할 때 유용하다. 다음 코드는 터미널에서 파일 및 확장자를 지정하면 새 확장자의 이름으로 복사본을 만든다.

In [68]:
%%writefile 6_change_ext_file.py
import os 
import sys
import shutil

def change_file_ext():
    print(1)
    if len(sys.argv) < 2:
        print("Usage: python {0} filename.old_ext 'new_ext'".format(sys.argv[0]))
        sys.exit()
    
    name = os.path.splitext(sys.argv[1])[0]+'.'+sys.argv[2]
    print(name)
    print(sys.argv[1])
    try:
        shutil.copyfile(sys.argv[1], name)
        print('copied')
    except OSError as err:
        print(err)
        
if __name__== "__main__":
    change_file_ext()

Overwriting 6_change_ext_file.py


In [69]:
!python 6_change_ext_file.py  hello.py  txt

1
hello.txt
hello.py
copied


## 4.3.3 pickle 모듈

`pickle` 모듈은 파이썬 객체를 가져와서 문자열 퓨현representation으로 변환한다. 

이러한 과정을 **피클링**pickling이라 한다.(직렬화 serialization라고도 한다.)   

반대로, 문자열표현을 객체로 재구성하는 것을 **언피클링**unpickling이라 한다.(역직렬화deserialization)

파이썬 3에서 pickle 모듈을 사용하려면, 바이너리 모드로 파일에 접근해야 한다. 다음 코드를 살펴보자.

In [70]:
import pickle

x={}
x['name'] = 'Neva'
x['age'] = '31'
x['ocupation'] ='CodeChef'

with open('name.pkl', 'wb') as f: # 피클링
    pickle.dump(x, f)

In [71]:
with open('name.pkl', 'rb') as f:
    name = pickle.load(f)
name

{'name': 'Neva', 'age': '31', 'ocupation': 'CodeChef'}

## 4.3.4 struct 모듈

`struct` 모듈을 사용하면 파이썬 객체를 이진 표현으로 변환하거나, 이진 표현을 파이썬 객체로 변환할 수 있다. 
객체는 특정 길이의 문자열만 처리할 수 있다. 

`struct` 모듈의 함수를 간단하게 살펴보자. struct.pack() 함수는 struct 형식format 의 문자열과 값을 취하여 바이트 객체를 반환한다. `struck.unpack()` 함수는 struck 형식의 문자열과 바이트 또는 바이트 배열 객체를 취하여 값을 반환한다. struct.calcsize() 함수는 struct 형식의 문자열을 취하여, struct 형식이 차지할 바이트 수를 반환한다. 

In [72]:
import struct

abc = struct.pack('>hhl', 1, 2, 3)
abc

b'\x00\x01\x00\x02\x00\x00\x00\x03'

In [73]:
struct.unpack('>hhl', abc)

(1, 2, 3)

In [74]:
struct.calcsize('>hhl')

8

struct 형식 `'>hhl'`이 의미하는 바를 살펴보자. 
* \>는 빅엔디언big-endian을 의미한다.(반대로 \< 리틀엔디언little-endian이다.)  
* h는 C타입으로 short를 나타내고 l은 long을 나타낸다.



# 4.4 오류처리

파이썬 코드를 컴파일할 때, 발생할 수 있는 두 가지 종류의 오류가 있다. 

**구문 오류**syntax error(구문 분석parsing 오류)와 **예외**exception(실행 중 발견되는 오류로 무조건적으로 치명적인 것은 아니다.)다.

구문 오류가 있으면 컴파일이 아예 안되지만, 예외는 실행 중에야 발견할 수 있으므로 신중하게 처리해야 한다. 

## 4.4.1 예외 처리

예외가 발생했는데 이를 코드 내에서 처리하지 않았다면, 파이썬은 예외의 오류메시지와 함께 **트레이스백(역추적)**traceback**을 출력한다. 트레이스백은 처리되지 않은 예외가 발생한 지점에서 호출 스택 맨 위까지 수행된 모든 호출 목록을 포함한다. 파이썬에서는 `try-except-finally`문을 사용하여 예측 가능한 예외를 처리할 수 있다. 

```{python}
try:
    예외 발생이 예측되는 코드
    
except 예외1 as 예외_변수1:
    예외 처리1
    
.
.

except 예외N as 예외_변수N:
    예외 처리N
    
finally:
    마지막 실행 코드
    
```

In [77]:
i = 0 
while True:
    try:
        x = int(input('숫자를 넣어줭~'))
    except ValueError:
        print(ValueError, '숫자가 아닙니다. 다시 입력해주세요~')
    finally:
        i+=1
    
    if i == 3:
        print( '3회 완료')
        break

숫자를 넣어줭~0
숫자를 넣어줭~ㅁ
<class 'ValueError'>
숫자를 넣어줭~-
<class 'ValueError'>
3회 완료


`raise`문을 사용하여 다음과 같이 특정 예외를 의도적으로 발생시킬 수 있다. 

In [78]:
import string
import sys
try:
    1/0
    f = open('myfile.txt')
    s = f.readline()
    i = int(string.strip(s))
except IOError as err:
    errno, strerror = err.args
    print(err)
    print(errno, sterror)
except ValueError:
    print('데이터를 숫자로 변환할 수 없습니다.')
except:
    print("예외 발생: {0}".format(sys.exc_info()[0]))
    raise

예외 발생: <class 'ZeroDivisionError'>


ZeroDivisionError: division by zero

`else`문도 쓸수 있다.

In [79]:
filename = 'hello.py'
try:
    f = open(filename, 'r')
except IOError:
    print("{0}를(을) 열 수 없습니다.".format(filename))
else:
    print("{0}는(은) 총 {1}줄 입니다.".format(filename, len(f.readlines())))
    f.close()

hello.py는(은) 총 0줄 입니다.


## 4.4.2 예외 처리에 대한 구글 파이썬 스타일 가이드

* `raise MyError('오류 메시지')` 또는 `raise MyError`와 같이 예외를 발생시킨다. 두 개의 인수 형식을 사용하지 않는다.(즉, raise MyError, '오류 메시지'와 같이 두개의 인수 형식을 사용하지 않는다.)     

* 내장 예외클래스를 적절하게 사용한다. 예를 들어 어떤 함수에서 예상 인수 값이 양수이지만 음수를 전달받았다면 ValueError 예외를 발생시키면 된다. 여기서 공개 API의 인수 값을 확인하는 데 assert문은 사용하지 않는다. assert문은 정확한 사용법을 강요하거나 예상치 못한 이벤트가 발생했음을 가리키는 것이 아니라, 내부적으로 정확성을 보장하기 위해 사용하는 것이다. 좋은 예는 다음과 같다.

In [81]:
def ConnectToNextPort(self, minimum):
    """사용 가능한 다음 포트에 연결한다. 새 minimum 포트를 반환한다."""
    if minimum <= 1024:
        raise ValueError('1025 이상의 포트를 입력해야 합니다.')
    port = self._FindNextOpenPort(minimum)
    
    if not port:
        raise ConnectionError('%d 포트에 연결할 수 없습니다.' % (minimum,))
    assert port >=minimum, '예상치 못한 %d 포트를 사용했습니다. 입력한 minimum 포트는 %d입니다.' % (port, minimum)
    return port

다음은 나쁜 예이다.

In [82]:
def ConnectToNextPort(self, minimum):
    """사용 가능한 다음 포트에 연결한다. 새 minimum 포트를 반환한다."""
    assert minimum > 1024, '1025 이상의 포트를 입력해야 합니다.'
    port = self._FindNextOpenPort(minimum)
    assert port is not None
    return port

* 라이브러리 또는 패키지에 따라 자체적인 예외를 정의하는 게 좋다. 이 경우 내장 `Exception` 클래스를 상속한다. 예외 이름은 `Error`로 끝나야 하며, `foo.FooError`와 같이 `foo.`가 붙으면 안 된다.    


* 모든 예외를 처리하는<sub>catch-all</sub> `except: except Execption, except StandardError` 문을 사용하지 않는다. 예외를 다시 발생시키려 하거나 코드의 가장 바깥쪽 블록(오류 메시지를 출력할 때)에서가 아니라면 말이다. 파이썬은 이 점에 관해 매우 관용적이라 `except:`문은 오탈자, `sys.exit()` 호출, `Ctrl+C` 인터럽트, 단위 테스트 실패 등 처리를 원하는 게 아닌 모든 종류의 예외까지 처리해버린다.



* `try/except` 블록 내 코드의 양을 최소화한다. try문에 걸리는 코드가 많을수록, 예외를 발생시키지 않을 것으로 예상한 코드 줄에서 예외가 발생할 확률도 높아진다. 이러한 경우 실제 오류가 발견하기 어렵다.    

* try문에서 예외가 발생하는지 여부에 관계없이 `finally`문을 꼭 사용한다. 이렇게 하면 파일 닫기와 같이 자원을 정리cleanup 하는 데 유용하다.


* 예외를 처리할 때는 다음과 같이, 쉼표(,) 대신 `as`를 사용한다.

```{python}
try:
    raise Error
except Error as error:
    pass
```

**Reference**

* <a href='https://github.com/SeWonKwon' ><div> <img src ='https://slid-capture.s3.ap-northeast-2.amazonaws.com/public/image_upload/6556674324ed41a289a354258718280d/964e5a8b-75ad-41fc-ae75-0ca66d06fbc7.png' align='left' /> </div></a>

<br>

* [파이썬 자료구조와 알고리즘, 미아 스타인](https://github.com/AstinCHOI/Python-and-Algorithms-and-Data-Structures)