# 패키지 네임스페이스
<br>

절대참조?
```python
from roboadvisor.analysis import statics
```

상대참조
```python
from .statics import statics_test
from .crawling parser import parser_test
```

# 가상환경
<br>

프로젝트를 수행할 때 파이썬 코드를 수행할 기본 인터프리터에서 추가로 프로젝트별로 필요한 패키지 설치

>virtualenv +pip, conda..

---

#### 가상환경 명령어

```python
conda create -n my_project pyhton = 3.4
activate my_project

where python             # 현재 실행되는 파이썬의 위치 출력

conda install matplolib  # 패키지 설치
deactivate
```

# 예외처리
<br>

예측 가능한 예외 : 발생 여부를 개발자가 사전에 인지할 수 있는 예외

예측 불가능한 예외 : 매우 많은 파일을 처리할 때 문제가 발생

---

예외 처리 구문 : try - except 문

```python
try:
    예외 발생 가능 코드
except 예외 타입:
    예외 발생시 실행되는 코드
```

예외의 발생은 예상 가능하므로 try문으로 대비할 수 있음.

---

예외 종류
1. IndexError : 리스트의 인덱스범위를 넘어갈 때
2. NameError : 존재하지 않는 변수를 호출할 때
3. ZeroDivisionError : 0으로 숫자를 나눌 때
4. ValueError : 변환할수 없는 문자/숫자를 반환할 때
5. FileNotFoundError : 존재하지 않는 파일을 호출할 때


---

예외 처리 : 오류에 강한 프로그램 구현을 위해 필요함

다양한 데이터들은 파일로 저장되어 있고 제공받음, file로부터 데이터를 읽을 수 있어야함

In [7]:
for i in range(10):
    try:
        print(10/i)
    except ZeroDivisionError:
        print("Not divided by 0")

Not divided by 0
10.0
5.0
3.3333333333333335
2.5
2.0
1.6666666666666667
1.4285714285714286
1.25
1.1111111111111112


In [8]:
# 예외 에러 메시지

for i in range(10):
    try:
        print(10/i)
    except ZeroDivisionError as e:
        print(e)
        print("Not divided by 0")

division by zero
Not divided by 0
10.0
5.0
3.3333333333333335
2.5
2.0
1.6666666666666667
1.4285714285714286
1.25
1.1111111111111112


#### try - except - else문
<br>

if - else문과 비슷한데, 예외가 발생하지 않을 경우 수행할 코드를 else문에 작성

---

#### try - except - finally문
<br>

예외 발생 여부와 상관없이 실행되는 코드

사용했던 자원들을 정리 작업

---

#### raise문
<br>

예외를 의도적으로 발생시키는 구문

---

#### assert문
<br>

미리 알아야 할 예외 정보가 조건에 만족하지 않을 경우 예외 발생

In [10]:
for i in range(10):
    try:
        result = 10 / i
    except ZeroDivisionError:
        print("Not divided by 0")
    else:
        print(10/i)

Not divided by 0
10.0
5.0
3.3333333333333335
2.5
2.0
1.6666666666666667
1.4285714285714286
1.25
1.1111111111111112


In [55]:
def number():
    try:
        num = int(input("정수 입력"))
    except ValueError as e:
        print(e)
    else:
        if num % 2 == 0:
            print("짝수 입니다.")
        else: 
            print("홀수 입니다.")

            
number()

정수 입력4
짝수 입니다.


In [56]:
try:
    for i in range(1,10):
        result = 10 // i
        print(result)
except ZeroDivisionError:
    print("Not divided by 0")
finally:
    print("종료되었다.")

10
5
3
2
2
1
1
1
1
종료되었다.


In [59]:
while True:
    value = input("변환할 정수값을 입력해 주세요. :")
    for digit in value:
        if digit not in "0123456789":
            raise ValueError("숫자값을 입력하지 않았습니다.")
    print("정수값으로 변환된 숫자 -", int(value))

변환할 정수값을 입력해 주세요. :4564891651
정수값으로 변환된 숫자 - 4564891651
변환할 정수값을 입력해 주세요. :244212.1.153484


ValueError: 숫자값을 입력하지 않았습니다.

In [65]:
def get_binary_number(decimal_number):
    assert isinstance(decimal_number,int), '정수가 아니야'
    return bin(decimal_number)

print(get_binary_number(10))
print(get_binary_number('10'))

0b1010


AssertionError: 정수가 아니야

In [79]:
talls = [150,155.5,148,117,161,163.5,185,164,170,169,159,152]

class OutOfRangeTallError(Exception):
    def __init__(self,message):
        self.tall = 160.5
        self.message = message
        
    def __str__(self):
        return self.message
    
    
# 파라미터값의 범위가 130이상 180이하가 아니면 예외(OutOfRangeTall) 발생
def checkTallValue(tall):
    if tall < 130:
        raise OutOfRangeTallError("중학생 평균 키 범위는 130 이상이어야합니다.")
    elif tall > 180:
        raise OutOfRangeTallError("중학생 평균 키 범위는 180 이하이어야합니다.")
        
# 중학생 키 값
def getMiddleTallAvg(talls):
    for idx, t in enumerate(talls):
        try:
            checkTallValue(t)
        except OutOfRangeTallError as e :
            print(e)
            print("작년도 중학생 키 평균값으로 보정합니다")
            talls[idx] = e.tall
    return sum(talls)/len(talls)

In [80]:
print("2022년도 중학생 평균 키 :",getMiddleTallAvg(talls))

중학생 평균 키 범위는 130 이상이어야합니다.
작년도 중학생 키 평균값으로 보정합니다
중학생 평균 키 범위는 180 이하이어야합니다.
작년도 중학생 키 평균값으로 보정합니다
2022년도 중학생 평균 키 : 159.41666666666666


# 파일 다루기
<br>

파일 : 컴퓨터를 실행할 때 가장 기본이 되는 단위

바이너리 파일 : 컴퓨터만 이해할 수 있는 2진법으로 저장, 메모장으로 열면 깨짐

텍스트 파일 : 사람도 이해할 수 있는 문자열으로 저장, 메모장으로 열면 확인 가능

In [93]:
f = open('dream.txt','r')
contents = f.read()
print(contents)
f.close()

I have a dream a song to sing
to help me cope with anything
if you see the wonder of a fairy tale
you can take the future even
if you fail I believe in angels
something good in everything



In [94]:
# close()를 까먹으니깐....

with open("dream.txt",'r') as my_file:
    contents = my_file.read()
    print(type(contents),contents)
    
# with 문은 런타임이 자동으로 open한 파일 close해줌.

<class 'str'> I have a dream a song to sing
to help me cope with anything
if you see the wonder of a fairy tale
you can take the future even
if you fail I believe in angels
something good in everything



In [95]:
# 한 줄씩 읽어서 리스트형으로 전환

with open("dream.txt",'r') as my_file:
    content_list = my_file.readlines()
    print(type(content_list))
    print(content_list)

<class 'list'>
['I have a dream a song to sing\n', 'to help me cope with anything\n', 'if you see the wonder of a fairy tale\n', 'you can take the future even\n', 'if you fail I believe in angels\n', 'something good in everything\n']


In [96]:
# 한 줄씩 읽어오기

with open("dream.txt",'r') as my_file:
    i = 0
    while 1:
        line = my_file.readline()
        if not line:
            break
        print(str(i)+ "===" +line.replace("\n",""))
        i = i + 1

0===I have a dream a song to sing
1===to help me cope with anything
2===if you see the wonder of a fairy tale
3===you can take the future even
4===if you fail I believe in angels
5===something good in everything


In [97]:
# 파일 안 글자의 통계 정보 출력하기

with open("dream.txt",'r') as my_file:
    contents = my_file.read()
    word_list = contents.split(" ")
    line_list = contents.split("\n")
    
print("총 글자의 수 :", len(contents))
print("총 단어의 수 :", len(word_list))
print("총 줄의 수 :", len(line_list))

총 글자의 수 : 188
총 단어의 수 : 35
총 줄의 수 : 7


In [99]:
# 텍스트 파일 저장시 표준 지정 - encoding

f = open("count_log.txt",'w',encoding='utf8')
for i in range(1,11):
    data = "%d번째 줄이다.\n" % i
    f.write(data)   
f.close()

In [100]:
# 파일 열기 모드 a로 새로운 글 추가하기

with open("count_log.txt",'a',encoding = 'utf8') as f:
    for i in range(1,11):
        data = "%d번째 줄이다.\n" % i
        f.write(data)

In [102]:
# 디렉터리 만들기

import os
os.mkdir("log")

# 이미 같은 파일명(폴더명)이 있다면 FileExistsError 발생.

FileExistsError: [WinError 183] 파일이 이미 있으므로 만들 수 없습니다: 'log'

In [103]:
# 이미 있나 없나 존재 여부 확인하기

import os
os.mkdir("log")

if not os.path.isdir("log"):
    os.mkdir("log")

FileExistsError: [WinError 183] 파일이 이미 있으므로 만들 수 없습니다: 'log'

In [104]:
# 로그 파일 만들기

import os

if not os.path.isdir("log"):
    os.mkdir("log")

if not os.path.exists("log/count_log.txt"):
    f = open("log/count_log.txt",'w',encoding="utf8")
    f.write("기록이 시작된다.\n")
    f.close()
    
with open("log/count_log.txt",'a',encoding="utf8") as f:
    import random, datetime
    for i in range(1,11):
        stamp = str(datetime.datetime.now())
        value = random.random() * 1000000
        log_line = stamp + "\t" + str(value) + "값이 생성되었다." + "\n"
        f.write(log_line)

# pickle 모듈
<br>

메모리에 로딩된 객체를 영속화? 할 수 있도록 지원

객체를 저장할 수 있는 파일을 열고 저장하고자 하는 객체를 넘기는 것(dump)

파일을 열때 'wb'로 열어야 함, binary 파일

dump()의 인수에는 저장할 객체, 저장될 파일 객체...

In [108]:
import pickle

f= open("list.pickle","wb")
test = [1,2,3,4,5]
pickle.dump(test,f)
f.close()

In [109]:
# 저장된 pickle 파일을 불러오는 프로세스
# rb로 불어온후 파일의 객체를 pickle.load()를 이용해 가져왔다.

f = open("list.pickle",'rb')
test_pickle = pickle.load(f)
print(test_pickle)
f.close()

[1, 2, 3, 4, 5]


In [114]:
# 단순히 생성된 객체만 저장하는게 아니고, 사용자가 직접 생성한 클래스의 객체도 저장함
# 우선 클래스와 객체 만들기

class Multiply(object):
    
    def __init__(self,multiplier):
        self.multiplier = multiplier
        
    def multiply(self,number):
        return number * self.multiplier

muliply = Multiply(5)
muliply.multiply(10)

50

In [119]:
# 먼저 pickle.dump를 이용해 multiply.object.pickle 파일을 만들고
# 다시 열어서 내가 만든 클래스안의 객체를 쓰는 프로세스.

import pickle 

f = open("multiply.object.pickle",'wb')
pickle.dump(muliply,f)
f.close()

f = open("multiply.object.pickle",'rb')
multiply_pickle = pickle.load(f)

multiply_pickle.multiply(5)

25

# CSV
<br>

CSV(Comma Separate Values) : 콤마 구분자, 텍스트 형식의 파읾

In [131]:
lines = 0                                            # 데이터의 행수를 저장할 변수 (열제목 행수 포함)
header = []                                          # 열제목 저장할 리스트 객체
customer_datas = []                                  # 데이터를 행단위로 저장할 리스트 객체

with open("customers.csv") as f:                     # 파일 열고
    while True:
        data = f.readline()                          # 라인 단위로 읽기
        if not data:                                 # 더 이상 읽은 내용이 업으면 None 반환, 무한루프 탈출
            break                                       
        if lines == 0:                               # 첫번째 열제목 줄을 읽어서 header 리스트에 저장
            header = data.split(',')
        else :                                       # data를 행 단위로 읽어서 customer_datas 리스트에 저장
            customer_datas.append(data.split(","))
        lines += 1                                   # 한 행 읽은 후에 읽은 행수 증가

        
print("Header :", header)
print("data size(rows)", len(customer_datas))

# 1~5번째 줄 출력
for idx in range(5):
    print(idx, " : ", customer_datas[idx],end="\n\n")
    
# 읽어들인 데이터를 csv파일 생성, 저장
with open("customer5.csv","w") as f:
    for customer in customer_datas:
        f.write(",".join(customer).strip('\n') + '\n')

print("file 저장 완료")

Header : ['customerNumber', 'customerName', 'contactLastName', 'contactFirstName', 'phone', 'addressLine1', 'addressLine2', 'city', 'state', 'postalCode', 'country', 'salesRepEmployeeNumber', 'creditLimit\n']
data size(rows) 122
0  :  ['103', 'Atelier graphique', 'Schmitt', 'Carine ', '40.32.2555', '"54', ' rue Royale"', 'NULL', 'Nantes', 'NULL', '44000', 'France', '1370', '21000\n']

1  :  ['112', 'Signal Gift Stores', 'King', 'Jean', '7025551838', '8489 Strong St.', 'NULL', 'Las Vegas', 'NV', '83030', 'USA', '1166', '71800\n']

2  :  ['114', '"Australian Collectors', ' Co."', 'Ferguson', 'Peter', '03 9520 4555', '636 St Kilda Road', 'Level 3', 'Melbourne', 'Victoria', '3004', 'Australia', '1611', '117300\n']

3  :  ['119', 'La Rochelle Gifts', 'Labrune', 'Janine ', '40.67.8555', '"67', ' rue des Cinquante Otages"', 'NULL', 'Nantes', 'NULL', '44000', 'France', '1370', '118200\n']

4  :  ['121', 'Baane Mini Imports', 'Bergulfsen', 'Jonas ', '07-98 9555', 'Erling Skakkes gate 78', 'NULL

### csv 관련 함수
<br>

csv모듈.reader(TextIOWrapper, delimiter= , qutoechar= , quoting = )

> delimiter = 데이터를 분리하는 기준

> qutoechar = 데이터를 묶을 때 사용하는 문자

> quoting = 데이터를 묶는 기준

csv모듈.writer

In [141]:
import csv

rownum = 0
header = []
datas = []

with open("korea_population_data.csv","r",encoding="cp949") as f:
    data = csv.reader(f)
    for row in data:
        if rownum == 0:
            header = row
        area = row[1]
        if area.find('김포')!= -1:
            datas.append(row)
        rownum += 1
        
with open("kimpo_population_data.csv","w",encoding='utf8') as f:
    writer = csv.writer(f, delimiter = '\t', quotechar = "'", quoting = csv.QUOTE_ALL)
    writer.writerow(header)
    for row in datas:
        writer.writerow(row)

### 이게 뭐지
<br>

이기종간 (hardware, os가 서로 다른 경우)의 데이터 교환 전송방식 : xml > json

---

html : 100여개의 태그가 존재 
```html
<tag>blabla</tag>
<명령어> blabla </명령어>
```
xml : 확장 가능한 마크업 언어

파싱? 

> DOM parser(객체 트리구조로 메모리에 생성, 랜덤하게 읽고 쓸 수 있음)

> SAX parser(1번 순차적으로 읽으면서 이벤트 기반으로 데이터 읽음)

```xml
<books>
<book>
<title>python</title>
<publisher>멀티캠퍼스</publisher>
<price>20000<price>
</book>
<book>
<title>db</title>
<publisher>오라클</publisher>
<price>30000<price>
</book>
</books>
```

json : 자바 스크립트 객체를 정의하는 형식

이기종간 (hardware, os가 서로 다른 경우)의 데이터 교환 전송방식

xml보다 경량, 호환성 좋음

```json
[{"title" : "python", "publisher" : "멀티캠퍼스", "price" : 20000},
 {"title" : "db", "publisher" : "오라클", "price" : 30000}]
```

# json
<br>

dumps() : python 객체를 json 데이터로 쓸때 직렬화
> dict => object, list, tuple => array, str => string, int, float => number

loads() : json포맷의 데이터를 python 객체로 읽을 때 역직렬화

메모리에 캐시되어 있는 json object를 python객체로 읽으려면 json.loads(json객체)

In [11]:
import json

dict_data = {"Name" : "kim", "Age" : 20, "Class" : "First"}
print(type(dict_data))
with open("data.json","w") as f:
    json.dump(dict_data,f)               # 메모리에 json object로 생성함
    print("파일에 기록함")

<class 'dict'>
파일에 기록함


In [14]:
json_obj = json.dumps(dict_data)         # 파이썬 객체를 직렬화해서 메모리에 json object로 생성
print(type(json_obj),json_obj)

<class 'str'> {"Name": "kim", "Age": 20, "Class": "First"}


In [15]:
with open("data.json","r") as f:
    pyobject = json.load(f)
    print(type(pyobject),pyobject)

<class 'dict'> {'Name': 'kim', 'Age': 20, 'Class': 'First'}


In [16]:
# 메모리에 캐시되어 있는 json object를 python객체로 읽으려면

py_object = json.loads(json_obj)
print(type(py_object),py_object)

<class 'dict'> {'Name': 'kim', 'Age': 20, 'Class': 'First'}


In [48]:
# 실습

class Array():

    def __init__(self):
        self.list2d = [[0,0,0,0],[0,0,0,0],[0,0,0,0]]
        #self.2dlist = None
        
    def makeListData(self):
        
        import random
        for row in range(3):
            for col in range(4):
                self.list2d[row][col] = random.randint(1,12)
                
    def printList(self):
        for row in range(3):
            for col in range(4):
                print(self.list2d[row][col], end = ' ')
            print()
        
        
    def findMatchNumber(self, compare):
        print("#일치하는 숫자:", end = " ")
        cnt = 0
        for row in range(3):
            for col in range(4):
                if self.list2d[row][col] == compare.list2d[row][col] :
                    cnt += 1
                    print("[", row, "]", "[", col, "]", "=", self.list2d[row][col], end = ' ' )
        
        print()
        print("일치하는 숫자 개수 :", cnt)

In [139]:
array1 = Array()
print("## 첫번째 Array 출력")
array1.makeListData()
array1.printList()
array2 = Array()
print("## 두번째 Array 출력")
array2.makeListData()
array2.printList()

array1.findMatchNumber(array2)

## 첫번째 Array 출력
6 1 6 7 
11 4 1 8 
10 9 10 10 
## 두번째 Array 출력
4 1 7 7 
1 11 8 8 
5 5 12 2 
#일치하는 숫자: [ 0 ] [ 1 ] = 1 [ 0 ] [ 3 ] = 7 [ 1 ] [ 3 ] = 8 
일치하는 숫자 개수 : 3
