---
### 1. 예외 처리

#### (1) 예외처리를 하는 이유

+ 자연스러운 예외 메시지를 출력
+ 프로그램의 비정상적인 종료를 방지

#### (2) 문법

    try:
        코드
        ...

    except[예외처리 클레스 [as 변수]]:
        코드 
        ...
        
    [else:
        코드 (예외가 발생하지 않았을 때 실행)
        ...]
        
    [finally:
        코드 (예외발생과는 무관하게 반드시 실행)
        ...]
        



In [1]:
def test(num):
    result = 10/num
    print(result)
    
    print("나머지 코드 실행~~")
    
###########################

test(3)
test(2)
test(0)

3.3333333333333335
나머지 코드 실행~~
5.0
나머지 코드 실행~~


ZeroDivisionError: division by zero

In [2]:
def test(num):
    
    try:
        result = 10/num
        print(result)
    
    except:
        print("다시 나눠주세요~")
    print("나머지 코드 실행~~~")
###########################

test(0)

다시 나눠주세요~
나머지 코드 실행~~~


In [3]:
def test(num):
    
    try:
        result = 10/num
        print(result)
    
    except ZeroDivisionError: # 0으로 나눴을때 에러를 잡아주는 예외처리 클래스
        print("0으로 나누면 안됩니다.")
    except:
        print("알수 없는 오류")
        
    print("나머지 코드 실행~~~")
###########################

test(100000)
test(0)
test("100000")

0.0001
나머지 코드 실행~~~
0으로 나누면 안됩니다.
나머지 코드 실행~~~
알수 없는 오류
나머지 코드 실행~~~


In [4]:
def test(num):
    
    try:
        result = 10/num
        print(result)
        arr = [0,1,2]
        print(arr[num])
    
    except ZeroDivisionError: # 0으로 나눴을때 에러를 잡아주는 예외처리 클래스
        print("0으로 나누면 안됩니다.")   
    except IndexError:    # 인덱스의 길이를 초과하여 접근할때 나타내는 예외처리 클래스
        print("인덱스의 접근이 잘못되었습니다.")

    except:
        print("알수 없는 오류")
        
    print("나머지 코드 실행~~~")
###########################

test(5)

2.0
인덱스의 접근이 잘못되었습니다.
나머지 코드 실행~~~


In [5]:
def test(num):
    
    try:
        result = 10/num
        print(result)
        arr = [0,1,2]
        print(arr[num])
    
    except (ZeroDivisionError,IndexError): # 0으로 나눴을때 에러를 잡아주는 예외처리 클래스
        print("0으로 나누거나 인덱스를 잘못 사용했습니다.")         # 인덱스의 길이를 초과하여 접근할때 나타내는 예외처리 클래스

    except:
        print("알수 없는 오류")
        
    print("나머지 코드 실행~~~")
###########################

test(5)

2.0
0으로 나누거나 인덱스를 잘못 사용했습니다.
나머지 코드 실행~~~


In [6]:
def test(num):
    
    try:
        result = 10/num
        print(result)
        arr = [0,1,2]
        print(arr[num])
    
    except ZeroDivisionError as e: # 0으로 나눴을때 에러를 잡아주는 예외처리 클래스
        print("0으로 나누면 안됩니다.",e)   
    except IndexError as e:    # 인덱스의 길이를 초과하여 접근할때 나타내는 예외처리 클래스
        print("인덱스의 접근이 잘못되었습니다.",e)

    except:
        print("알수 없는 오류")
        
    print("나머지 코드 실행~~~")
###########################

test(5)

2.0
인덱스의 접근이 잘못되었습니다. list index out of range
나머지 코드 실행~~~


In [7]:
def test(num):
    f = None
    try:
        result = 10/num
        print(result)
        arr = [0,1,2]
        print(arr[num])
        
        f = open("module.py")
    
    except ZeroDivisionError as e: # 0으로 나눴을때 에러를 잡아주는 예외처리 클래스
        print("0으로 나누면 안됩니다.",e)
        return
#        sys.exit()
    except IndexError as e:    # 인덱스의 길이를 초과하여 접근할때 나타내는 예외처리 클래스
        print("인덱스의 접근이 잘못되었습니다.",e)
        return
    except:
        print("알수 없는 오류")
        return
    finally:
        print("이곳의 코드는 반드시 실행됨")
        if f != None:
            f.close()
#     else: 
    print("나머지 코드 실행~~~")

###########################

test(2)
print("-"*35)
test(5)
print("-"*35)
test(0)


5.0
2
알수 없는 오류
이곳의 코드는 반드시 실행됨
-----------------------------------
2.0
인덱스의 접근이 잘못되었습니다. list index out of range
이곳의 코드는 반드시 실행됨
-----------------------------------
0으로 나누면 안됩니다. division by zero
이곳의 코드는 반드시 실행됨


In [8]:
# traceback

import traceback

def third():
    try:
        a = 10/0
        print(a)
    except ZeroDivisionError as e:
        print("에러 원인 : " , e)
        traceback.print_exc()
        
def second():
    third()
    
def first():
    second()

##############################

first()

에러 원인 :  division by zero


Traceback (most recent call last):
  File "<ipython-input-8-909e61598994>", line 7, in third
    a = 10/0
ZeroDivisionError: division by zero


In [9]:
# 예외를 일부러 발생 : raise

def test():
    try:
        a=10/2
        print(a)
        raise ZeroDivisionError
        
    except ZeroDivisionError as e:
        print("0으로 나누면 안됩니다. ", e)
    print("잘 실행되었습니까? ")
    
#####################################33

test()

5.0
0으로 나누면 안됩니다.  
잘 실행되었습니까? 


In [10]:
# 음수로 나눴을 때 예외 발생을 위한 예외 처리 클래스 작성

class NegativeDivideError(Exception): # Excpetion : 예외 처리 클래스의 가장 부모
    pass

def div(a,b):
    if b < 0:
        raise NegativeDivideError
    return a/b

def main():
    print("프로그램 시작")
    try:
        result = div(10,2)       
        print(result)
        
        
        result = div(10,-2)
        print(result)
        
    except NegativeDivideError as e:
        print("음수로 나눌 수 없다.")
        
#############################    
    
main()

프로그램 시작
5.0
음수로 나눌 수 없다.


---
## 2. 정규 표현식(Regular Expression)

+ http://docs.python.org/3.8/library/re.html

#### (1) 반복

    * : 0번 이상 반복, 특정 문자의 반복 횟수를 지정
        ex) ab* : a, ab, abbb, abbbbbb ....
            lo*l : ll, lol, lool, looool ....
            
    
    + : 1번 이상 반복
        ex) ab+ : ab, abb, abbbb, abbbbb ....
    
    
    ? : 0번 또는 1번만 반복
        ex) ab? : a, ab ....
       
       
    {M} : m회 반복
        ex) a{3}bc : aaabc ....
       
       
    {m,n} : m회부터 n회까지 반복
        ex) a[2,4]bc : aabc, aaabc, aaaabc ....
        
        
#### (2) 매칭

    . : 유일하게 줄바꿈 문자를 제외한 모든 문자와 매치
        ex) a.b : aab, abb, acb, adb ....
        
    
    ^ : 문자열의 시작과 매치
        ex) ^abc : abc, abcd, abcde, abcdef ....
        
    
    $ : 문자열의 마지막과 매치
    ex) a$ : zdba, ccca, dba ....
    
    
    [] : 문자 집합 중 한 문자와(한 문자 추출) 매치
        ex) [abc]zyz : axyz, bxyz, cxyz ....
            [a-z]bc : abc, bbc, cbc, dbc .... zbc
            a[.]b : a.b(보이는 그대로 문자 .이다)
            [a^bc]hello : (b는 재외) ahello, chello
            [a-zA-Z0-9]hello : 특수문자를 제외한 모든 숫자와 문자
            
            
#### (3) 특수문자(\문자)

    \d : 모든 숫자와 매치
        ex) ab\d\dc : ab00c, ab23ca, ab99c (a와 c 사이에 반드시 숫자가 와야됨)....    
            ab[0-9][0-9]c
       

    \D : 숫자가 아닌 문자와 매치
    
    
    \s : 공백 문자와 매치
    
    
    \S : 공백 문자를 제외한 모든 것과 매치
    
    
    \w : 특수문자를 제외한 숫자 또는 문자와 매치
    
    
    \W : 숫자 또는 문자가 아닌 모든 문자와 매치    

#### (4) 파이썬 제공하는 객체 또는 메서드

    - compile() : 정규 표현식 객체 생성
    - match() : 문자열의 처음부터 정규식과 매치되는지 조사
    - search() : 문자열 전체를 검색하여 정규식과 매치되는지 조사
    - findall() : 정규식과 매치되는 모든 문자열을 리스트로 리턴
    - finditer() : 정규식과 매치되는 모든 문자열을 반복 가능한 객체로 리턴    
    - split() : 문자열 분리
    - sub() : 문자열 변경(교체)
        sub("패턴","바꿀 문자열", "문자열", [바꿀 횟수])
      ...

In [74]:
#객체를 생성해서 사용하는 방법 : compile()

import re # 정규표현식 사용할수 있는 모듈
a = re.compile('[0-9] [a-z]+ .+')
print(bool(a.match("3 dofany dofeel07")))
print(bool(a.match("ayo 3 dofany dofeel07")))
print("-"*35)

# 객체를 생성하지 않고 바로 함수를 사용하는 방법 
print(bool(re.match("[0-9]*th","35th is everything"))) # re.match(패턴,데이터)
print(bool(re.match("[0-9]*th","   35th is everything")))

print(bool(re.search("[0-9]*th","   35th is everything")))
print(re.search("[0-9]*th","   35th is everything 60th is very very"))
print("-"*35)

# 전화번호와 매칭되는 패턴 작성
print(bool(re.match("[0-9]{3}-[0-9]{3,4}-[0-9]{4}", "010-222-2323은 내 전화번호 입니다.")))
print(bool(re.match("\d{3}-\d{3,4}-\d{4}", "010-222-2323은 내 전화번호 입니다.")))
print("-"*35)

# findall과 finditer
data = "life 3333 is 222 too 10 short"
p = re.compile("[a-z]+")


# p.match(data))
# p.search(data))

m = p.findall(data)
print(m)

n = p.finditer(data)
for i in n:
    print(i.group())
    print(i.span())

True
False
-----------------------------------
True
False
True
<re.Match object; span=(3, 7), match='35th'>
-----------------------------------
True
True
-----------------------------------
['life', 'is', 'too', 'short']
life
(0, 4)
is
(10, 12)
too
(17, 20)
short
(24, 29)


In [118]:
data = "1234 abc가나다ABC_555-6"
print(re.findall("[0-9]", data)) # 숫자 1개만 일치하는 패턴
print(re.findall("[0-9]+", data)) # 숫자 1개 이상 일치하는 패턴
print(re.findall("[0-9]{2}", data)) # 숫자 2개와 일치하는 패턴
print(re.findall("[0-9]{2,3}", data)) # 숫자 2개부터 3개까지 일치하는 패턴

data = "1234 abc가나다ABC_555-6 mbc air air"
print(re.findall(".bc",data)) # bc로 끝나는 세글자(mbc, abc)
print(re.findall("a..",data)) # a로 시작하는 세글자(abc, air, air)
print(re.findall("air$",data)) # air로 끝나는 세글자(air)
print(re.findall("^1[0-9]+",data)) # 반드시 1로 시작하는 세글자(1, 1234)
print(re.findall("[^1]+",data)) # 1을 뺀 모든 데이터(234 abc가나다ABC_555-6 mbc air air)

['1', '2', '3', '4', '5', '5', '5', '6']
['1234', '555', '6']
['12', '34', '55']
['123', '555']
['abc', 'mbc']
['abc', 'air', 'air']
['air']
['1234']
['234 abc가나다ABC_555-6 mbc air air']


In [130]:
# split
data = "mbc,kbs sbs:ytn"
print(data.split())
print(data.split(','))

print(re.split(",|:| ",data))
print(re.split("\W+",data))

['mbc,kbs', 'sbs:ytn']
['mbc', 'kbs sbs:ytn']
['mbc', 'kbs', 'sbs', 'ytn']
['mbc', 'kbs', 'sbs', 'ytn']


In [137]:
# sub
data = "1234 abc가나다ABC_555_6"
m = re.sub("[0-9]","8",data)
print(m)
print("-"*35)

# 주어진 데이터에서 구분기호를 ","로 통일
data = "mbc,kbs sbs:ytn"
m = re.sub("\W",",",data)
print(m)

8888 abc가나다ABC_888_8
-----------------------------------
mbc,kbs,sbs,ytn


In [143]:
# match, search 객체의 메서드

p = re.compile("[a-z]+")
data = "python 123 !? python"

m = p.match(data)
print(m)
print(m.group()) # 매치된 문자열을 돌려준다.
print(m.start(),m.end()) # 매치된 문자열의 시작과 끝 위치를 돌려준다.
print(m.span()) # 매치된 문자열의 (시작, 끝)에 해당하는 튜플을 돌려준다.

<re.Match object; span=(0, 6), match='python'>
python
0 6
(0, 6)


In [208]:
# 컴파일 옵션 : S(or DOTALL) => 줄바꿈 문자도 인식가능 , I(or IGNORECASE) => 대,소문자 구별없이 인식가능, M(or MULTILINE) =>

p = re.compile("a.b", re.S)

m1 = p.match("axb is bla bla bla~~~")
print(m1)

m2 = p.match("a+b is bla bla bla~~~")
print(m2)

m3 = p.match("a\nb is bla bla bla~~~")
print(m3)
print("-"*35)


#p = re.compile("[a-zA-Z]")
p = re.compile("[a-z]",re.I)
print(p.match("python"))
print(p.match("Python"))
print("-"*35)


data = """python one
life is too short
python two
you need python
Python three
"""

p = re.compile("^[p|P]ython\s\w+",re.M) # 첫글자 대,소문자 상관없이 python으로 시작하는 문자열 추출
print(p.findall(data))
print("-"*35)

data ="""
<a href="abc1.html">abc1</a>
<a href="abc2.html">abc2</a>
<a href="abc3.html">abc3</a>
<a href="xyz.html">xyz</a>
<a href="pic.jpg">pic</a>
"""

p = re.findall('href="(.+)"',data) # ["abc1.html", "abc2.html", "abc3.html", "xyz.html", "pic.jpg"]
print(p)

p = re.findall("\w+[.][h|j]\w+",data)
print(p)

<re.Match object; span=(0, 3), match='axb'>
<re.Match object; span=(0, 3), match='a+b'>
<re.Match object; span=(0, 3), match='a\nb'>
-----------------------------------
<re.Match object; span=(0, 1), match='p'>
<re.Match object; span=(0, 1), match='P'>
-----------------------------------
['python one', 'python two', 'Python three']
-----------------------------------
['abc1.html', 'abc2.html', 'abc3.html', 'xyz.html', 'pic.jpg']
['abc1.html', 'abc2.html', 'abc3.html', 'xyz.html', 'pic.jpg']
