## 1. 예외 처리


#### (1) 예외처리를 하는 이유
+ 자연스러운 예외 메시지를 출력
+ 프로그램의 비정상적인 종료를 방지


#### (2) 문법

    try :
        코드
        ...

    except [예외처리 클래스 [as 변수]]:
        코드
        ...
    
    [else :
        코드 (예외가 발생하지 않았을 때 실행)
        ... ]
        
    [finally:
        코드 (예외발생과는 무관하게 반드시 실행)
        ...]

In [3]:
def test(num):
    result = 10/num
    print(result)
    
    print("나머지 코드 실행~~~")
    
###########################################

test(3)
test(2)
test(0)

3.3333333333333335
나머지 코드 실행~~~
5.0
나머지 코드 실행~~~


ZeroDivisionError: division by zero

In [5]:
def test(num):
    try:
        result = 10/num
        print(result)
    except:
        print("에러가 났어요")
    
    print("나머지 코드 실행~~~")
    
###########################################

test(3)
test(0)

3.3333333333333335
나머지 코드 실행~~~
에러가 났어요
나머지 코드 실행~~~


In [10]:
def test(num):
    try:
        result = 10/num
        print(result)
    except ZeroDivisionError:
        print("0으로 나누면 안됩니다.")
    except:
        print("알수없는 오류")
        
    print("나머지 코드 실행~~~")
    
###########################################

test(3)
test(0)
test('가')

3.3333333333333335
나머지 코드 실행~~~
0으로 나누면 안됩니다.
나머지 코드 실행~~~
알수없는 오류
나머지 코드 실행~~~


In [13]:
def test(num):
    try:
        result = 10/num
        print(result)
        
        arr = [0, 1, 2]
        print(arr[num])
    except ZeroDivisionError:
        print("0으로 나누면 안됩니다.")
    except IndexError:
        print("인덱스를 잘못 사용했습니다")
    except:
        print("알수없는 오류")
        
    print("나머지 코드 실행~~~")
    
###########################################

test(5)

2.0
인덱스를 잘못 사용했습니다
나머지 코드 실행~~~


In [14]:
def test(num):
    try:
        result = 10/num
        print(result)
        
        arr = [0, 1, 2]
        print(arr[num])
    except (ZeroDivisionError, IndexError):
        print("0으로 나누거나 인덱스를 잘못 사용했습니다.")
    except:
        print("알수없는 오류")
        
    print("나머지 코드 실행~~~")
    
###########################################

test(5)

2.0
0으로 나누거나 인덱스를 잘못 사용했습니다.
나머지 코드 실행~~~


In [16]:
def test(num):
    try:
        result = 10/num
        print(result)
        
        arr = [0, 1, 2]
        print(arr[num])
    except ZeroDivisionError as e:
        print("0으로 나누면 안됩니다.", e)
    except IndexError as e:
        print("인덱스를 잘못 사용했습니다", e)
    except:
        print("알수없는 오류")
        
    print("나머지 코드 실행~~~")
    
###########################################

# test(0)
test(5)

2.0
인덱스를 잘못 사용했습니다 list index out of range
나머지 코드 실행~~~


In [18]:
def test(num):
    try:
        result = 10/num
        print(result)
        
        arr = [0, 1, 2]
        print(arr[num])
    except ZeroDivisionError as e:
        print("0으로 나누면 안됩니다.", e)
    except IndexError as e:
        print("인덱스를 잘못 사용했습니다", e)
    except:
        print("알수없는 오류")
    else:    
        print("나머지 코드 실행~~~")
    
###########################################

test(2)
test(5)

5.0
2
나머지 코드 실행~~~
2.0
인덱스를 잘못 사용했습니다 list index out of range


In [25]:
import sys

def test(num):
    f = None
    try:
        result = 10/num
        print(result)
        
        arr = [0, 1, 2]
        print(arr[num])
        
        f = open("cmdTest.py")
    except ZeroDivisionError as e:
        print("0으로 나누면 안됩니다.", e)
        # return
        # sys.exit()
    except IndexError as e:
        print("인덱스를 잘못 사용했습니다", e)
        return
    except:
        print("알수없는 오류")
        return
    finally:
        print("이곳의 코드는 반드시 실행됨.")
        if f != None:
            f.close()
        
    print("나머지 코드 실행~~~")
    
###########################################

#test(2)
#test(5)
test(0)

0으로 나누면 안됩니다. division by zero
이곳의 코드는 반드시 실행됨.
나머지 코드 실행~~~


In [27]:
# traceback
import traceback

def third():
    try:
        a = 10/0
        print(a)
    except ZeroDivisionError as e:
        print("에러원인 : ", e)
        traceback.print_exc()

def second():
    third()

def first():
    second()

##############################################

first()

에러원인 :  division by zero


Traceback (most recent call last):
  File "<ipython-input-27-f55327dc21b8>", line 6, in third
    a = 10/0
ZeroDivisionError: division by zero


In [29]:
# 예외를 일부러 발생 : raise

def test():
    try:
        a = 10/2
        print(a)
        raise ZeroDivisionError
    except ZeroDivisionError as e:
        print("0으로 나누면 안됩니다.", e)
        
    print("잘 실행되었습니까?")
    
#############################################

test()

5.0
0으로 나누면 안됩니다. 
잘 실행되었습니까?


In [33]:
# 음수로 나누었을 때 예외 발생을 위한 예외 처리 클래스 작성

class NegativeDivideError(Exception):
    pass

def positiveDivide(a, b):
    if b < 0:
        raise NegativeDivideError
    
    return a / b

def main():
    print("프로그램 시작")
    
    try:
        result = positiveDivide(10, 2)
        print(result)

        result = positiveDivide(10, -2)
        print(result)
    except NegativeDivideError as e:
        print("음수로 나눌 수 없다")
######################################

main()

프로그램 시작
5.0
음수로 나눌 수 없다


---
## 2. 정규 표현식(Regular Expression)

+ https://docs.python.org/3.8/library/re.html

#### (1) 반복

    * : 0회 이상
        ab* : a, ab, abb, abbb, abbbbbb, ....
        lo*l : ll, lol, lool, loool, loooooool, ...
        
    + : 1회 이상
        ab+ : ab, abb, abbbb, abbbbbbb, ....
        
    ? : 0회 또는 1회
        ab? : a, ab
        
    {m} : m회 반복
        a{3}bc : aaabc
        
    {m,n} : m회부터 n회까지 반복
        a{2,4}bc : aabc, aaabc, aaaabc
        
        
        
#### (2) 매칭

    . : 줄바꿈 문자를 제외한 모든 문자와 매치
        a.b : aab, abb, acb, adb, ....
        
    ^ : 문자열의 시작과 매치
        ^abc : abc, abcd, abcde, abcdefg, ....
        
    $ : 문자열의 마지막과 매치
        $a : zdba, ccca, dba, ....
        
    [] : 문자 집합 중 한 문자와 매치
        [abc]xyz : axyz, bxyz, cxyz
        [a-z]bc : abc, bbc, cbc, dbc, ... zbc
        a[.]b : a.b
        [a^bc]hello : ahello, chello
        [a-zA-Z0-9]hello : 특수문자를 제외한 모든 숫자와 문자
        
        
    
#### (3) 특수문자(\문자)

    \d : 모든 숫자와 매치
        ab\d\dc : ab00c, ab23c, ab99c, ...
        ab[0-9][0-9]c
        
    \D : 숫자가 아닌 문자와 매치
    
    \s : 공백문자와 매치
    
    \S : 공백문자를 제외한 모든 것과 매치
    
    \w : 숫자 또는 문자와 매치
    
    \W : 숫자 또는 문자가 아닌 모든 문자와 매치
    
    
    
#### (4) 파이썬 제공하는 객체 또는 메서드

    - compile() : 정규 표현식 객체 생성
    - match() : 문자열의 처음부터 정규식과 매치되는지 조사
    - search() : 문자열 전체를 검색하여 정규식과 매치되는지 조사
    - findall() : 정규식과 매치되는 모든 문자열을 리스트로 리턴
    - finditer() : 정규식과 매치되는 모든 문자열을 반복 가능한 객체로 리턴
    - split() : 문자열 분리
    - sub() : 변경(교체)
        sub("패턴", "바꿀 문자열", "문자열", [바꿀 횟수])
    ...

In [1]:
import re

In [17]:
# 객체를 생성해서 사용하는 방법
p = re.compile("[0-9] [a-z]+ .+")
print(bool(p.match("3 dkjdkj alkdf343")))
print(bool(p.match("aklfkl 3 dkjdkj alkdf343")))

print("------------------------------------------------------")

# 바로 함수를 사용하는 방법
print(bool(re.match("[0-9]*th", "35th is everything")))
print(bool(re.match("[0-9]*th", "   35th is everything")))
print(bool(re.search("[0-9]*th", "   35th is everything")))
print(re.search("[0-9]*th", "   35th is everything 60th is very very"))

print("------------------------------------------------------")

# 전화번호와 매칭되는 패턴 작성
print(bool(re.match("[0-9]{3}-[0-9]{3,4}-[0-9]{4}", "010-222-2323은 내 전화번호 입니다.")))
print(bool(re.match("\d{3}-\d{3,4}-\d{4}", "010-222-2323은 내 전화번호 입니다.")))

True
False
------------------------------------------------------
True
False
True
<re.Match object; span=(3, 7), match='35th'>
------------------------------------------------------
True
True


In [47]:
# findall 과 finditer

data = "life 3333 is 222 333 444 too 10 short"
p = re.compile("[a-z]+")

# p.match(data)
# p.search(data)

m = p.findall(data)
print(m)

m1 = p.finditer(data)
print(m1)

for i in m1:
    print(i)
    print(i.group())
    print(i.span())

['life', 'is', 'too', 'short']
<callable_iterator object at 0x000002880E9080A0>
<re.Match object; span=(0, 4), match='life'>
life
(0, 4)
<re.Match object; span=(10, 12), match='is'>
is
(10, 12)
<re.Match object; span=(25, 28), match='too'>
too
(25, 28)
<re.Match object; span=(32, 37), match='short'>
short
(32, 37)


In [32]:
data = "1234 abc가나다ABC_555_6"

print(re.findall("[0-9]", data)) # 숫자 1개만 일치하는 패턴
print(re.findall("[0-9]+", data)) # 숫자 1개이상 일치하는 패턴
print(re.findall("[0-9]{2}", data)) # 숫자 2개와 일치하는 패턴
print(re.findall("[0-9]{2,3}", data)) # 숫자 2개부터 3개까지 일치하는 패턴

['1', '2', '3', '4', '5', '5', '5', '6']
['1234', '555', '6']
['12', '34', '55']
['123', '555']


In [38]:
data = "1234 abc가나다ABC_555_6 mbc air air"

print(re.findall(".bc", data)) # bc로 끝나는 세글자 (abc, mbc)
print(re.findall("a..", data)) # a로 시작하는 세글자 (abc, air, air)
print(re.findall("air$", data)) # 가장 마지막에 air로 끝나는 패턴 (air)
print(re.findall("^1[0-9]+", data)) # 가장 처음에 1로 시작하는 숫자들 (1) (1234)
print(re.findall("[^1]+", data)) # 1을 뺀 모든 데이터 (234 abc가나다ABC_555_6 mbc air air)

['abc', 'mbc']
['abc', 'air', 'air']
['air']
['1234']
['234 abc가나다ABC_555_6 mbc air air']


In [43]:
# split

data = "mbc,kbs sbs:ytn"

print(data.split(" "))
print(data.split(","))

print(re.split(",|:| ", data))
print(re.split("\W+", data))

['mbc,kbs', 'sbs:ytn']
['mbc', 'kbs sbs:ytn']
['mbc', 'kbs', 'sbs', 'ytn']
['mbc', 'kbs', 'sbs', 'ytn']


In [46]:
# sub

data = "1234 abc가나다ABC_555_6"

# m = re.sub("[0-9]+", "888", data)
m = re.sub("[0-9]", "8", data)
print(m)

print("----------------------------------------")

# 주어진 데이터에서 구분기호를 ","로 통일
data = "mbc,kbs sbs:ytn"

m = re.sub("\W+", ",", data)
print(m)

8888 abc가나다ABC_888_8
----------------------------------------
mbc,kbs,sbs,ytn


In [51]:
# match, search 객체의 메서드

p = re.compile("[a-z]+")
data = "python 123 !? python"

m = p.match(data)
print(m)
print(m.group())
print(m.start(), m.end())
print(m.span())

<re.Match object; span=(0, 6), match='python'>
python
0 6
(0, 6)


In [61]:
# 컴파일 옵션 : S(or DOTALL), I(or IGNORECASE), M(or MULTILINE)

p = re.compile("a.b", re.S)

m1 = p.match("axb is bla bla bla~~~")
print(m1)

m2 = p.match("a+b is bla bla bla~~~")
print(m2)

m3 = p.match("a\nb is bla bla bla~~~")
print(m3)

print("------------------------------------------")

# p = re.compile("[a-z]")
# p = re.compile("[a-zA-Z]")
p = re.compile("[a-z]", re.I)

print(p.match("python"))
print(p.match("Python"))

print("------------------------------------------")

data = """python one
life is too short
python two
you need python
Python three
"""

p = re.compile("^[p|P]ython\s\w+", re.M) # 첫글자 대소문자 상관없이 python으로 시작하는 문자열
print(p.findall(data))

<re.Match object; span=(0, 3), match='axb'>
<re.Match object; span=(0, 3), match='a+b'>
<re.Match object; span=(0, 3), match='a\nb'>
------------------------------------------
<re.Match object; span=(0, 1), match='p'>
<re.Match object; span=(0, 1), match='P'>
------------------------------------------
['python one', 'python two', 'Python three']


In [66]:
data = """
<a href="abc1.html">abc1</a>
<a href="abc2.html">abc2</a>
<a href="abc3.html">abc3</a>
<a href="xyz.html">xyz</a>
<a href="pic.jpg">pic</a>
"""
# ["abc1.html", "abc2.html", "abc3.html", "xyz.html", "pic.jpg"]

p = re.findall('href="(.+)"', data)
print(p)

['abc1.html', 'abc2.html', 'abc3.html', 'xyz.html', 'pic.jpg']


In [63]:
p=re.compile("[\s|\w]+[.]html",re.M)
print(p.findall(data))

['abc1.html', 'abc2.html', 'abc3.html', 'xyz.html']


In [64]:
p = re.compile("\w{3,4}[.]\w{3,4}", re.M)
p.findall(data)

['abc1.html', 'abc2.html', 'abc3.html', 'xyz.html', 'pic.jpg']

In [65]:
p=re.compile("\w*[.]\w*",re.M)
print(p.findall(data))

['abc1.html', 'abc2.html', 'abc3.html', 'xyz.html', 'pic.jpg']


In [70]:
p = re.findall('\w+[.][h|j]\w+',data)
print(p)

['abc1.html', 'abc2.html', 'abc3.html', 'xyz.html', 'pic.jpg']
