# 정규표현식
<br/>
## 1) 확장문자
    - s : 공백 문자(스페이스, 탭, 폼 피드, 라인 피드)
    - d : 숫자
    - D : 숫자가 아닌 문자 [^0-9]와 동일
    - w : 알파벳, 숫자, 밑줄 기호(_) [A-Za-z0-9]
    - W : w의 반대 문자[^A-Za-z0-9]
    - 특수문자 : 특수문자 자체를 의미

## 2) 특수문자
    - * : 0회 이상 반복
    - + : 1회 이상 반복
    - ? : 0 또는 1개의 문자 매칭
    - . : 정확히 1개 문자 매칭
    
## 3) 플래그
    - g : 전역매칭(매칭되는 모든 값을 찾음)
    - i : 대소문자 무시
    - m : 여러 줄 매칭

## 4) 기타
    - () : 괄호로 묶인 패턴은 매칭된 다음, 그 부분을 기억한다.
    - | : ~ 또는 ~
    - {} : 반복 횟수

In [6]:
# re 모듈 - Regular Expression을 지원하는 모듈
import re
str = 'My id number is lgm0920'

# findall('검색어', 문자열) - 문자열에서 검색어와 일치하는 내용들을 모두 찾음
a = re.findall('a', str)
print(a)

b = re.findall('lgm', str)
print(b)

c = re.findall('m', str)
print(c)

d = re.findall('M', str)
print(d)

[]
['lgm']
['m', 'm']
['M']


In [10]:
str = 'My id number is lgm0920'

# 소문자를 모두 찾아서 리스트로 반환
a = re.findall('[a-z]', str)
print(a)

# + 반복 옵션, 소문자를 하나씩 끊어서 찾지 않고 연속해서 찾음(단어 단위)
b = re.findall('[a-z]+', str)
print(b)

# 대문자를 모두 찾아서 리스트로 반환
c = re.findall('[A-Z]', str)

# 숫자를 모두 찾아서 리스트로 반환
d = re.findall('[0-9]', str)
print(d)

# + 반복 옵션, 숫자를 하나씩 끊어서 찾지 않고 연속해서 찾음(단어 단위)
e = re.findall('[0-9]+', str)
print(e)

# 소문자 대문자 모두 찾아서 리스트로 반환
f = re.findall('[A-Za-z]', str)
print(f)

['y', 'i', 'd', 'n', 'u', 'm', 'b', 'e', 'r', 'i', 's', 'l', 'g', 'm']
['y', 'id', 'number', 'is', 'lgm']
['0', '9', '2', '0']
['0920']
['M', 'y', 'i', 'd', 'n', 'u', 'm', 'b', 'e', 'r', 'i', 's', 'l', 'g', 'm']


In [12]:
str = 'My id number is lgm_0920$%'

# 소문자, 대문자, 숫자(문자 단위)
a = re.findall('[a-zA-Z0-9]', str)
print(a)

# 소문자, 대문자, 숫자(단어 단위)
b = re.findall('[a-zA-Z0-9]+', str)
print(b)

# ^ not, 소문자, 대문자, 숫자가 아닌 문자들(공백문자, 특수문자)
c = re.findall('[^a-zA-Z0-9]', str)
print(c)

# 영문자, 숫자, _
d = re.findall('[\w]', str)
print(d)

# 영문자, 숫자, _ (단어 단위)
e = re.findall('[\w]+', str)
print(e)

# 영문자, 숫자, _가 아닌 경우
f = re.findall('[\W]+', str)
print(f)

['M', 'y', 'i', 'd', 'n', 'u', 'm', 'b', 'e', 'r', 'i', 's', 'l', 'g', 'm', '0', '9', '2', '0']
['My', 'id', 'number', 'is', 'lgm', '0920']
[' ', ' ', ' ', ' ', '_', '$', '%']
['M', 'y', 'i', 'd', 'n', 'u', 'm', 'b', 'e', 'r', 'i', 's', 'l', 'g', 'm', '_', '0', '9', '2', '0']
['My', 'id', 'number', 'is', 'lgm_0920']
[' ', ' ', ' ', ' ', '$%']


In [17]:
import re

# 비밀번호 정합성 체크를 위한 함수
def pwd_check(pwd):
    # 비밀번호 길이 확인 (6~12)
    if len(pwd) < 6 or len(pwd) > 12:
        print(pwd, "의 길이가 적당하지 않습니다.")
        return False
    
    # 숫자 혹은 알파벳 유무 확인
    # 소문자, 대문자, 숫자만 선택, 특수문자는 걸러지게 됨
    # findall() 리스트로 리턴, [0] 첫번째 요소
    if re.findall('[a-zA-Z0-9]+', pwd)[0] != pwd:
        print(pwd, '==> 숫자와 영문자로만 구성되어야 합니다.')
        return False
    
    # 알파벳 대소문자 확인
    # 소문자의 길이가 0이거나 대문자의 길이가 0이면
    if len(re.findall('[a-z]', pwd)) == 0 or len(re.findall('[A-Z]', pwd)) == 0:
        print(pwd, "==> 대문자와 소문자가 모두 필요합니다.")
        return False
    
    print(pwd, "==> 올바른 비밀 번호입니다.")
    return True

pwd_check('12abc')
pwd_check('123abc')
pwd_check('123abc%')
pwd_check('123Abc')

12abc 의 길이가 적당하지 않습니다.
123abc ==> 대문자와 소문자가 모두 필요합니다.
123abc% ==> 숫자와 영문자로만 구성되어야 합니다.
123Abc ==> 올바른 비밀 번호입니다.


True

In [19]:
import re

# 이메일 주소 정합성 체크를 위한 함수
# ^[] 시작, [^] not, $ 끝, \. 마침표
def email_check(email):
    exp = re.findall('^[a-z0-9]{2,}@[a-z0-9]{2,}\.[a-z{2,}$]', email)
    if len(exp) == 0:
        print(email, "===> 잘못된 이메일 형식입니다.")
        return
    
    print(email, "===> 올바른 이메일 주소입니다!")
    return

email_check("lee@gmail")
email_check("lee_gmail.com")
email_check("lee")
email_check("lee@gmail.com")

lee@gmail ===> 잘못된 이메일 형식입니다.
lee_gmail.com ===> 잘못된 이메일 형식입니다.
lee ===> 잘못된 이메일 형식입니다.
lee@gmail.com ===> 올바른 이메일 주소입니다!


[]
