### requests 함께 활용하여 로또 번호 가져오기

In [74]:
import requests
result = requests.get('https://dhlottery.co.kr/gameResult.do?method=byWin&drwNo=893')
result.encoding=None

In [75]:
import re
pat = re.compile('lrg\s+ball.+>(\d+)</span>')
pat.findall(result.text)

['1', '15', '17', '23', '25', '41', '10']

 ### 이메일의 도메인 앞부분 마킹 처리( 문자열 바꾸기 sub() 활용)

In [71]:
import re
user_list = ['ggoreb@naver.com', 'seorab@gmail.com', 'human@ggoreb.com']
regex = '(\w+@)\w+([.]com)'
pattern = re.compile(regex)
change = '\g<1>*****\g<2>'
for user in user_list:
    res = pattern.sub(change, user)
    print(res)

ggoreb@*****.com
seorab@*****.com
human@*****.com


### 전화번호 중 중간자리 숫자 마킹 처리

In [72]:
import re
text = '010-8478-8181'
regex = '([0-9]{3})-\d{3,4}-([0-9]{4})'
pattern = re.compile(regex)
change = '\g<1>-****-\g<2>'
res = pattern.sub(change, text)
print(res)

010-****-8181


### com과 net으로 끝나는 이메일 주소를 찾는 정규식 만들기(finditer())

In [60]:
import re
text = '''주로 사용하는 이메일 주소는 a@ggoreb.com 이고,
가끔 사용하는 이메일 주소는 b@ggoreb.info 입니다.
이번에 새로 만든 c@ggoreb.net도 있습니다.'''
regex = '\w+@\w+[.](com|net)'
pattern = re.compile(regex)
it = pattern.finditer(text)
for i in it:
    print(i.group())

a@ggoreb.com
c@ggoreb.net


### findall() 과 finditer()

In [62]:
import re
text = '1번 a@a.com 2번 b@b.org 3번 c@c.net'
regex = '\w+@\w+[.](com|net)' # 괄호로 감싸진 녀석들에 한해서 or 연산을 한다는 의미 (finditer()에서만 적용)
pattern = re.compile(regex)
it = pattern.finditer(text)
for i in it:
    print(i.group())

a@a.com
c@c.net


In [63]:
import re
text = '1번 a@a.com 2번 b@b.org 3번 c@c.net'
regex = '\w+@\w+[.](com|net)' # 괄호로 감싸진 녀석들이 그룹이 되어 findall()에 의해 출력이 되어버린다
pattern = re.compile(regex)
res = pattern.findall(text)
for it in res:
    print(it)

com
net


In [69]:
import re
text = '1번 a@a.com 2번 b@b.org 3번 c@c.net'
regex = '\w+@\w+[.][a-z]+'
pattern = re.compile(regex)
res = pattern.findall(text)
for it in res:
    if it[-3:-1] == 'com' or 'net':
        print(it)

a@a.com
b@b.org
c@c.net


### 여러 기호를 제외하고 검색어만 확인하는 정규식 만들기(findall(), \s*)

In [57]:
import re
text = '#서울,    #강남,    입력'
regex = '#(\w+),*\s*'
pattern = re.compile(regex)
res = pattern.findall(text)
print(res)
# 검색어는 #기호 다음부터 시작
# 여러 개의 검색어가 입력될 때는 comma(,)와 공백으로 구분
# 검색어 구분자 중 공백은 한개 이상이 입력될 수 있음

['서울', '강남']


### 문자열 중 전화번호 확인하는 정규식 만들기

In [1]:
import re
text = '대표자 : 꼬렙 사업자등록번호 : 100-99-23242324 대표전화 : 051-1234-5678'
regex = '[0-9]{2,3}-[0-9]{4}-[0-9]{4}'
pattern = re.compile(regex)
res = pattern.search(text)
print(res.group())
# 숫자 2~3자리-숫자4자리-숫자4자리

051-1234-5678


### 문자열 중 사업자등록번호만 확인하는 정규식 만들기(search())

In [49]:
import re
text = '대표자 : 꼬렙 사업자등록번호 : 100-99-23242324 대표전화 : 051-1234-5678'
regex = '[0-9]{3}-[0-9]{2}-[0-9]{8}'
pattern = re.compile(regex) # 숫자 3자리-숫자 2자리-숫자8자리 search
res = pattern.search(text)
print(res)

<re.Match object; span=(19, 34), match='100-99-23242324'>


### 영어와 숫자로만 구성되어 있는지 확인하는 정규식 만들기

In [48]:
import re
text = 'abcd1234'
regex = '^[a-zA-Z0-9]+$'
pattern = re.compile(regex)
res = pattern.match(text)
print(res)

<re.Match object; span=(0, 8), match='abcd1234'>


### 숫자 2자리 + 영어 소문자 2자리 + 숫자 4자리로 구성되었는지 확인하는 정규식 만들기

In [34]:
import re
text = '12ab1234'
regex = '\d{2}[a-z]{2}[0-9]{4}'
pattern = re.compile(regex)
res = pattern.match(text)
print(res)

<re.Match object; span=(0, 8), match='12ab1234'>


###  문자열의 내용 중 이름과 전화번호를 찾아내는 정규식 만들기

In [30]:
import re
text = '이름:꼬렙, 전화번호:1234'
regex = '^이름:(\w+), 전화번호:(\d+)$'
pattern = re.compile(regex)
res = pattern.match(text)
print(res.group(1))
print(res.group(2))

꼬렙
1234


### 문자열의 내용이 특정 형식에 맞는지 확인하는 정규식 만들기

In [20]:
import re
text = '안녕하세요. 저는 OOO에서 태어났고... 열심히 하겠습니다. 감사합니다.'
regex = '^안녕하세요.*열심히.*감사합니다[.]$'
pattern = re.compile(regex)
res = pattern.match(text)
print(res)

# '안녕하세요' 라는 문자열로 시작
#내용 중 '열심히' 라는 문자열 반드시 포함
#'감사합니다.' 라는 문자열로 종료

<re.Match object; span=(0, 41), match='안녕하세요. 저는 OOO에서 태어났고... 열심히 하겠습니다. 감사합니다.'>


### () 로 그룹 만들기

In [1]:
import re
text = '791111-1234567'
regex = '[0-9]{6}-([1-4]{1}\d{6}$)'
pattern = re.compile(regex)
res = pattern.match(text)
print(res)
print(res.group(1))

#앞자리 숫자 6개 / 뒷자리 숫자 7개 [0-9]{6}-\d{7}
#뒷자리의 시작 숫자는 1 ~ 4

<re.Match object; span=(0, 14), match='791111-1234567'>
1234567


### 은행계좌번호 출력

In [9]:
import re
text = '123-12-123456'
regex = '1\d{2}-1\d{1}-\d{6}'
pattern = re.compile(regex)
res = pattern.match(text)
print(res)

#숫자 3자리-숫자 2자리-숫자 6자리
#첫번째 3자리 숫자의 시작은 반드시 1
#두번째 2자리 숫자의 시작은 반드시 1

<re.Match object; span=(0, 13), match='123-12-123456'>


### 주민등록번호 출력

In [3]:
import re
text = '791111-1234567'
regex = '[0-9]{6}-[1-4]{1}\d{6}$'
pattern = re.compile(regex)
res = pattern.match(text)
print(res)

#앞자리 숫자 6개 / 뒷자리 숫자 7개 [0-9]{6}-\d{7}
#뒷자리의 시작 숫자는 1 ~ 4

<re.Match object; span=(0, 14), match='791111-1234567'>


In [10]:
import re # 정규 표현식 사용을 위한 모듈 import
pattern = re.compile('[a]')
print(pattern.match('a'))

<re.Match object; span=(0, 1), match='a'>
