## 07-1 정규 표현식 살펴보기

In [2]:
data="""
park 800905-1049118
kim  700905-1059119
"""

result=[]
for line in data.split("\n"):
    word_result=[]
    for word in line.split(" "):
        if len(word)==14 and word[:6].isdigit() and word[7:].isdigit():
            word=word[:6]+"-"+"*******"
        word_result.append(word)
    result.append(" ".join(word_result))
print("\n".join(result))


park 800905-*******
kim  700905-*******



In [5]:
#정규식 사용

import re

data="""
park 800905-1049118
kim  700905-1059119
"""

pat=re.compile("(\d{6})[-]\d{7}")
print(pat.sub("\g<1>-*******", data))


park 800905-*******
kim  700905-*******



## 07-2.3. 정규식을 이용한 문자열 검색

In [13]:
import re

p=re.compile("[a-z]+")

-----
match : 문자열의 처음부터 정규식과 매치되는지 조사

In [8]:
m=p.match("python")
print(m)

<_sre.SRE_Match object; span=(0, 6), match='python'>


In [9]:
m=p.match("3 python")
print(m)

None


In [11]:
p=re.compile("[a-z]+")
m=p.match("string goes here")

if m:
    print("Match found: ", m.group())
else:
    print("No Match")

Match found:  string


-----
search : match와 비슷하지만 문자열 처음부터가 아니라 전체를 검색

In [14]:
m=p.search("python")
print(m)

<_sre.SRE_Match object; span=(0, 6), match='python'>


In [15]:
m=p.search("3 python")
print(m)

<_sre.SRE_Match object; span=(2, 8), match='python'>


-----
filndall

In [16]:
result=p.findall("life is too short")
print(result)

['life', 'is', 'too', 'short']


-----
finditer : findall과 동일하지만 반복가능한 객체를 돌려줌

In [17]:
result=p.finditer("life is too short")
print(result)

<callable_iterator object at 0x000001B1A4394CF8>


In [19]:
for r in result: print(r)

<_sre.SRE_Match object; span=(5, 7), match='is'>
<_sre.SRE_Match object; span=(8, 11), match='too'>
<_sre.SRE_Match object; span=(12, 17), match='short'>


## 07-2.4. match 객체의 메서드

In [20]:
m=p.match("python")
m.group()

'python'

In [21]:
m.start()

0

In [22]:
m.end()

6

In [23]:
m.span()

(0, 6)

In [24]:
m=p.search("3 python")
m.group()

'python'

In [25]:
m.start()

2

In [26]:
m.end()

8

In [27]:
m.span()

(2, 8)

-----
모듈 단위로 수행하기

In [28]:
p=re.compile("[a-z]+")
m=p.match("python")

In [29]:
m=re.match("[a-z]+", "python")

## 07-2.5. 컴파일 옵션

-----
DOTALL(S) : .이 줄바꿈 문자를 포함하여 모든 문자와 매치할 수 있도록 한다.

In [30]:
import re

p=re.compile("a.b")
m=p.match("a\nb")
print(m)

None


In [31]:
p=re.compile("a.b", re.DOTALL)
m=p.match("a\nb")
print(m)

<_sre.SRE_Match object; span=(0, 3), match='a\nb'>


-----
IGNORECASE(I):대소문자에 관계없이 매치할 수 있도록 한다.

In [32]:
p=re.compile("[a-z]", re.I)
p.match("python")

<_sre.SRE_Match object; span=(0, 1), match='p'>

In [33]:
p.match("Python")

<_sre.SRE_Match object; span=(0, 1), match='P'>

In [34]:
p.match("PYTHON")

<_sre.SRE_Match object; span=(0, 1), match='P'>

-----
MULTILINE(M):여러줄과 매치할 수 있도록 한다.(^,$ 메타문자의 사용과 관계가 있는 옵션이다.)

In [35]:
import re
p=re.compile("^python\s\w+")

data="""python one
life is too short
python two
you need python
python three"""

print(p.findall(data))

['python one']


In [36]:
import re
p=re.compile("^python\s\w+", re.MULTILINE)

data="""python one
life is too short
python two
you need python
python three"""

print(p.findall(data))

['python one', 'python two', 'python three']


-----
VERBOSE(X):verbose모드를 사용할 수 있도록 한다.(정규식을 보기 편하게 만들 수 있고 주석등을 사용할 수 있게 된다.)

In [37]:
charref=re.compile(r"&[#](0[0-7]+|[0-9]+|x[0-9a-fA-F]+);")

In [39]:
charref=re.compile(r"""
&[#]               #Start of a numeric entity reference
(
0[0-7]+            #Octal form
|[0-9]+            #Decimal form
|x[0-9a-fA-F]+     #Hexadecimal form
)
;                  #Trailing semicolon
""", re.VERBOSE)

## 07-2.6. 백슬래시 문제

In [1]:
import re

p=re.compile("\\section")

In [2]:
p=re.compile("\\\\section")

In [3]:
p=re.compile(r"\\section")

## 07-3.1 메타문자

-----
| : or과 동일한 의미

In [5]:
p=re.compile("Crow|Servo")
m=p.match("CrowHello")
print(m)

<_sre.SRE_Match object; span=(0, 4), match='Crow'>


-----
^:문자열의 맨 처음과 일치함을 의미

In [6]:
print(re.search("^Life", "Life is too short"))

<_sre.SRE_Match object; span=(0, 4), match='Life'>


In [7]:
print(re.search("^Life", "My Life"))

None


In [8]:
print(re.search("^Life", "life is too short"))

None


-----
$:문자열의 끝과 매치함을 의미(^과 반대)

In [9]:
print(re.search("short$", "Life is too short"))

<_sre.SRE_Match object; span=(12, 17), match='short'>


In [10]:
print(re.search("short$", "Life is too short, you need python"))

None


-----
\A:문자열의 처음과 매치됨(re.MULTILINE 옵션 사용할 경우 ^과 달리 \A는 줄과 상관없이 전체 문자열의 처음하고만 매치)

-----
\Z:문자열의 끝과 매치됨(\A와 마찬가지로 전체 문자열의 끝과 매치)

-----
\b:단어 구분자. 보통 whitespace에 의해 구분됨

In [11]:
p=re.compile(r"\bclass\b")
print(p.search("no class at all"))

<_sre.SRE_Match object; span=(3, 8), match='class'>


In [12]:
print(p.search("the declassified algorith"))

None


-----
\B:whitespace로 구분된 단어가 아닌 경우에만 매치(\b와 반대)

In [13]:
p=re.compile(r"\Bclass\B")
print(p.search("no class at all"))

None


In [14]:
print(p.search("the declassified algorithm"))

<_sre.SRE_Match object; span=(6, 11), match='class'>


In [15]:
print(p.search("one subclass is"))

None


## 07-3.2. 그루핑

In [16]:
p=re.compile("(ABC)+")
m=p.search("ABCABCABC OK?")
print(m)

<_sre.SRE_Match object; span=(0, 9), match='ABCABCABC'>


In [17]:
print(m.group())

ABCABCABC


In [27]:
p=re.compile(r"(\w+)\s+((\d+)[-]\d+[-]\d+)")
m=p.search("park 010-1234-1234")

In [28]:
print(m.group(1))

park


In [29]:
print(m.group(2))

010-1234-1234


In [30]:
print(m.group(3))

010


-----
그루핑된 문자열 재참조하기

In [31]:
p=re.compile(r"(\b\w+)\s+\1")          #(그룹)+" "+그룹과 동일한 단어 => 2개의 동일한 단어를 연속적으로 사용해야만 매치됨
p.search("Paris in the the spring").group()        # \1은 정규식의 그룹 중 첫 번째 그룹을 가리킴. \2는 두 번째 그룹

'the the'

-----
그루핑된 문자열에 이름 붙이기

In [32]:
p=re.compile(r"(?P<name>\w+)\s+((\d+)[-]\d+[-]\d+)")
m=p.search("park 010-1234-1234")
print(m.group("name"))

park


In [34]:
p=re.compile(r"(?P<word>\b\w+)\s+(?P=word)")
p.search("Paris in the the spring").group()

'the the'

## 07-3.3. 전방 탐색

In [35]:
p=re.compile(".+:")
m=p.search("http://google.com")
print(m.group())

http:


-----
긍정형 전방 탐색:(?=...) ...에 해당되는 정규식과 매치되어야 하며 조건이 통과되어도 문자열이 소비되지 않음

In [37]:
p=re.compile(".+(?=:)")           #(?=:)으로 변경함. 검색결과에서는 :이 제거된 후 돌려주는 효과가 있음
m=p.search("http://google.com")
print(m.group())

http


In [38]:
p=re.compile(r".*[.]([^b].?.?|.[^a]?.?|..?[^t]?)$")     #조건이 늘어날수록 너무 복잡해짐. 이 때 쓰는게 부정형 전방 탐색

-----
부정형 전방 탐색:(?!...)...에 해당회는 정규식과 매치되지 않아야하며 조건이 통과되어도 문자열이 소비되지 않음

In [40]:
p=re.compile(r".*[.](?!bat$).*$")         #확장자가 bat가 아닌 경우에만 통과됨

In [41]:
p=re.compile(r".*[.](?!bat$|exe$).*$")    #exe 확장자 제외 조건 추가

## 07-3.4. 문자열 바꾸기

In [42]:
p=re.compile("(blue|white|red)")
p.sub("colour","blue socks and red shoes")    #첫 번째 매개변수 = 바꿀 문자열 / 두 번째 매개변수 = 대상 문자열

'colour socks and colour shoes'

In [44]:
p.sub("colour","blue socks and red shoes", count=1)     #바꾸기 횟수 제한

'colour socks and red shoes'

In [45]:
p.subn("colour","blue socks and red shoes")   #subn 메서드는 sub와 동일한 기능. 차이는 결과 튜플로 반환 + 바꾸기 발생 횟수 보여줌

('colour socks and colour shoes', 2)

-----
sub메서드 사용 시 참조 구문 사용하기

In [46]:
# 이름+전화번호 -바꾸기-> 전화번호+이름 

p=re.compile(r"(?P<name>\w+)\s+(?P<phone>(\d+)[-]\d+[-]\d+)")
print(p.sub("\g<phone> \g<name>", "park 010-1234-1234"))

010-1234-1234 park


In [47]:
p=re.compile(r"(?P<name>\w+)\s+(?P<phone>(\d+)[-]\d+[-]\d+)")
print(p.sub("\g<2> \g<1>", "park 010-1234-1234"))

010-1234-1234 park


-----
sub메서드의 매개변수로 함수 넣기

In [48]:
def hexrepl(match):
    value=int(match.group())
    return hex(value)

In [49]:
p=re.compile(r"\d+")

In [50]:
p.sub(hexrepl, "Call 65490 for printing, 49152 for user code.")

'Call 0xffd2 for printing, 0xc000 for user code.'

## 07-3.5. Greedy vs. Non-Greedy

In [52]:
s="<html><head><title>Title</title>"
len(s)

32

In [53]:
print(re.match("<.*>",s).span())

(0, 32)


In [55]:
print(re.match("<.*>",s).group())

<html><head><title>Title</title>


In [56]:
print(re.match("<.*?>",s).group())   #?로 가능한 한 가장 최소한의 반복을 수행하도록 도와줌

<html>


## 08장 종합문제

-----
Q1. 문자열 바꾸기

In [60]:
a1="a:b:c:d"

a1=a1.split(":")
"#".join(a1)

'a#b#c#d'

-----
Q2. 딕셔너리 값 추출하기

In [144]:
a2={"A":90, "B":80}
a2["C"]

#"C"에 해당하는 key값이 없을 경우 오류 대신 70을 얻을 수 있도록 수정

KeyError: 'C'

In [64]:
a2["C"]=70
a2["C"]

#이거.. 아니다... ㅠ

70

In [147]:
#답

#딕셔너리의 get함수 사용
a2={"A":90,"B":80}
a2.get("C",70)

70

-----
Q3. 리스트의 더하기와 extend 함수

In [65]:
# +기호 사용

a3=[1,2,3]
a3=a3+[4,5]

a3

[1, 2, 3, 4, 5]

In [66]:
#extend 사용

a3=[1,2,3]
a3.extend([4,5])

a3

[1, 2, 3, 4, 5]

In [67]:
#차이점이 있는가? 있다면 차이점을 설명하시오.

In [68]:
a3=[1,2,3]
id(a3)

2727872146504

In [69]:
a3=a3+[4,5]
id(a3)

2727872126408

In [70]:
a3=[1,2,3]
id(a3)

2727872165960

In [71]:
a3.extend((4,5))
id(a3)

2727872165960

In [72]:
# + 를 사용하면 id값이 달라짐. extend를 사용하면 id값이 이전과 동일함

-----
Q4. 리스트 총합 구하기

In [79]:
#50점 이상 점수의 총합

A=[20,55,67,82,45,33,90,87,100,25]

result=0
for i in A:
    if i>=50:
        result = i+result
    else: pass

print(result)

481


In [148]:
#책의 답

A=[20,55,67,82,45,33,90,87,100,25]

result=0
while A:
    mark=A.pop()
    if mark>=50:
        result += mark
        
print(result)

481


-----
Q5. 피보나치 함수

In [151]:
#n이하까지 피보나치 수열을 출력하는 함수를 작성

def add_seq(n):
    result=[0,1]
    result_tot=0
    while result_tot<=n:
        result_tot=result[-1]+result[-2]    
        if result_tot>n:
            False
        else:
            result.append(result_tot)
    
    return result


In [152]:
add_seq(20)

[0, 1, 1, 2, 3, 5, 8, 13]

In [156]:
#우정이가 고쳐준 답안

def add_seq(n):
    result=[0,1]
    result_tot=0
    while len(result)<n:
        result_tot=result[-1]+result[-2]    
        if len(result)>n:
            False
        else:
            result.append(result_tot)
    
    return result

In [157]:
add_seq(10)

[0, 1, 1, 2, 3, 5, 8, 13, 21, 34]

In [158]:
#책의 답

def fib(n):
    if n==0 : return 0
    if n==1 : return 1
    return fib(n-2) + fib(n-1)

for i in range(10):
    print(fib(i))

0
1
1
2
3
5
8
13
21
34


-----
Q6. 숫자의 총합 구하기

In [110]:
#입력받은 숫자의 총합을 구하는 프로그램 작성(65,45,2,3,45,8)

def add_Q6(*argv):
    total=0
    for i in argv:
        total += i
    
    return total

In [111]:
add_Q6(65,45,2,3,45,8)

168

In [11]:
#프로그램을!작성! 책의 답

user_input = input("숫자를 입력하세요: ")
numbers = user_input.split(",")             #문자열을 split을 하면 list로 돌려줌
total = 0
for n in numbers:
    total += int(n) 
print(total)

숫자를 입력하세요: 65,45,2,3,45,8
168


-----
Q7. 한 줄 구구단

In [119]:
#2~9의 숫자 중 하나를 입력받아 해당 숫자의 구구단을 한 줄로 출력하는 프로그램을 작성

def gugu(n):
    for i in range(1,10):
        print(n*i, end=" ")

In [120]:
gugu(3)

3 6 9 12 15 18 21 24 27 

In [16]:
#프로그램을! 작성!

num=int(input("2~9사이의 숫자 입력: "))

for i in range(1,10):
    print(num*i, end=" ")

2~9사이의 숫자 입력: 5
5 10 15 20 25 30 35 40 45 

-----
Q8. 역순 저장

In [138]:
#다음 abc.txt 파일 내용을 역순으로 저장하기

f8=open("C:\\Test\\JT_Python\\abc.txt", "r")
data8=f8.read()
print(data8)
f8.close()

AAA
BBB
CCC
DDD
EEE


In [128]:
#for 문을 이용해 문자열을 역순으로 만드는 법

s='abcde'
s_reverse=''

for char in s:
    s_reverse=char+s_reverse
    print(s_reverse)    #과정을 보기위해 넣음 
    
print(s_reverse)

a
ba
cba
dcba
edcba
edcba


In [139]:
data8_re=''

for i in data8:
    data8_re=i+data8_re
    
print(data8_re)

EEE
DDD
CCC
BBB
AAA


In [140]:
f8=open("C:\\Test\\JT_Python\\abc.txt", "w")
f8.write(data8_re)
f8.close()

In [141]:
f8=open("C:\\Test\\JT_Python\\abc.txt", "a")
f8.write("\n243")
f8.close()

In [142]:
f8=open("C:\\Test\\JT_Python\\abc.txt", "r")
check8=f8.read()
print(check8)
f8.close()

EEE
DDD
CCC
BBB
AAA
243


In [17]:
#책의 답 : 흠 근데 마지막 숫자는...?

f = open('C:\\Test\\JT_Python\\abc.txt', 'r')
lines = f.readlines()    # 모든 라인을 읽음
f.close()

lines.reverse()          # 읽은 라인을 역순으로 정렬

f = open('C:\\Test\\JT_Python\\abc.txt', 'w')
for line in lines:
    line = line.strip()  # 포함되어 있는 줄 바꿈 문자 제거
    f.write(line)
    f.write('\n')        # 줄 바꿈 문자 삽입
f.close()

-----
Q9. 평균값 구하기

In [9]:
#sample.txt 파일의 숫자 값을 모두 읽어 총합과 평균 값을 구한 후 평균 값을 result.txt 파일에 쓰는 프로그램을 작성

f9=open("C:\\Test\\JT_Python\\sample.txt", "r")
data9=f9.read()
f9.close()

nums=data9.split("\n")
total=0

for i in nums:
    total += int(i)

print(total)

average=total/len(nums)
print(average)

f9=open("C:\\Test\\JT_Python\\result.txt", "w")
f9.write(str(average))
f9.close()

790
79.0


-----
Q10. 사칙연산 계산기

In [42]:
#다음과 같이 동작하는 클래스 Calculator를 작성
#하다가 안되서 답보고 따라함 ㅎ

class Calculator:
    def __init__(self, datalist):
        self.datalist=datalist
        
    def add(self):
        result=0
        for n in self.datalist:
            result += int(n)
        return result
    
    def avg(self):
        total=self.add()
        return total/len(self.datalist)
    
cal1 = Calculator([1,2,3,4,5]) 
print (cal1.add())
print (cal1.avg())

cal2 = Calculator([6,7,8,9,10]) 
print (cal2.add())
print (cal2.avg())

15
3.0
40
8.0


In [None]:
#답

class Calculator:
    def init (self, numberList): 
        self.numberList = numberList

    def add(self): result = 0
        for num in self.numberList: 
            result += num
        return result

    def avg(self):
        total = self.add()
        return total / len(self.numberList)

cal1 = Calculator([1,2,3,4,5]) 
print (cal1.add())
print (cal1.avg())

cal2 = Calculator([6,7,8,9,10]) 
print (cal2.add())
print (cal2.avg())

-----
Q11. 모듈 사용 방법

In [143]:
#명령 프롬프트 창에서 파이썬 셸을 열어 mymod.py 모듈을 import해서 사용할 수 있는 방법을 기술
#책보고 따라함ㅎㅎ..

# 1.sys모듈 사용하기
import sys
sys.path.append("C:\\Test\\JT_Python")
import mymod

# 2.PYTHONPATH 환경변수 사용하기
C:\\Users\\personal>set PYTHONPATH=C:\\Test\\JT_Python
C:\\Users\\personal>python
import mymod

#3. 현재 디렉터리 사용하기
C:\\Users\\personal>cd C:\\Test\\JT_Python
C:\\Test\\JT_Python>python
import mymod

-----
Q12. 오류와 예외 처리

In [43]:
#다음 코드의 실행 결과 예측 및 이유 설명

result = 0

try:
    [1, 2, 3][3]
    "a"+1
    4 / 0
except TypeError:
    result += 1
except ZeroDivisionError:
    result += 2
except IndexError:
    result += 3
finally:
    result += 4

print(result)

#3+1+2=6 -> 응 아니야ㅠㅠㅠㅠㅠㅠㅠㅠㅠ

7


In [44]:
[1,2,3][3]

IndexError: list index out of range

In [45]:
"a"+1

TypeError: Can't convert 'int' object to str implicitly

In [46]:
4/0

ZeroDivisionError: division by zero

In [47]:
#에러 유형은 다 맞긴함
#try문 안의 [1, 2, 3][3] 이라는 문장 수행 시 IndexError가 발생하여 except IndexError: 구문으로 이동
#result에 3이 더해져 3이 되고, 최종적으로 finally 구문이 실행되어 result에 4가 더해져 7이 됨

-----
Q13. DashInsert 함수

In [20]:
#DashInsert 함수: 숫자로 구성된 문자열을 입력받아 문자열 안에서 (홀수 연속->두 수 사이 - 추가),(짝수 연속-> * 추가)
#DashInsert 함수 완성하기

data13=input("숫자를 입력하세요: ")

data13=list(data13)
data1313=list(data13[1:])

result=[]

for n in data13:
    for m in data1313:
        if int(n)%2==1 & int(m)%2==1:
            result.append(n+"-")
        elif int(n)%2==0 & int(m)%2==0:
            result.append(n+"*")
        else:
            result.append(n)
    
print(result)

#걍 답지보고 따라함..

숫자를 입력하세요: 1234
['1', '1-', '1', '2*', '2*', '2*', '3', '3-', '3', '4*', '4*', '4*']


In [24]:
#책의 답

data13=input("숫자를 입력하세요: ")
data13=list(map(int,data13))

result=[]

for i, num in enumerate(data13):
    result.append(str(num))
    if i < len(data13)-1:                   # 다음 수가 있다면
        is_odd = num % 2 == 1                # 현재 수가 홀수
        is_next_odd = data13[i+1] % 2 == 1  # 다음 수가 홀수
        if is_odd and is_next_odd:           # 연속 홀수
            result.append("-")
        elif not is_odd and not is_next_odd: # 연속 짝수
            result.append("*")

print("".join(result))

숫자를 입력하세요: 1122233334
1-12*2*23-3-3-34


-----
Q14. 문자열 압축하기

In [25]:
#문자열을 입력받아 같은 문자가 연속적으로 반복되는 경우, 그 반복 횟수를 표시해 문자열을 압축하여 표시
#책 보고 품

def compress_string(s):
    _c = ""
    cnt = 0
    result = ""
    for c in s:
        if c!=_c:
            _c = c
            if cnt: result += str(cnt)
            result += c
            cnt = 1
        else:
            cnt +=1
    if cnt: result += str(cnt)
    return result

print (compress_string("aaabbcccccca"))

a3b2c6a1


-----
Q15. Duplicate Numbers

In [33]:
#0~9의 문자로 된 숫자를 입력받았을 때, 이 입력값이 0~9의 모든 숫자를 각각 한 번씩만 사용한 것인지 확인하는 함수를 작성
#책 보고 함

data15=input("숫자를 입력하세요: ")
data15=list(map(int, data15))

def num_ck(data15):
    result=[]
    
    for n in data15:
        if n not in result:
            result.append(n)
            
    if len(data15) == len(result): print(True)
    else: print(False)

숫자를 입력하세요: 1234567


In [35]:
num_ck(data15)

True


In [None]:
#책 답

def chkDupNum(s):
    result = []
    for num in s:
        if num not in result:
            result.append(num)
        else:
            return False
    return len(result) == 10

-----
Q16. 모스 부호 해독

In [36]:
#문자열 형식으로 입력받은 모스 부호(dot:. dash:-)를 해독하여 영어 문장으로 출력하는 프로그램을 작성
#책 보고 함

dic = {
    '.-':'A','-...':'B','-.-.':'C','-..':'D','.':'E','..-.':'F',
    '--.':'G','....':'H','..':'I','.---':'J','-.-':'K','.-..':'L',
    '--':'M','-.':'N','---':'O','.--.':'P','--.-':'Q','.-.':'R',
    '...':'S','-':'T','..-':'U','...-':'V','.--':'W','-..-':'X',
    '-.--':'Y','--..':'Z'
}

def morse(src):
    result = []
    for word in src.split("  "):
        for char in word.split(" "):
            result.append(dic[char])
        result.append(" ")
    return "".join(result)


print(morse('.... .  ... .-.. . . .--. ...  . .- .-. .-.. -.--'))

HE SLEEPS EARLY 


-----
Q17. 기초 메타 문자

In [None]:
#다음 중 정규식 a[.]{3,}b 과 매치되는 문자열은?

#1. acccb
#2. a....b
#3. aaab
#4. a.cccb

#정답은 2 -> {3,}은 앞 문자의 반복횟수가 3회 이상이어야 매치 

In [1]:
#확인

import re

p=re.compile("a[.]{3,}b")

print(p.match("acccb"))
print(p.match("a...b"))
print(p.match("aaab"))
print(p.match("a.cccb"))

None
<_sre.SRE_Match object; span=(0, 5), match='a...b'>
None
None


-----
Q18. 문자열 검색

In [2]:
#다음 코드의 결괏값은?

import re
p = re.compile("[a-z]+")    #소문자로 이루어진 단어 정규식
m = p.search("5 python")    #문자열 python과 매치. search는 문자 전체를 매치
m.start() + m.end()

#'pn' 아닐까... -> 응 아니야

10

In [3]:
#확인

print(m.start())     #매치 시작 문자열은 p -> 인덱스 2
print(m.end())       #매치 끝 문자열은 n -> 인덱스 8

2
8


-----
Q19. 그루핑

In [59]:
#휴대폰 번호 뒷자리인 숫자 4개를 ####로 바꾸는 프로그램을 정규식을 사용하여 작성

import re

data_num="""
park 010-9999-9988
kim 010-9909-7789
lee 010-8789-7768
"""

num=re.compile(r"(\w+)\s+\d+[-]\d+[-](\d+)")
num2=num.match(data_num)
print(num2)

#왜 안돼..?

None


In [1]:
#답

import re

s = """
park 010-9999-9988
kim 010-9909-7789
lee 010-8789-7768
"""

pat = re.compile("(\d{3}[-]\d{4})[-]\d{4}")
result = pat.sub("\g<1>-####", s)

print(result)


park 010-9999-####
kim 010-9909-####
lee 010-8789-####



-----
Q20. 전방 탐색

In [3]:
#긍정형 전방 탐색 기법을 사용하여 .com, .net이 아닌 이메일 주소는 제외시키는 정규식을 작성
#답지보고 따라함...ㅎㅎㅎ

import re

email = re.compile(".*[@].*[.](?=com$|net$).*$")     # *$는 확장자를 의미

print(email.match("python@gmail.com"))
print(email.match("naver@daum.net"))
print(email.match("kakao@myhome.co.kr"))

<_sre.SRE_Match object; span=(0, 16), match='python@gmail.com'>
<_sre.SRE_Match object; span=(0, 14), match='naver@daum.net'>
None
