#Regular Expression

## 정규표현식 강의

정규표현식(정규식;Regular expression)은 **문자열에서 특정 문자 조합을 찾기 위한 패턴**으로, Python뿐 아니라 문자열을 다루는 모든 곳에서 사용합니다.

Python에서는 re라는 라이브러리에서 정규표현식 처리 함수를 제공합니다.

참조: https://docs.python.org/ko/3/library/re.html

re를 사용하기 위해서는 `re` 패키지를 불러와야 합니다.

In [None]:
import re

###메타 문자

메타 문자는 정규표현식에서 특별한 용도로 사용하는 문자입니다.

#### 주요 메타문자 목록
```
. ^ $ * + ? { } [ ] \ | ( )
```
#### 메타문자별 의미와 예
```
[abc]        # a 혹은 b 혹은 c 
```
```
[0-9]        # 0부터 9까지의 정수값 중 하나. [0123456789]와 동일
```
```
[a-zA-Z]     # 소문자 a부터 z, 대문자 A부터 Z까지의 알파벳 중 하나
```
```
[^0-9]       # 0부터 9까지의 정수값이 아닌 값
```
----
```
\d           # 숫자. [0-9]와 동일
```
```
\D           # 숫자. [^0-9]와 동일
```
```
\w           # 숫자 혹은 알파벳. [0-9a-zA-Z]와 동일. 
```
```
\W           # 숫자 혹은 알파벳이 아닌 문자. [^0-9a-zA-Z]와 동일. 
```
```
\s           # 공백 문자. [ \t\n\r\f\v]과 동일
```
```
\S           # 공백이 아닌 문자. [^ \t\n\r\f\v]과 동일
```

---

```
ya?          # ya에서 a가 등장하지 않거나 1회 등장하거나. y, ya
```
```
ya+          # ya에서 a가 1회 이상 반복. ya, yaa, yaaa, ...
```
```
ya*          # ya에서 a가 0회 이상 반복. y, ya, yaa, yaaa, ...
```
```
ya{3}        # ya에서 a가 3회 반복. yaaa
```
```
ya{3,5}      # ya에서 a가 3회 이상 5회 이하 반복. yaaa, yaaaa, yaaaaa
```
```
ab|c|def   # ab 혹은 c 혹은 def
```
```
가.다         # .은 모든 문자와 매치. 가나다, 가a다, 가!다, 가0다, 가\t다, ...
```
---
```
^\d[a-z]     # 문자열의 맨 첫 두 문자가 숫자와 소문자 알파벳의 연쇄. 1z,2x87384, 3t가나다라, 0r!>hi, ...
```
```
\d[a-z]$     # 문자열의 맨 끝 두 문자가 숫자와 소문자 알파벳의 연쇄. 873841z, 가나다라3t, !>hi0r, ...
```
```
^\d[a-z]$    # 문자열이 숫자로 시작해서 소문자 알파벳으로 끝남. 1z, 3t, 0r, ...
```
```
[wW]hy\?     # 메타 문자로서의 ?가 아닌 문장부호로서의 ?를 검색하고 싶을 경우 백슬래시로 escape. Why?, why?
```


###주의할 것

정규표현식으로 문자열을 찾을 때에는 문자열의 왼쪽부터 찾으며, 일치하는 가장 긴 문자열이 선택됩니다.

In [None]:
a=re.search('[1-3]+','12322hihihi1231231222')
print(a)

### re.compile

정규식 패턴을 정규식 객체로 컴파일합니다. 정규식 객체는 아래에 설명되는 match(), search() 및 기타 메서드를 일치시키는 데 사용할 수 있습니다.
정규식이 단일 프로그램에서 여러 번 사용될 때, re.compile()을 사용하고 결과 정규식 객체를 저장하여 재사용하는 것이 더 효율적입니다.

In [None]:
# patt = re.compile(pattern)
# result = patt.match(string)

In [None]:
# result = re.match(patt, string)

In [None]:
patt = re.compile('[abc]')
result = patt.match('a')
print(result)

In [None]:
result = re.match(patt, 'b123')
print(result)

###re.match

re.match는 문자열의 시작부터 정규식과 일치하는 부분을 찾아냅니다. 결과로 Match object를 반환하기 때문에 문자열로 쓸 때는 group() 메소드를 써줍니다.

In [None]:
p = re.compile("[a-zA-Z]+") # alphabet 1회 이상 반복

In [None]:
# search success
m1 = p.match("Hello!")
print(m1)

In [None]:
m1 = p.match("Hiiiii")
if m1:
  print(f"서치 성공: {m1.group()}, {m1.start()}, {m1.end()}, {m1.span()} ")
else:
  print(f"서치 실패: {m1}")

In [None]:
# search failure
m2 = p.match("2022 hello!")
if m2:
  print(f"서치 성공: {m2.group()}, {m2.start()}, {m2.end()}, {m2.span()} ")
else:
  print(f"서치 실패: {m2}")

### re.search

re.search는 문자열 전체를 검색하여 정규식과 일치하는 부분을 찾아냅니다. 결과로 Match object를 반환하기 때문에 문자열로 쓸 때는 group() 메소드를 써줍니다.

In [None]:
p = re.compile("\w+") # alpha-numeric 1회 이상 반복
m = p.search("cat")
print('m:',m)
print()
print('m.group():',m.group())

In [None]:
p = re.compile("\w+") # alpha-numeric 1회 이상 반복
m = p.search("     cat")
print('m:',m)
print()
print('m.group():',m.group())

In [None]:
p = re.compile("@\w+\.com") # email 주소 @ 이하 구하기

In [None]:
# search success
m1 = p.search("aaa@google.com")
if m1:
  print(f"서치 성공: {m1.group()}, {m1.start()}, {m1.end()}, {m1.span()} ")
else:
  print(f"서치 실패: {m1}")


In [None]:
# search failure
m2 = p.search("aaa@hanmail.net")
if m2:
    print(f"서치 성공: {m2.group()}, {m2.start()}, {m2.end()}, {m2.span()} ")
else:
  print(f"서치 실패: {m2}")

In [None]:
# search success
m2 = p.search("aaa@123google.com")
if m2:
    print(f"서치 성공: {m2.group()}, {m2.start()}, {m2.end()}, {m2.span()} ")
else:
  print(f"서치 실패: {m2}")

In [None]:
# search failure
m2 = p.search("aaa@ google.com")
if m2:
    print(f"서치 성공: {m2.group()}, {m2.start()}, {m2.end()}, {m2.span()} ")
else:
  print(f"서치 실패: {m2}")

###re.findall

re.findall은 문자열 전체를 검색하여 정규식과 일치하는 부분 전체를 리스트로 반환합니다.

In [None]:
p = re.compile("하세요|하지요|싶어요")

In [None]:
result = p.findall("안녕하세요. 제 소개부터 드리도록 하지요. 저는 의미있는 일을 하고 싶어요. 건강하세요.")
print(result)

###re.finditer

re.finditer는 문자열 전체를 검색하여 정규식과 일치하는 부분을 반복 가능한 객체(match 객체)로 돌려줍니다.

In [None]:
p = re.compile("하세요|하지요|싶어요")         

In [None]:
result = p.finditer("안녕하세요. 제 소개부터 드리도록 하지요. 저는 의미있는 일을 하고 싶어요. 건강하세요.")
print(result)

In [None]:
result = p.finditer("안녕하세요. 제 소개부터 드리도록 하지요. 저는 의미있는 일을 하고 싶어요. 건강하세요.")
for r in result: 
  print(r)
  print(r.group())

###re.sub

re.sub은 정규식과 일치하는 부분을 다른 문자열로 치환합니다.

In [None]:
p = re.compile("ab+")
result = p.sub("0", "ab~~~abb~~~abbbbb~~~")
print(result)

In [None]:
p = re.compile("[^ab]+")
result = p.sub("0", "ab~~~abb~~~abbbbb~~~")
print(result)

###Grouping

그루핑 메타 기호 ( )를 잘 활용하면, match 객체의 group 인덱스로 그루핑된 부분의 문자열을 추출할 수 있습니다.

In [None]:
print('without grouping')
p = re.compile("\w+\s[0-9]+")
m = p.findall("park 01012341234")
print(m)

print()
print('with grouping')
p = re.compile("(\w+)\s[0-9]")
m = p.findall("park 01012341234")
print(m)


In [None]:
p = re.compile("(\w+)\s+(\d+[-]\d+[-]\d+)")
m = p.search("park    010-1234-1234")
print(m.group(0)) #매치된 문자 전체
print(m.group(1)) #첫번째 괄호 안의 문자
print(m.group(2)) #두번째 괄호 안의 문자


###Look-ahead

전방 탐색(look-ahead)은 찾아내고자 하는 문자열의 패턴의 전방에 특정 조건을 걸고 싶을 때 사용합니다. 

전방에 X가 매치되는 조건을 걸고 싶을 때는 (?=X)

전방에 X가 매치되지 않는 조건을 걸고 싶을 때는 (?!X)

In [None]:
p = re.compile(".+(?=:)")
result = p.search("http://google.com").group()
print(result)

In [None]:
p = re.compile("[a-z]+(?![0-9])")
result = p.search("hello2022!").group()
print(result)

###Look-behind

후방 탐색(look-behind)은 찾아내고자 하는 문자열의 패턴의 후방에 특정 조건을 걸고 싶을 때 사용합니다. 

후방에 X가 매치되는 조건을 걸고 싶을 때는 (?<=X)

후방에 X가 매치되지 않는 조건을 걸고 싶을 때는 (?<!X)

In [None]:
p = re.compile("(?<=://).+")
result = p.search("http://google.com").group()
print(result)

In [None]:
p = re.compile("(?<![a-z])\d+")
result = p.search("hello2022!").group()
print(result)

###최소 문자 매치하기



정규표현식에서 말하는 탐욕스럽다(greedy) : 문자를 집어 삼킨다
- 마침표는 모든 문자를 다 의미하기 때문에 반복하면 모든 문자를 집어삼키는 특성이 있다

물음표를 삽입하여 최소 문자 매치를 구한다.

In [None]:
#greedy
example1 = '저는 91년에 태어났습니다. 97년에는 IMF가 있었습니다. 지금은 2020년입니다.'
p = re.compile("\d.+년")
result =p.findall(example1)
print(result) #문장 맨 앞의 숫자부터 맨 뒤의 '년' 사이 모든 문자를 반환한다

In [None]:
#non-greedy
example1 = '저는 91년에 태어났습니다. 97년에는 IMF가 있었습니다. 지금은 2020년입니다.'
p = re.compile("\d.+?년")
result =p.findall(example1)
print(result)

###자유롭게 연습하기

## 정규표현 실습

### 문제 1-1

크롤링해온 텍스트의 태그 지우기

In [None]:
f = open("/content/Q1.txt", 'r')
text = f.read()

In [None]:
print(text)

In [None]:
new_text= #코드를 작성하세요
print(new_text)

이른 아침 문을 여는 빵집입니다. 아침식사로 빵을 사러 가기엔 좋지만 매장안에서 드실 공간은 없어요. 이 빵집은 특이하게도 물 또는 커피를 무료로 텀블러에 담아갈수 있습니다.  가볍게 아침을 해결하고자 하는 여행자나 현지인은 들러보면 좋을 장소입니다.  참고로, 식빵 나오는 시간은 오전11시~12시 입니다. 빵 가격은 가성비 괜찮은 편이고 맛은 무난합니다. 우연히 들어갔는데 사장님이 따뜻하고 친절하셔서 제주도 이미지마저 좋게 느껴졌어요. 그리고 무엇보다 빵이 정말 맛있어요. 제주도에서 원탑입니다!!! 여기보다 두배는 ...내용 더보기맛집검색하다가 스쳐지나갔는데 숙소근처에 있길래 들렸어요!!  시식하는빵도 있고  빵구매하는데 서비스로 흰색찹살떡??도 주시고 친절하세요! 인절미빵 강추입니다!  ...내용 더보기인절미빵. 먹물치즈빵? 제일 맛있었고 대파빵은 삼겹살을 부르는 꽤 매운 맛이었어요! 빵이 대체로 다~~~~맛있고 친절하십니다 주차는 근처 공영주차장에 하면 됩니다 다...내용 더보기사진을 제대로 못찍엇는데 뒤에 비닐로 싸진 빵들이에요 ㅋㅋㅋ  여기 진짜 촤고에요 보니 동네찐로컬맛집같아요 빵종류도 많고 각 빵마다 시식빵이 있는데 크기가 넘 커서...내용 더보기성산 여행하는 동안 두번이나 방문했어요 빵도 특색있고 하나하나 다 맛있고 사장님도 직원분도 친절하시고  커피도 무료로 먹을수 있게 해주시고 살때마다 서비스빵을 주...내용 더보기사장님 너무 친절하시고 빵이 진짜 맛있어요.. 미친 맛,,,,🥹가격이 타 빵집보다 훠얼씬 저렴한데  맛이 훠얼씬 맛있네요,,,??!?! 저희 동네에 있었음 매일 가고싶네요ㅠㅠㅠ …내용 더보기재료를 아끼지 않으세요 눚은시간 방문했는데도 손님들이 꽤 왔어요 마늘바게트에는 소스를 아끼지 않았고 다른빵들도 크림이 듬뿍 들어 있었어요 서비스도 주시고 시식…내용 더보기


### 문제 1-2

정제한 텍스트에서 '내용 더보기' 지우고 한글과 공백문자만 남기기

In [None]:
e_text= #코드를 작성하세요
print(e_text)

이른 아침 문을 여는 빵집입니다 아침식사로 빵을 사러 가기엔 좋지만 매장안에서 드실 공간은 없어요 이 빵집은 특이하게도 물 또는 커피를 무료로 텀블러에 담아갈수 있습니다  가볍게 아침을 해결하고자 하는 여행자나 현지인은 들러보면 좋을 장소입니다  참고로 식빵 나오는 시간은 오전시시 입니다 빵 가격은 가성비 괜찮은 편이고 맛은 무난합니다 우연히 들어갔는데 사장님이 따뜻하고 친절하셔서 제주도 이미지마저 좋게 느껴졌어요 그리고 무엇보다 빵이 정말 맛있어요 제주도에서 원탑입니다 여기보다 두배는 맛집검색하다가 스쳐지나갔는데 숙소근처에 있길래 들렸어요  시식하는빵도 있고  빵구매하는데 서비스로 흰색찹살떡도 주시고 친절하세요 인절미빵 강추입니다  인절미빵 먹물치즈빵 제일 맛있었고 대파빵은 삼겹살을 부르는 꽤 매운 맛이었어요 빵이 대체로 다맛있고 친절하십니다 주차는 근처 공영주차장에 하면 됩니다 다사진을 제대로 못찍엇는데 뒤에 비닐로 싸진 빵들이에요   여기 진짜 촤고에요 보니 동네찐로컬맛집같아요 빵종류도 많고 각 빵마다 시식빵이 있는데 크기가 넘 커서성산 여행하는 동안 두번이나 방문했어요 빵도 특색있고 하나하나 다 맛있고 사장님도 직원분도 친절하시고  커피도 무료로 먹을수 있게 해주시고 살때마다 서비스빵을 주사장님 너무 친절하시고 빵이 진짜 맛있어요 미친 맛가격이 타 빵집보다 훠얼씬 저렴한데  맛이 훠얼씬 맛있네요 저희 동네에 있었음 매일 가고싶네요 재료를 아끼지 않으세요 눚은시간 방문했는데도 손님들이 꽤 왔어요 마늘바게트에는 소스를 아끼지 않았고 다른빵들도 크림이 듬뿍 들어 있었어요 서비스도 주시고 시식


### 문제 2-1

data.txt에서 역 이름 (이대역,신촌역,여의도역 등)  추출하기


<font color=red> 역명을 직접 검색하지 않고 정규표현으로 찾기

In [None]:
f = open("/content/Q2.txt", 'r')
text = f.read()

In [None]:
print(text)

이대역 근처 카페 좀 알려줘.
이대역 맛집 좀 알려줄 수 있니.
여의도역 주변 식당 좀 알려줘.
여의도역 유명한 맛집 좀 알려줄 수 있니.
신촌역 괜찮은 식당 어떤 거 있니?
신촌역 카페 어디 있어?
안양역 주변 식당 어떤 데가 좋아?
안양역 근처에 카페 어떤 거 있는지 알려줄 수 있니?
홍대역 맛집 어디 있어?
홍대역 카페 어디가 괜찮아?
동대문역 주변 음식점 좀 알려줘.
동대문역 주변 카페 좀 알려주라.


In [None]:
#answer
p = re.compile( #컴파일할 패턴
result = #코드를 작성하세요
print(set(result))

{'신촌역', '이대역', '동대문역', '홍대역', '안양역', '여의도역'}


### 문제 2-2

('어디 있어?', '어디 있어?', '좀 알려줘.') 등 묻는 부분 추출하기

In [None]:
#answer
p = re.compile( #컴파일할 패턴
result = #코드를 작성하세요
print(result)

['좀 알려줘.', '좀 알려줄 수 있니.', '좀 알려줘.', '좀 알려줄 수 있니.', '어떤 거 있니?', '어디 있어?', '어떤 데가 좋아?', '어떤 거 있는지 알려줄 수 있니?', '어디 있어?', '어디가 괜찮아?', '좀 알려줘.', '좀 알려주라.']


### 문제 2-3

(근처 카페, 맛집, 주변 식당) 등 궁금한 부분 추출하기

In [None]:
#answer
p = re.compile( #컴파일할 패턴
result = #코드를 작성하세요
print(result)

['근처 카페', '맛집', '주변 식당', '유명한 맛집', '괜찮은 식당', '카페', '주변 식당', '근처에 카페', '맛집', '카페', '주변 음식점', '주변 카페']


### 문제 2-4

질문 바꾸기
 - 위에서 찾은 리스트를 토대로 질문 바꾸기

In [None]:
#역 이름 바꾸기

p = re.compile( #컴파일할 패턴
result = #코드를 작성하세요
print(result)

안암역 근처 카페 좀 알려줘.
안암역 맛집 좀 알려줄 수 있니.
안암역 주변 식당 좀 알려줘.
안암역 유명한 맛집 좀 알려줄 수 있니.
안암역 괜찮은 식당 어떤 거 있니?
안암역 카페 어디 있어?
안암역 주변 식당 어떤 데가 좋아?
안암역 근처에 카페 어떤 거 있는지 알려줄 수 있니?
안암역 맛집 어디 있어?
안암역 카페 어디가 괜찮아?
안암역 주변 음식점 좀 알려줘.
안암역 주변 카페 좀 알려주라.


In [None]:
#질문 바꾸기
p = re.compile( #컴파일할 패턴
result = #코드를 작성하세요
print(result)

이대역 근처 카페 알려주세요
이대역 맛집 알려주세요
여의도역 주변 식당 알려주세요
여의도역 유명한 맛집 알려주세요
신촌역 괜찮은 식당 알려주세요
신촌역 카페 알려주세요
안양역 주변 식당 알려주세요
안양역 근처에 카페 알려주세요
홍대역 맛집 알려주세요
홍대역 카페 알려주세요
동대문역 주변 음식점 알려주세요
동대문역 주변 카페 알려주세요


In [None]:
#질문 바꾸기2
p = re.compile( #컴파일할 패턴
result = #코드를 작성하세요
print(result)

이대 레스토랑 좀 알려줘.
이대 레스토랑 좀 알려줄 수 있니.
여의도 레스토랑 좀 알려줘.
여의도 레스토랑 좀 알려줄 수 있니.
신촌 레스토랑 어떤 거 있니?
신촌 레스토랑 어디 있어?
안양 레스토랑 어떤 데가 좋아?
안양 레스토랑 어떤 거 있는지 알려줄 수 있니?
홍대 레스토랑 어디 있어?
홍대 레스토랑 어디가 괜찮아?
동대문 레스토랑 좀 알려줘.
동대문 레스토랑 좀 알려주라.

이대역 레스토랑 좀 알려줘.
이대역 레스토랑 좀 알려줄 수 있니.
여의도역 레스토랑 좀 알려줘.
여의도역 레스토랑 좀 알려줄 수 있니.
신촌역 레스토랑 어떤 거 있니?
신촌역 레스토랑 어디 있어?
안양역 레스토랑 어떤 데가 좋아?
안양역 레스토랑 어떤 거 있는지 알려줄 수 있니?
홍대역 레스토랑 어디 있어?
홍대역 레스토랑 어디가 괜찮아?
동대문역 레스토랑 좀 알려줘.
동대문역 레스토랑 좀 알려주라.


### 문제 2-5

데이터 불리기
 - 위에서 찾은 리스트로 for loop을 사용하여 다양한 조합으로 데이터 불리기

In [None]:
#역 이름 조합

p = re.compile( #컴파일할 패턴
station = #코드를 작성하세요

for one in station:
  print(one,'--------')
  result = #코드를 작성하세요
  print(result)

신촌역 --------
신촌역 근처 카페 좀 알려줘.
신촌역 맛집 좀 알려줄 수 있니.
신촌역 주변 식당 좀 알려줘.
신촌역 유명한 맛집 좀 알려줄 수 있니.
신촌역 괜찮은 식당 어떤 거 있니?
신촌역 카페 어디 있어?
신촌역 주변 식당 어떤 데가 좋아?
신촌역 근처에 카페 어떤 거 있는지 알려줄 수 있니?
신촌역 맛집 어디 있어?
신촌역 카페 어디가 괜찮아?
신촌역 주변 음식점 좀 알려줘.
신촌역 주변 카페 좀 알려주라.
이대역 --------
이대역 근처 카페 좀 알려줘.
이대역 맛집 좀 알려줄 수 있니.
이대역 주변 식당 좀 알려줘.
이대역 유명한 맛집 좀 알려줄 수 있니.
이대역 괜찮은 식당 어떤 거 있니?
이대역 카페 어디 있어?
이대역 주변 식당 어떤 데가 좋아?
이대역 근처에 카페 어떤 거 있는지 알려줄 수 있니?
이대역 맛집 어디 있어?
이대역 카페 어디가 괜찮아?
이대역 주변 음식점 좀 알려줘.
이대역 주변 카페 좀 알려주라.
동대문역 --------
동대문역 근처 카페 좀 알려줘.
동대문역 맛집 좀 알려줄 수 있니.
동대문역 주변 식당 좀 알려줘.
동대문역 유명한 맛집 좀 알려줄 수 있니.
동대문역 괜찮은 식당 어떤 거 있니?
동대문역 카페 어디 있어?
동대문역 주변 식당 어떤 데가 좋아?
동대문역 근처에 카페 어떤 거 있는지 알려줄 수 있니?
동대문역 맛집 어디 있어?
동대문역 카페 어디가 괜찮아?
동대문역 주변 음식점 좀 알려줘.
동대문역 주변 카페 좀 알려주라.
홍대역 --------
홍대역 근처 카페 좀 알려줘.
홍대역 맛집 좀 알려줄 수 있니.
홍대역 주변 식당 좀 알려줘.
홍대역 유명한 맛집 좀 알려줄 수 있니.
홍대역 괜찮은 식당 어떤 거 있니?
홍대역 카페 어디 있어?
홍대역 주변 식당 어떤 데가 좋아?
홍대역 근처에 카페 어떤 거 있는지 알려줄 수 있니?
홍대역 맛집 어디 있어?
홍대역 카페 어디가 괜찮아?
홍대역 주변 음식점 좀 알려줘.
홍대역 주변 카페 좀 알려주라.
안양역 --------
안양역 근처 카페 좀 알려줘.
안

In [None]:
#다양한 조합으로 
p = re.compile( #컴파일할 패턴
only_r = #코드를 작성하세요

for one in only_r:
  print(one,'--------')
  result = #코드를 작성하세요
  print(result)

{'좀 알려줄 수 있니.', '어디 있어?', '좀 알려주라.', '어떤 거 있니?', '어떤 거 있는지 알려줄 수 있니?', '좀 알려줘.', '어디가 괜찮아?', '어떤 데가 좋아?'}

좀 알려줄 수 있니. --------
이대역 근처 카페 좀 알려줄 수 있니.
이대역 맛집 좀 알려줄 수 있니.
여의도역 주변 식당 좀 알려줄 수 있니.
여의도역 유명한 맛집 좀 알려줄 수 있니.
신촌역 괜찮은 식당 좀 알려줄 수 있니.
신촌역 카페 좀 알려줄 수 있니.
안양역 주변 식당 좀 알려줄 수 있니.
안양역 근처에 카페 좀 알려줄 수 있니.
홍대역 맛집 좀 알려줄 수 있니.
홍대역 카페 좀 알려줄 수 있니.
동대문역 주변 음식점 좀 알려줄 수 있니.
동대문역 주변 카페 좀 알려줄 수 있니.
어디 있어? --------
이대역 근처 카페 어디 있어?
이대역 맛집 어디 있어?
여의도역 주변 식당 어디 있어?
여의도역 유명한 맛집 어디 있어?
신촌역 괜찮은 식당 어디 있어?
신촌역 카페 어디 있어?
안양역 주변 식당 어디 있어?
안양역 근처에 카페 어디 있어?
홍대역 맛집 어디 있어?
홍대역 카페 어디 있어?
동대문역 주변 음식점 어디 있어?
동대문역 주변 카페 어디 있어?
좀 알려주라. --------
이대역 근처 카페 좀 알려주라.
이대역 맛집 좀 알려주라.
여의도역 주변 식당 좀 알려주라.
여의도역 유명한 맛집 좀 알려주라.
신촌역 괜찮은 식당 좀 알려주라.
신촌역 카페 좀 알려주라.
안양역 주변 식당 좀 알려주라.
안양역 근처에 카페 좀 알려주라.
홍대역 맛집 좀 알려주라.
홍대역 카페 좀 알려주라.
동대문역 주변 음식점 좀 알려주라.
동대문역 주변 카페 좀 알려주라.
어떤 거 있니? --------
이대역 근처 카페 어떤 거 있니?
이대역 맛집 어떤 거 있니?
여의도역 주변 식당 어떤 거 있니?
여의도역 유명한 맛집 어떤 거 있니?
신촌역 괜찮은 식당 어떤 거 있니?
신촌역 카페 어떤 거 있니?
안양역 주변 식당 어떤 거 있니?
안양역 근처에 카페 어떤 거 있니

In [None]:
#다양한 조합으로 
p = re.compile( #컴파일할 패턴
result =  #코드를 작성하세요

for one in result:
  print(one,'--------')
  result = #코드를 작성하세요
  print(result)

['근처 카페', '맛집', '주변 식당', '유명한 맛집', '괜찮은 식당', '카페', '주변 식당', '근처에 카페', '맛집', '카페', '주변 음식점', '주변 카페']

근처 카페 --------
이대역 근처 카페 좀 알려줘.
이대역 근처 카페 좀 알려줄 수 있니.
여의도역 근처 카페 좀 알려줘.
여의도역 근처 카페 좀 알려줄 수 있니.
신촌역 근처 카페 어떤 거 있니?
신촌역 근처 카페 어디 있어?
안양역 근처 카페 어떤 데가 좋아?
안양역 근처 카페 어떤 거 있는지 알려줄 수 있니?
홍대역 근처 카페 어디 있어?
홍대역 근처 카페 어디가 괜찮아?
동대문역 근처 카페 좀 알려줘.
동대문역 근처 카페 좀 알려주라.
맛집 --------
이대역 맛집 좀 알려줘.
이대역 맛집 좀 알려줄 수 있니.
여의도역 맛집 좀 알려줘.
여의도역 맛집 좀 알려줄 수 있니.
신촌역 맛집 어떤 거 있니?
신촌역 맛집 어디 있어?
안양역 맛집 어떤 데가 좋아?
안양역 맛집 어떤 거 있는지 알려줄 수 있니?
홍대역 맛집 어디 있어?
홍대역 맛집 어디가 괜찮아?
동대문역 맛집 좀 알려줘.
동대문역 맛집 좀 알려주라.
주변 식당 --------
이대역 주변 식당 좀 알려줘.
이대역 주변 식당 좀 알려줄 수 있니.
여의도역 주변 식당 좀 알려줘.
여의도역 주변 식당 좀 알려줄 수 있니.
신촌역 주변 식당 어떤 거 있니?
신촌역 주변 식당 어디 있어?
안양역 주변 식당 어떤 데가 좋아?
안양역 주변 식당 어떤 거 있는지 알려줄 수 있니?
홍대역 주변 식당 어디 있어?
홍대역 주변 식당 어디가 괜찮아?
동대문역 주변 식당 좀 알려줘.
동대문역 주변 식당 좀 알려주라.
유명한 맛집 --------
이대역 유명한 맛집 좀 알려줘.
이대역 유명한 맛집 좀 알려줄 수 있니.
여의도역 유명한 맛집 좀 알려줘.
여의도역 유명한 맛집 좀 알려줄 수 있니.
신촌역 유명한 맛집 어떤 거 있니?
신촌역 유명한 맛집 어디 있어?
안양역 유명한 맛집 어떤 데가 좋아?
안양역 유명한 맛집 어떤 거 있는지