## 실시간 검색어 확인하기

### requests
- request.get() : get 요청을 보내는 기능  -> 반환 값 : requests.response
- https://requests.readthedocs.io/en/master/api/#requests.Response

In [None]:
import requests

url = "http://www.daum.net"
response = requests.get(url)

print(response.text)
#print(response.url)
#print(response.content)
#print(response.encoding)
#print(response.headers)
#print(response.json)
#print(response.links)
#print(response.ok)
#print(response.status_code)

### BeautifulSoup
- BeautifulSoup(데이터, 파싱 방법(html, xml))
- 파싱(Parsing) : 우리가 가진 데이터를 의미있는 값으로 변환하는 작업
- response.text의 정보를 분리해서 BeautifulSoup에 가지런히 정리해주는 역할

```python
from bs4 import BeautifulSoup
```

In [None]:
import requests
from bs4 import BeautifulSoup

url = "http://www.daum.net"
response = requests.get(url)   # url로 부터 응답 값 받아오기

print(BeautifulSoup(response.text, 'html.parser'))   # html.parser로 파싱

In [None]:
print(type(response.text), type(BeautifulSoup(response.text, 'html.parser')))

<class 'str'> <class 'bs4.BeautifulSoup'>


In [None]:
import requests
from bs4 import BeautifulSoup

url = "http://www.daum.net"
response = requests.get(url)
# print(response.text[:500])

soup = BeautifulSoup(response.text, 'html.parser')

print(soup.title)
print(soup.title.string)  # url의 title을 출력
print(soup.span)  # html의 가장 상단에 있는 span tag 출력
print(soup.findAll('span'))  # html의 모든 span tag 출력

In [None]:
import requests
from bs4 import BeautifulSoup

url = "http://www.daum.net"
response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

file = open("daum.html", "w")   # 파일에 daum.html 이름으로 response.text를 저장
file.write(response.text)
file.close()

### 실시간 검색어 공통점
- a 태그를 가지고 있다.
- link_favorsch 클래스를 가지고 있다.
```html
<a href="https://search.daum.net/search?w=tot&amp;q=%EC%BD%94%EB%A1%9C%EB%82%9819+%EB%B0%9C%EC%83%9D%ED%98%84%ED%99%A9&amp;DA=NPI" class="link_favorsch @6">코로나19 발생현황</a>
</li>
<li>
<a href="https://search.daum.net/search?w=tot&amp;q=%EA%B3%B5%EB%B6%80%EC%99%95%EC%B0%90%EC%B2%9C%EC%9E%AC&amp;DA=NPI" class="link_favorsch @7">홍진경X이혜성</a>
</li>
<li>
<a href="https://search.daum.net/search?w=tot&amp;q=%EB%AA%A9%EC%9E%AC%ED%8C%90%EB%A7%A4%EC%82%AC%EC%9D%B4%ED%8A%B8&amp;DA=NPT" class="link_favorsch @8">목재판매사이트</a>
</li>
<li>
<a href="https://search.daum.net/search?w=tot&amp;q=%EB%B0%A9%ED%83%84+11%EC%96%B5%EB%B7%B0&amp;DA=NPI&amp;rtmaxcoll=NNS" class="link_favorsch @9">방탄 11억뷰</a>
</li>
<li>
<a href="https://search.daum.net/search?w=tot&amp;q=%EC%8B%9C%EC%8A%A4%ED%85%9C%EB%B9%84%EA%B3%84&amp;DA=NPT" class="link_favorsch @10">시스템비계</a>
</li>
</ul>
```

In [None]:
import requests
from bs4 import BeautifulSoup

url = "http://www.daum.net"
response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

# html 문서에서 실시간 검색어를 가져오는 코드
soup.findAll('a', 'link_favorsch')

.findAll('a', 'b') : a와 b를 포함하는 텍스트를 찾아라

.get_text() : 텍스트에서 글자만 추출 

In [None]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime

url = "http://www.daum.net"
response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

# html 문서에서 실시간 검색어를 가져오는 코드
results = soup.findAll('a', 'link_favorsch')   # 리스트의 형태로 반환
rank = 1

print(datetime.today().strftime('%Y년 %m월 %d일의 실시간 검색어 순위입니다.\n'))

for result in results:
    print(str(rank)+'위 ', result.get_text(), '\n')
    rank += 1

#### open()
- open(파일, 모드)
- 파이썬에서 파일을 편집하기 위해선 open()을 이용
- 'r' (read) : 읽기 전용 모드
- 'w' (write) : 쓰기 모드(기존의 내용은 덮어씌워짐)
- 'a' (append) : 기존의 파일에 새로운 내용을 덧붙이기(기존의 내용은 보존)

### 파일로 출력하기

In [None]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime

url = 'http://www.daum.net'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
rank = 1

results = soup.findAll('a', 'link_favorsch')
search_rank_file = open('rankresult.txt', 'w')   # rankresult.txt 파일생성(쓰기 모드)

print(datetime.today().strftime('%Y년 %m월 %d일의 실시간 검색어 순위입니다. \n'))   # 응답 날짜 출력

for result in results:   # 실시간 검색어 이쁘게 출력하면서 rankresult.txt 파일에 쓰기
    search_rank_file.write(str(rank)+'위.'+result.get_text()+'\n')
    print(str(rank)+'위.', result.get_text(), '\n')
    rank += 1

2021년 06월 01일의 실시간 검색어 순위입니다. 

1위. 코로나19 발생현황 

2위. 홍진경X이혜성 

3위. 사회복지사 

4위. 옥주현 일침 

5위. 고압펌프 

6위. 사회적 거리두기 

7위. 톡이나할까 오연서 

8위. 욕실리모델링 

9위. 박수진 복귀 

10위. 77사이즈여성옷 



### 응용하기 (현재 적용 불가)
- https://datalab.naver.com/keyword/realtimeList.naver?age=20s
- ? 이전은 공통된 부분, 이후는 파라미터
- 네이버 데이터 랩은 나이를 기준으로 페이지를 분류해놓았음
- 20대를 기준으로 데이터를 크롤링 해보자

In [None]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime

url = 'https://datalab.naver.com/'

response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

# span.class , title_cell : 해당 날짜
# span.class , title : 그 날짜의 검색어 순위

results = soup.findAll('span', 'title')
results_date = soup.findAll('span', 'title_cell')

rank_num = 1

for result_date in results_date:
    rank = 1
    print(result_date.get_text()+'의 검색어 순위는..')
    for result in results:
        print(rank, '위. ', result.get_text(), '\n')
        rank += 1
        rank_num += 1
        if rank_num % 10 == 0:
            break

- 가끔 사이트에서 자체적으로 크롤링을 막는 경우, 봇이 아닌 사람 임을 확인시켜줄 필요가 있음
```python
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
```

In [None]:
print(soup)

## 날씨 정보 받아오기

- https://www.notion.so/likelion/OpenWeatherMap-API-Key-12b608bcfd8840ccb53a2c16771f2648

### API (application programming interface)
- 응용프로그램 프로그래밍 인터페이스 : 프로그램과 프로그램을 이어주는 연결고리
- 누군가가 만들어 놓은 프로그램을 다른 사람이 끌어다가 사용할 수 있게 만들어 놓은 도구
- 이미 만들어져 있는 Openweathermap을 사용하여 날씨를 출력해볼 예정
- 오픈소스로 열려있는 **API = OpenAPI**
- API number : OpenAPI를 사용하기 위해 발급받은 키

### f-string
- 문자열 안에 포함되어있는 {}에 변수의 값을 넣고싶을 때 문자열 앞에 f를 붙이는 방법
- API주소의 ?이후가 API연결을 위한 parameter가 들어감
```python
city = "Seoul"
apikey = "################################"
api = f"http://api.openweathermap.org/data/2.5/weather?q={city}&appid={apikey}"  # API요청을 보낼 API서버의 주소
print(api)
```

- 문자열의 정보 중에서 원하는 정보만을 뽑아내기 위해 json 모듈을 사용
- json : **j**ava**s**cript **o**bject **n**otation
- 데이터를 주고 받을 때 주로 사용하는 포멧이다 (type : dictionary)
- json 형태로 변환 : json.loads(str)

In [None]:
import requests
import json

city = "Seoul"
apikey = "9c9885a3d009e3e6f69e6a49ebcd24d2"
lang = "kr"

api = f"http://api.openweathermap.org/data/2.5/weather?q={city}&appid={apikey}&lang={lang}&units=metric"  # API요청을 보낼 API서버의 주소

result = requests.get(api)

data = json.loads(result.text)
data

{'base': 'stations',
 'clouds': {'all': 0},
 'cod': 200,
 'coord': {'lat': 37.5683, 'lon': 126.9778},
 'dt': 1622599200,
 'id': 1835848,
 'main': {'feels_like': 25.15,
  'grnd_level': 1007,
  'humidity': 55,
  'pressure': 1014,
  'sea_level': 1014,
  'temp': 25.14,
  'temp_max': 25.76,
  'temp_min': 23.42},
 'name': 'Seoul',
 'sys': {'country': 'KR',
  'id': 8105,
  'sunrise': 1622578342,
  'sunset': 1622630883,
  'type': 1},
 'timezone': 32400,
 'visibility': 10000,
 'weather': [{'description': '맑음', 'icon': '01d', 'id': 800, 'main': 'Clear'}],
 'wind': {'deg': 189, 'gust': 2.75, 'speed': 1.8}}

In [None]:
print(data['name'],"의 날씨입니다.")
print("오늘의 날씨는 ",data['weather'][0]['description'],"입니다.")
print("현재 온도는 ",data['main']['temp'],"입니다.")
print("하지만 체감 온도는 ",data['main']['feels_like'],"입니다.")
# 최저 기온 : main - temp_min
print("최저 기온은 ",data['main']['temp_min'],"입니다.")
# 최고 기온 : main - temp_max
print("최고 기온은 ",data['main']['temp_max'],"입니다.")
# 습도 : main - humidity
print("습도는", data['main']['humidity'], '입니다.')
# 기압 : main - pressure
print("기압은", data['main']['pressure'], '입니다.')
# 풍향 : wind - deg
print("풍향은", data['wind']['deg'], '입니다.')
# 풍속 : wind - speed
print("풍속은", data['wind']['speed'], '입니다.')

Seoul 의 날씨입니다.
오늘의 날씨는  맑음 입니다.
현재 온도는  25.14 입니다.
하지만 체감 온도는  25.15 입니다.
최저 기온은  23.42 입니다.
최고 기온은  25.76 입니다.
습도는 55 입니다.
기압은 1014 입니다.
풍향은 189 입니다.
풍속은 1.8 입니다.


- https://openweathermap.org/current 의 정보를 이용해 다른 곳의 날씨 정보도 조회해보기

## 번역하기
**학습목표**
1. 번역기를 만든다.
2. 번역을 원하는 문장을 설정한다.
3. 번역을 원하는 언어를 설정한다.
4. 번역한다.

In [None]:
!pip install googletrans==3.1.0a0

In [None]:
from googletrans import Translator

# Translator 클래스의 객체를 생성
translator = Translator()

sentence = input('번역하고 싶은 문장을 입력해주세요 : ')    # 번역 할 문장을 지정
detected = translator.detect(sentence)                      # 언어 감지함수

print(detected)         # confidence : 언어 감지 성공확률
print(detected.lang)    # 언어만 추출

번역하고 싶은 문장을 입력해주세요 : 안녕하세요
Detected(lang=ko, confidence=1)
ko


### translate(text, dest, src)
- text : 번역을 원하는 문장
- dest(destination) : 번역할 언어
- scr(source) : Translator가 자체적으로 언어를 인지해주기 때문에 비워도 상관없음

In [None]:
from googletrans import Translator

translator = Translator()

sentence = input('번역하고 싶은 문장을 입력해주세요 : ')
destination = input('어떤 언어로 번역을 원하시나요? (예시, en:영어, ja:일본어) :')

result = translator.translate(sentence, destination)
detected = translator.detect(sentence)

print('==============출 력 결 과==============')
print(detected.lang,':',sentence)
print(destination,':',result.text)
print('=======================================')

번역하고 싶은 문장을 입력해주세요 : 안녕
어떤 언어로 번역을 원하시나요? (예시, en:영어, ja:일본어) :en
ko : 안녕
en : Hi


## 메일 보내기

### 사전 준비
- Google 보안 수준 변경하기 : https://www.notion.so/likelion/Google-93ee4cffb5b7481584be4de44ce5bf5e
- Google IMAP 설정하기 : https://www.notion.so/likelion/Google-IMAP-ca417541e62b4f958ff695b8db8c0feb

### SMTP(Simple Mail Transfer Protocol)
- SMTP 서버를 이용해서 우리가 원하는 곳으로 메일을 보낼 수 있다.
- python의 smtplib 모듈을 사용
1. SMTP 메일 서버를 연결한다
2. SMTP 메일 서버에 로그인한다
3. SMTP 메일 서버로 메일을 보낸다
```python
import smtplib
SMTP_SERVER = 'smtp.gmail.com'
SMTP_PORT = 465
smtp = smtplib.SMTP(SMTP_SERVER, SMTP_PORT)   # 원하는 메일 서버에 연결해주는 기능. 서버주소와 포트번호가 필요.
print(smtp)  # 이대로 작동시키면 보안으로 인해 연결이 불가능
# SSL을 처리하는 것이 포함된 함수를 이용해 접속해야 함
```

In [None]:
import smtplib

SMTP_SERVER = 'smtp.gmail.com'
SMTP_PORT = 465

smtp = smtplib.SMTP_SSL(SMTP_SERVER, SMTP_PORT)   

print(smtp)

<smtplib.SMTP_SSL object at 0x7f8fa251dbd0>


#### 로그인

In [None]:
import smtplib

SMTP_SERVER = 'smtp.gmail.com'
SMTP_PORT = '465'

smtp = smtplib.SMTP_SSL(SMTP_SERVER, SMTP_PORT)
smtp.login('yejunii4196@likelion.org', 'BlUe771324!@')

(235, b'2.7.0 Accepted')

#### 메일 보내기

In [None]:
smtp.send_message()
smtp.quit()

### MIME (Multipurpose Internet Mail Extensions)
- 영어가 아닌 외국어나(한글 포함) 사진과 같은 것들을 SMTP에서 알아볼 수 있게하는 형식
- python의 email.message 모듈을 사용
- MIME 형태를 띄는 이메일을 만들기 위한 3가지 단계
1. 이메일을 만든다 (MIME에 내용을 넣는다)
2. 이메일에 내용을 담는다
3. 발신자, 수신자를 설정한다

In [None]:
import smtplib
from email.message import EmailMessage

SMTP_SERVER = 'smtp.gmail.com'
SMTP_PORT = '465'

message = EmailMessage()
message.set_content('코드라이언 수업 중입니다.')   # 본문에 내용을 넣는 구문

## Header Part(제목, 발신인, 수신인) ## 
message['Subject'] = '이것은 제목입니다.'          # 제목
message['From'] = 'yejunii4196@likelion.org'       # 발신인
message['To'] = 'yejunii4196@naver.com'            # 수신인

smtp = smtplib.SMTP_SSL(SMTP_SERVER, SMTP_PORT)    # 원하는 메일 서버에 연결해주는 기능.
smtp.login('yejunii4196@likelion.org', 'BlUe771324!@')

smtp.send_message(message)
smtp.quit()

(221, b'2.0.0 closing connection 15sm15336054pfy.15 - gsmtp')

### 사진 첨부하기
- rb (read binary), wb (write binary), ab (append binary) 

In [None]:
test = open('기말고사 일정-1.jpg', 'rb')
test.read()   # binary file

In [None]:
with open('기말고사 일정-1.jpg', 'rb') as image:   # 위의 코드보다 더 안전하게 파일을 열고닫는 방법
    image_file = image.read()

- 일반적인 텍스트만 존재하는 타입 : plane text type
- 다른 포멧의 파일들도 포함되어있는 타입 : mixed type
- add_attachment(...) : mixed type으로 바꿔주는 함수. 3가지의 재료가 필요함
1. image
2. maintype - 첨부한 타입의 유형(image, video 등)
3. subtype - 확장자(png, jpg 등)

In [None]:
import smtplib
from email.message import EmailMessage
import imghdr   # 이미지의 확장자가 바뀌어도 동적으로 파라메터를 넣어주기 위함

SMTP_SERVER = 'smtp.gmail.com'
SMTP_PORT = 465

message = EmailMessage()
message.set_content('코드라이언 수업중입니다.')

message["Subject"] = "이것은 제목입니다."
message["From"] = "yejunii4196@likelion.org"
message["To"] = "yejunii4196@naver.com"

with open('기말고사 일정-1.jpg', 'rb') as image:   # 위의 코드보다 더 안전하게 파일을 열고닫는 방법
    image_file = image.read()

image_type = imghdr.what('기말고사 일정-1', image_file)   # 이미지의 확장자 추출
# print(image_type)
message.add_attachment(image_file, maintype='image', subtype=image_type)

smtp = smtplib.SMTP_SSL(SMTP_SERVER, SMTP_PORT)
smtp.login('yejunii4196@likelion.org', 'BlUe771324!@')
smtp.send_message(message)

smtp.quit()

(221, b'2.0.0 closing connection i10sm10250030pfk.74 - gsmtp')

### 유효성 검사하기
- 이메일 주소가 실제로 이메일 주소인지 유효성을 검사하는 것
- ^[a-zA-Z0-9.+_-]+@[a-zA-Z0-9]+\.[a-zA-Z]{2,3}\$  <-> yejunii4196@likelion.org
- ^ : 시작, \$ : 끝
- [a-zA-Z0-9.+_-]  :  a-z, A-Z, 0-9, ., +, _, - 가 1회 이상 반복된다.
- [a-zA-Z]{2, 3} : a-z, A-Z가 최소 2회, 최대 3번 반복된다.

- re 모듈을 import 해야함
- re.match(정규 표현식, 유효성 검사대상)

In [None]:
import re

email = 'yejunii4196@naver.com'

reg = "^[a-zA-Z0-9.+_-]+@[a-zA-Z0-9]+\.[a-zA-Z]{2,3}$"
print(re.match(reg, email))


<re.Match object; span=(0, 21), match='yejunii4196@naver.com'>


### 유효할 경우에만 메일을 보내기

In [None]:
import smtplib
import re
from email.message import EmailMessage
import imghdr

SMTP_SERVER = 'smtp.gmail.com'
SMTP_PORT = 465

send_address = input('이메일 주소를 입력해주세요 : ')
password = input('비밀번호를 입력해주세요 : ')

receive_address = input('받으실 분의 주소를 입력해주세요 : ')
title = input('제목을 입력해주세요 : ')
content = input('내용을 입력해주세요 : ')

message = EmailMessage()
message.set_content(content)

## MIME 작성 Part ##
message['Subject'] = title
message['From'] = send_address
message['To'] = receive_address

## 이미지 첨부 ##
with open('기말고사 일정-1.jpg', 'rb') as image:
    image_file = image.read()
image_type = imghdr.what('기말고사 일정-1', image_file)
message.add_attachment(image_file, maintype='image', subtype=image_type)

## 유효성 검사 ##
reg = '^[a-zA-Z0-9.+_-]+@[a-zA-Z0-9]+\.[a-zA-Z]{2,3}$'

## 유효할 경우에만 전송 ##
if re.match(reg, send_address) == None:          # bool(re.match(reg, send_address)) 도 가능
    print('유효하지 않은 이메일 주소입니다.')
else:
    smtp = smtplib.SMTP_SSL(SMTP_SERVER, SMTP_PORT)
    smtp.login(send_address, password)
    smtp.send_message(message)
    smtp.quit()
    print('전송 완료')

print('종료')