# 0. 목표

- 오픈 API를 이용하여 요청 및 응답을 통해 JSON or XML 형식으로 제공되는 데이터를 수집
- 수집한 결과를 DB 혹은 파일 (텍스트, csv, 엑셀) 등 저장
    - pandas에서 할일
    - 필요한 부분은 댕겨서 사용


# 1. 네이버 오픈 api를 이용한 뉴스 수집
- https://developers.naver.com/docs/serviceapi/search/news/news.md#%EB%89%B4%EC%8A%A4
- 데이터 : 뉴스
    - 용도 : NLP(자연어처리)계열
    - 관련 분야
        - 카테고리 분류, 키워드 추출, 텍스트 요약, 헤드라인 생성, 글의 논조 분석, 기자의 성향 분석, 기자의 MBTI 등

- 출처
    - dev.naver.com
    - 최초에는 가입 및 인증, 애플리케이션 생성 등의 절차 필요
    - Client ID : *
    - Client PW : *

In [None]:
# 리눅스상에서 네이버가 제공한 기본 예제를 통해 직접 통신 테스트 진행 -> 이상없음
!curl "https://openapi.naver.com/v1/search/news.json?query=%EC%A3%BC%EC%8B%9D&display=10&start=1&sort=sim" \
    -H "X-Naver-Client-Id: Client-id" \
    -H "X-Naver-Client-Secret: Client-Secret" -v

*   Trying 110.93.147.11:443...
* Connected to openapi.naver.com (110.93.147.11) port 443 (#0)
* ALPN, offering h2
* ALPN, offering http/1.1
*  CAfile: /etc/ssl/certs/ca-certificates.crt
*  CApath: /etc/ssl/certs
* TLSv1.0 (OUT), TLS header, Certificate Status (22):
* TLSv1.3 (OUT), TLS handshake, Client hello (1):
* TLSv1.2 (IN), TLS header, Certificate Status (22):
* TLSv1.3 (IN), TLS handshake, Server hello (2):
* TLSv1.2 (IN), TLS header, Certificate Status (22):
* TLSv1.2 (IN), TLS handshake, Certificate (11):
* TLSv1.2 (IN), TLS header, Certificate Status (22):
* TLSv1.2 (IN), TLS handshake, Server key exchange (12):
* TLSv1.2 (IN), TLS header, Certificate Status (22):
* TLSv1.2 (IN), TLS handshake, Server finished (14):
* TLSv1.2 (OUT), TLS header, Certificate Status (22):
* TLSv1.2 (OUT), TLS handshake, Client key exchange (16):
* TLSv1.2 (OUT), TLS header, Finished (20):
* TLSv1.2 (OUT), TLS change cipher, Change cipher spec (1):
* TLSv1.2 (OUT), TLS header, Certificate Status

# 3. 파이썬 구현

### 3-1. 필요 모듈, 데이터 준비

In [None]:
import urllib
import urllib.request as req

In [None]:
# 네이버 오픈 API 요청시 필요한 키값
# 이런 값들은 git 등에 업로드하면 절대 안됨!

CLIENT_ID = 'Client_ID'
CLIENT_SECRET = 'Client_Secret'
DEV_NAVER_URL = "https://openapi.naver.com/v1/search/news.json?query={}&display=10&start=1&sort=sim"

In [None]:
# 검색어 -> utf-8 인코딩되서 %A... 스타일로 변경되어야 한다.
keyword = '삼성'
enc_text = urllib.parse.quote(keyword)
enc_text

'%EC%82%BC%EC%84%B1'

### 3-2. 요청 처리

In [None]:
# 1. URL 완성
url = DEV_NAVER_URL.format( enc_text )
print(url)

# 2. 요청 객체 생성
request = req.Request(url) # 요청 객체 반환, 반환값 저장

# 3. 네이버 ID, 시크릿키 세팅 -> 헤더 추가
request.add_header("X-Naver-Client-Id", CLIENT_ID)
request.add_header("X-Naver-Client-Secret", CLIENT_SECRET)

# 4.실제 요청
response = req.urlopen( request )

# 5. 응답 코드 출력
response.getcode() # 200 : 성공 의미

https://openapi.naver.com/v1/search/news.json?query=%EC%82%BC%EC%84%B1&display=10&start=1&sort=sim


200

### 3-3. 응답 결과 처리

In [None]:
import json

# 응답 결과 처리
if response.getcode() == 200:
    print('응답 결과 파싱')
    res_json = json.load(response)
    print(res_json)

응답 결과 파싱
{'lastBuildDate': 'Tue, 08 Aug 2023 09:11:22 +0900', 'total': 10258776, 'start': 1, 'display': 10, 'items': [{'title': '&quot;<b>삼성</b>맨 취업 꿀팁 쏠쏠해요&quot;…<b>삼성</b> 강남 &apos;컬처랩&apos; 인기몰이', 'originallink': 'https://www.hankyung.com/economy/article/202308079417g', 'link': 'https://n.news.naver.com/mnews/article/015/0004876789?sid=101', 'description': '<b>삼성</b>전자는 체험형 플래그십 스토어 &apos;<b>삼성</b> 강남&apos;에서 차별화된 오프라인 수업 &apos;컬처랩(Culture Lab)&apos;을 운영하고 있다고 7일 밝혔다. &apos;컬처랩&apos;은 <b>삼성</b>전자의 최신 모바일·가전제품을 활용해 다양한 콘텐츠를 즐기며 배우는... ', 'pubDate': 'Mon, 07 Aug 2023 08:47:00 +0900'}, {'title': '<b>삼성</b>바이오에피스, ISO 정보보호 경영시스템 인증', 'originallink': 'https://www.yna.co.kr/view/PYH20230807104200017?input=1196m', 'link': 'https://n.news.naver.com/mnews/article/001/0014116729?sid=101', 'description': '고한승 <b>삼성</b>바이오에피스 사장(오른쪽)이 7일 인천 연수구 <b>삼성</b>바이오에피스 송도 사옥에서 열린 ISO 27001 인증서 수여식에서 임성환 BSI 코리아 대표와 기념 촬영하고 있다. 2023.8.7 [<b>삼성</b>바이오에피스 제공.... ', 'pubDate': 'Mon, 07 Aug 2023 14:37:00 +090

In [None]:
type(res_json) # 사전형 자료

dict

### 3-4. 모든 뉴스의 제목만 추출하시오
- 특수기호 ex) &quot:, &apos : 이런 기호는 삭제한다.

In [None]:
# 1. 단순 대체
for news in res_json['items']:
    print(news['title'].replace('<b>', '').replace('</b>', ''))
    # replace는 가장 단순하게 제가 가능하지만 => 모든 노이즈의 종류를 사전에 알아야하고, 문자열을 여러번 생성해 메모리가 낭비됨.
    #break

&quot;삼성맨 취업 꿀팁 쏠쏠해요&quot;…삼성 강남 &apos;컬처랩&apos; 인기몰이
삼성바이오에피스, ISO 정보보호 경영시스템 인증
“잼버리 학생들 이쪽으로”…삼성 이재용 팔 걷어붙였다
삼성운용, KODEX반도체 순자산 5000억 돌파
자동차 기업도 아닌데...삼성전자, 유럽 최대 모터쇼 가는 속내는
&quot;취미부터 취업까지 다양한 클래스&quot;…삼성강남 &apos;컬처랩&apos; 인기
&apos;삼성 강남&apos;서 매주 오프라인 강좌 &apos;컬처랩&apos; 운영
삼성전자, 차별화된 오프라인 클래스 컬처랩 운영
삼성 때문에 4일째 잠 못 잔 유튜버…&quot;Z플립5, 왜 고장이 안 나&quot;
삼성 강남, 매주 특별한 클래스 &apos;컬처랩&apos; 진행


In [None]:
# 2. 정규 표현식 활용 => 문자열 내부에 노이즈가 존재 -> 패턴 정의해서 정규식 처리 -> 클린 데이터로 구성
import re
# html 태그에 대한 정규식 => 일치하면 -> ''로 대체
p = re.compile('<[a-z0-9]+>|</[a-z0-9]+>', re.IGNORECASE) # 정규식
# 단, 기본 상식 정보로 html에 대해서 알고 있어야 한다.
# 단, &문자: 엔티티 표현에 대한 대체 처리 필요 &quot; => " ............ 대체해줘야 함 => 즉 노이즈를 다 알아야 한다!!
for news in res_json['items']:
    print(p.sub('', news['title']))

&quot;삼성맨 취업 꿀팁 쏠쏠해요&quot;…삼성 강남 &apos;컬처랩&apos; 인기몰이
삼성바이오에피스, ISO 정보보호 경영시스템 인증
“잼버리 학생들 이쪽으로”…삼성 이재용 팔 걷어붙였다
삼성운용, KODEX반도체 순자산 5000억 돌파
자동차 기업도 아닌데...삼성전자, 유럽 최대 모터쇼 가는 속내는
&quot;취미부터 취업까지 다양한 클래스&quot;…삼성강남 &apos;컬처랩&apos; 인기
&apos;삼성 강남&apos;서 매주 오프라인 강좌 &apos;컬처랩&apos; 운영
삼성전자, 차별화된 오프라인 클래스 컬처랩 운영
삼성 때문에 4일째 잠 못 잔 유튜버…&quot;Z플립5, 왜 고장이 안 나&quot;
삼성 강남, 매주 특별한 클래스 &apos;컬처랩&apos; 진행


In [None]:
# 3. html은 정규식으로 해결, &문자;(엔티티) -> 보안 이슈 때문에 처리된것 -> 원래대로 복원해준다. -> 당연히 라이브러리가 있지 않을까?
# html 엔티티 일괄 처리!
import html
import re
# html 태그에 대한 정규식 => 일치하면 -> ''로 대체
p = re.compile('<[a-z0-9]+>|</[a-z0-9]+>', re.IGNORECASE) # 정규식
# 단, 기본 상식 정보로 html에 대해서 알고 있어야 한다.
# 단, &문자: 엔티티 표현에 대한 대체 처리 필요 &quot; => " ............ 대체해줘야 함 => 즉 노이즈를 다 알아야 한다!!
for news in res_json['items']:
    print(p.sub('', html.unescape(news['title']))) # unescape 함수 : 원문으로 되돌린다!
# html 라이브러리 공부 필요할듯

"삼성맨 취업 꿀팁 쏠쏠해요"…삼성 강남 '컬처랩' 인기몰이
삼성바이오에피스, ISO 정보보호 경영시스템 인증
“잼버리 학생들 이쪽으로”…삼성 이재용 팔 걷어붙였다
삼성운용, KODEX반도체 순자산 5000억 돌파
자동차 기업도 아닌데...삼성전자, 유럽 최대 모터쇼 가는 속내는
"취미부터 취업까지 다양한 클래스"…삼성강남 '컬처랩' 인기
'삼성 강남'서 매주 오프라인 강좌 '컬처랩' 운영
삼성전자, 차별화된 오프라인 클래스 컬처랩 운영
삼성 때문에 4일째 잠 못 잔 유튜버…"Z플립5, 왜 고장이 안 나"
삼성 강남, 매주 특별한 클래스 '컬처랩' 진행


# 4. 함수화
- 외부와 통신하는 부분을 함수화하여 재사용성을 높인다.


- 요구사항
    - 입력
        - 키워드(문자열), 포맷(json(기본값) or xml, 문자열), 검색결과갯수(10~100, 정수)
    - 연산
        - 네이버 뉴스 검색 수행
    - 출력
        - 응답 결과를 json 객체로 리턴
    - 함수명
        - get_search_news

In [None]:
json.load()

In [None]:
# My Code
# 네이버 오픈 API 요청시 필요한 키값
# 이런 값들은 git 등에 업로드하면 절대 안됨!
import re
import html
import urllib
import urllib.request as req
import json


CLIENT_ID = 'Client ID'
CLIENT_SECRET = 'Client Secret'
DEV_NAVER_URL = "https://openapi.naver.com/v1/search/news.json?query={}&display=10&start=1&sort=sim"
def get_search_news(keyword : chr, type : chr, number : int) :
    enc_text = urllib.parse.quote(keyword)
    url = DEV_NAVER_URL.format( enc_text )
    request = req.Request(url) # 요청 객체 반환, 반환값 저장
    request.add_header("X-Naver-Client-Id", CLIENT_ID)
    request.add_header("X-Naver-Client-Secret", CLIENT_SECRET)
    response = req.urlopen( request )
    # 응답 결과 처리
    if response.getcode() == 200:
        res_json = json.load(response)
        print(res_json)
    else : print('오류 발생')

In [None]:
get_search_news('삼성', json, 10)

{'lastBuildDate': 'Tue, 08 Aug 2023 10:11:39 +0900', 'total': 10259017, 'start': 1, 'display': 10, 'items': [{'title': '&quot;갤Z플립5·폴드5 해냈다&quot;…<b>삼성</b>, 폴더블 사전 판매량 100만대 첫 돌파', 'originallink': 'http://www.newsis.com/view/?id=NISX20230808_0002405900&cID=13005&pID=13100', 'link': 'https://n.news.naver.com/mnews/article/003/0012018712?sid=105', 'description': '<b>삼성</b>전자 새 폴더블 스마트폰 갤럭시 Z 플립5·폴드5 국내 사전 판매량이 100만대를 넘어서며 폴더블 역대 최고 기록을 달성했다. <b>삼성</b>전자는 지난 1일부터 7일까지 1주일간 진행한 플립5·폴드5 사전 판매량은 최종... ', 'pubDate': 'Tue, 08 Aug 2023 09:23:00 +0900'}, {'title': '&quot;<b>삼성</b>맨 취업 꿀팁 쏠쏠해요&quot;…<b>삼성</b> 강남 &apos;컬처랩&apos; 인기몰이', 'originallink': 'https://www.hankyung.com/economy/article/202308079417g', 'link': 'https://n.news.naver.com/mnews/article/015/0004876789?sid=101', 'description': '<b>삼성</b>전자는 체험형 플래그십 스토어 &apos;<b>삼성</b> 강남&apos;에서 차별화된 오프라인 수업 &apos;컬처랩(Culture Lab)&apos;을 운영하고 있다고 7일 밝혔다. &apos;컬처랩&apos;은 <b>삼성</b>전자의 최신 모바일·가전제품을 활용해 다양한 콘텐츠를 즐기며 배우는... ', 'pubDate': 'Mon, 07 Au

In [None]:
import urllib
import urllib.request as req
import json

CLIENT_ID = 'Client ID'
CLIENT_SECRET = 'Client Secret'
DEV_NAVER_URL = "https://openapi.naver.com/v1/search/news.{}?query={}&display={}&start=1&sort=sim"

def get_search_news(keyword : str = '삼성', format : str = 'json', display : int = 10) -> dict:
    enc_text = urllib.parse.quote(keyword)    # '삼성' -> '%A......'
    url = DEV_NAVER_URL.format( format, enc_text, display )    #  url 완성
    request = req.Request(url)
    request.add_header('X-Naver-Client-Id', CLIENT_ID)
    request.add_header('X-Naver-Client-Secret', CLIENT_SECRET)
    res_json = None
    try:
        response = req.urlopen( request )
        code = response.getcode()
        if  code == 200:
            res_json = json.load( response )
            res_json['status'] = 'success'
        else:
            # 오류 발생시 어떯게 처리할지 협의 필요
            res_json = { 'status':'fail', 'code': code }
    except Exception as e:
        res_json = { 'status':'fail', 'code': -1 }
    finally:
        return res_json

get_search_news()

{'lastBuildDate': 'Tue, 08 Aug 2023 10:36:05 +0900',
 'total': 10259095,
 'start': 1,
 'display': 10,
 'items': [{'title': '&quot;갤Z플립5·폴드5 해냈다&quot;…<b>삼성</b>, 폴더블 사전 판매량 100만대 첫 돌파',
   'originallink': 'http://www.newsis.com/view/?id=NISX20230808_0002405900&cID=13005&pID=13100',
   'link': 'https://n.news.naver.com/mnews/article/003/0012018712?sid=105',
   'description': '<b>삼성</b>전자 새 폴더블 스마트폰 갤럭시 Z 플립5·폴드5 국내 사전 판매량이 100만대를 넘어서며 폴더블 역대 최고 기록을 달성했다. <b>삼성</b>전자는 지난 1일부터 7일까지 1주일간 진행한 플립5·폴드5 사전 판매량은 최종... ',
   'pubDate': 'Tue, 08 Aug 2023 09:23:00 +0900'},
  {'title': '&quot;<b>삼성</b>맨 취업 꿀팁 쏠쏠해요&quot;…<b>삼성</b> 강남 &apos;컬처랩&apos; 인기몰이',
   'originallink': 'https://www.hankyung.com/economy/article/202308079417g',
   'link': 'https://n.news.naver.com/mnews/article/015/0004876789?sid=101',
   'description': '<b>삼성</b>전자는 체험형 플래그십 스토어 &apos;<b>삼성</b> 강남&apos;에서 차별화된 오프라인 수업 &apos;컬처랩(Culture Lab)&apos;을 운영하고 있다고 7일 밝혔다. &apos;컬처랩&apos;은 <b>삼성</b>전자의 최신 모바일·가전제품을 활용해 다양한 콘텐츠를 즐기며 배우는..

In [None]:
results = get_search_news('카눈', display=20)
len( results['items'] )

20

In [None]:
# 응답 데이터에서 제목, 요약, 등록일 정보 추출
'''
결과를 파싱해서 뽑는 최종 형태
[
    {
        'title' : '내용'
        'description' : '요약'
        'pub_date' : '날짜정보'
    }

]
'''
import re
import html

# 형태 1
pattern = re.compile('<[a-z0-9]+>|</[a-z0-9]+>', re.IGNORECASE)
[{ 'title':pattern.sub('', html.unescape( news['title']) ).strip(),
'description':pattern.sub('', html.unescape( news['description']) ).strip(),
'pub_date':news['pubDate'] } for news in results['items']]

[{'title': '입추에도 폭염…내일부터 태풍 카눈 영향 전국에 비',
  'description': '강원영동·경북북동산지 제외 체감온도 35도 이상 무더위 카눈 경로 다소 서쪽으로…전국에 비바람 전망 변함 없어 절기상 입추(立秋)인 8일에도 강원영동을 제외하고는 폭염이 이어지겠다. 제6호 태풍 카눈 예상...',
  'pub_date': 'Tue, 08 Aug 2023 08:48:00 +0900'},
 {'title': "태풍 카눈 북상에 위기경보 '경계'로…중대본 2단계 가동",
  'description': "이번 조처는 제6호 태풍 '카눈'이 북상해 우리나라 전역에 직접적인 영향을 줄 것으로 확실시됨에 따라 범정부 차원의 선제적으로 대응하기 위한 것이다. 기상청에 따르면 태풍 카눈은 이날 오후 3시 기준 일본 오키나와...",
  'pub_date': 'Mon, 07 Aug 2023 18:44:00 +0900'},
 {'title': '행안부, 태풍 카눈 북상 대비 중대본 2단계 가동',
  'description': '행정안전부는 제6호 태풍 ‘카눈’이 북상해 우리나라 전역에 직접적인 영향을 줄 것으로 확실시됨에 따라... 기상청에 따르면, 태풍 카눈은 이날 15시 기준 일본 오키나와 동북동쪽 약 350km 부근 해상에서 126km/h로 동진...',
  'pub_date': 'Mon, 07 Aug 2023 18:40:00 +0900'},
 {'title': "'태풍 카눈 북상' 중대본 2단계 가동…위기경보 '경계' 상향",
  'description': "행정안전부는 제6호 태풍 '카눈'이 북상해 우리나라 전역에 직접적인 영향을 줄 것으로 확실시됨에 따라... 기상청에 따르면, 태풍 카눈은 오늘 오후 3시 기준 일본 오키나와 동북동쪽 약 350㎞ 부근 해상에서 126㎞/h로 동진...",
  'pub_date': 'Mon, 07 Aug 2023 18:53:00 +0900'},
 {'title': '태풍 ‘카눈’ 이미 간접영향권…중대본 바로 ‘2

In [None]:
# 형태2 람다 함수 사용

clean_str = lambda x:pattern.sub('', html.unescape( x ) ).strip()
final_results = [
    {
        'title'         : clean_str( news['title'] ),
        'description'   : clean_str( news['description'] ),
        'pub_date'      : news['pubDate']
    }
    for news in results[ 'items' ]
]
final_results[0], len(final_results)

({'title': '입추에도 폭염…내일부터 태풍 카눈 영향 전국에 비',
  'description': '강원영동·경북북동산지 제외 체감온도 35도 이상 무더위 카눈 경로 다소 서쪽으로…전국에 비바람 전망 변함 없어 절기상 입추(立秋)인 8일에도 강원영동을 제외하고는 폭염이 이어지겠다. 제6호 태풍 카눈 예상...',
  'pub_date': 'Tue, 08 Aug 2023 08:48:00 +0900'},
 20)

# 5. 데이터베이스 저장을 위한 DataFrame 변환
- 현재 형태 [{},{},{}....] -> DataFrame으로 변환 처리

In [None]:
import pandas as pd

In [None]:
df = pd.DataFrame.from_dict(final_results) # 사전 값을 DataFrame 형태로 변환
df.head(5)

Unnamed: 0,title,description,pub_date
0,입추에도 폭염…내일부터 태풍 카눈 영향 전국에 비,강원영동·경북북동산지 제외 체감온도 35도 이상 무더위 카눈 경로 다소 서쪽으로…전...,"Tue, 08 Aug 2023 08:48:00 +0900"
1,태풍 카눈 북상에 위기경보 '경계'로…중대본 2단계 가동,이번 조처는 제6호 태풍 '카눈'이 북상해 우리나라 전역에 직접적인 영향을 줄 것으...,"Mon, 07 Aug 2023 18:44:00 +0900"
2,"행안부, 태풍 카눈 북상 대비 중대본 2단계 가동",행정안전부는 제6호 태풍 ‘카눈’이 북상해 우리나라 전역에 직접적인 영향을 줄 것으...,"Mon, 07 Aug 2023 18:40:00 +0900"
3,'태풍 카눈 북상' 중대본 2단계 가동…위기경보 '경계' 상향,행정안전부는 제6호 태풍 '카눈'이 북상해 우리나라 전역에 직접적인 영향을 줄 것으...,"Mon, 07 Aug 2023 18:53:00 +0900"
4,태풍 ‘카눈’ 이미 간접영향권…중대본 바로 ‘2단계’ 가동,제6호 태풍 ‘카눈’이 북상하면서 10일 오전부터 우리나라 전역에 직접적인 영향을 ...,"Mon, 07 Aug 2023 21:13:00 +0900"


# 6. 데이터베이스에 저장

- 관계형 데이터베이스에 저장
    - 정형 데이터 형태로
    - 반정형 데이터 -> 가공 -> 정형 데이터로 저장하는 과정
- DB
    - mysql, maria,

In [None]:
# 파이썬 <->  mysql or mariadb ... 상호연동을 위해서는 해당 DB를 지원하는 패키지 설치가 필요함!
!pip install pymysql # 로컬에서 수행해야하는 작업 -> 추후 VS-Code 사용해야함

Collecting pymysql
  Downloading PyMySQL-1.1.0-py3-none-any.whl (44 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/44.8 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m44.8/44.8 kB[0m [31m1.1 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pymysql
Successfully installed pymysql-1.1.0


In [None]:
# 필요 모듈 가져오기
import pymysql
# 고급 기능
from sqlalchemy import create_engine # db <-> mysql <-> sqlalchemy <-> pandas
import pandas.io.sql as pSql

In [None]:
# 접속정보
IP = '127.0.0.1'
ID = 'root'
PW = '1234'
PORT = 3306
DBNAME = 'news'
TABLENM = 'tbl_news'
PROTOCAL = 'mysql+pymysql'

In [None]:
# 1. 접속 URL 생성 -> I/O -> with문, try ~ 병행
# 프로토콜명://아이디:비밀번호@IP(혹은도메인):포트/데이터베이스명?파라미터(인코딩...)
db_url = f'{PROTOCAL}://{ID}:{PW}@{IP}:{PORT}/{DBNAME}'
db_url

'mysql+pymysql://root:1234@127.0.0.1:3306/news'

In [None]:
# 2. 엔진 생성
from IPython.utils import encoding
engine = create_engine(db_url) # encoding = 'utf8'

In [None]:
# 3. 실제 연결 (클라우드에서는 안됨)
# ------------------------------------ 여기서부터는 로컬환경에서 실행 불가 ------------------------------------
conn = engine.connect()

In [None]:
#4. 데이터를 데이터베이스에 입력(밀어 넣는다)
# 테이블이 없다면 자동 생성 (테이블 자체가 효율적이지는 않다 -> 추후 수정 가능)
# 데이터는 기존 내용 지우고 덮어쓰기도 가능
# 기존 데이터에 이어서 추가도 가능 <- if_exists = 'append' : 누적해서 추가
df.to_sql(name = TABLENM, con = conn, if_exists = 'append', index=False)

In [None]:
# 5. 연결 닫기
conn.close()

# 7. 파이썬 덤프

- 단독 실행 코드로 *.py 파일 생성
- 코드 정리
    - 불필요한 내용 제거
- Local 환경에서 VS-code를 활용하여 DB에 저장

# 8. 자동화
- 준비사항
    - 파이썬의 가상환경
        - 프로젝트별로 별도의 실행공간을 설정하여 여러개의 프로그램이 가동되도 영향을 받지 않게 구성
        - 현재는 생략
    - 파이썬 실행 명령의 경로 획득
        - c://.../python.exe
            - 콘솔 or 터미널등 창이 뜨고 실행
        - c://.../pythonw.exe -> 이거 사용한다
            - 벡엔드 프로세스로 실행됨
    - 파이썬 실행 파일의 위치 정보
        - C:\Users\NT551XCJ\Desktop\py_projects\auto
    - 파이썬 파일
        - run.py
- 방법
    - 윈도우 -> 윈도우 서버가 적합 (가장 쉽고 시간 정확함)
        - 작업 스케줄러
            - 일반 : 제목, 내용 등등
            - 트리거 : 이벤트 발생시간, 주기 지정
            - 동작 : 경로, 실행파일, 인자 등등 세팅
    - 리눅스 / 맥
        - cron 명령어 사용
    - 패키지 활용하여 SW적으로 처리