# 데이터 베이스
- 규모가 크지 않은 데이터라면 csv와 json형식으로 사용해도 문제는 없음.
- 데이터 규모가 굉장히 크거나 복잡하면 데이터베이스를 사용하는 것이 편리.


### 장점
- 데이터와 관련된 모든 처리를 하나의 소프트웨어로 할 수 있음.
- 여러 데이터의 속성을 연관시키며 저장 가능.
- 중복된 데이터를 허용하지 않는 제약을 둘 수 있음.
- 데이터의 정합성을 확보.
- 데이터에 동시 접근했을 경우 문제 처리.
- 대량의 데이터를 조금씩 읽어 사용 할 수 있으며 정렬 등도 쉽게 처리함.



### SQLite
: 가볍게 파일 하나로 사용할 수 있는 데이터베이스


In [2]:
import sqlite3

# sqlite Database에 연결하기
dbpath = "../Data/test.sqlite"
conn = sqlite3.connect(dbpath)

# 테이블을 생성하고 데이터 넣기
curs = conn.cursor()
curs.executescript(
    """
    /* item 테이블이 이미 있다면 제거 */
    DROP TABLE IF EXISTS items;

    /* 테이블 생성하기 */
    CREATE TABLE items(
        item_id INTEGER PRIMARY KEY AUTOINCREMENT,
        name TEXT UNIQUE,
        price INTEGER
    );

    /* 데이터 넣기 */
    INSERT INTO items(name, price) VALUES('Apple', 800);
    INSERT INTO items(name, price) VALUES('Orange', 780);
    INSERT INTO items(name, price) VALUES('Banana', 430);
    """
)

<sqlite3.Cursor at 0x7fb89d050a40>

In [3]:
# 위의 조작을 데이터베이스에 반영하기
conn.commit()

In [7]:
# 데이터 추출하기
curs = conn.cursor()
curs.execute("SELECT item_id, name, price FROM items")
item_list = curs.fetchall()

#출력하기
for it in item_list:
    print(it,type(it))

(1, 'Apple', 800) <class 'tuple'>
(2, 'Orange', 780) <class 'tuple'>
(3, 'Banana', 430) <class 'tuple'>


In [8]:
# 데이터 넣기
curs = conn.cursor()
curs.execute("INSERT INTO items (name,price) VALUES (?,?)",("Mango",5200))
conn.commit()

In [11]:
# 여러 데이터를 연속으로 넣기
curs = conn.cursor()
data = [("Kiwi", 4000),("Grape", 8000),("Peach",9400)]
curs.executemany("INSERT INTO items (name,price) VALUES (?,?)", data)
conn.commit()

In [13]:
# 4000 ~ 7000원 사이의 데이터 추출하기
curs = conn.cursor()
price_range = (4000, 7000)
curs.execute("SELECT * FROM items WHERE price between ? AND ?",price_range)
item_list = curs.fetchall()

#출력하기
for it in item_list:
    print(it,type(it))

(4, 'Mango', 5200) <class 'tuple'>
(5, 'Kiwi', 4000) <class 'tuple'>


---
# MySQL 연결

In [14]:
!pip install pymysql

Collecting pymysql
  Downloading PyMySQL-1.0.2-py3-none-any.whl (43 kB)
[K     |████████████████████████████████| 43 kB 2.2 MB/s eta 0:00:01
[?25hInstalling collected packages: pymysql
Successfully installed pymysql-1.0.2


In [3]:
import pymysql

In [18]:
# connection
conn = pymysql.connect(host="127.0.0.1", user = "root", password="qwer1234", \
                        db = "education", charset="utf8")

In [19]:
# Connection으로 부터 Cursor 생성
curs = conn.cursor()

In [19]:
# SQL 문장
sql = "select * from student"
curs.execute(sql)

22

In [12]:
# Data Fetch
rows = curs.fetchall()
print(rows)

(('b002', '관우', '심리학과', '010-222', '서울'), ('b003', '장비', '경제학과', '010-333', '서울'), ('c001', '조조', '국문학과', '016-111', '경기'), ('c002', '여포', '심리학과', '016-222', '경기'), ('c003', '손견', '경제학과', '016-333', '경기'), ('d001', '홍길동', '수학과', '017-001', '광주'), ('q001', '유비', '국문학과', '010-1111', '서울'), ('q002', '관우', '심리학과', '010-2222', '서울'), ('q003', '장비', '경제학과', '010-3333', '서울'), ('S001', '박소명', '컴퓨터공학과', '123-4567', None), ('S002', '최민국', '컴퓨터공학과', '234-5678', None), ('S003', '이승호', '국문학과', '345-6789', None), ('S004', '정수봉', '국문학과', '456-7890', None), ('S005', '김상진', '사학과', '567-8901', None), ('S006', '황정숙', '사학과', '678-9012', None), ('S010', 'James', 'Computer', '1234', None), ('S777', 'Cathy', 'Math', '12345', None), ('S888', 'James', 'math', '1234', None), ('S999', '홍길동', '컴공', '123', None))


In [26]:
# Connection 종료
conn.close()

In [47]:
# list로 변환
rowList = list(rows)
print(rowList, len(rowList))

[] 0


In [31]:
# data type 확인

type(rowList)

list

In [33]:
# 필요한 부분 데이터 빼오기
print(rowList[0])
print(rowList[0][1])

('b002', '관우', '심리학과', '010-222', '서울')
관우


## Insert Data #1

In [4]:
# connection
conn = pymysql.connect(host="127.0.0.1", user = "root", password="qwer1234", \
                        db = "education", charset="utf8")


In [5]:
# Connection으로 부터 Cursor 생성
curs = conn.cursor()

In [6]:
# SQL 문장
sql = "insert into student (scode, sname, sdept, sphone, saddress) values (%s, %s, %s, %s, %s)"

In [7]:
# Insert 실행
curs.execute(sql, ('q001','유비','국문학과','010-1111','서울'))
curs.execute(sql, ('q002','관우','심리학과','010-2222','서울'))
curs.execute(sql, ('q003','장비','경제학과','010-3333','서울'))

1

In [8]:
conn.commit()

In [None]:
# SQL 문장
sql = "select * from student"
curs.execute(sql)

In [22]:
# Data Fetch
rows = curs.fetchall()
print(rows)

()


## Insert Data #2

In [13]:
# connection
conn = pymysql.connect(host="127.0.0.1", user = "root", password="qwer1234", \
                        db = "education", charset="utf8")

In [14]:
# Connection으로 부터 Cursor 생성
curs = conn.cursor()

In [15]:
data = (
    ('w001', '조조', '국문학과', '016-111', '경기'),
    ('w002', '여포', '심리학과', '016-222', '경기'),
    ('w003', '손권', '경제학과', '016-333', '경기')
)

In [16]:
# SQL 문장
sql = "insert into student (scode, sname, sdept, sphone, saddress) values (%s, %s, %s, %s, %s)"

In [17]:
curs.executemany(sql,data)

3

In [18]:
conn.commit()

In [20]:
# SQL 문장
sql = "select * from student"
curs.execute(sql)

22

In [21]:
# Data Fetch
rows = curs.fetchall()
print(rows)

(('b002', '관우', '심리학과', '010-222', '서울'), ('b003', '장비', '경제학과', '010-333', '서울'), ('c001', '조조', '국문학과', '016-111', '경기'), ('c002', '여포', '심리학과', '016-222', '경기'), ('c003', '손견', '경제학과', '016-333', '경기'), ('d001', '홍길동', '수학과', '017-001', '광주'), ('q001', '유비', '국문학과', '010-1111', '서울'), ('q002', '관우', '심리학과', '010-2222', '서울'), ('q003', '장비', '경제학과', '010-3333', '서울'), ('S001', '박소명', '컴퓨터공학과', '123-4567', None), ('S002', '최민국', '컴퓨터공학과', '234-5678', None), ('S003', '이승호', '국문학과', '345-6789', None), ('S004', '정수봉', '국문학과', '456-7890', None), ('S005', '김상진', '사학과', '567-8901', None), ('S006', '황정숙', '사학과', '678-9012', None), ('S010', 'James', 'Computer', '1234', None), ('S777', 'Cathy', 'Math', '12345', None), ('S888', 'James', 'math', '1234', None), ('S999', '홍길동', '컴공', '123', None), ('w001', '조조', '국문학과', '016-111', '경기'), ('w002', '여포', '심리학과', '016-222', '경기'), ('w003', '손권', '경제학과', '016-333', '경기'))


---
### select의 내용을 dataFrame으로 보기

In [23]:
!pip install sqlalchemy



In [24]:
import pandas as pd
from sqlalchemy import create_engine

In [26]:
engine = create_engine("mysql+pymysql://root:qwer1234@127.0.0.1:3306/education")
conn = engine.connect()

In [28]:
data =pd.read_sql_table('student',conn)
data

Unnamed: 0,scode,sname,sdept,sphone,saddress
0,b002,관우,심리학과,010-222,서울
1,b003,장비,경제학과,010-333,서울
2,c001,조조,국문학과,016-111,경기
3,c002,여포,심리학과,016-222,경기
4,c003,손견,경제학과,016-333,경기
5,d001,홍길동,수학과,017-001,광주
6,q001,유비,국문학과,010-1111,서울
7,q002,관우,심리학과,010-2222,서울
8,q003,장비,경제학과,010-3333,서울
9,S001,박소명,컴퓨터공학과,123-4567,


In [29]:
conn.close()

---
### dataFrame을 Database로 Insert 하기

In [35]:
column = ['rank','title']
movies = pd.read_csv("../Data/DaumList.csv")
movies.columns = column
movies.head()

Unnamed: 0,rank,title
0,1,탑건: 매버릭
1,2,마녀(魔女) Part2. The Other One
2,3,범죄도시 2
3,4,브로커
4,5,버즈 라이트이어


In [36]:
engine = create_engine("mysql+pymysql://root:qwer1234@127.0.0.1:3306/daum")
conn = engine.connect()

In [37]:
movies.to_sql(name='movie',con = engine, if_exists='append',index=False) #if_exists 만약에 테이블이 있다면 append 로 추가하기

In [40]:
daum = pd.read_sql_table('movie',conn)
daum

Unnamed: 0,rank,title
0,1,탑건: 매버릭
1,2,마녀(魔女) Part2. The Other One
2,3,범죄도시 2
3,4,브로커
4,5,버즈 라이트이어
5,6,쥬라기 월드: 도미니언
6,7,극장판 윌벤져스 : 수상한 캠핑 대소동
7,8,극장판 포켓몬스터DP: 기라티나와 하늘의 꽃다발 쉐이미
8,9,헤어질 결심
9,10,룸 쉐어링


In [43]:
column = ['rank','title','content']
ridibooks = pd.read_csv("../Data/ridi200.csv")
ridibooks.columns = column
ridibooks.head()

Unnamed: 0,rank,title,content
0,1,역행자,"<역행자> 오타쿠 흙수저에서 월 1억 자동수익을 실현한 무자본 연쇄창업마,\r\n라..."
1,2,작별인사,"<작별인사> 누구도 도와줄 수 없는 상황, 혼자 헤쳐나가야 한다\r\n지켜야 할 약..."
2,3,인플레이션에서 살아남기,"<인플레이션에서 살아남기> \n\n40년 만에 찾아온 인플레의 역습, \r\n당신의..."
3,4,변화하는 세계 질서,<변화하는 세계 질서> \n\n《원칙 Principles: Life & Work》으...
4,5,피스타운,"<피스타운> -“여긴 너무 비현실적이야, 그렇지 않아?”\r\n-뭐든지 이룰 수 있..."


In [44]:
engine = create_engine("mysql+pymysql://root:qwer1234@127.0.0.1:3306/ridibooks")
conn = engine.connect()

In [45]:
ridibooks.to_sql(name='bestseller',con = engine, if_exists='append',index=False) #if_exists 만약에 테이블이 있다면 append 로 추가하기

In [46]:
bestseller = pd.read_sql_table('bestseller',conn)
bestseller

Unnamed: 0,rank,title,content
0,1,역행자,"<역행자> 오타쿠 흙수저에서 월 1억 자동수익을 실현한 무자본 연쇄창업마,\r\n라..."
1,2,작별인사,"<작별인사> 누구도 도와줄 수 없는 상황, 혼자 헤쳐나가야 한다\r\n지켜야 할 약..."
2,3,인플레이션에서 살아남기,"<인플레이션에서 살아남기> \n\n40년 만에 찾아온 인플레의 역습, \r\n당신의..."
3,4,변화하는 세계 질서,<변화하는 세계 질서> \n\n《원칙 Principles: Life & Work》으...
4,5,피스타운,"<피스타운> -“여긴 너무 비현실적이야, 그렇지 않아?”\r\n-뭐든지 이룰 수 있..."
...,...,...,...
195,196,데미안,<데미안> 데미안을 통해 참다운 어른이 되어 가는 소년 싱클레어의 이야기.\r\n한...
196,197,합리적 남자,<합리적 남자> \n\n작가는 인터넷 공간에서 롤로 토마시라는 필명으로 활동하며 전...
197,198,개정판 | 현명한 투자자 1,<개정판 | 현명한 투자자 1> \n\n가치투자의 아버지 벤저민 그레이엄의 《현명한...
198,199,나의 월급 독립 프로젝트,<나의 월급 독립 프로젝트> \n\n종잣돈 480만원으로 시작해 3년 만에 30억 ...


In [48]:
#BeautifulSoup
from bs4 import BeautifulSoup

#request
from urllib.request import urlopen

url = 'https://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnId=108'
page = urlopen(url)
soup = BeautifulSoup(page, 'html.parser')


In [60]:
soup

<?xml version="1.0" encoding="utf-8" ?>
<rss version="2.0">
<channel>
<title>기상청 육상 중기예보</title>
<link/>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp
<description>기상청 날씨 웹서비스</description>
<language>ko</language>
<generator>기상청</generator>
<pubdate>2022년 06월 28일 (화)요일 06:00</pubdate>
<item>
<author>기상청</author>
<category>육상중기예보</category>
<title>전국 육상 중기예보 - 2022년 06월 28일 (화)요일 06:00 발표</title>
<link/>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp
<guid>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp</guid>
<description>
<header>
<title>전국 육상중기예보</title>
<tm>202206280600</tm>
<wf><![CDATA[○ (강수) 1일(금)은 수도권과 강원영서, 4일(월)은 제주도, 5일(화)은 전국에 비가 오는 곳이 있겠습니다.<br />○ (기온) 이번 예보기간 아침 기온은 22~24도로 어제(27일, 아침최저기온 23~29도)와 비슷하거나 조금 낮겠고,<br />          낮 기온은 27~34도로 어제(27일, 낮최고기온 24~32도)와 비슷하거나 조금 높겠습니다.<br />○ (주말전망) 2일(토)은 중부지방은 대체로 흐리고, 남부지방은 구름많겠으며, 3일(일)은 전국이 구름많겠습니다. 아침 기온은 22~24도, 낮 기온은 27~34도가 되겠습니다.<br /><br />* 1일(금)에는 정체전선의 위치에 따라 강수 구역이 변동될 수 있으며 정체전선의 영향권에서 벗어난 지역에서도

In [70]:
locs = soup.find_all("location")

count = 0

seq = []
city = []
tmef = []
wf = []
tmn = []
tmx = []

for loc in locs:
    
    datas = loc.find_all("data")
    for data in datas:
        count += 1
        seq.append(count)
        city.append(loc.find("city").string)
        tmef.append(data.find("tmef").string)
        wf.append(data.find("wf").string)
        tmn.append(data.find("tmn").string)
        tmx.append(data.find("tmx").string)


    

In [96]:
import pandas as pd

In [97]:
# data = []
# for q,w,e,r,t,y in zip(seq,city,tmef,wf,tmn,tmx):
#     data.append([q,w,e,r,t,y])
data = []
for w,e,r,t,y in zip(city,tmef,wf,tmn,tmx):
    data.append([w,e,r,t,y])

In [98]:
column = ['city','tmef','wf','tmn','tmx']
df = pd.DataFrame(data=data,columns= column)

In [99]:
engine = create_engine("mysql+pymysql://root:qwer1234@127.0.0.1:3306/weather")
conn = engine.connect()
df.to_sql(name='forecast',con = engine, if_exists='append',index=False) #if_exists 만약에 테이블이 있다면 append 로 추가하기

In [100]:
forecast = pd.read_sql_table('forecast',conn)
forecast

Unnamed: 0,seq,city,tmef,wf,tmn,tmx
0,1,서울,2022-07-01 00:00,흐리고 비,23,28
1,2,서울,2022-07-01 12:00,흐리고 비,23,28
2,3,서울,2022-07-02 00:00,흐림,23,29
3,4,서울,2022-07-02 12:00,구름많음,23,29
4,5,서울,2022-07-03 00:00,구름많음,23,30
...,...,...,...,...,...,...
528,529,서귀포,2022-07-05 00:00,흐리고 비,24,27
529,530,서귀포,2022-07-05 12:00,흐림,24,27
530,531,서귀포,2022-07-06 00:00,흐림,24,28
531,532,서귀포,2022-07-07 00:00,흐림,24,28


In [101]:
conn.close()