### 파이썬 크롤링
> 데이터를 자동으로 저장하는 모습을 보여드리기 위해, 크롤링 기술을 가볍게 활용하기로 함 <br>
> 파이썬 입문과 크롤링 부트캠프에서 익힌 크롤링 기술을 활용하기로 함

In [None]:
import requests
from bs4 import BeautifulSoup

for pnum in range(10):
    if pnum == 0: res = requests.get('https://davelee-fun.github.io/')
    else: res = requests.get('https://davelee-fun.github.io/page'+str(pnum+1))
    soup = BeautifulSoup(res.content, 'html.parser')
    data = soup.select('div.card-body')
    
    for item in data:
        category = item.select_one('h2.card-title').get_text().replace('관련 상품 추천','').strip()
        product = item.select_one('h4.card-text').get_text().replace('상품명:','').strip()
        print(category, product)

### Schema 구성
> workbench 를 통해, schema 구성 <br>
> 일회성 schema 는 파이썬으로 자동으로 하기보다는 workbench 를 활용하는 것이 일반적임

```sql
DROP DATABASE IF EXISTS ecommerce;
CREATE DATABASE ecommerce;
USE ecommerce;
CREATE TABLE teddyproducts (
    ID INT UNSIGNED NOT NULL AUTO_INCREMENT,
    TITLE VARCHAR(200) NOT NULL,
    CATEGORY VARCHAR(20) NOT NULL,
    PRIMARY KEY(ID)
);
```

### 크롤링 + mysql 저장

In [None]:
import requests, pymysql
from bs4 import BeautifulSoup

db = pymysql.connect(
    host='localhost', 
    port=3306, 
    user='root', 
    passwd='12345678', 
    db='ecommerce', 
    charset='utf8')
cursor = db.cursor()

for pnum in range(10):
    if pnum == 0: res = requests.get('https://davelee-fun.github.io/')
    else: res = requests.get('https://davelee-fun.github.io/page'+str(pnum+1))
    soup = BeautifulSoup(res.content, 'html.parser')
    data = soup.select('div.card-body')
    
    for item in data:
        category = item.select_one('h2.card-title').get_text().replace('관련 상품 추천','').strip()
        product = item.select_one('h4.card-text').get_text().replace('상품명:','').strip()
        print(category, product)
        sql= """INSERT INTO teddyproducts (TITLE, CATEGORY) VALUES('"""+product+"""', '"""+category+"""');"""
        print(sql)
        cursor.execute(sql)
        
db.commit()
db.close()

행거도어 리빙스토리 1+1 문에 거는 문 옷걸이 음자리 도어후크 방문 행거, 음자리도어후크-로즈골드, 2개
INSERT INTO teddyproducts (TITLE, CATEGORY) VALUES('리빙스토리 1+1 문에 거는 문 옷걸이 음자리 도어후크 방문 행거, 음자리도어후크-로즈골드, 2개', '행거도어');
행거도어 나이스후크 도어행거 2개 세트 (문행거), 블랙+화이트
INSERT INTO teddyproducts (TITLE, CATEGORY) VALUES('나이스후크 도어행거 2개 세트 (문행거), 블랙+화이트', '행거도어');
행거도어 리빙파이 도어훅 옷걸이 행거 7구, 블랙, 1개
INSERT INTO teddyproducts (TITLE, CATEGORY) VALUES('리빙파이 도어훅 옷걸이 행거 7구, 블랙, 1개', '행거도어');
행거도어 선우랜드 우드볼 도어훅 10구, 실버, 1개
INSERT INTO teddyproducts (TITLE, CATEGORY) VALUES('선우랜드 우드볼 도어훅 10구, 실버, 1개', '행거도어');
행거도어 웰렉스 도어행거 MH1060 신형 본사직발송 미니건조대 도어옷걸이 도어훅, 고동색, 1개
INSERT INTO teddyproducts (TITLE, CATEGORY) VALUES('웰렉스 도어행거 MH1060 신형 본사직발송 미니건조대 도어옷걸이 도어훅, 고동색, 1개', '행거도어');
행거도어 엔비 엔틱 7구 도어훅 옷걸이, 도어훅 1+1, 1+1
INSERT INTO teddyproducts (TITLE, CATEGORY) VALUES('엔비 엔틱 7구 도어훅 옷걸이, 도어훅 1+1, 1+1', '행거도어');
행거도어 코시나 무타공 문걸이 후크선반 1단, 화이트, 1개
INSERT INTO teddyproducts (TITLE, CATEGORY) VALUES('코시나 무타공 문걸이 후크선반 1단, 화이트, 1개', '행거도어');
행거도어 코시나 무타공 올스텐 문걸이행거, 혼합 색

### mysql 데이터 읽기

In [None]:
import pymysql

db = pymysql.connect(
    host='localhost', 
    port=3306, 
    user='root', 
    passwd='12345678', 
    db='ecommerce', 
    charset='utf8')

cursor = db.cursor()
sql = "SELECT * FROM teddyproducts WHERE CATEGORY = '행거도어';"
cursor.execute(sql)
rows = cursor.fetchall()
for row in rows:
    print(row[1])

db.close()

<div class="alert alert-block" style="border: 2px solid #E65100;background-color:#FFF3E0;padding:10px">
<font size="4em" style="font-weight:bold;color:#BF360C;">기본 데이터 분석</font><br>
<font size="3em" style="color:#BF360C;">카테고리 종류를 알려주세요</font>
    
<code>
SELECT DISTINCT CATEGORY FROM teddyproducts
</code>

    DISTINCT - 중복된 거 제외

</div>

In [15]:
import pymysql

db = pymysql.connect(
    host='localhost',
    port=3306,
    user='root',
    passwd='12345678',
    db='ecommerce',
    charset='utf8')

cursor = db.cursor()
sql = "SELECT DISTINCT CATEGORY FROM teddyproducts;"
cursor.execute(sql)
rows = cursor.fetchall() #전부 조회
for row in rows:
    print(row)
db.close()

('매트리스커버',)
('여름이불세트',)
('행거도어',)


<div class="alert alert-block" style="border: 2px solid #E65100;background-color:#FFF3E0;padding:10px">
<font size="4em" style="font-weight:bold;color:#BF360C;">기본 데이터 분석</font><br>
<font size="3em" style="color:#BF360C;">카테고리별 상품 갯수를 알려주세요</font>
    
<code>
SELECT CATEGORY, COUNT(*) FROM teddyproducts GROUP BY CATEGORY
</code>
    
</div>

In [16]:
import pymysql

db = pymysql.connect(
    host='localhost',
    port=3306,
    user='root',
    passwd='12345678',
    db='ecommerce',
    charset='utf8')

cursor = db.cursor()
sql = "SELECT CATEGORY, COUNT(*) FROM teddyproducts GROUP BY CATEGORY;"
cursor.execute(sql)
rows = cursor.fetchall() #전부 조회
for row in rows:
    print(row)
db.close()

('매트리스커버', 62)
('여름이불세트', 62)
('행거도어', 64)
