Skip to content

pjt3591oo/webtoon_crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

네이버 웹툰 크롤러

해당 크롤러는 네이버의 요일별 웹툰 정보를 수집하여 디비에 저장을 하는 크롤러 입니다.

사용디비

db : mysql or mariaDB
library : sqlalchepy(orm)

다른 디비를 사용 할 경우 /config/DB_config.py를 수정 해 주시면 됩니다 uri만 수정하여 사용. 나머지 정보는 부가적인 정보.

의존 모듈 설치

$ pip3 install -r requirements.txt

크롤러 실행

$ python3 webtoon.py

댓글을 저장하는 기본값은 3페이지 입니다 만약 더 많은 댓글을 수직하고 싶다면 data_parse에 3번쨰 인자로 수치를 넣어 주세요

디비 테이블 구성

CREATE TABLE webtoons(
    id INT NOT NULL PRIMARY KEY AUTO_INCREMENT,
    title VARCHAR(250),
    titleId VARCHAR(250),
    weekday VARCHAR(250)
);

CREATE TABLE webtoonCuts(
    id INT NOT NULL PRIMARY KEY AUTO_INCREMENT,
    titleId VARCHAR(250),
    no VARCHAR(250),
    no_title VARCHAR(250),
    rank FLOAT(10)
);

CREATE TABLE webtoonCuts(
    id INT NOT NULL PRIMARY KEY AUTO_INCREMENT,
    titleId VARCHAR(250),
    no VARCHAR(250),
    commentNo VARCHAR(250),
    content VARCHAR(250)
);

About

naver webtoon crawler

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages