Skip to content

xiao-wu-1024/demo_reptile

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

java爬虫(demo)

特别备注,本demo仅供学习参考

描述

  • 框架 SpringBoot + MyBatis-Plus
  • 数据库 Mysql
  • 使用前记得 导入sql脚本文件(重要的事说三遍)
  • 使用前记得 导入sql脚本文件(重要的事说三遍)
  • 使用前记得 导入sql脚本文件(重要的事说三遍)

sql脚本

CREATE TABLE `test_reptile` (
  `id` bigint NOT NULL AUTO_INCREMENT COMMENT '主键',
  `name` varchar(20) DEFAULT NULL COMMENT '链接名称',
  `url` varchar(400) NOT NULL COMMENT '链接',
  `other` varchar(255) DEFAULT NULL COMMENT '备用字段',
  `type` bigint NOT NULL COMMENT '链接类型',
  `domain_id` bigint NOT NULL COMMENT '域名id',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=29 DEFAULT CHARSET=utf8 COMMENT='爬虫链接库';

## 这个是预留表
CREATE TABLE `test_reptile_label` (
  `id` bigint NOT NULL AUTO_INCREMENT,
  `html_label` varchar(60) NOT NULL COMMENT '标签名',
  `html_label_attributes` varchar(60) NOT NULL COMMENT '标签属性',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=utf8 COMMENT='爬虫html标签库';

CREATE TABLE `test_source` (
  `id` bigint NOT NULL AUTO_INCREMENT,
  `source_name` varchar(20) DEFAULT NULL COMMENT '资源库名称(网站)',
  `source_url` varchar(255) DEFAULT NULL COMMENT '资源库域名',
  `source_top` varchar(255) DEFAULT NULL COMMENT '资源库前缀(多个)',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=13 DEFAULT CHARSET=utf8 COMMENT='资源网站';

About

爬图片和网站上的所有链接

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages