Popular repositories Loading
-
-
fengchao
fengchao PublicForked from lipengyu/uudatahive
蜂巢爬虫系统 是一套只需要定义XPath,就可实现爬取网站,APP的系统, 支持多种解析方式(XPath,正则表达式),多种下载方式(HttpClient库, PhantomJs, Selenium),多种输出方式(Excel,MongoDB)。 可不做任何修改发布到Yarn,Docker,Mesos系统中实现分布式。
Java
-
ScriptSpider
ScriptSpider PublicForked from xjtushilei/ScriptSpider
自主研发的一个java版本的分布式的通用爬虫,可以热插拔各个组件(提供默认的),自动切换代理,自动结构化数据与存储。使用redis,分布式调度等技术。
Java
-
spider-1
spider-1 PublicForked from JFanZhao/spider
使用java+httpclient+httpcleaner,多线程、分布式爬去电商网站商品信息,数据存储在hbase上,并使用solr对商品建立索引,使用redis队列存储一个共享的url仓库;使用zookeeper对爬虫节点生命周期进行监视等。
Java
-
spring-boot-api-project-seed
spring-boot-api-project-seed PublicForked from lihengming/spring-boot-api-project-seed
🌱🚀一个基于Spring Boot & MyBatis的种子项目,用于快速构建中小型API、RESTful API项目
Java
If the problem persists, check the GitHub status page or contact support.