Skip to content

whxcode/Crawl

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

数据转载应声明原创地址、如要作为商用应该向原作者商议后

golang中文官网部分数据爬取

因为golang天然支持并发、所以在这个程序中无论是存储还是爬取都使用了多线程

在 bin 文件夹中已经打包了三个平台(windows、macOs、linux)的可执行文件 获取数据成功后会在当前运行的目录下新建一个 data.json 文件

命令行解释

-t 是开启数据存储(先要爬取才能够存储) -s 启始页(1) -e 结束页(2)

使用方法

1、爬取数据

./main -s 1 -e 205(因为目前go中文网主题是205页) Text image

2、存储数据

./main -t(注意数据库) Text image

About

一个爬虫demo

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages