GitHub - SAOInformaticsTeam/webspider: 在线地址: http://www.jobinfo.cc:8000/

--	--
Version	1.0.1
WebSite	http://www.jobinfo.cc:8000/
Source	https://github.com/GuozhuHe/webspider
Keywords	`Python3`, `Tornado`, `Celery`, `Requests`, `Job`

关于本网站

编写这个项目的初衷是本人在找工作时，一直想对所求职位的薪水待遇、学历要求等等的方面有一个全面的了解，但苦于没有客观直接的信息，所以就自己动手编写了这个网站，网站的数据采集自某个专注于互联网招聘的平台，定期更新，真实有效。本网站从多维度展示互联网相关工作岗位的情况，包括每种岗位薪资范围、学历要求、工作经验要求等等，以饼图、线型图等多种方式呈现。希望能在找工作的时候对你有所帮助。

项目简介

本项目使用的编程语言是python3，数据库用的是MySQL, 主要用到的库是celery和requests，并实现了定时任务，出错重试，日志记录，自动更改Cookies等的功能，使用ECharts + Bootstrap 来构建前端页面。

展示页面

Quick Start

以下操作均是在 Linux - Ubuntu 环境下执行

克隆项目

git clone git@github.com:GuozhuHe/webspider.git

安装 MySQL, Redis, Python3

# 安装 redis
apt-get install redis-server

# 后台启动 redis-server
nohup redis-server &

# 安装 python3
apt-get install python3

# 安装 MySQL
apt-get install mysql-server

# 启动 MySQL
sudo service mysql start

配置数据库和表

# 创建数据库
CREATE DATABASE `spider` CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
# 还需要创建相关表，表的定义语句在 tests/schema.sql 文件中，可自行复制进 MySQL 命令行中执行。

make
# 构建成功后项目的 env/bin 目录下会有可执行脚本

执行单元测试

make test

代码风格检查

make flake8

运行 Web Server

env/bin/web

运行爬虫程序

# 启动定时任务分发器
env/bin/celery_beat
# 启动爬取 拉勾数据 的 worker
env/bin/celery_lagou_data_worker
# 启动爬取 职位数据 的 worker
env/bin/celery_lagou_jobs_data_worker
# 启动爬取 职位数量 的 worker
env/bin/celery_lagou_jobs_count_worker

# 直接爬取职位数量
env/bin/crawl_lagou_jobs_count
# 直接爬取职位数据
env/bin/crawl_lagou_data
# 启动celery监控 
env/bin/celery_flower

清除构建信息

make clean

TODO

前后端分离
更为丰富的数据展示维度
重构爬虫
缓存、失效机制
Fix Bug: MySQL Server has gone away. 详见此MR

Name		Name	Last commit message	Last commit date
Latest commit History 50 Commits
tests		tests
webspider		webspider
.gitattributes		.gitattributes
.gitignore		.gitignore
.landscape.yml		.landscape.yml
.travis.yml		.travis.yml
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
job-chart.jpg		job-chart.jpg
requirements.txt		requirements.txt
setup.cfg		setup.cfg
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

关于本网站

项目简介

展示页面

Quick Start

TODO

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

SAOInformaticsTeam/webspider

Folders and files

Latest commit

History

Repository files navigation

关于本网站

项目简介

展示页面

Quick Start

TODO

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages