使用说明

详细介绍请看博客：风雨雾凇

环境准备：

python3.6
scrapy1.5
numpy
PIL
wordcloud
pymysql
jieba 具体安装教程请百度。

将unit目录放入你的python安装目录下的lib下。里面放着的是项目需要用到的header字典。

抓取数据

使用git下载完整项目后，打开**/lagou/lagou/pipelines.py**文件。修改第26、41行：（建议数据库名为lagou，表名为lagou）

      修改表名lagou
26    sql = "insert into lagou values(null,\"%s\",\"%s\",\"%s\",\"%s\",\"%s\",\"%s\",\"%s\",\"%s\",\"%s\")" % (
      #修改成你的数据库host和用户密码、数据库名
41    sql = sqlHelper("localhost", "root", "admin", "lagou")

scrapy crawl lagouSpider

等待5分钟左右即可爬取完成并存入数据库中。查看数据库：
如果想抓取其他职业数据，将**/lagou/lagou/spiders/lagouSpider.py**第12行url改成对应职位：

       #30改成对应总页数
11     for i in range(1, 30):
       #java
12     start_urls.append('https://www.lagou.com/zhaopin/Java/2/?filterOption=' + str(i))
       #python
12     start_urls.append('https://www.lagou.com/zhaopin/Python/2/?filterOption=' + str(i))

制作词云

打开**/chiyun/demo.py**,同样修改51行的数据库相关代码后，运行，稍等片刻则可以出现结果。

制作其他关键词词云请修改**/chiyun/demo.py**,55行：

54    for data in datas:
          # 2对应拉钩网每个职位的工资范围 （可以通过修改代码计算出平均范围）
          # 3对应拉钩网每个职位的最低要求
          # 4对应拉钩网每个职位的关键要求tag
          # 6对应拉钩网每个招聘公司类型
          # 8对应拉钩网招聘公司的关键词
55        text += data[4]

例如修改为8：得到结果图：
如果不喜欢这张图片或字体可以更换。将你想要生成的图片和字体放进该文件夹，修改/lagou/lagou/spiders/lagouSpider.py 第58、59行。

      #更改为你放进去的字体和背景图名称
58    font = path.join(path.dirname(__file__), "xingshu.ttf")
59    background = np.array(Image.open(path.join(d, "demo.webp")))

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
__pycache__		__pycache__
chiyun		chiyun
lagou		lagou
unit		unit
README.md		README.md
__init__.py		__init__.py
lagou.sql		lagou.sql
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

使用说明

详细介绍请看博客：风雨雾凇

将unit目录放入你的python安装目录下的lib下。里面放着的是项目需要用到的header字典。

抓取数据

制作词云

About

Releases

Packages

Languages

fengyuwusong/lagou-scrapy

Folders and files

Latest commit

History

Repository files navigation

使用说明

详细介绍请看博客：风雨雾凇

将unit目录放入你的python安装目录下的lib下。里面放着的是项目需要用到的header字典。

抓取数据

制作词云

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages