Skip to content

从拉钩上获取某个计算机语言的的相关招聘信息,并生成各种词云图。

License

Notifications You must be signed in to change notification settings

xmanrui/lagou_wordcloud

Repository files navigation

lagou_wordcloud

从拉钩上获取某个计算机语言的的相关招聘信息,并生成各种词云图,代码只在Python3中测试过。

  • Python技术栈词云图:
  • Python工资词云图
  • Python公司区域分布词云图
  • Python行业词云图
  • 其它职位的词云图见img_wordcloud文件夹。

使用

安装

  • 1.安装Python3
  • 2.安装词云图生成库:pip install wordcloud
  • 3.安装结巴分词库:pip install jieba

运行

  • 1.修改职位名称和需要查询的城市,运行get_position_brief_info.py抓取职位相关信息并保存到excel文件中。 如爬取python,抓取到的招聘信息将保存在/xlsx_file/python_position_info.xlsx文件中,有了该文件才能生成词云图。

  • 2.运行generate_wordcloud.py模块的函数可以生成词云图:

    • 运行generate_skill_wordcloud()函数,生成技术栈词云图;
    • 运行generate_salary_worlcloud()函数,生成工资词云图;
    • 运行generate_district_wordcloud()函数,生成公司区域分布词云图;
    • 运行generate_industry_field_wordcloud()函数,生成行业词云图;
  • 3.statistics.py模块用于数值统计

    • calulate_average_salary()函数用于计算工资的平均最低限和平均最高限;
      • 测试输出如下:
        机器学习: 20.82k - 36.69k
        自然语言处理: 17.87k - 33.63k
        数据挖掘: 17.06k - 31.39k
        大数据: 15.40k - 26.34k
        前端: 13.26k - 23.27k
        产品: 13.23k - 22.52k
        ios: 13.05k - 22.70k
        安卓: 12.85k - 22.15k
        java: 12.81k - 21.81k
        python: 12.23k - 21.48k
        爬虫: 11.97k - 20.82k
        需求: 11.92k - 20.22k
        unity3d: 11.89k - 20.79k
        cocos2d-x: 11.76k - 20.67k
        c++: 11.72k - 19.85k
        javascript: 11.45k - 20.52k
        opengl: 11.00k - 22.00k
        嵌入式: 10.83k - 18.65k
        c#: 9.92k - 16.84k
        测试: 9.91k - 16.70k
        运营: 8.50k - 14.42k
    • 各岗位工资上下限柱状图

联系方式:

About

从拉钩上获取某个计算机语言的的相关招聘信息,并生成各种词云图。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages