从拉钩上获取某个计算机语言的的相关招聘信息,并生成各种词云图,代码只在Python3中测试过。
- Python技术栈词云图:
- Python工资词云图
- Python公司区域分布词云图
- Python行业词云图
- 其它职位的词云图见img_wordcloud文件夹。
- 1.安装Python3
- 2.安装词云图生成库:pip install wordcloud
- 3.安装结巴分词库:pip install jieba
-
1.修改职位名称和需要查询的城市,运行get_position_brief_info.py抓取职位相关信息并保存到excel文件中。 如爬取python,抓取到的招聘信息将保存在/xlsx_file/python_position_info.xlsx文件中,有了该文件才能生成词云图。
-
2.运行generate_wordcloud.py模块的函数可以生成词云图:
- 运行generate_skill_wordcloud()函数,生成技术栈词云图;
- 运行generate_salary_worlcloud()函数,生成工资词云图;
- 运行generate_district_wordcloud()函数,生成公司区域分布词云图;
- 运行generate_industry_field_wordcloud()函数,生成行业词云图;
-
3.statistics.py模块用于数值统计
- calulate_average_salary()函数用于计算工资的平均最低限和平均最高限;
- 测试输出如下:
机器学习: 20.82k - 36.69k
自然语言处理: 17.87k - 33.63k
数据挖掘: 17.06k - 31.39k
大数据: 15.40k - 26.34k
前端: 13.26k - 23.27k
产品: 13.23k - 22.52k
ios: 13.05k - 22.70k
安卓: 12.85k - 22.15k
java: 12.81k - 21.81k
python: 12.23k - 21.48k
爬虫: 11.97k - 20.82k
需求: 11.92k - 20.22k
unity3d: 11.89k - 20.79k
cocos2d-x: 11.76k - 20.67k
c++: 11.72k - 19.85k
javascript: 11.45k - 20.52k
opengl: 11.00k - 22.00k
嵌入式: 10.83k - 18.65k
c#: 9.92k - 16.84k
测试: 9.91k - 16.70k
运营: 8.50k - 14.42k
- 测试输出如下:
- 各岗位工资上下限柱状图
- calulate_average_salary()函数用于计算工资的平均最低限和平均最高限;