In [1]:
import pandas as pd

# 读取上传的CSV文件
file_path = 'data/data_all.csv'
data = pd.read_csv(file_path)

# 显示数据的前几行以了解其结构
data

Unnamed: 0,id,company,title,salary,education,description,hiring_manager,last_active,address,link
0,0,广东倾云科技有限公司,【初级】web前端开发工程师,2-4K·13薪,大专,1.熟悉HTML5、JavaScript、CSS3;2.熟悉使用css3的flex/grid...,梁先生,2周内活跃,中山广东倾云科技有限公司一层,https://www.zhipin.com/job_detail/2c08c111e752...
1,1,火眼科技（天津）有限公司,IT运维工程师,2-4K,大专,一、工作内容1、软件数据分析，月/季报告撰写2、软件平台学习，能够熟练讲解，在使用过程中能够...,刘向宇,刚刚活跃,衡水桃城区众成大厦2407,https://www.zhipin.com/job_detail/8095129b4242...
2,2,郑州玉带信息技术有限责任公司,实习web前端开发工程师,1-6K,大专,参加公司自研产品的Web和微信端小程序开发，使用vue、elementUI和eCharts，...,郭先生,刚刚活跃,郑州二七区升龙世纪花园壹区1号楼,https://www.zhipin.com/job_detail/83875f1369c5...
3,3,广东天勤科技有限公司,兴宁前端、程序员实习生,1-4K,大专,实习生要求：1、需要在梅州兴宁市长期工作（家在梅州市内）2、统招全日制大专或以上学历的应届毕...,林先生,在线,梅州兴宁市天勤网络37号,https://www.zhipin.com/job_detail/9a7d1cb58dc7...
4,4,武汉赢月网络科技有限公司,运维工程师,2-3K,大专,负责日常网络及各子系统管理维护,赵爽,刚刚活跃,武汉洪山区长航·蓝晶国际7栋1009,https://www.zhipin.com/job_detail/f59b21cdfee8...
...,...,...,...,...,...,...,...,...,...,...
8757,8757,武汉麦尔盛科技有限公司,建筑智能化工程师,6-8K,大专,岗位职责1.负责建筑智能化售前技术支持，客户进行技术交流；2.编写相关智能化系统售前、投标、...,李女士,刚刚活跃,武汉江岸区武汉创立方产业园10栋402,https://www.zhipin.com/job_detail/7d807e3712b2...
8758,8758,深圳市共济科技股份有限公司,运维服务工程师,6-9K,大专,工作职责：1、按照服务规范及SLA要求完成项目巡检任务，确保客户监控系统稳定及可用性；2、按...,朱女士,刚刚活跃,上海浦东新区深圳市共济科技股份有限公司盛荣路88弄5号楼202,https://www.zhipin.com/job_detail/6299655df389...
8759,8759,上海企想信息技术有限公司,c++/QT开发工程师,8-12K,大专,岗位职责：1. 负责基于linux系统的嵌入式QT软件设计、开发和维护2. 设备的嵌入式QT...,张女士,2月内活跃,上海宝山区企想信息技术公司10楼,https://www.zhipin.com/job_detail/ea3fa00abb97...
8760,8760,苏州中科行智智能科技有限公司,机器视觉销售工程师（苏州）,8-13K·13薪,大专,岗位职责：1、负责公司机器视觉产品的市场开发并达成个人销售目标；2、负责潜在用户的扫描，成熟...,倪静华,刚刚活跃,苏州吴中区人工智能产业园E1,https://www.zhipin.com/job_detail/f806c8fac656...


In [2]:
# 统计不同职位标题的数量
unique_titles = data['title'].nunique()

# 由于薪资的格式多样，需要先进行处理，我们将薪资分为ABCD四类：
# A: 高薪 (>10K)
# B: 中上薪 (6-10K)
# C: 中薪 (3-6K)
# D: 低薪 (<3K)
# 这里我们假设薪资格式为 "最低薪资-最高薪资"，并取最低薪资作为判断依据

def classify_salary(salary):
    try:
        # 提取薪资的最低值
        min_salary = int(salary.split('-')[0].replace('K', ''))
        if min_salary > 10:
            return 'A'
        elif 6 <= min_salary <= 10:
            return 'B'
        elif 3 <= min_salary < 6:
            return 'C'
        else:
            return 'D'
    except:
        # 处理无法解析的薪资情况
        return 'Unknown'

# 应用薪资分类函数
data['salary_class'] = data['salary'].apply(classify_salary)

# 统计每个薪资类别的职位数量
salary_class_counts = data['salary_class'].value_counts()

unique_titles, salary_class_counts

(3648,
 salary_class
 A          3077
 D          2028
 C          1945
 B          1711
 Unknown       1
 Name: count, dtype: int64)

In [3]:
result = data.groupby(['title', 'salary_class'])['id'].apply(list).unstack(fill_value=[])

# 将结果转换为DataFrame，以便更好地展示
result_df = result.reset_index()
result

salary_class,A,B,C,D,Unknown
title,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
(合肥)网络工程师(双休+五险一金),[],[],[8635],[],[]
(校招)芯片设计工程师-上海(J10020),[],[],[],[6437],[]
(校招)芯片验证工程师-上海(J10022),[],[],[],[6336],[]
. Net高级软件工程师,[4521],[],[],[],[]
.NET MES软件开发工程师,[5810],[],[],[],[]
...,...,...,...,...,...
（船舶行业）副总工程师,[6952],[],[],[],[]
（高级）AI软件研发工程师,[6223],[],[],[],[]
（高级）自动驾驶软件工程师,[6263],[],[],[],[]
（高级）软件开发工程师,[6290],[],[],[],[]
