# 特征工程 

特征工程指的是最大程度上从原始数据中汲取特征和信息来使得模型和算法达到尽可能好的效果。

【特征工程具体内容包括：】
- 数据预处理
- 特征选择
- 特征变换与提取
- 特征组合
- 数据降维


## 一、特征工程常见的方法

### 1. 特征选择  

数据预处理：一些前期的数据清洗和预处理工作，是对原始数据的基本整理和重塑。

在数据清洗、数据分析基本已完成。
 
特征选择即选择与目标变量相关的自变量进行用于建模，也叫变量筛选

【特征选择基于两个基本面：】
- 特征是否发散，即该特征对于模型是否有解释力，如果特征是一成不变的（0方差），这样的特征是无用的。
- 特征是否与目标变量有一定的相关性。这一点要充分基于业务层面去考虑。

In [1]:
# 过滤法之方差筛选
from sklearn.feature_selection import VarianceThreshold
X = [[0, 0, 1], [0, 1, 0], [1, 0, 0], [0, 1, 1], [0, 1, 0], [0, 1, 1]]
sel = VarianceThreshold(threshold=(.8 * (1 - .8)))
sel.fit_transform(X)

array([[0, 1],
       [1, 0],
       [0, 0],
       [1, 1],
       [1, 0],
       [1, 1]])

第一列值为0的比例超过了80%，在结果中VarianceThreshold剔除这一列

In [2]:
# 过滤法之卡方检验 通过卡方检验筛选2个最好的特征。
from sklearn.datasets import load_iris
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
iris = load_iris()
X, y = iris.data, iris.target
X.shape
X_new = SelectKBest(chi2, k=2).fit_transform(X, y)
X_new.shape

(150, 2)

In [3]:
# 嵌入法之基于惩罚项的特征选择法 
from sklearn.svm import LinearSVC
from sklearn.datasets import load_iris
from sklearn.feature_selection import SelectFromModel
iris = load_iris()
X, y = iris.data, iris.target
print('原始数据特征维度：', X.shape)
lsvc = LinearSVC(C=0.01, penalty="l1", dual=False).fit(X, y)
model = SelectFromModel(lsvc, prefit=True)
X_new = model.transform(X)
print('l1惩罚处理之后的数据维度：', X_new.shape)

原始数据特征维度： (150, 4)
l1惩罚处理之后的数据维度： (150, 3)


In [5]:
# 嵌入法之基于树模型的特征选择法
from sklearn.ensemble import ExtraTreesClassifier
from sklearn.datasets import load_iris
from sklearn.feature_selection import SelectFromModel
iris = load_iris()
X, y = iris.data, iris.target
print('原始数据特征维度：', X.shape)
clf = ExtraTreesClassifier()
clf = clf.fit(X, y)
clf.feature_importances_  
model = SelectFromModel(clf, prefit=True)
X_new = model.transform(X)
print('l1惩罚处理之后的数据维度：', X_new.shape)

原始数据特征维度： (150, 4)
l1惩罚处理之后的数据维度： (150, 2)


### 2.特征变换与特征提取  

- 数据标准化：基于列 / 数据归一化：基于行
- 数据区间缩放
- 数值目标变量对数化处理（有必要的情况下）
- 定量特征二值化（有必要的情况下）
- 定性特征哑编码（one-hot）/大文本信息提取（效果类似于one-hot）


In [None]:
# one-hot的两种方法
# sklearn onehotencoder
from sklearn.preprocessing import OneHotEncoder
from sklearn.datasets import load_iris
iris = load_iris()
OneHotEncoder().fit_transform(iris.target.reshape((-1,1))).toarray()

In [None]:
# pandas dummies 方法
import pandas as pd
pd.get_dummies(iris.target)

### 3.特征组合
在单特征不能取得进一步效果的情况下可尝试不同特征之间的特征组合。
<br>特别需要基于业务考量，而不是随意组合。 

###  4.降维
适用于高维数据，成千上万的特征数量，但一般特征情况下不建议使用。
- PCA
- SVD
- LDA
- t-SNE

#### 7.招聘数据的特征工程探索

In [8]:
import warnings
warnings.filterwarnings('ignore')
import numpy as np
import pandas as pd

In [9]:
lagou_df = pd.read_csv('./lagou_data5.csv', encoding='utf-8',index_col=[0]) 
lagou_df.head()

Unnamed: 0,advantage,city,education,industry,label,position_detail,position_name,salary,size,stage,work_year
0,工作氛围好,成都,本科,O2O,"'年底双薪', '绩效奖金', '岗位晋升', '定期体检'",职位描述：工作职责：?1、负责新零售业务的数据分析工作，挖掘数据分析需求，制定并实施分析方案...,数据分析师,15000.0,2000人以上,D轮及以上,1-3年
1,"六险二金,晋升通道,独当一面,话语权",北京,本科,移动互联网,"'股票期权', '带薪年假', '绩效奖金', '扁平管理'",职位描述：工作职责:方向一、经营分析/指标体系1. 参与公司核心策略的数据分析，基于策略逻辑...,数据分析类,32500.0,2000人以上,C轮,5-10年
2,五险一金,北京,不限,移动互联网,"'年底多薪', '岗位晋升', '定期体检', '五险一金'",职位描述：职位描述：1、收集、处理用户海量数据，挖掘用户行为特征，为产品、运营提供参考依据；...,数据分析师 (MJ000766),12500.0,500-2000人,C轮,1-3年
3,"六险一金,周末双休,营养工作餐,萌宠陪伴",广州,大专,移动互联网,"'六险一金', '周末双休', '营养工作餐', '暖心下午茶'",职位描述：职位描述：1.负责对业务的专题进行统计分析，形成专题分析报告；2.基于业务理解，设...,数据分析师,11500.0,50-150人,A轮,1-3年
4,爱奇艺,北京,本科,其他,"'绩效奖金', '五险一金', '交通补助', '带薪年假'",职位描述：岗位职责： 1、负责内容合作部产品及运营数据指标的搭建； 2、负责数据后台的完善与...,数据分析师,10000.0,2000人以上,上市公司,1-3年


In [10]:
# advantage和label这两个特征作用不大，可在最后剔除
# 分类变量one-hot处理
# pandas one-hot方法
pd.get_dummies(lagou_df['city']).head()

Unnamed: 0,上海,其他,北京,南京,广州,成都,杭州,武汉,深圳
0,0,0,0,0,0,1,0,0,0
1,0,0,1,0,0,0,0,0,0
2,0,0,1,0,0,0,0,0,0
3,0,0,0,0,1,0,0,0,0
4,0,0,1,0,0,0,0,0,0


In [11]:
# sklearn onehot方法
# 先要硬编码labelcoder
from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import LabelEncoder
lbl = LabelEncoder()
lbl.fit(list(lagou_df['city'].values))
lagou_df['city'] = lbl.transform(list(lagou_df['city'].values))
# 查看硬编码结果
lagou_df['city'].head()

0    5
1    2
2    2
3    4
4    2
Name: city, dtype: int32

In [12]:
# 再由硬编码转为one-hot编码
df_city = OneHotEncoder().fit_transform(lagou_df['city'].values.reshape((-1,1))).toarray()
df_city[:5]

array([[0., 0., 0., 0., 0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 1., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0., 0., 0., 0.]])

In [13]:
# 分类特征统一one-hot处理
cat_features = ['city', 'industry', 'education', 'position_name', 'size', 'stage', 'work_year']
for col in cat_features:
    temp = pd.get_dummies(lagou_df[col])
    lagou_df = pd.concat([lagou_df, temp],axis=1)
    lagou_df = lagou_df.drop([col], axis=1)
    
lagou_df.shape

(1650, 641)

In [14]:
pd.options.display.max_columns = 999
lagou_df = lagou_df.drop(['advantage', 'label'], axis=1)
lagou_df.head()

Unnamed: 0,position_detail,salary,0,1,2,3,4,5,6,7,8,O2O,企业服务,信息安全,其他,医疗健康,教育,数据服务,电子商务,硬件,移动互联网,金融,不限,博士,大专,本科,硕士,00062-高级深度学习（杭州）,00148-深度学习专家（北京/杭州）,19校招-数据挖掘/机器学习算法工程师,2019-深度学习/机器学习工程师,2019届深度学习实习生,2019暑期实习-数据分析助理,2019校招-数据分析师,2019校招-数据挖掘/机器学习算法工程师,2019校招-数据挖掘工程师,2019校招-深度学习/计算机视觉算法工程师,?深度学习平台工程师,?深度学习应用软件工程师,AI Lab机器学习系统工程师,AI-机器学习工程师,AILABS-深度学习算法工程师(J180712004),AI算法工程师-机器学习,AML机器学习平台研发工程师,JTCPJS-数据挖掘工程师,Java/机器学习方向实习生,Java研发经理-机器学习方向,MIG03-NLP机器学习工程师/研究员（深圳）,MIG03-机器学习高级工程师（深圳）,MIG18-机器学习系统开发工程师（深圳）,MSSQ010-数据分析师,NLP/数据挖掘工程师,NLP/机器学习/自然语言处理工程师,NLP/机器学习专家,NLP自然语言处理/机器学习,PTBU-数据挖掘工程师,Python工程师-机器学习方向,Spider数据挖掘工程师,TEG13-数据挖掘工程师,UC事业部-数据挖掘专家,【社招/校招/实习】深度学习平台开发工程师,【资深数据挖掘工程师】,业务数据分析,中级数据挖掘工程师,产品经理-机器学习方向,人人事业部-TP-数据挖掘工程师,人工智能-机器学习,人工智能/机器学习专家,人工智能/机器学习工程师,人工智能、机器学习高级工程师,人工智能与机器学习工程师,人工智能机器学习,人工智能深度学习高级工程师,优酷-机器学习/深度学习工程师,像算法/深度学习工程师,公安数据挖掘研发主管,初级深度学习研发工程师,初级深度学习算法工程师,到店餐饮-高级数据挖掘工程师,前端开发工程师-机器学习团队-上海徐汇-00669,后台开发工程师 （深度学习平台）,和而泰 419 Lab 机器学习工程师,和而泰 419 Lab 机器学习高级工程师,品牌客户销售部-数据分析师,商业化数据分析师,图像算法/数据挖掘/机器学习-P7/P8-高德,图像算法/深度学习工程师,图像视觉/深度学习算法工程师,图像识别/深度学习工程师,垂直搜索-数据挖掘研究员,基于深度学习语音算法研发工程师(003760),大数据分析师,大数据分析师/算法工程师/数据挖掘,大数据数据开发工程师/大数据数据分析师,大数据研发工程师-大数据分析师,大数据部-用户研究员（会数据分析）,大数据部-高级数据分析师,大规模机器学习工程师,头条实验室科学家-机器学习,头条实验室算法工程师-机器学习,实习机器学习工程师,实习生--语音识别/机器学习,小米金融-机器学习/算法岗,市场调研/策略运营/数据分析,推荐与数据挖掘工程师,推荐算法/机器学习/数据挖掘/高级工程师,搜狐媒体-集团商业部-数据挖掘工程师,搜狗明医-机器学习研究员-北京-02086,搜狗机器翻译-数据挖掘研究员,搜狗机器翻译-机器学习研究员-北京-02886,搜狗输入法-数据挖掘研究员-北京-04091,搜狗问问-数据挖掘研究员-北京-01300,搜索App-深度学习研究员-北京-03545,数据产品经理/数据分析师,数据分析,数据分析 (MJ000537),数据分析 （2019校招）,数据分析(base上海),"数据分析, 数据挖掘,机器学习",数据分析-专车,数据分析-创新工作,数据分析-创新工具,数据分析-商品库,数据分析-机票事业部(J13017),数据分析/数据挖掘/BI工程师,数据分析/运营,数据分析与开发工程师,数据分析与挖掘实习岗,数据分析专员,数据分析专家,数据分析主管,数据分析助理,数据分析员,数据分析员主管,数据分析实习生,数据分析实习生-创新工具,数据分析岗,数据分析岗-风控方向,数据分析工程师,数据分析师,数据分析师 (MJ000108),数据分析师 (MJ000766),数据分析师 --10号线亮马桥,数据分析师 08-02-29,数据分析师(000447),数据分析师(3776),数据分析师(3838),数据分析师(J10227),数据分析师(J171124002),数据分析师(好价),数据分析师-,数据分析师--商发部,数据分析师-SH2927,数据分析师-TY,数据分析师-faceu,数据分析师-上海,数据分析师-内容付费,数据分析师-创新工具,数据分析师-北京,数据分析师-北京-00363,数据分析师-国际化,数据分析师-增长方向,数据分析师-增长策略方向,数据分析师-数据平台,数据分析师-脑科学,数据分析师-运营分析方向,数据分析师-销售,数据分析师-高级,数据分析师/数据挖掘工程师,数据分析师/数据挖掘工程师-Java,数据分析师/高级数据分析师,数据分析师09132101,数据分析师（大数据方向）,数据分析师（急招）,数据分析师（数据库方向）,数据分析师（新零售）,数据分析方向-数据工艺工程师-昌平,数据分析类,数据分析经理,数据分析（外包）,数据挖掘,数据挖掘 leader,数据挖掘(J10069),数据挖掘/广告算法,数据挖掘/机器学习,数据挖掘/机器学习工程师,数据挖掘/机器学习工程师/专家,数据挖掘/机器学习工程师【2019校园招聘】,数据挖掘/机器学习算法,数据挖掘/模型开发工程师,数据挖掘/算法专家-客户运营,数据挖掘/算法专家-新零售,数据挖掘/算法实习生,数据挖掘/算法工程师,数据挖掘/自然语言处理/机器学习/推荐系统,数据挖掘DataMing,数据挖掘RD,数据挖掘leader,数据挖掘、机器学习,数据挖掘、机器学习资深工程师,数据挖掘与建模专员,数据挖掘与建模工程师,数据挖掘与量化分析师,数据挖掘专家,数据挖掘专家(P7),数据挖掘专家-阿里新零售,数据挖掘专家/leader,数据挖掘实习生,数据挖掘实习生-人工智能实验室,数据挖掘实习生-杭州,数据挖掘实习生-核心广告系统,数据挖掘岗,数据挖掘工程师,数据挖掘工程师 (MJ000420),数据挖掘工程师 (MJ000902),数据挖掘工程师(2454),数据挖掘工程师(J180118007),数据挖掘工程师(P6),数据挖掘工程师(上海),数据挖掘工程师--北京,数据挖掘工程师-ICTR,数据挖掘工程师-人工智能实验室,数据挖掘工程师-反作弊方向,数据挖掘工程师-商业化-（北京）,数据挖掘工程师-大数据应用方向,数据挖掘工程师-用户产品方向,数据挖掘工程师/Java,数据挖掘工程师/专家,数据挖掘工程师/高级工程师,数据挖掘工程师/高级数据挖掘工程师,数据挖掘工程师/高级算法工程师,数据挖掘工程师或专家（上海）,数据挖掘工程师（北京/深圳）,数据挖掘工程师（增长）,数据挖掘工程师（实习）,数据挖掘工程师（武汉光谷——实习可转正）,数据挖掘工程师（济南）,数据挖掘工程师（高级）,数据挖掘师,数据挖掘师岗,数据挖掘开发,数据挖掘开发工程师,数据挖掘总监,数据挖掘技术专家,数据挖掘技术经理,数据挖掘攻城狮,数据挖掘架构师-餐饮生态部,数据挖掘研发工程师,数据挖掘算法工程师,数据挖掘算法工程师-国际化,数据挖掘算法高级工程师,数据挖掘算法高级工程师/专家,数据挖掘经理,数据挖掘讲师,数据挖掘负责人,数据挖掘部经理,数据挖掘高级工程师,数据挖掘高级工程师/技术专家,数据挖掘高级开发工程师/架构师,数据挖掘（算法）工程师,数据挖掘（赴百度）,数据科学家/数据分析师,数据科学家/机器学习工程师,数据解析与深度学习工程师-海外专场,文本分析与数据挖掘工程师-国际化,文本分析和数据挖掘工程师,无人车-机器学习/深度学习算法研究院/专家,无人配送-无人机深度学习算法,日志数据挖掘和安全建模,智能加速芯片-架构工程师（深度学习方向）,智能语音-数据挖掘研究员,智能语音-深度学习平台开发工程师,智能语音-深度学习研究员,智能问答-机器学习研究员,智能问答-深度学习研究员-北京-03425,智能驾驶-机器学习研究员-北京-02907,机器学习,机器学习 建模,机器学习 资深,机器学习-研发工程师,机器学习-金融事业部,机器学习/AI算法工程师,机器学习/人工智能方向实习生 （技术）,机器学习/数据挖掘专家,机器学习/数据挖掘工程师,机器学习/数据挖掘工程师/专家,机器学习/数据挖掘技术专家,机器学习/数据挖掘研发工程师,机器学习/文本挖掘工程师-杭州-00444,机器学习/深度学习,机器学习/深度学习/数据挖掘/算法/模型开发,机器学习/深度学习/算法工程师,机器学习/深度学习优化工程师,机器学习/深度学习优化工程师.,机器学习/深度学习工程师,机器学习/深度学习平台高级研发工程师--上海,机器学习/深度学习平台高级研发工程师--北京,机器学习/深度学习开发工程师,机器学习/深度学习算法工程师,机器学习/深度学习算法研究员,机器学习/深度学习算法研究员/专家,机器学习/算法工程师,机器学习/算法工程师(J180715001),机器学习/算法高级经理,机器学习/自然语言处理工程师,机器学习/自然语言处理算法工程师,机器学习/计算机图形图像算法工程师,机器学习/计算机视觉研发工程师,机器学习/计算机视觉算法 实习生,机器学习/计算机视觉算法工程师,机器学习/计算机视觉算法工程师(J180628019),机器学习/高性能服务端工程师,机器学习、数据挖掘工程师,机器学习、数据挖掘算法工程师,机器学习、数据挖掘算法工程师/高级算法工程师,机器学习与人工智能高级工程师,机器学习与算法工程师/研究员,机器学习专家,机器学习云平台开发工程师,机器学习及算法工程师,机器学习和算法工程师,机器学习实习,机器学习实习生,机器学习岗,机器学习工程师,机器学习工程师(000662),机器学习工程师-上海,机器学习工程师-金融事业部,机器学习工程师/AI工程师,机器学习工程师/专家(J171211019),机器学习工程师J10010,机器学习工程师实习生,机器学习工程师（AI）,机器学习工程师（上海-静安区）,机器学习工程师（人工智能中心）,机器学习工程师（偏工程）,机器学习工程师（偏算法）,机器学习工程师（北京）,机器学习工程师（广州）,机器学习工程师（掌上生活团队）,机器学习工程师（搜索算法）,机器学习工程师（武汉）,机器学习工程开发高级工程师,机器学习平台-平台工程专家,机器学习平台-平台工程专家(J180718011),机器学习平台产品经理,机器学习平台工程人员,机器学习平台开发工程师,机器学习平台研发工程师,机器学习平台系统开发工程师 (MJ000150),机器学习应用工程师,机器学习应用开发工程师,机器学习开发工程师,机器学习技术专家,机器学习技术经理,机器学习架构工程师A,机器学习架构师,机器学习模型师,机器学习研发工程师,机器学习研发工程师 (MJ000173),机器学习研发工程师【MIUI】,机器学习研究员,机器学习研究员(J180203019),机器学习研究员-多模态学习方向,机器学习科学家（可兼职）（上海）,机器学习科学家（可兼职）（西安）,机器学习算法,机器学习算法专家,机器学习算法实习生,机器学习算法工程师,机器学习算法工程师 (MJ000045),机器学习算法工程师 (MJ000057),机器学习算法工程师--实习岗,机器学习算法工程师-多模态学习方向,机器学习算法工程师-校招,机器学习算法工程师/专家,机器学习算法工程师（上海）,机器学习算法工程师（应届毕业生）,机器学习算法工程师（杭州）,机器学习算法开发工程师,机器学习算法研发工程师,机器学习算法研究员,机器学习算法研究员 (MJ000031),机器学习算法负责人-CVR模型方向,机器学习系统工程师,机器学习系统工程师-AI-Lab,机器学习系统工程师（南京）,机器学习讲师,机器学习负责人,机器学习资深专家,机器学习资深工程师,机器学习资深研发工程师,机器学习高级专家,机器学习高级工程师,机器学习高级研发工程师,机器学习（工作地：北京/郑州）,机器学习（数据）,机器学习（算法专家）,机器学习（高级）工程师-国际化,深度/机器学习,深度/机器学习实习生,深度/机器学习研究员,深度学习,深度学习 AI 前沿技术创新研究员,深度学习 PaaS 平台研发工程师,深度学习 前沿技术创新架构师,深度学习(J12957),深度学习-NLP/机器翻译/机器创作,深度学习-校招,深度学习-自然语言处理工程师,深度学习-自然语言处理高级工程师,深度学习-视觉算法工程师,深度学习-计算机视觉,深度学习-计算机视觉工程师,深度学习-闲聊后台开发工程师,深度学习/医学图像处理实习生,深度学习/医学图像算法工程师,深度学习/图像处理 算法工程师,深度学习/机器学习工程师,深度学习/机器学习工程师-上海,深度学习/机器学习研发工程师,深度学习/机器学习算法工程师,深度学习/自然语言处理算法工程师,深度学习/计算机视觉工程师,深度学习Leader,深度学习PaaS平台研发工程师,深度学习专家,深度学习专家-金融事业部J11177,深度学习优化,深度学习图像算法工程师,深度学习培训讲师,深度学习基础架构,深度学习基础设施平台工程师,深度学习实习岗,深度学习实习生,深度学习工程师,深度学习工程师-NLP方向,深度学习工程师-博士,深度学习工程师/深度学习专家 I,深度学习工程师A,深度学习工程师实习生,深度学习平台工程师,深度学习平台开发工程师,深度学习平台方案工程师 (MJ000110),深度学习开发工程师,深度学习开发工程师（视频生态）,深度学习数据平台研发工程师,深度学习架构师,深度学习架构师A,深度学习框架-研发工程师,深度学习框架研发实习生,深度学习框架研发工程师,深度学习研发工程师,深度学习研发工程师 (计算机视觉方向),深度学习研发工程师-AI平台,深度学习研究员,深度学习研究员-AI平台-北京-01140,深度学习科学家,深度学习算法,深度学习算法专家,深度学习算法专家/资深工程师,深度学习算法专家（无人配送）,深度学习算法压缩工程师,深度学习算法实习工程师,深度学习算法实习生,深度学习算法实习生-广州,深度学习算法工程师,深度学习算法工程师 (MJ000172),深度学习算法工程师(J10429),深度学习算法工程师-VR方向【2019校园招聘】,深度学习算法工程师实习生,深度学习算法工程师（19届）,深度学习算法工程师（AI热门领域）,深度学习算法工程师（技术）,深度学习算法工程师（新产品组）,深度学习算法工程师（语音/多模态方向）,深度学习算法工程师（资深）,深度学习算法工程师（输入法）,深度学习算法架构师,深度学习算法研发工程师,深度学习算法研究员,深度学习算法研究员、副研究员,深度学习算法研究工程师,深度学习算法研究工程师-厦门,深度学习算法科学家,深度学习算法移植和优化(J180601005),深度学习系统工程师,深度学习系统研究员,深度学习系统研究员（北京）,深度学习视觉算法专家-无人车,深度学习视觉算法工程师,深度学习解决方案工程师,深度学习解决方案架构师,深度学习语音算法工程师,深度学习资深专家,深度学习资深算法工程师,深度学习软件工程师,深度学习软件研发工程师,深度学习首席工程师,深度学习高级工程师,深度学习高级工程师（研发中心）,深度学习高级研发工程师,深度学习高级研究员,深度学习高级算法工程师,深度学习高级算法工程师(J171126002),物流机器人-深度学习工程师,瓜子二手车数据挖掘工程师,用户运营与数据分析,研究员（深度学习，强化学习）,移动端高级深度学习算法工程师,策略/数据分析师,策略运营/数据分析,算法-数据挖掘,算法/数据挖掘工程师,算法/数据挖掘高级工程师,算法/机器学习-Lead工程师,算法专家机器学习,算法工程师(机器学习),算法工程师--机器学习方向,算法工程师-数据挖掘,算法工程师-机器学习,算法工程师-机器学习方向,算法工程师/数据挖掘工程师,算法工程师/深度学习,算法工程师—机器学习方向,算法工程师机器学习,算法工程师（人工智能/深度学习）,算法工程师（数据挖掘）,算法工程师（机器学习方向）,算法工程师（机器学习）,算法工程师（机器学习）-机票事业部(J12936),算法工程师（深度学习方向）,算法工程师（深度学习）,算法（深度学习）实习生,自然语言处理 \机器学习\数据挖掘工程师要医疗背景,自然语言处理&amp;机器学习,自然语言处理/数据挖掘/深度学习工程师（实习生）,自然语言处理/机器学习研究员,自然语言处理/机器学习算法工程师,自然语言处理NLP/机器学习,自然语言处理工程师/数据挖掘工程师,营销算法专家-机器学习／人工智能／AI,蚂蚁金服-高级算法工程师/算法专家（机器学习方向）,行业数据分析师,视觉跟踪/深度学习工程师,计算机视觉-机器学习/深度学习专家,计算机视觉/机器学习工程师--大数据&amp;滴滴研究院(J13266),计算机视觉/深度学习方向,计算机视觉/深度学习算法工程师,计算机视觉/深度学习算法工程师 (直播部),计算机视觉、机器学习、深度学习的实习生,计算机视觉及深度学习实习生,计算机视觉／深度学习工程师,资深后端开发/机器学习方向,资深数据分析-趣头条数据中心,资深数据分析师,资深数据挖掘,资深数据挖掘-EWT,资深数据挖掘专家,资深数据挖掘岗,资深数据挖掘工程师,资深数据挖掘工程师 (MJ000027),资深数据挖掘经理,资深机器学习研究员,资深机器学习算法工程师,资深机器学习算法工程师-金融事业部(J13090),资深深度学习工程师,资深深度学习算法,资深深度学习算法工程师,资深深度学习算法工程师/深度学习算法项目经理,资深研究员（机器学习方向）,资深算法工程师/深度学习/智能算法,资深算法工程师（机器学习方向）,资深算法架构师（深度学习）,软件工程师(机器学习),量化研究员-机器学习,量化研究员（机器学习）,销售支持实习生-数据分析,阿里高德-智慧交通-数据挖掘工程师/专家,阿里高德-智慧交通-机器学习工程师/专家,风控-机器学习,风控/策略算法，机器学习，自然语言处理,风控数据挖掘及机器学习研发工程师,风控策略研发工程师/机器学习算法工程师/数据分析师,高德-数据挖掘&amp;机器学习算法资深工程师/技术专家,高德-数据挖掘专家,高德-数据挖掘资深工程师/专家,高德-资深数据挖掘工程师/专家,高性能深度学习库开发工程师 (MJ000018),高端机器学习工程师,高级/资深数据挖掘工程师,高级CRM产品经理-数据分析方向,高级推荐算法工程师 /高级数据挖掘工程师,高级数据分析师,高级数据分析师 08-02-28,高级数据分析师-上海-00064,高级数据分析师-上海-01114,高级数据挖掘专家,高级数据挖掘工程师,高级数据挖掘工程师(上海),高级数据挖掘工程师-数据仓库方向,高级数据挖掘工程师（北京）,高级数据挖掘师,高级数据科学家-机器学习,高级机器学习,高级机器学习/数据挖掘工程师,高级机器学习工程师,高级机器学习研究员,高级机器学习算法工程师,高级深度学习,高级深度学习研发工程师,高级深度学习（广州）,高级研发工程师（深度学习）,高级算法工程师（机器学习）,高阶数据分析师,（2019校招）数据挖掘工程师,（校招/实习生）机器学习／算法工程师,（高级）数据挖掘工程师,15-50人,150-500人,2000人以上,50-150人,500-2000人,少于15人,A轮,B轮,C轮,D轮及以上,上市公司,不需要融资,天使轮,未融资,1-3年,10年以上,1年以下,3-5年,5-10年,不限.1,应届毕业生
0,职位描述：工作职责：?1、负责新零售业务的数据分析工作，挖掘数据分析需求，制定并实施分析方案...,15000.0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,0,0
1,职位描述：工作职责:方向一、经营分析/指标体系1. 参与公司核心策略的数据分析，基于策略逻辑...,32500.0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0
2,职位描述：职位描述：1、收集、处理用户海量数据，挖掘用户行为特征，为产品、运营提供参考依据；...,12500.0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,0
3,职位描述：职位描述：1.负责对业务的专题进行统计分析，形成专题分析报告；2.基于业务理解，设...,11500.0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0
4,职位描述：岗位职责： 1、负责内容合作部产品及运营数据指标的搭建； 2、负责数据后台的完善与...,10000.0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0


#### 职位描述特征的信息提取

In [21]:
lagou_df2 = pd.read_csv('./lagou_data5.csv', encoding='utf-8')
lagou_df2 = lagou_df2[['position_detail', 'salary']]
lagou_df2

Unnamed: 0,position_detail,salary
0,职位描述：工作职责：?1、负责新零售业务的数据分析工作，挖掘数据分析需求，制定并实施分析方案...,15000.0
1,职位描述：工作职责:方向一、经营分析/指标体系1. 参与公司核心策略的数据分析，基于策略逻辑...,32500.0
2,职位描述：职位描述：1、收集、处理用户海量数据，挖掘用户行为特征，为产品、运营提供参考依据；...,12500.0
3,职位描述：职位描述：1.负责对业务的专题进行统计分析，形成专题分析报告；2.基于业务理解，设...,11500.0
4,职位描述：岗位职责： 1、负责内容合作部产品及运营数据指标的搭建； 2、负责数据后台的完善与...,10000.0
...,...,...
1645,职位描述：岗位职责：1、与公司团队配合研发人脸检测，人脸点对齐，人脸识别等算法；2、负责实时...,18000.0
1646,职位描述：岗位职责：1. 开展计算机视觉/深度学习等相关领域研究和开发工作；2. 有深度学习...,37500.0
1647,职位描述：岗位职责:1、理解业务需求，产出技术方案。2、负责设计与开发深度学习算法及应用模型...,22500.0
1648,职位描述：工作内容（根据实际情况偏重以下其一）：1. 负责深度学习计算机视觉技术的研发，领域...,22500.0


In [16]:
# 提取Python信息
for i, j in enumerate(lagou_df2['position_detail']):
    if 'python' in j:
        lagou_df2['position_detail'][i] = j.replace('python', 'Python')

In [23]:
lagou_df2['Python'] = pd.Series()
for i, j in enumerate(lagou_df2['position_detail']):
    if 'Python' in j:
        lagou_df2['Python'][i] = 1
    else:
        lagou_df2['Python'][i] = 0
        
lagou_df2['Python'].value_counts()

0.0    914
1.0    736
Name: Python, dtype: int64

In [24]:
lagou_df2['R'] = pd.Series()
for i, j in enumerate(lagou_df2['position_detail']):
    if 'R' in j:
        lagou_df2['R'][i] = 1
    else:
        lagou_df2['R'][i] = 0
        
lagou_df2['R'].value_counts()

0.0    945
1.0    705
Name: R, dtype: int64

In [25]:
for i, j in enumerate(lagou_df2['position_detail']):
    if 'sql' in j:
        lagou_df2['position_detail'][i] = j.replace('sql', 'SQL')

lagou_df2['SQL'] = pd.Series()
for i, j in enumerate(lagou_df2['position_detail']):
    if 'SQL' in j:
        lagou_df2['SQL'][i] = 1
    else:
        lagou_df2['SQL'][i] = 0
        
lagou_df2['SQL'].value_counts()

0.0    1203
1.0     447
Name: SQL, dtype: int64

In [26]:
lagou_df2['Excel'] = pd.Series()
for i, j in enumerate(lagou_df2['position_detail']):
    if 'Excel' in j:
        lagou_df2['Excel'][i] = 1
    else:
        lagou_df2['Excel'][i] = 0
        
lagou_df2['Excel'].value_counts()

0.0    1551
1.0      99
Name: Excel, dtype: int64

In [27]:
lagou_df2['Java'] = pd.Series()
for i, j in enumerate(lagou_df2['position_detail']):
    if 'Java' in j:
        lagou_df2['Java'][i] = 1
    else:
        lagou_df2['Java'][i] = 0
        
lagou_df2['Java'].value_counts()

0.0    1335
1.0     315
Name: Java, dtype: int64

In [28]:
for i, j in enumerate(lagou_df2['position_detail']):
    if 'linux' in j:
        lagou_df2['position_detail'][i] = j.replace('linux', 'Linux')
        
lagou_df2['Linux'] = pd.Series()
for i, j in enumerate(lagou_df2['position_detail']):
    if 'Linux' in j:
        lagou_df2['Linux'][i] = 1
    else:
        lagou_df2['Linux'][i] = 0
        
lagou_df2['Linux'].value_counts()

0.0    1321
1.0     329
Name: Linux, dtype: int64

In [29]:
lagou_df2['C++'] = pd.Series()
for i, j in enumerate(lagou_df2['position_detail']):
    if 'C++' in j:
        lagou_df2['C++'][i] = 1
    else:
        lagou_df2['C++'][i] = 0
        
lagou_df2['C++'].value_counts()

0.0    1165
1.0     485
Name: C++, dtype: int64

In [30]:
for i, j in enumerate(lagou_df2['position_detail']):
    if 'spark' in j:
        lagou_df2['position_detail'][i] = j.replace('spark', 'Spark')

lagou_df2['Spark'] = pd.Series()
for i, j in enumerate(lagou_df2['position_detail']):
    if 'Spark' in j:
        lagou_df2['Spark'][i] = 1
    else:
        lagou_df2['Spark'][i] = 0
        
lagou_df2['Spark'].value_counts()

0.0    1237
1.0     413
Name: Spark, dtype: int64

In [31]:
for i, j in enumerate(lagou_df2['position_detail']):
    if 'tensorflow' in j:
        lagou_df2['position_detail'][i] = j.replace('tensorflow', 'Tensorflow')
        
    if 'TensorFlow' in j:
        lagou_df2['position_detail'][i] = j.replace('TensorFlow', 'Tensorflow')
        
lagou_df2['Tensorflow'] = pd.Series()
for i, j in enumerate(lagou_df2['position_detail']):
    if 'Tensorflow' in j:
        lagou_df2['Tensorflow'][i] = 1
    else:
        lagou_df2['Tensorflow'][i] = 0
        
lagou_df2['Tensorflow'].value_counts()

0.0    1221
1.0     429
Name: Tensorflow, dtype: int64

In [32]:
lagou_df2 = lagou_df2.drop(['position_detail'], axis=1)
lagou_df2.head()

Unnamed: 0,salary,Python,R,SQL,Excel,Java,Linux,C++,Spark,Tensorflow
0,15000.0,1.0,1.0,1.0,0.0,0.0,0.0,0.0,1.0,0.0
1,32500.0,0.0,1.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0
2,12500.0,1.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0
3,11500.0,0.0,0.0,1.0,1.0,0.0,0.0,0.0,0.0,0.0
4,10000.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0


In [33]:
lagou_df = lagou_df.drop(['position_detail', 'salary'], axis=1)
lagou_df.head()

Unnamed: 0,0,1,2,3,4,5,6,7,8,O2O,企业服务,信息安全,其他,医疗健康,教育,数据服务,电子商务,硬件,移动互联网,金融,不限,博士,大专,本科,硕士,00062-高级深度学习（杭州）,00148-深度学习专家（北京/杭州）,19校招-数据挖掘/机器学习算法工程师,2019-深度学习/机器学习工程师,2019届深度学习实习生,2019暑期实习-数据分析助理,2019校招-数据分析师,2019校招-数据挖掘/机器学习算法工程师,2019校招-数据挖掘工程师,2019校招-深度学习/计算机视觉算法工程师,?深度学习平台工程师,?深度学习应用软件工程师,AI Lab机器学习系统工程师,AI-机器学习工程师,AILABS-深度学习算法工程师(J180712004),AI算法工程师-机器学习,AML机器学习平台研发工程师,JTCPJS-数据挖掘工程师,Java/机器学习方向实习生,Java研发经理-机器学习方向,MIG03-NLP机器学习工程师/研究员（深圳）,MIG03-机器学习高级工程师（深圳）,MIG18-机器学习系统开发工程师（深圳）,MSSQ010-数据分析师,NLP/数据挖掘工程师,NLP/机器学习/自然语言处理工程师,NLP/机器学习专家,NLP自然语言处理/机器学习,PTBU-数据挖掘工程师,Python工程师-机器学习方向,Spider数据挖掘工程师,TEG13-数据挖掘工程师,UC事业部-数据挖掘专家,【社招/校招/实习】深度学习平台开发工程师,【资深数据挖掘工程师】,业务数据分析,中级数据挖掘工程师,产品经理-机器学习方向,人人事业部-TP-数据挖掘工程师,人工智能-机器学习,人工智能/机器学习专家,人工智能/机器学习工程师,人工智能、机器学习高级工程师,人工智能与机器学习工程师,人工智能机器学习,人工智能深度学习高级工程师,优酷-机器学习/深度学习工程师,像算法/深度学习工程师,公安数据挖掘研发主管,初级深度学习研发工程师,初级深度学习算法工程师,到店餐饮-高级数据挖掘工程师,前端开发工程师-机器学习团队-上海徐汇-00669,后台开发工程师 （深度学习平台）,和而泰 419 Lab 机器学习工程师,和而泰 419 Lab 机器学习高级工程师,品牌客户销售部-数据分析师,商业化数据分析师,图像算法/数据挖掘/机器学习-P7/P8-高德,图像算法/深度学习工程师,图像视觉/深度学习算法工程师,图像识别/深度学习工程师,垂直搜索-数据挖掘研究员,基于深度学习语音算法研发工程师(003760),大数据分析师,大数据分析师/算法工程师/数据挖掘,大数据数据开发工程师/大数据数据分析师,大数据研发工程师-大数据分析师,大数据部-用户研究员（会数据分析）,大数据部-高级数据分析师,大规模机器学习工程师,头条实验室科学家-机器学习,头条实验室算法工程师-机器学习,实习机器学习工程师,实习生--语音识别/机器学习,小米金融-机器学习/算法岗,市场调研/策略运营/数据分析,推荐与数据挖掘工程师,推荐算法/机器学习/数据挖掘/高级工程师,搜狐媒体-集团商业部-数据挖掘工程师,搜狗明医-机器学习研究员-北京-02086,搜狗机器翻译-数据挖掘研究员,搜狗机器翻译-机器学习研究员-北京-02886,搜狗输入法-数据挖掘研究员-北京-04091,搜狗问问-数据挖掘研究员-北京-01300,搜索App-深度学习研究员-北京-03545,数据产品经理/数据分析师,数据分析,数据分析 (MJ000537),数据分析 （2019校招）,数据分析(base上海),"数据分析, 数据挖掘,机器学习",数据分析-专车,数据分析-创新工作,数据分析-创新工具,数据分析-商品库,数据分析-机票事业部(J13017),数据分析/数据挖掘/BI工程师,数据分析/运营,数据分析与开发工程师,数据分析与挖掘实习岗,数据分析专员,数据分析专家,数据分析主管,数据分析助理,数据分析员,数据分析员主管,数据分析实习生,数据分析实习生-创新工具,数据分析岗,数据分析岗-风控方向,数据分析工程师,数据分析师,数据分析师 (MJ000108),数据分析师 (MJ000766),数据分析师 --10号线亮马桥,数据分析师 08-02-29,数据分析师(000447),数据分析师(3776),数据分析师(3838),数据分析师(J10227),数据分析师(J171124002),数据分析师(好价),数据分析师-,数据分析师--商发部,数据分析师-SH2927,数据分析师-TY,数据分析师-faceu,数据分析师-上海,数据分析师-内容付费,数据分析师-创新工具,数据分析师-北京,数据分析师-北京-00363,数据分析师-国际化,数据分析师-增长方向,数据分析师-增长策略方向,数据分析师-数据平台,数据分析师-脑科学,数据分析师-运营分析方向,数据分析师-销售,数据分析师-高级,数据分析师/数据挖掘工程师,数据分析师/数据挖掘工程师-Java,数据分析师/高级数据分析师,数据分析师09132101,数据分析师（大数据方向）,数据分析师（急招）,数据分析师（数据库方向）,数据分析师（新零售）,数据分析方向-数据工艺工程师-昌平,数据分析类,数据分析经理,数据分析（外包）,数据挖掘,数据挖掘 leader,数据挖掘(J10069),数据挖掘/广告算法,数据挖掘/机器学习,数据挖掘/机器学习工程师,数据挖掘/机器学习工程师/专家,数据挖掘/机器学习工程师【2019校园招聘】,数据挖掘/机器学习算法,数据挖掘/模型开发工程师,数据挖掘/算法专家-客户运营,数据挖掘/算法专家-新零售,数据挖掘/算法实习生,数据挖掘/算法工程师,数据挖掘/自然语言处理/机器学习/推荐系统,数据挖掘DataMing,数据挖掘RD,数据挖掘leader,数据挖掘、机器学习,数据挖掘、机器学习资深工程师,数据挖掘与建模专员,数据挖掘与建模工程师,数据挖掘与量化分析师,数据挖掘专家,数据挖掘专家(P7),数据挖掘专家-阿里新零售,数据挖掘专家/leader,数据挖掘实习生,数据挖掘实习生-人工智能实验室,数据挖掘实习生-杭州,数据挖掘实习生-核心广告系统,数据挖掘岗,数据挖掘工程师,数据挖掘工程师 (MJ000420),数据挖掘工程师 (MJ000902),数据挖掘工程师(2454),数据挖掘工程师(J180118007),数据挖掘工程师(P6),数据挖掘工程师(上海),数据挖掘工程师--北京,数据挖掘工程师-ICTR,数据挖掘工程师-人工智能实验室,数据挖掘工程师-反作弊方向,数据挖掘工程师-商业化-（北京）,数据挖掘工程师-大数据应用方向,数据挖掘工程师-用户产品方向,数据挖掘工程师/Java,数据挖掘工程师/专家,数据挖掘工程师/高级工程师,数据挖掘工程师/高级数据挖掘工程师,数据挖掘工程师/高级算法工程师,数据挖掘工程师或专家（上海）,数据挖掘工程师（北京/深圳）,数据挖掘工程师（增长）,数据挖掘工程师（实习）,数据挖掘工程师（武汉光谷——实习可转正）,数据挖掘工程师（济南）,数据挖掘工程师（高级）,数据挖掘师,数据挖掘师岗,数据挖掘开发,数据挖掘开发工程师,数据挖掘总监,数据挖掘技术专家,数据挖掘技术经理,数据挖掘攻城狮,数据挖掘架构师-餐饮生态部,数据挖掘研发工程师,数据挖掘算法工程师,数据挖掘算法工程师-国际化,数据挖掘算法高级工程师,数据挖掘算法高级工程师/专家,数据挖掘经理,数据挖掘讲师,数据挖掘负责人,数据挖掘部经理,数据挖掘高级工程师,数据挖掘高级工程师/技术专家,数据挖掘高级开发工程师/架构师,数据挖掘（算法）工程师,数据挖掘（赴百度）,数据科学家/数据分析师,数据科学家/机器学习工程师,数据解析与深度学习工程师-海外专场,文本分析与数据挖掘工程师-国际化,文本分析和数据挖掘工程师,无人车-机器学习/深度学习算法研究院/专家,无人配送-无人机深度学习算法,日志数据挖掘和安全建模,智能加速芯片-架构工程师（深度学习方向）,智能语音-数据挖掘研究员,智能语音-深度学习平台开发工程师,智能语音-深度学习研究员,智能问答-机器学习研究员,智能问答-深度学习研究员-北京-03425,智能驾驶-机器学习研究员-北京-02907,机器学习,机器学习 建模,机器学习 资深,机器学习-研发工程师,机器学习-金融事业部,机器学习/AI算法工程师,机器学习/人工智能方向实习生 （技术）,机器学习/数据挖掘专家,机器学习/数据挖掘工程师,机器学习/数据挖掘工程师/专家,机器学习/数据挖掘技术专家,机器学习/数据挖掘研发工程师,机器学习/文本挖掘工程师-杭州-00444,机器学习/深度学习,机器学习/深度学习/数据挖掘/算法/模型开发,机器学习/深度学习/算法工程师,机器学习/深度学习优化工程师,机器学习/深度学习优化工程师.,机器学习/深度学习工程师,机器学习/深度学习平台高级研发工程师--上海,机器学习/深度学习平台高级研发工程师--北京,机器学习/深度学习开发工程师,机器学习/深度学习算法工程师,机器学习/深度学习算法研究员,机器学习/深度学习算法研究员/专家,机器学习/算法工程师,机器学习/算法工程师(J180715001),机器学习/算法高级经理,机器学习/自然语言处理工程师,机器学习/自然语言处理算法工程师,机器学习/计算机图形图像算法工程师,机器学习/计算机视觉研发工程师,机器学习/计算机视觉算法 实习生,机器学习/计算机视觉算法工程师,机器学习/计算机视觉算法工程师(J180628019),机器学习/高性能服务端工程师,机器学习、数据挖掘工程师,机器学习、数据挖掘算法工程师,机器学习、数据挖掘算法工程师/高级算法工程师,机器学习与人工智能高级工程师,机器学习与算法工程师/研究员,机器学习专家,机器学习云平台开发工程师,机器学习及算法工程师,机器学习和算法工程师,机器学习实习,机器学习实习生,机器学习岗,机器学习工程师,机器学习工程师(000662),机器学习工程师-上海,机器学习工程师-金融事业部,机器学习工程师/AI工程师,机器学习工程师/专家(J171211019),机器学习工程师J10010,机器学习工程师实习生,机器学习工程师（AI）,机器学习工程师（上海-静安区）,机器学习工程师（人工智能中心）,机器学习工程师（偏工程）,机器学习工程师（偏算法）,机器学习工程师（北京）,机器学习工程师（广州）,机器学习工程师（掌上生活团队）,机器学习工程师（搜索算法）,机器学习工程师（武汉）,机器学习工程开发高级工程师,机器学习平台-平台工程专家,机器学习平台-平台工程专家(J180718011),机器学习平台产品经理,机器学习平台工程人员,机器学习平台开发工程师,机器学习平台研发工程师,机器学习平台系统开发工程师 (MJ000150),机器学习应用工程师,机器学习应用开发工程师,机器学习开发工程师,机器学习技术专家,机器学习技术经理,机器学习架构工程师A,机器学习架构师,机器学习模型师,机器学习研发工程师,机器学习研发工程师 (MJ000173),机器学习研发工程师【MIUI】,机器学习研究员,机器学习研究员(J180203019),机器学习研究员-多模态学习方向,机器学习科学家（可兼职）（上海）,机器学习科学家（可兼职）（西安）,机器学习算法,机器学习算法专家,机器学习算法实习生,机器学习算法工程师,机器学习算法工程师 (MJ000045),机器学习算法工程师 (MJ000057),机器学习算法工程师--实习岗,机器学习算法工程师-多模态学习方向,机器学习算法工程师-校招,机器学习算法工程师/专家,机器学习算法工程师（上海）,机器学习算法工程师（应届毕业生）,机器学习算法工程师（杭州）,机器学习算法开发工程师,机器学习算法研发工程师,机器学习算法研究员,机器学习算法研究员 (MJ000031),机器学习算法负责人-CVR模型方向,机器学习系统工程师,机器学习系统工程师-AI-Lab,机器学习系统工程师（南京）,机器学习讲师,机器学习负责人,机器学习资深专家,机器学习资深工程师,机器学习资深研发工程师,机器学习高级专家,机器学习高级工程师,机器学习高级研发工程师,机器学习（工作地：北京/郑州）,机器学习（数据）,机器学习（算法专家）,机器学习（高级）工程师-国际化,深度/机器学习,深度/机器学习实习生,深度/机器学习研究员,深度学习,深度学习 AI 前沿技术创新研究员,深度学习 PaaS 平台研发工程师,深度学习 前沿技术创新架构师,深度学习(J12957),深度学习-NLP/机器翻译/机器创作,深度学习-校招,深度学习-自然语言处理工程师,深度学习-自然语言处理高级工程师,深度学习-视觉算法工程师,深度学习-计算机视觉,深度学习-计算机视觉工程师,深度学习-闲聊后台开发工程师,深度学习/医学图像处理实习生,深度学习/医学图像算法工程师,深度学习/图像处理 算法工程师,深度学习/机器学习工程师,深度学习/机器学习工程师-上海,深度学习/机器学习研发工程师,深度学习/机器学习算法工程师,深度学习/自然语言处理算法工程师,深度学习/计算机视觉工程师,深度学习Leader,深度学习PaaS平台研发工程师,深度学习专家,深度学习专家-金融事业部J11177,深度学习优化,深度学习图像算法工程师,深度学习培训讲师,深度学习基础架构,深度学习基础设施平台工程师,深度学习实习岗,深度学习实习生,深度学习工程师,深度学习工程师-NLP方向,深度学习工程师-博士,深度学习工程师/深度学习专家 I,深度学习工程师A,深度学习工程师实习生,深度学习平台工程师,深度学习平台开发工程师,深度学习平台方案工程师 (MJ000110),深度学习开发工程师,深度学习开发工程师（视频生态）,深度学习数据平台研发工程师,深度学习架构师,深度学习架构师A,深度学习框架-研发工程师,深度学习框架研发实习生,深度学习框架研发工程师,深度学习研发工程师,深度学习研发工程师 (计算机视觉方向),深度学习研发工程师-AI平台,深度学习研究员,深度学习研究员-AI平台-北京-01140,深度学习科学家,深度学习算法,深度学习算法专家,深度学习算法专家/资深工程师,深度学习算法专家（无人配送）,深度学习算法压缩工程师,深度学习算法实习工程师,深度学习算法实习生,深度学习算法实习生-广州,深度学习算法工程师,深度学习算法工程师 (MJ000172),深度学习算法工程师(J10429),深度学习算法工程师-VR方向【2019校园招聘】,深度学习算法工程师实习生,深度学习算法工程师（19届）,深度学习算法工程师（AI热门领域）,深度学习算法工程师（技术）,深度学习算法工程师（新产品组）,深度学习算法工程师（语音/多模态方向）,深度学习算法工程师（资深）,深度学习算法工程师（输入法）,深度学习算法架构师,深度学习算法研发工程师,深度学习算法研究员,深度学习算法研究员、副研究员,深度学习算法研究工程师,深度学习算法研究工程师-厦门,深度学习算法科学家,深度学习算法移植和优化(J180601005),深度学习系统工程师,深度学习系统研究员,深度学习系统研究员（北京）,深度学习视觉算法专家-无人车,深度学习视觉算法工程师,深度学习解决方案工程师,深度学习解决方案架构师,深度学习语音算法工程师,深度学习资深专家,深度学习资深算法工程师,深度学习软件工程师,深度学习软件研发工程师,深度学习首席工程师,深度学习高级工程师,深度学习高级工程师（研发中心）,深度学习高级研发工程师,深度学习高级研究员,深度学习高级算法工程师,深度学习高级算法工程师(J171126002),物流机器人-深度学习工程师,瓜子二手车数据挖掘工程师,用户运营与数据分析,研究员（深度学习，强化学习）,移动端高级深度学习算法工程师,策略/数据分析师,策略运营/数据分析,算法-数据挖掘,算法/数据挖掘工程师,算法/数据挖掘高级工程师,算法/机器学习-Lead工程师,算法专家机器学习,算法工程师(机器学习),算法工程师--机器学习方向,算法工程师-数据挖掘,算法工程师-机器学习,算法工程师-机器学习方向,算法工程师/数据挖掘工程师,算法工程师/深度学习,算法工程师—机器学习方向,算法工程师机器学习,算法工程师（人工智能/深度学习）,算法工程师（数据挖掘）,算法工程师（机器学习方向）,算法工程师（机器学习）,算法工程师（机器学习）-机票事业部(J12936),算法工程师（深度学习方向）,算法工程师（深度学习）,算法（深度学习）实习生,自然语言处理 \机器学习\数据挖掘工程师要医疗背景,自然语言处理&amp;机器学习,自然语言处理/数据挖掘/深度学习工程师（实习生）,自然语言处理/机器学习研究员,自然语言处理/机器学习算法工程师,自然语言处理NLP/机器学习,自然语言处理工程师/数据挖掘工程师,营销算法专家-机器学习／人工智能／AI,蚂蚁金服-高级算法工程师/算法专家（机器学习方向）,行业数据分析师,视觉跟踪/深度学习工程师,计算机视觉-机器学习/深度学习专家,计算机视觉/机器学习工程师--大数据&amp;滴滴研究院(J13266),计算机视觉/深度学习方向,计算机视觉/深度学习算法工程师,计算机视觉/深度学习算法工程师 (直播部),计算机视觉、机器学习、深度学习的实习生,计算机视觉及深度学习实习生,计算机视觉／深度学习工程师,资深后端开发/机器学习方向,资深数据分析-趣头条数据中心,资深数据分析师,资深数据挖掘,资深数据挖掘-EWT,资深数据挖掘专家,资深数据挖掘岗,资深数据挖掘工程师,资深数据挖掘工程师 (MJ000027),资深数据挖掘经理,资深机器学习研究员,资深机器学习算法工程师,资深机器学习算法工程师-金融事业部(J13090),资深深度学习工程师,资深深度学习算法,资深深度学习算法工程师,资深深度学习算法工程师/深度学习算法项目经理,资深研究员（机器学习方向）,资深算法工程师/深度学习/智能算法,资深算法工程师（机器学习方向）,资深算法架构师（深度学习）,软件工程师(机器学习),量化研究员-机器学习,量化研究员（机器学习）,销售支持实习生-数据分析,阿里高德-智慧交通-数据挖掘工程师/专家,阿里高德-智慧交通-机器学习工程师/专家,风控-机器学习,风控/策略算法，机器学习，自然语言处理,风控数据挖掘及机器学习研发工程师,风控策略研发工程师/机器学习算法工程师/数据分析师,高德-数据挖掘&amp;机器学习算法资深工程师/技术专家,高德-数据挖掘专家,高德-数据挖掘资深工程师/专家,高德-资深数据挖掘工程师/专家,高性能深度学习库开发工程师 (MJ000018),高端机器学习工程师,高级/资深数据挖掘工程师,高级CRM产品经理-数据分析方向,高级推荐算法工程师 /高级数据挖掘工程师,高级数据分析师,高级数据分析师 08-02-28,高级数据分析师-上海-00064,高级数据分析师-上海-01114,高级数据挖掘专家,高级数据挖掘工程师,高级数据挖掘工程师(上海),高级数据挖掘工程师-数据仓库方向,高级数据挖掘工程师（北京）,高级数据挖掘师,高级数据科学家-机器学习,高级机器学习,高级机器学习/数据挖掘工程师,高级机器学习工程师,高级机器学习研究员,高级机器学习算法工程师,高级深度学习,高级深度学习研发工程师,高级深度学习（广州）,高级研发工程师（深度学习）,高级算法工程师（机器学习）,高阶数据分析师,（2019校招）数据挖掘工程师,（校招/实习生）机器学习／算法工程师,（高级）数据挖掘工程师,15-50人,150-500人,2000人以上,50-150人,500-2000人,少于15人,A轮,B轮,C轮,D轮及以上,上市公司,不需要融资,天使轮,未融资,1-3年,10年以上,1年以下,3-5年,5-10年,不限.1,应届毕业生
0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,0,0
1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0
2,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,0
3,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0
4,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0


In [38]:
lagou = pd.concat((lagou_df2, lagou_df), axis=1).reset_index(drop=True)
lagou.head()

Unnamed: 0,salary,Python,R,SQL,Excel,Java,Linux,C++,Spark,Tensorflow,0,1,2,3,4,5,6,7,8,O2O,企业服务,信息安全,其他,医疗健康,教育,数据服务,电子商务,硬件,移动互联网,金融,不限,博士,大专,本科,硕士,00062-高级深度学习（杭州）,00148-深度学习专家（北京/杭州）,19校招-数据挖掘/机器学习算法工程师,2019-深度学习/机器学习工程师,2019届深度学习实习生,2019暑期实习-数据分析助理,2019校招-数据分析师,2019校招-数据挖掘/机器学习算法工程师,2019校招-数据挖掘工程师,2019校招-深度学习/计算机视觉算法工程师,?深度学习平台工程师,?深度学习应用软件工程师,AI Lab机器学习系统工程师,AI-机器学习工程师,AILABS-深度学习算法工程师(J180712004),AI算法工程师-机器学习,AML机器学习平台研发工程师,JTCPJS-数据挖掘工程师,Java/机器学习方向实习生,Java研发经理-机器学习方向,MIG03-NLP机器学习工程师/研究员（深圳）,MIG03-机器学习高级工程师（深圳）,MIG18-机器学习系统开发工程师（深圳）,MSSQ010-数据分析师,NLP/数据挖掘工程师,NLP/机器学习/自然语言处理工程师,NLP/机器学习专家,NLP自然语言处理/机器学习,PTBU-数据挖掘工程师,Python工程师-机器学习方向,Spider数据挖掘工程师,TEG13-数据挖掘工程师,UC事业部-数据挖掘专家,【社招/校招/实习】深度学习平台开发工程师,【资深数据挖掘工程师】,业务数据分析,中级数据挖掘工程师,产品经理-机器学习方向,人人事业部-TP-数据挖掘工程师,人工智能-机器学习,人工智能/机器学习专家,人工智能/机器学习工程师,人工智能、机器学习高级工程师,人工智能与机器学习工程师,人工智能机器学习,人工智能深度学习高级工程师,优酷-机器学习/深度学习工程师,像算法/深度学习工程师,公安数据挖掘研发主管,初级深度学习研发工程师,初级深度学习算法工程师,到店餐饮-高级数据挖掘工程师,前端开发工程师-机器学习团队-上海徐汇-00669,后台开发工程师 （深度学习平台）,和而泰 419 Lab 机器学习工程师,和而泰 419 Lab 机器学习高级工程师,品牌客户销售部-数据分析师,商业化数据分析师,图像算法/数据挖掘/机器学习-P7/P8-高德,图像算法/深度学习工程师,图像视觉/深度学习算法工程师,图像识别/深度学习工程师,垂直搜索-数据挖掘研究员,基于深度学习语音算法研发工程师(003760),大数据分析师,大数据分析师/算法工程师/数据挖掘,大数据数据开发工程师/大数据数据分析师,大数据研发工程师-大数据分析师,大数据部-用户研究员（会数据分析）,大数据部-高级数据分析师,大规模机器学习工程师,头条实验室科学家-机器学习,头条实验室算法工程师-机器学习,实习机器学习工程师,实习生--语音识别/机器学习,小米金融-机器学习/算法岗,市场调研/策略运营/数据分析,推荐与数据挖掘工程师,推荐算法/机器学习/数据挖掘/高级工程师,搜狐媒体-集团商业部-数据挖掘工程师,搜狗明医-机器学习研究员-北京-02086,搜狗机器翻译-数据挖掘研究员,搜狗机器翻译-机器学习研究员-北京-02886,搜狗输入法-数据挖掘研究员-北京-04091,搜狗问问-数据挖掘研究员-北京-01300,搜索App-深度学习研究员-北京-03545,数据产品经理/数据分析师,数据分析,数据分析 (MJ000537),数据分析 （2019校招）,数据分析(base上海),"数据分析, 数据挖掘,机器学习",数据分析-专车,数据分析-创新工作,数据分析-创新工具,数据分析-商品库,数据分析-机票事业部(J13017),数据分析/数据挖掘/BI工程师,数据分析/运营,数据分析与开发工程师,数据分析与挖掘实习岗,数据分析专员,数据分析专家,数据分析主管,数据分析助理,数据分析员,数据分析员主管,数据分析实习生,数据分析实习生-创新工具,数据分析岗,数据分析岗-风控方向,数据分析工程师,数据分析师,数据分析师 (MJ000108),数据分析师 (MJ000766),数据分析师 --10号线亮马桥,数据分析师 08-02-29,数据分析师(000447),数据分析师(3776),数据分析师(3838),数据分析师(J10227),数据分析师(J171124002),数据分析师(好价),数据分析师-,数据分析师--商发部,数据分析师-SH2927,数据分析师-TY,数据分析师-faceu,数据分析师-上海,数据分析师-内容付费,数据分析师-创新工具,数据分析师-北京,数据分析师-北京-00363,数据分析师-国际化,数据分析师-增长方向,数据分析师-增长策略方向,数据分析师-数据平台,数据分析师-脑科学,数据分析师-运营分析方向,数据分析师-销售,数据分析师-高级,数据分析师/数据挖掘工程师,数据分析师/数据挖掘工程师-Java,数据分析师/高级数据分析师,数据分析师09132101,数据分析师（大数据方向）,数据分析师（急招）,数据分析师（数据库方向）,数据分析师（新零售）,数据分析方向-数据工艺工程师-昌平,数据分析类,数据分析经理,数据分析（外包）,数据挖掘,数据挖掘 leader,数据挖掘(J10069),数据挖掘/广告算法,数据挖掘/机器学习,数据挖掘/机器学习工程师,数据挖掘/机器学习工程师/专家,数据挖掘/机器学习工程师【2019校园招聘】,数据挖掘/机器学习算法,数据挖掘/模型开发工程师,数据挖掘/算法专家-客户运营,数据挖掘/算法专家-新零售,数据挖掘/算法实习生,数据挖掘/算法工程师,数据挖掘/自然语言处理/机器学习/推荐系统,数据挖掘DataMing,数据挖掘RD,数据挖掘leader,数据挖掘、机器学习,数据挖掘、机器学习资深工程师,数据挖掘与建模专员,数据挖掘与建模工程师,数据挖掘与量化分析师,数据挖掘专家,数据挖掘专家(P7),数据挖掘专家-阿里新零售,数据挖掘专家/leader,数据挖掘实习生,数据挖掘实习生-人工智能实验室,数据挖掘实习生-杭州,数据挖掘实习生-核心广告系统,数据挖掘岗,数据挖掘工程师,数据挖掘工程师 (MJ000420),数据挖掘工程师 (MJ000902),数据挖掘工程师(2454),数据挖掘工程师(J180118007),数据挖掘工程师(P6),数据挖掘工程师(上海),数据挖掘工程师--北京,数据挖掘工程师-ICTR,数据挖掘工程师-人工智能实验室,数据挖掘工程师-反作弊方向,数据挖掘工程师-商业化-（北京）,数据挖掘工程师-大数据应用方向,数据挖掘工程师-用户产品方向,数据挖掘工程师/Java,数据挖掘工程师/专家,数据挖掘工程师/高级工程师,数据挖掘工程师/高级数据挖掘工程师,数据挖掘工程师/高级算法工程师,数据挖掘工程师或专家（上海）,数据挖掘工程师（北京/深圳）,数据挖掘工程师（增长）,数据挖掘工程师（实习）,数据挖掘工程师（武汉光谷——实习可转正）,数据挖掘工程师（济南）,数据挖掘工程师（高级）,数据挖掘师,数据挖掘师岗,数据挖掘开发,数据挖掘开发工程师,数据挖掘总监,数据挖掘技术专家,数据挖掘技术经理,数据挖掘攻城狮,数据挖掘架构师-餐饮生态部,数据挖掘研发工程师,数据挖掘算法工程师,数据挖掘算法工程师-国际化,数据挖掘算法高级工程师,数据挖掘算法高级工程师/专家,数据挖掘经理,数据挖掘讲师,数据挖掘负责人,数据挖掘部经理,数据挖掘高级工程师,数据挖掘高级工程师/技术专家,数据挖掘高级开发工程师/架构师,数据挖掘（算法）工程师,数据挖掘（赴百度）,数据科学家/数据分析师,数据科学家/机器学习工程师,数据解析与深度学习工程师-海外专场,文本分析与数据挖掘工程师-国际化,文本分析和数据挖掘工程师,无人车-机器学习/深度学习算法研究院/专家,无人配送-无人机深度学习算法,日志数据挖掘和安全建模,智能加速芯片-架构工程师（深度学习方向）,智能语音-数据挖掘研究员,智能语音-深度学习平台开发工程师,智能语音-深度学习研究员,智能问答-机器学习研究员,智能问答-深度学习研究员-北京-03425,智能驾驶-机器学习研究员-北京-02907,机器学习,机器学习 建模,机器学习 资深,机器学习-研发工程师,机器学习-金融事业部,机器学习/AI算法工程师,机器学习/人工智能方向实习生 （技术）,机器学习/数据挖掘专家,机器学习/数据挖掘工程师,机器学习/数据挖掘工程师/专家,机器学习/数据挖掘技术专家,机器学习/数据挖掘研发工程师,机器学习/文本挖掘工程师-杭州-00444,机器学习/深度学习,机器学习/深度学习/数据挖掘/算法/模型开发,机器学习/深度学习/算法工程师,机器学习/深度学习优化工程师,机器学习/深度学习优化工程师.,机器学习/深度学习工程师,机器学习/深度学习平台高级研发工程师--上海,机器学习/深度学习平台高级研发工程师--北京,机器学习/深度学习开发工程师,机器学习/深度学习算法工程师,机器学习/深度学习算法研究员,机器学习/深度学习算法研究员/专家,机器学习/算法工程师,机器学习/算法工程师(J180715001),机器学习/算法高级经理,机器学习/自然语言处理工程师,机器学习/自然语言处理算法工程师,机器学习/计算机图形图像算法工程师,机器学习/计算机视觉研发工程师,机器学习/计算机视觉算法 实习生,机器学习/计算机视觉算法工程师,机器学习/计算机视觉算法工程师(J180628019),机器学习/高性能服务端工程师,机器学习、数据挖掘工程师,机器学习、数据挖掘算法工程师,机器学习、数据挖掘算法工程师/高级算法工程师,机器学习与人工智能高级工程师,机器学习与算法工程师/研究员,机器学习专家,机器学习云平台开发工程师,机器学习及算法工程师,机器学习和算法工程师,机器学习实习,机器学习实习生,机器学习岗,机器学习工程师,机器学习工程师(000662),机器学习工程师-上海,机器学习工程师-金融事业部,机器学习工程师/AI工程师,机器学习工程师/专家(J171211019),机器学习工程师J10010,机器学习工程师实习生,机器学习工程师（AI）,机器学习工程师（上海-静安区）,机器学习工程师（人工智能中心）,机器学习工程师（偏工程）,机器学习工程师（偏算法）,机器学习工程师（北京）,机器学习工程师（广州）,机器学习工程师（掌上生活团队）,机器学习工程师（搜索算法）,机器学习工程师（武汉）,机器学习工程开发高级工程师,机器学习平台-平台工程专家,机器学习平台-平台工程专家(J180718011),机器学习平台产品经理,机器学习平台工程人员,机器学习平台开发工程师,机器学习平台研发工程师,机器学习平台系统开发工程师 (MJ000150),机器学习应用工程师,机器学习应用开发工程师,机器学习开发工程师,机器学习技术专家,机器学习技术经理,机器学习架构工程师A,机器学习架构师,机器学习模型师,机器学习研发工程师,机器学习研发工程师 (MJ000173),机器学习研发工程师【MIUI】,机器学习研究员,机器学习研究员(J180203019),机器学习研究员-多模态学习方向,机器学习科学家（可兼职）（上海）,机器学习科学家（可兼职）（西安）,机器学习算法,机器学习算法专家,机器学习算法实习生,机器学习算法工程师,机器学习算法工程师 (MJ000045),机器学习算法工程师 (MJ000057),机器学习算法工程师--实习岗,机器学习算法工程师-多模态学习方向,机器学习算法工程师-校招,机器学习算法工程师/专家,机器学习算法工程师（上海）,机器学习算法工程师（应届毕业生）,机器学习算法工程师（杭州）,机器学习算法开发工程师,机器学习算法研发工程师,机器学习算法研究员,机器学习算法研究员 (MJ000031),机器学习算法负责人-CVR模型方向,机器学习系统工程师,机器学习系统工程师-AI-Lab,机器学习系统工程师（南京）,机器学习讲师,机器学习负责人,机器学习资深专家,机器学习资深工程师,机器学习资深研发工程师,机器学习高级专家,机器学习高级工程师,机器学习高级研发工程师,机器学习（工作地：北京/郑州）,机器学习（数据）,机器学习（算法专家）,机器学习（高级）工程师-国际化,深度/机器学习,深度/机器学习实习生,深度/机器学习研究员,深度学习,深度学习 AI 前沿技术创新研究员,深度学习 PaaS 平台研发工程师,深度学习 前沿技术创新架构师,深度学习(J12957),深度学习-NLP/机器翻译/机器创作,深度学习-校招,深度学习-自然语言处理工程师,深度学习-自然语言处理高级工程师,深度学习-视觉算法工程师,深度学习-计算机视觉,深度学习-计算机视觉工程师,深度学习-闲聊后台开发工程师,深度学习/医学图像处理实习生,深度学习/医学图像算法工程师,深度学习/图像处理 算法工程师,深度学习/机器学习工程师,深度学习/机器学习工程师-上海,深度学习/机器学习研发工程师,深度学习/机器学习算法工程师,深度学习/自然语言处理算法工程师,深度学习/计算机视觉工程师,深度学习Leader,深度学习PaaS平台研发工程师,深度学习专家,深度学习专家-金融事业部J11177,深度学习优化,深度学习图像算法工程师,深度学习培训讲师,深度学习基础架构,深度学习基础设施平台工程师,深度学习实习岗,深度学习实习生,深度学习工程师,深度学习工程师-NLP方向,深度学习工程师-博士,深度学习工程师/深度学习专家 I,深度学习工程师A,深度学习工程师实习生,深度学习平台工程师,深度学习平台开发工程师,深度学习平台方案工程师 (MJ000110),深度学习开发工程师,深度学习开发工程师（视频生态）,深度学习数据平台研发工程师,深度学习架构师,深度学习架构师A,深度学习框架-研发工程师,深度学习框架研发实习生,深度学习框架研发工程师,深度学习研发工程师,深度学习研发工程师 (计算机视觉方向),深度学习研发工程师-AI平台,深度学习研究员,深度学习研究员-AI平台-北京-01140,深度学习科学家,深度学习算法,深度学习算法专家,深度学习算法专家/资深工程师,深度学习算法专家（无人配送）,深度学习算法压缩工程师,深度学习算法实习工程师,深度学习算法实习生,深度学习算法实习生-广州,深度学习算法工程师,深度学习算法工程师 (MJ000172),深度学习算法工程师(J10429),深度学习算法工程师-VR方向【2019校园招聘】,深度学习算法工程师实习生,深度学习算法工程师（19届）,深度学习算法工程师（AI热门领域）,深度学习算法工程师（技术）,深度学习算法工程师（新产品组）,深度学习算法工程师（语音/多模态方向）,深度学习算法工程师（资深）,深度学习算法工程师（输入法）,深度学习算法架构师,深度学习算法研发工程师,深度学习算法研究员,深度学习算法研究员、副研究员,深度学习算法研究工程师,深度学习算法研究工程师-厦门,深度学习算法科学家,深度学习算法移植和优化(J180601005),深度学习系统工程师,深度学习系统研究员,深度学习系统研究员（北京）,深度学习视觉算法专家-无人车,深度学习视觉算法工程师,深度学习解决方案工程师,深度学习解决方案架构师,深度学习语音算法工程师,深度学习资深专家,深度学习资深算法工程师,深度学习软件工程师,深度学习软件研发工程师,深度学习首席工程师,深度学习高级工程师,深度学习高级工程师（研发中心）,深度学习高级研发工程师,深度学习高级研究员,深度学习高级算法工程师,深度学习高级算法工程师(J171126002),物流机器人-深度学习工程师,瓜子二手车数据挖掘工程师,用户运营与数据分析,研究员（深度学习，强化学习）,移动端高级深度学习算法工程师,策略/数据分析师,策略运营/数据分析,算法-数据挖掘,算法/数据挖掘工程师,算法/数据挖掘高级工程师,算法/机器学习-Lead工程师,算法专家机器学习,算法工程师(机器学习),算法工程师--机器学习方向,算法工程师-数据挖掘,算法工程师-机器学习,算法工程师-机器学习方向,算法工程师/数据挖掘工程师,算法工程师/深度学习,算法工程师—机器学习方向,算法工程师机器学习,算法工程师（人工智能/深度学习）,算法工程师（数据挖掘）,算法工程师（机器学习方向）,算法工程师（机器学习）,算法工程师（机器学习）-机票事业部(J12936),算法工程师（深度学习方向）,算法工程师（深度学习）,算法（深度学习）实习生,自然语言处理 \机器学习\数据挖掘工程师要医疗背景,自然语言处理&amp;机器学习,自然语言处理/数据挖掘/深度学习工程师（实习生）,自然语言处理/机器学习研究员,自然语言处理/机器学习算法工程师,自然语言处理NLP/机器学习,自然语言处理工程师/数据挖掘工程师,营销算法专家-机器学习／人工智能／AI,蚂蚁金服-高级算法工程师/算法专家（机器学习方向）,行业数据分析师,视觉跟踪/深度学习工程师,计算机视觉-机器学习/深度学习专家,计算机视觉/机器学习工程师--大数据&amp;滴滴研究院(J13266),计算机视觉/深度学习方向,计算机视觉/深度学习算法工程师,计算机视觉/深度学习算法工程师 (直播部),计算机视觉、机器学习、深度学习的实习生,计算机视觉及深度学习实习生,计算机视觉／深度学习工程师,资深后端开发/机器学习方向,资深数据分析-趣头条数据中心,资深数据分析师,资深数据挖掘,资深数据挖掘-EWT,资深数据挖掘专家,资深数据挖掘岗,资深数据挖掘工程师,资深数据挖掘工程师 (MJ000027),资深数据挖掘经理,资深机器学习研究员,资深机器学习算法工程师,资深机器学习算法工程师-金融事业部(J13090),资深深度学习工程师,资深深度学习算法,资深深度学习算法工程师,资深深度学习算法工程师/深度学习算法项目经理,资深研究员（机器学习方向）,资深算法工程师/深度学习/智能算法,资深算法工程师（机器学习方向）,资深算法架构师（深度学习）,软件工程师(机器学习),量化研究员-机器学习,量化研究员（机器学习）,销售支持实习生-数据分析,阿里高德-智慧交通-数据挖掘工程师/专家,阿里高德-智慧交通-机器学习工程师/专家,风控-机器学习,风控/策略算法，机器学习，自然语言处理,风控数据挖掘及机器学习研发工程师,风控策略研发工程师/机器学习算法工程师/数据分析师,高德-数据挖掘&amp;机器学习算法资深工程师/技术专家,高德-数据挖掘专家,高德-数据挖掘资深工程师/专家,高德-资深数据挖掘工程师/专家,高性能深度学习库开发工程师 (MJ000018),高端机器学习工程师,高级/资深数据挖掘工程师,高级CRM产品经理-数据分析方向,高级推荐算法工程师 /高级数据挖掘工程师,高级数据分析师,高级数据分析师 08-02-28,高级数据分析师-上海-00064,高级数据分析师-上海-01114,高级数据挖掘专家,高级数据挖掘工程师,高级数据挖掘工程师(上海),高级数据挖掘工程师-数据仓库方向,高级数据挖掘工程师（北京）,高级数据挖掘师,高级数据科学家-机器学习,高级机器学习,高级机器学习/数据挖掘工程师,高级机器学习工程师,高级机器学习研究员,高级机器学习算法工程师,高级深度学习,高级深度学习研发工程师,高级深度学习（广州）,高级研发工程师（深度学习）,高级算法工程师（机器学习）,高阶数据分析师,（2019校招）数据挖掘工程师,（校招/实习生）机器学习／算法工程师,（高级）数据挖掘工程师,15-50人,150-500人,2000人以上,50-150人,500-2000人,少于15人,A轮,B轮,C轮,D轮及以上,上市公司,不需要融资,天使轮,未融资,1-3年,10年以上,1年以下,3-5年,5-10年,不限.1,应届毕业生
0,15000.0,1.0,1.0,1.0,0.0,0.0,0.0,0.0,1.0,0.0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,0,0
1,32500.0,0.0,1.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0
2,12500.0,1.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,0
3,11500.0,0.0,0.0,1.0,1.0,0.0,0.0,0.0,0.0,0.0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0
4,10000.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,1,0,0,0,0,0,0


In [39]:
lagou.to_csv('lagou_featured.csv', encoding='utf-8')

In [36]:
X = lagou_df.drop(['salary'], axis=1)
y = np.log(lagou_df['salary'].values.reshape((-1, 1)))
print(X.shape, y.shape)

KeyError: "['salary'] not found in axis"

In [None]:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
print(X_train.shape, y_train.shape, X_test.shape, y_test.shape)

In [None]:
from sklearn.model_selection import KFold
from sklearn.ensemble import GradientBoostingRegressor

model = GradientBoostingRegressor(n_estimators = 40, max_depth = 2)
model.fit(X_train, y_train)

In [None]:
from sklearn.metrics import mean_squared_error
y_pred = model.predict(X_test)
print(np.sqrt(mean_squared_error(y_test, y_pred)))

In [None]:
np.exp(y_pred[:10])

In [None]:
np.exp(y_test[:10])