In [13]:
import pandas as pd
import geopandas as gpd
import sys
import json

folder = "/var/essdata/IDU/other/mm_22/industrial-location"
sys.path.append(folder)

from api.app.func import get_ontology_industry, get_ontology_specialities, get_ontology_edu_groups, get_potential_estimates

In [15]:
ontology = pd.read_csv("../api/app/data/ontology.csv", index_col=0)
cv = pd.read_csv("../api/app/data/cv.csv", index_col=0)
graduates = pd.read_csv("../api/app/data/graduates.csv", index_col=0)
cities = gpd.read_file("../api/app/data/cities.geojson", index_col=0).drop_duplicates("city", keep=False)

### Табличное представление онтологии

In [5]:
# Для всех индустрий
ontology_electronics = get_ontology_industry(ontology)
pd.DataFrame(ontology_electronics)

Unnamed: 0,prof_domain,type,speciality,idustry_code,edu_group_code,speciality_id,edu_group,edu_group_id
0,Добыча нефти и газа,СПО,"Оператор, аппаратчик",mining_oil_gas,21,0,"Прикладная геология, горное дело, нефтегазовое...",0
1,Добыча нефти и газа,СПО,Монтажник,mining_oil_gas,21,1,"Прикладная геология, горное дело, нефтегазовое...",0
2,Добыча нефти и газа,СПО,Машинист,mining_oil_gas,21,2,"Прикладная геология, горное дело, нефтегазовое...",0
3,Добыча нефти и газа,СПО,Мастер по ремонту оборудования,mining_oil_gas,21,3,"Прикладная геология, горное дело, нефтегазовое...",0
4,Добыча нефти и газа,СПО,Разнорабочий,mining_oil_gas,21,4,"Прикладная геология, горное дело, нефтегазовое...",0
...,...,...,...,...,...,...,...,...
125,Электроника и микроэлектроника,СПО,Разнорабочий,electronics,11,4,"Электроника, радиотехника и системы связи (СПО)",20
126,Электроника и микроэлектроника,ВПО,Инженер-конструктор,electronics,11,10,"Электроника, радиотехника и системы связи (ВПО)",21
127,Электроника и микроэлектроника,ВПО,Специалист по сертификации,electronics,27,16,Управление в технических системах (ВПО),5
128,Электроника и микроэлектроника,ВПО,Технолог,electronics,11,8,"Электроника, радиотехника и системы связи (ВПО)",21


In [6]:
# Для выбранной индустрии
ontology_electronics = get_ontology_industry(ontology, idustry_code="electronics")
pd.DataFrame(ontology_electronics)

Unnamed: 0,prof_domain,type,speciality,idustry_code,edu_group_code,speciality_id,edu_group,edu_group_id
0,Электроника и микроэлектроника,СПО,Механик,electronics,11,18,"Электроника, радиотехника и системы связи (СПО)",20
1,Электроника и микроэлектроника,СПО,Монтажник,electronics,11,1,"Электроника, радиотехника и системы связи (СПО)",20
2,Электроника и микроэлектроника,СПО,Контролер ОТК,electronics,18,14,Химические технологии (СПО),12
3,Электроника и микроэлектроника,СПО,"Оператор, аппаратчик",electronics,11,0,"Электроника, радиотехника и системы связи (СПО)",20
4,Электроника и микроэлектроника,СПО,"Оператор, аппаратчик",electronics,15,0,Машиностроение (СПО),3
5,Электроника и микроэлектроника,СПО,Сварщик,electronics,15,11,Машиностроение (СПО),3
6,Электроника и микроэлектроника,СПО,Электромонтажник,electronics,11,22,"Электроника, радиотехника и системы связи (СПО)",20
7,Электроника и микроэлектроника,СПО,Разнорабочий,electronics,11,4,"Электроника, радиотехника и системы связи (СПО)",20
8,Электроника и микроэлектроника,ВПО,Инженер-конструктор,electronics,11,10,"Электроника, радиотехника и системы связи (ВПО)",21
9,Электроника и микроэлектроника,ВПО,Специалист по сертификации,electronics,27,16,Управление в технических системах (ВПО),5


### Перечень профессий и направлений подготовки из онтологии

In [9]:
specialists = get_ontology_specialities(ontology, idustry_code='electronics')
specialists

{18: 'Механик',
 1: 'Монтажник',
 14: 'Контролер ОТК',
 0: 'Оператор, аппаратчик',
 11: 'Сварщик',
 22: 'Электромонтажник',
 4: 'Разнорабочий',
 10: 'Инженер-конструктор',
 16: 'Специалист по сертификации',
 8: 'Технолог',
 17: 'Инженер по качеству'}

In [12]:
groups = get_ontology_edu_groups(ontology, idustry_code='electronics')
groups

{'СПО': {20: 'Электроника, радиотехника и системы связи (СПО)',
  12: 'Химические технологии (СПО)',
  3: 'Машиностроение (СПО)'},
 'ВПО': {21: 'Электроника, радиотехника и системы связи (ВПО)',
  5: 'Управление в технических системах (ВПО)'}}

### Оценка потенциала городов для развития выбранной промышленной индустрии

С учетом:
- количества открытых резюме специалистов задействованных в индустрии
- прогнозного числа выпускников соответствующих направлений подготовки
- значимости профессий и направлений подготовки в будущем производстве


In [17]:
# значимость профессий
s_weigths = json.loads(json.dumps({18: 0.5, 1: 1, 14: 1, 0: 0.9, 11: 0.2, 22: 1, 4: 0.1, 10: 0.9, 16: 1, 8: 0.5, 17: 0.6}))

# значимость потенциальных выпускнов направлений подготовки
e_weighrs = json.loads(json.dumps({20: 0.5, 12: 0.7, 3: 0.1, 21: 0.6, 5: 0.5}))

estimate = get_potential_estimates(ontology, cv, graduates, cities, specialities=s_weigths, edu_groups=e_weighrs, workforce_type='all')
estimate = gpd.GeoDataFrame.from_features(estimate)
estimate

Unnamed: 0,geometry,city,estimate,graduates_forecast_number,graduates_forecast_sum_number,specialists_number,specialists_sum_number
0,POINT (37.61764 55.75582),Москва,1.000,"{('ВПО', 11): 18632, ('ВПО', 27): 60136, ('СПО...",80587.0,"{'Инженер по качеству': 20, 'Механик': 36, 'Мо...",378.0
1,POINT (30.31588 59.93910),Санкт-Петербург,0.868,"{('ВПО', 11): 20508, ('ВПО', 27): 28454, ('СПО...",57559.0,"{'Инженер по качеству': 44, 'Механик': 52, 'Мо...",415.0
2,POINT (53.23578 54.40332),Бавлы,0.620,,0.0,"{'Механик': 1, 'Разнорабочий': 3, 'Электромонт...",330.0
3,POINT (56.22944 58.01046),Пермь,0.397,"{('ВПО', 11): 1292, ('ВПО', 27): 2007, ('СПО',...",7147.0,"{'Инженер по качеству': 19, 'Механик': 26, 'Мо...",353.0
4,POINT (92.85257 56.01057),Красноярск,0.367,"{('ВПО', 11): 8870, ('ВПО', 27): 7427, ('СПО',...",19918.0,"{'Инженер по качеству': 10, 'Механик': 25, 'Мо...",209.0
...,...,...,...,...,...,...,...
1639,POINT (59.93582 51.51975),Адамовка,0.000,,0.0,{'Разнорабочий': 1},1.0
1640,POINT (54.74135 52.92600),Шарлык,0.000,,0.0,{'Разнорабочий': 1},1.0
1641,POINT (37.03995 52.97238),Новосиль,0.000,,0.0,,0.0
1642,POINT (54.97615 51.83197),Подгородняя Покровка,0.000,,0.0,,0.0
