In [1]:
import numpy as np
import pandas as pd

import warnings
warnings.filterwarnings('ignore')

# Загрузка данных. Описание датасета

**Описание датасета**

Сведения Федеральной таможенной службы по экспорту и импорту из российских регионов за 2016-2021 годы. Данные представлены с детализацией до десятизначных кодов товаров, а также стран, в которые эти товары экспортируются или импортируются субъектами РФ. 
Единица наблюдения в датасете – сгруппированный из таможенных деклараций объём импорта или экспорта по десятизначному коду товара между регионом России и страной за месяц.
Данные извлечены csv-файлов, скачанных с портала stat.customs.ru, и преобразованы в формат машиночитаемой плоской таблицы.
Унифицированы наименования единиц наблюдения (атрибут measure): числовые коды преобразованы в соответствующие кодовые обозначения (например, «1000 ШТ», «КГ NAOH»).

* **direction** Обозначение направления торговли: ИМ (импорт); ЭК (экспорт).
* **month** Месяц и год осуществления поставки
* **country** Кодовое обозначение страны участника торговли в формате Alpha2 (Например GB, US и тд.)
* **code** Кодовое обозначение товара в соответствии с десятизначным классификатором товарной номенклатуры внешнеэкономической деятельности ТН ВЭД. Например, код ТН ВЭД 8458912001 означает: 84 – станки и оборудование; 8458 – станки токарные 845891 – с ЧПУ 84589120 – многоцелевые 8458912001 – высокоскоростные для авиационной промышленности.
* **measure** Краткое обозначение дополнительной единицы измерения товара (например, «Пары», «ШТ» и другие). Дополнительные единицы измерения собираются Федеральной таможенной службой не по каждому виду товара. Если по товару такая информация не собирается, то в этом поле ставится «1», а в поле quantity – «0».
* **value** Суммарный объём товаров в поставках по таможенным декларациям в долларах США (для анализа перевели в тыс.долл)
* **netto** Суммарный вес нетто товаров в поставках по таможенным декларациям в килограммах
* **quantity** Суммарное количество товаров по таможенным декларациям в соответствии с дополнительными единицами измерения (атрибут measure)
* **region** Код ОКАТО региона России-участника торговли (например, «17» – Владимирская область).
* **district** Код ОКАТО федерального округа России-участника торговли (например, «01» – Центральный федеральный округ).


Экспорт и импорт российских регионов: таможенная статистика с детализацией до товаров за 2016-2021 гг. // ФТС; обработка: Кочанов Д.В., Сусина А.А., Копыток В.К., Инфраструктура научно-исследовательских данных, АНО «ЦПУР», 2022. Доступ: Лицензия CC BY-SA. Размещено: 23.03.2022. (Ссылка на набор данных: http://data-in.ru/data-catalog/datasets/201/)

**Внесенные в набор данных изменения по сравнению с источниками**.

Данные извлечены csv-файлов, скачанных с портала stat.customs.ru, и преобразованы в формат машиночитаемой плоской таблицы.
Унифицированы наименования единиц наблюдения (атрибут measure): числовые коды преобразованы в соответствующие кодовые обозначения (например, «1000 ШТ», «КГ NAOH»).

**Известные ограничения данных**

Данные по дополнительным единицам измерения заполняются Федеральной таможенной службой не для всех товаров, поэтому получить эту информацию невозможно. Отсутствующие данные по дополнительным единицам измерения отмечены «1», в таком случае количество товаров в дополнительных единицах измерения в колонке «KOL» отмечено как «0».

Данные по весу нетто округлены до килограммов, поэтому вес некоторых поставок отмечен как «0».

Данные о регионе участнике торговли могут быть заполнены не очень точно. Поскольку данные собираются из таможенных деклараций, где указано предприятие отправитель или получатель, то его юридический адрес может не соответствовать фактическому месту отправления или получения поставки. Например, производство размещено в регионе, а головной офис компании расположен в Москве, поставка отправляется из региона, но в декларации в качестве юридического адреса указывается Москва.

Некоторые поставки засекречены и декларируются под кодом «SSSSSSSSSS».

Данные за 2016-2017 гг. по суммарному объему, количеству и весу товаров округлены до целых (приводятся без десятичной части).
Официальные данные в открытых источниках Федеральной таможенной службы регулярно уточняются и корректируются, поэтому в датасете могут быть представлены сведения, отличающиеся от актуальных. Данные за 2016-2017 гг. выгружены 15.12.2020 г., данные за 2018-2021 гг. выгружены 20.03.2022 г. Разные даты выгрузки обусловлены отсутствием в открытом доступе архивных данных за 2016-2017 гг.

### ОПТИМИЗАЦИЯ ИСПОЛЬЗОВАННОЙ ПАМЯТИ*
*приведена в отдельном ноутбуке

### ЗАГРУЗКА ДАТАСЕТА

In [2]:
column_types = {
    'code': 'category',
    'country': 'category',
    'direction': 'category',
    'district': 'uint8',
    'mapp': 'category',
    'measure': 'category',
    'mon': 'uint8',
    'netto': 'float32',
    'quantity': 'float32',
    'region': 'uint32',
    'value': 'float32',
    'year': 'uint16'};

Датасет сохранен по адресу: https://mega.nz/file/gaERFbDD#6YWYjpl_iXEYsg49xkYblAeGzHCrrQ1E_aAm7a2WoEg

In [3]:
df = pd.read_csv('data_new.csv',dtype=column_types,parse_dates=['month'],infer_datetime_format=True);


In [4]:
df.drop(df[(df['year'] < 2019)].index, inplace=True) ;
## УДАЛЕНЫ ДАННЫЕ ДО 2019 ДЛЯ УСКОРЕНИЯ РАБОТЫ. В ДАЛЬНЕЙШЕМ ВОЗМОЖЕН ИХ АНАЛИЗ ПРИ ЖЕЛАНИИ

In [5]:
df['value'] = df['value']/1000 ;
## ПЕРЕВОД ДОЛЛ.США В ТЫС.ДОЛЛ США ДЛЯ ОПТИМИЗАЦИИ

In [6]:
import gc
gc.collect();

In [7]:
def table(year, num):
   
    #новая таблица из фильтр исходной таблицы по году и направлению импорт/экспорт
    
    tbl = df[(df['year'] == year) & (df['direction'] == 'ИМ')]    
    
# объединение таблиц

    for i in range(num):

        tbl2 = df[(df['year'] == year-i) & (df['direction'] == 'ЭК')]
        tbl2 = tbl2.groupby(['mapp'], as_index=False)\
                            .agg({'value':'sum'})\
                            .rename(columns={'value':f'exp_{year-i}'})


        tbl = pd.merge(tbl, tbl2[['mapp',f'exp_{year-i}']], on='mapp', how='left')
        gc.collect()
        tbl[f'exp_{year-i}'] = tbl[f'exp_{year-i}'].fillna(0)

        tbl2 = df[(df['year'] == year-i) & (df['direction'] == 'ИМ')]
        tbl2 = tbl2.groupby(['mapp'], as_index=False)\
                            .agg({'value':'sum'})\
                            .rename(columns={'value':f'imp_{year-i}'})


        tbl = pd.merge(tbl, tbl2[['mapp',f'imp_{year-i}']], on='mapp', how='left')
        gc.collect()
        #переименование столбцев value
        tbl[f'imp_{year-i}'] = tbl[f'imp_{year-i}'].fillna(0)
        
    return tbl;


In [8]:
tbl1 = table(2021,3)
tbl1
## в коде выше в скобках указан - год отсчета - 2021 и количество лет для анализа - 3 предыдущих года 
## (в дальнейшем можно перевести в месяцы для анализа по месяцам, а не по годам)
## в полученной таблице - взяты дынные по импорту (в тыс.долл) за указанный год (2021), и в столбцах приведены соответствующие данные по предыдущим периодам (в тыс.долл)
## exp_2021	imp_2021	exp_2020	imp_2020	exp_2019	imp_2019
## данные соотносятся c другими периодами по столбцу 'mapp'
## в будущем можно добавить для анализа столбцы с количесвенными даными, а не только денежные.

Unnamed: 0,direction,month,country,code,measure,value,netto,quantity,region,district,year,mon,mapp,exp_2021,imp_2021,exp_2020,imp_2020,exp_2019,imp_2019
0,ИМ,2021-01-01,CN,9403301900,ШТ,16.375839,7484.799805,105.0,5000,7,2021,1,50007CN9403301900,0.0,50.247639,0.0,50.741798,0.0,60.743881
1,ИМ,2021-01-01,CN,9032890000,ШТ,12.858600,2024.680054,124959.0,5000,7,2021,1,50007CN9032890000,0.0,637.312500,0.0,327.573761,0.0,224.579178
2,ИМ,2021-01-01,CN,9616101000,1,0.955220,188.399994,0.0,5000,7,2021,1,50007CN9616101000,0.0,39.151821,0.0,44.915089,0.0,2.872310
3,ИМ,2021-01-01,IT,8484900000,1,7.770350,165.893005,0.0,5000,7,2021,1,50007IT8484900000,0.0,100.472092,0.0,68.371559,0.0,23.649441
4,ИМ,2021-01-01,CN,9405109807,1,129.933289,32586.369141,0.0,5000,7,2021,1,50007CN9405109807,0.0,3482.534912,0.0,1871.708252,0.0,2237.085938
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2918999,ИМ,2021-09-01,BY,3923301010,1,26.883450,17316.000000,0.0,85000,3,2021,9,850003BY3923301010,0.0,187.225052,0.0,13.665680,0.0,25.870491
2919000,ИМ,2021-10-01,BY,4805932000,1,12.217800,20695.000000,0.0,85000,3,2021,10,850003BY4805932000,0.0,63.522270,0.0,0.000000,0.0,0.000000
2919001,ИМ,2021-11-01,BY,4805932000,1,24.750750,41717.000000,0.0,85000,3,2021,11,850003BY4805932000,0.0,63.522270,0.0,0.000000,0.0,0.000000
2919002,ИМ,2021-12-01,CN,7326909807,1,4.999620,1000.000000,0.0,85000,3,2021,12,850003CN7326909807,0.0,4.999620,0.0,0.000000,0.0,0.000000


In [9]:
spsk_ndr_strn = ('AU,AT,AL,AI,AD,BS,BE,BM,BG,IO,HU,VG,DE,GG,GI,GR,DK,JE,IE,IS,ES,IT,CA,CY,KR,LV,LT,LI,LU,MT,FM,MC,MS,NL,NZ,NO,IM,KY,TC,PN,PL,PT,RO,SM,SH,MK,SG,SK,SI,GB,US,TW,UA,FI,FK,FR,HR,ME,CZ,CH,SE,EE,GS,JP').split(',')
## сформирован на основании нормативных актов

In [10]:
tbl1.loc[tbl1['country'].isin(spsk_ndr_strn), 'type_strn'] = 1
## новый столбец - является ли страна участник недружественной страной

In [11]:
tbl1['type_strn'] = tbl1['type_strn'].fillna(0)
tbl1['type_strn'].astype('uint8');

In [12]:
tbl2 = tbl1.groupby(['mapp'], as_index=False)\
                            .agg({'netto':'sum', 'quantity':'sum'})\
                            .rename(columns={'netto':'netto_2021', 'quantity':'quantity_2021'})


tbl = pd.merge(tbl1, tbl2[['mapp','netto_2021', 'quantity_2021']], on='mapp', how='left')
tbl

## в данном анализе было принято решение анализировать годовые данные для ускорения работы. 
## но проведенный пример анализа возможно распространить и на отдельные месяцы.

Unnamed: 0,direction,month,country,code,measure,value,netto,quantity,region,district,...,mapp,exp_2021,imp_2021,exp_2020,imp_2020,exp_2019,imp_2019,type_strn,netto_2021,quantity_2021
0,ИМ,2021-01-01,CN,9403301900,ШТ,16.375839,7484.799805,105.0,5000,7,...,50007CN9403301900,0.0,50.247639,0.0,50.741798,0.0,60.743881,0.0,22401.400391,345.0
1,ИМ,2021-01-01,CN,9032890000,ШТ,12.858600,2024.680054,124959.0,5000,7,...,50007CN9032890000,0.0,637.312500,0.0,327.573761,0.0,224.579178,0.0,68818.031250,413376.0
2,ИМ,2021-01-01,CN,9616101000,1,0.955220,188.399994,0.0,5000,7,...,50007CN9616101000,0.0,39.151821,0.0,44.915089,0.0,2.872310,0.0,7592.314941,0.0
3,ИМ,2021-01-01,IT,8484900000,1,7.770350,165.893005,0.0,5000,7,...,50007IT8484900000,0.0,100.472092,0.0,68.371559,0.0,23.649441,1.0,1770.532959,0.0
4,ИМ,2021-01-01,CN,9405109807,1,129.933289,32586.369141,0.0,5000,7,...,50007CN9405109807,0.0,3482.534912,0.0,1871.708252,0.0,2237.085938,0.0,692359.125000,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2918999,ИМ,2021-09-01,BY,3923301010,1,26.883450,17316.000000,0.0,85000,3,...,850003BY3923301010,0.0,187.225052,0.0,13.665680,0.0,25.870491,0.0,119569.000000,0.0
2919000,ИМ,2021-10-01,BY,4805932000,1,12.217800,20695.000000,0.0,85000,3,...,850003BY4805932000,0.0,63.522270,0.0,0.000000,0.0,0.000000,0.0,103797.000000,0.0
2919001,ИМ,2021-11-01,BY,4805932000,1,24.750750,41717.000000,0.0,85000,3,...,850003BY4805932000,0.0,63.522270,0.0,0.000000,0.0,0.000000,0.0,103797.000000,0.0
2919002,ИМ,2021-12-01,CN,7326909807,1,4.999620,1000.000000,0.0,85000,3,...,850003CN7326909807,0.0,4.999620,0.0,0.000000,0.0,0.000000,0.0,1000.000000,0.0


In [13]:
tbl.drop(['direction','month','value','netto', 'quantity', 'mon','year'], axis=1, inplace=True)
## удаляем столбцы с месячными данными, оставляем только годовые.

In [14]:
new_tbl = tbl.drop_duplicates().reset_index(drop=True)

In [15]:
tbl_ndr_strn = new_tbl[(new_tbl['type_strn'] == 1)]
## логично предположить, что главные товары, для которых требуется активное импортозамещение - это те, которые раньше поставлялись из недружественных стран.
# создадим отдельную таблицу с данными по недружестенным странам.

In [16]:
tbl_ndr_strn['gr4'] = tbl_ndr_strn['code'].apply(lambda x: x[:4])
tbl_ndr_strn['gr4'] = tbl_ndr_strn['gr4'].astype('category')
## ДОБАВЛЕНИЕ КОДОВ ТНВЭД БОЛЕЕ ВЫСОКОГО УРОВНЯ (4 знака)

In [17]:
tbl1['gr4'] = tbl1['code'].apply(lambda x: x[:4])
tbl1['gr4'] = tbl1['gr4'].astype('category')
tbl3 = tbl1.groupby(['gr4'], as_index=False)\
                            .agg({'value':'sum'})\
                            .rename(columns={'value':'value_2021_gr4_total'})


tbl_ndr_strn = pd.merge(tbl_ndr_strn, tbl3[['gr4','value_2021_gr4_total']], on='gr4', how='left')


#### Cоздаем новые аналитические столбцы:
* **%_imp_nedr_strn**  - доля импорта в общем объеме: объем импорта в 2021 (в тыс.долл) по строке / на весь импорт по группе ТНВЭД (4 знака) 2021
* **rost_imp_2021** - процентный рост импорта по строке в сравнении к прошлому периоду: объем импорта в 2021 (в тыс.долл) по строке / объем импорта в 2020 (в тыс.долл) по строке 
* **rost_imp_2020** --""--
* **rost_exp_2021** - процентный рост экспорта по строке в сравнении к прошлому периоду: объем экспорта в 2021 (в тыс.долл) по строке / объем экспорта в 2020 (в тыс.долл) по строке
* **rost_exp_2020** --""--
* **doly_exp_imp_2021** % доля экспорта 2021 в импорте 2021


In [18]:
tbl_ndr_strn['%_imp_nedr_strn'] = tbl_ndr_strn['imp_2021'] / tbl_ndr_strn['value_2021_gr4_total'] *100
tbl_ndr_strn['rost_imp_2021'] = tbl_ndr_strn['imp_2021'] / tbl_ndr_strn['imp_2020']*100
tbl_ndr_strn['rost_imp_2020'] = tbl_ndr_strn['imp_2020'] / tbl_ndr_strn['imp_2019']*100

tbl_ndr_strn['rost_exp_2021'] = tbl_ndr_strn['exp_2021'] / tbl_ndr_strn['exp_2020']*100
tbl_ndr_strn['rost_exp_2020'] = tbl_ndr_strn['exp_2020'] / tbl_ndr_strn['exp_2019']*100

tbl_ndr_strn['doly_exp_imp_2021'] = tbl_ndr_strn['exp_2021'] / tbl_ndr_strn['imp_2021']*100

tbl_ndr_strn[['%_imp_nedr_strn', 
             'rost_imp_2021',
             'rost_imp_2020',
             'rost_exp_2021',
             'rost_exp_2020',
             'doly_exp_imp_2021'
              ]] = \
             tbl_ndr_strn[['%_imp_nedr_strn', 
             'rost_imp_2021',
             'rost_imp_2020',
             'rost_exp_2021',
             'rost_exp_2020',
             'doly_exp_imp_2021'
              ]].fillna(0)

tbl_ndr_strn[['rost_imp_2021', 'rost_imp_2020']] = tbl_ndr_strn[['rost_imp_2021', 'rost_imp_2020']].replace([np.inf, -np.inf], 0)

In [19]:
## подгружаем назания кодов ТНВЭД
tnved = pd.read_csv('TNVED.csv', sep='\t', index_col=None)
tnved['code'] = tnved['KOD']
tnved.drop(['KOD'], axis=1, inplace=True)
tbl_ndr_strn = pd.merge(tbl_ndr_strn, tnved[['code','NAME']], on='code', how='left')

In [20]:
## новая таблица без учета стран, регионов
tbl4 = tbl_ndr_strn.groupby(['code'], as_index=False)\
                        .agg({'exp_2021':'sum', 
                              'imp_2021': 'sum', 
                              'imp_2020':'sum', 
                              'exp_2020':'sum', 
                              'imp_2019': 'sum', 
                              'exp_2019':'sum',
                              'netto_2021': 'sum', 
                              'quantity_2021':'sum'
                             })
                        #.sort_values('value', ascending=False)
    
tbl4 = tbl4.drop_duplicates().reset_index(drop=True)
    
tbl4['gr4'] = tbl4['code'].apply(lambda x: x[:4])
tbl4['gr4'] = tbl4['gr4'].astype('category')
## ДОБАВЛЕНИЕ КОДОВ ТНВЭД БОЛЕЕ ВЫСОКОГО УРОВНЯ (4 знака)
## и создание аналитических столбцов
tbl4 = pd.merge(tbl4, tbl3[['gr4','value_2021_gr4_total']], on='gr4', how='left')
    
tbl4['%_imp2021_by_total'] = tbl4['imp_2021'] / (tbl4['imp_2021'].sum()) *100*100 #увеличиваем вес данного коэффициента на 100
tbl4['%_netto_by_total'] = tbl4['netto_2021'] / (tbl4['netto_2021'].sum()) *100*100 #увеличиваем вес данного коэффициента на 100
tbl4['rost_imp_2021'] = tbl4['imp_2021'] / tbl4['imp_2020']*100
tbl4['rost_imp_2020'] = tbl4['imp_2020'] / tbl4['imp_2019']*100
tbl4['rost_exp_2021'] = tbl4['exp_2021'] / tbl4['exp_2020']*100
tbl4['rost_exp_2020'] = tbl4['exp_2020'] / tbl4['exp_2019']*100
tbl4['doly_exp_imp_2021'] = tbl4['exp_2021'] / tbl4['imp_2021']*100
tbl4[['%_imp2021_by_total', 
             'rost_imp_2021',
             'rost_imp_2020',
             'rost_exp_2021',
             'rost_exp_2020',
             'doly_exp_imp_2021'
              ]] = \
tbl4[['%_imp2021_by_total', 
             'rost_imp_2021',
             'rost_imp_2020',
             'rost_exp_2021',
             'rost_exp_2020',
             'doly_exp_imp_2021'
              ]].fillna(0)

tbl4[['rost_imp_2021', 'rost_imp_2020','rost_exp_2020', 'rost_exp_2021']] = tbl4[['rost_imp_2021', 'rost_imp_2020','rost_exp_2020', 'rost_exp_2021']].replace([np.inf, -np.inf], 0)

In [21]:
## добавляем данные по ВВП
column_types = {
    'TNVED': 'category',
    'Name': 'str',
    '2021': 'float32'}
otgruz_2021 = pd.read_csv('vsego_otgruz_2021.csv',dtype=column_types , index_col=None).rename(columns={'2021':'VVP_2021_gr4'})
otgruz_2021['gr4'] = otgruz_2021['TNVED']
otgruz_2021.drop(['TNVED'], axis=1, inplace=True)

tbl4 = pd.merge(tbl4, otgruz_2021[['gr4','VVP_2021_gr4']], on='gr4', how='left')
tbl4['VVP_2021_gr4'] = tbl4['VVP_2021_gr4']*1000

tbl4['VVP_2021_gr4'] = tbl4['VVP_2021_gr4'].fillna('0')

In [22]:
#добавляем название ТНВЭД
tbl4 = pd.merge(tbl4, tnved[['code','NAME']], on='code', how='left')

In [23]:
# новый аналитический параметр: доля импорта в ВВП по группе товаров(4знака)
tbl4['VVP_2021_gr4'] = tbl4['VVP_2021_gr4'].astype('float64')
tbl4['Imp_VVP_2021_gr4_%%'] = tbl4['imp_2021'] / tbl4['VVP_2021_gr4']*100
tbl4['Imp_VVP_2021_gr4_%%'] = tbl4['Imp_VVP_2021_gr4_%%'].replace([np.inf, -np.inf], 0)


In [24]:
#корректировка зкачков значений, где ранее не было импорта или экпорта
tbl4.loc[(tbl4['imp_2020'] < 1) & (tbl4['imp_2021'] > 100), 'rost_imp_2021'] = 100
tbl4.loc[(tbl4['imp_2019'] < 1) & (tbl4['imp_2020'] > 100), 'rost_imp_2020'] = 100
tbl4.loc[(tbl4['exp_2020'] < 1) & (tbl4['exp_2021'] > 100), 'rost_exp_2021'] = 100
tbl4.loc[(tbl4['exp_2019'] < 1) & (tbl4['exp_2020'] > 100), 'rost_exp_2020'] = 100

### считаем баллы по каждому ТНВЭД:
* **считаем баллы по импорту**: доля импорта конкретного товара в общем импорте и доля веса данного товара в общем весе всего импорта умножаем на скорость роста импорта за 2021 и 2020 годы
* **вычитаем баллы по экспорту**: доля экспорта конкретного товара в импорте этого товара умножаем на скорость роста экспорта за 2021 и 2020 годы
* **прибавляем баллы по ВВП** : если доля импорта существенно больше, чем ВВП по данному товару, то возможности импортазамещения увеличиваются



In [25]:
# считаем баллы по каждому ТНВЭД:
# доля импорта конкретного товара в общем импорте и доля веса данного товара в общем весе всего импорта умножаем на скорость роста импорта за 2021 и 2020 годы
#
#=(L5+M5)/100*(N5+O5)-(P5+Q5)*R5/100+U5
tbl4['Sred_ball'] = (((tbl4['%_imp2021_by_total']+ tbl4['%_netto_by_total'])/10)* (tbl4['rost_imp_2021']+tbl4['rost_imp_2020']))-\
                    ((tbl4['rost_exp_2021']+tbl4['rost_exp_2020'])*tbl4['doly_exp_imp_2021'])/100+\
                    tbl4['Imp_VVP_2021_gr4_%%']

In [26]:
tbl4['ball_imp'] = (((tbl4['%_imp2021_by_total']+ tbl4['%_netto_by_total'])/10)* (tbl4['rost_imp_2021']+tbl4['rost_imp_2020']))
tbl4['ball_exp'] = ((tbl4['rost_exp_2021']+tbl4['rost_exp_2020'])*(tbl4['doly_exp_imp_2021'])/100)

In [27]:
tbl4['Vivodi'] = [f'баллы по импорту: {round(x,2)}, \
                    баллы по экспорту: {round(y,2)}, \
                   баллы по ВВП: {round(z,2)}'\
                  for x,y,z in zip(tbl4['ball_imp'], tbl4['ball_exp'], tbl4['Imp_VVP_2021_gr4_%%'])]

In [28]:
result = tbl4.loc[(tbl4['code'] != 'XXXXXXXXXX')]\
            .sort_values(['Sred_ball'], ascending=False)
result = result[['code','NAME', 'imp_2021','Sred_ball','Vivodi']].reset_index(drop=True)



In [29]:
result.head(60)

Unnamed: 0,code,NAME,imp_2021,Sred_ball,Vivodi
0,2710196209,ТОПЛИВА ЖИДКИЕ С СОДЕРЖАНИЕМ СЕРЫ НЕ БОЛЕЕ 1 М...,82496.59,240997.184189,"баллы по импорту: 241020.86, ..."
1,8901201000,ШТ-МОРСКИЕ ТАНКЕРЫ,3721344.0,43375.613281,"баллы по импорту: 43375.66, ..."
2,2517101000,"ГАЛЬКА, ГРАВИЙ, ЩЕБЕНЬ",38585.12,40523.480469,"баллы по импорту: 40523.7, ..."
3,2818200000,"ОКСИД АЛЮМИНИЯ, ОТЛИЧНЫЙ ОТ ИСКУССТВЕННОГО КОР...",1432489.0,25008.287109,"баллы по импорту: 25008.29, ..."
4,2701111000,УГОЛЬ КАМЕННЫЙ - АНТРАЦИТ С ПРЕДЕЛЬНЫМ ВЫХОДОМ...,104706.2,16748.29221,"баллы по импорту: 16493.05, ..."
5,2701111000,УГОЛЬ КАМЕННЫЙ - АНТРАЦИТ С ПРЕДЕЛЬНЫМ ВЫХОДОМ...,104706.2,16010.855974,"баллы по импорту: 16493.05, ..."
6,2710194800,ГАЗОЙЛИ ДЛЯ ПРОЧИХ ЦЕЛЕЙ С СОДЕРЖАНИЕМ СЕРЫ БО...,3011.29,14787.947473,"баллы по импорту: 14830.22, ..."
7,3909509008,ПРОЧИЕ СМОЛЫ ЭПОКСИДНЫЕ:ПРОЧИЕ,166075.7,10325.430664,"баллы по импорту: 10325.66, ..."
8,2523290000,ПОРТЛАНДЦЕМЕНТ ПРОЧИЙ,5616.177,8733.608871,"баллы по импорту: 8804.2, ..."
9,7401000000,ШТЕЙН МЕДНЫЙ; МЕДЬ ЦЕМЕНТАЦИОННАЯ (МЕДЬ ОСАЖДЕ...,453144.8,8063.508301,"баллы по импорту: 8063.51, ..."


In [30]:
result.to_excel('result.xls', index=False)

In [31]:
tbl4.to_excel('result_full_details.xls', index=False)