In [1]:
import pandas as pd

In [2]:
df = pd.read_excel("dataset/8. Данные АСУПР с диспетчерскими ОДС.xlsx")

# sql representation
```sql
-- 8.Данные АСУПР с диспетчерскими ОДС.xlsx
create table if not exists dispatch_services(
    id bigserial primary key,
    external_id bigint,
    -- ID YY
    address text,
    -- Адрес
    country text,
    -- Округ
    unom bigint references address_registry(unom)  on delete cascade,
    -- UNOM
    consumer_group text,
    -- Группа
    dispatch_number text,
    -- № ОДС
    dispatch_address text,
    -- Адрес ОДС
    consumer text,
    -- Потребитель (или УК)
    chp text -- ЦТП (центральная ТП)04-05-0604/185
);
```

In [3]:
df.head(2)

Unnamed: 0,ID УУ,Адрес,Полный адрес,Округ,UNOM,Группа,№ ОДС,Адрес ОДС,Потребитель (или УК),ЦТП
0,785480981,"10-я Парковая ул., д. 15","город Москва, 10-я Парковая улица, дом 15",ВАО,18777,МКД,ОДС №27-Измайлово,"город Москва, 7-я Парковая улица, дом 15, корп...","ГБУ ""ЖИЛИЩНИК РАЙОНА ИЗМАЙЛОВО""",04-05-0604/185
1,785481133,"10-я Парковая ул., д. 17","город Москва, 10-я Парковая улица, дом 17",ВАО,18778,МКД,ОДС №27-Измайлово,"город Москва, 7-я Парковая улица, дом 15, корп...","ГБУ ""ЖИЛИЩНИК РАЙОНА ИЗМАЙЛОВО""",04-05-0604/185


In [5]:
list(df.columns)

['ID УУ',
 'Адрес',
 'Полный адрес',
 'Округ',
 'UNOM',
 'Группа',
 '№ ОДС',
 'Адрес ОДС',
 'Потребитель (или УК)',
 'ЦТП']

In [6]:
df_to_sql_mapping = {
    "ID УУ": "external_id",
    "Адрес": "address",
    "Округ": "country",
    "UNOM": "unom",
    "Группа": "consumer_group",
    "№ ОДС": "dispatch_number",
    "Адрес ОДС": "dispatch_address",
    "Потребитель (или УК)": "consumer",
    "ЦТП": "chp",
}

In [7]:
df.rename(columns=df_to_sql_mapping, inplace=True)

In [8]:
df.head(2)

Unnamed: 0,external_id,address,Полный адрес,country,unom,consumer_group,dispatch_number,dispatch_address,consumer,chp
0,785480981,"10-я Парковая ул., д. 15","город Москва, 10-я Парковая улица, дом 15",ВАО,18777,МКД,ОДС №27-Измайлово,"город Москва, 7-я Парковая улица, дом 15, корп...","ГБУ ""ЖИЛИЩНИК РАЙОНА ИЗМАЙЛОВО""",04-05-0604/185
1,785481133,"10-я Парковая ул., д. 17","город Москва, 10-я Парковая улица, дом 17",ВАО,18778,МКД,ОДС №27-Измайлово,"город Москва, 7-я Парковая улица, дом 15, корп...","ГБУ ""ЖИЛИЩНИК РАЙОНА ИЗМАЙЛОВО""",04-05-0604/185


In [9]:
df.isna().sum()

external_id           0
address               0
Полный адрес          0
country               0
unom                  0
consumer_group        1
dispatch_number     755
dispatch_address    755
consumer              0
chp                  18
dtype: int64

In [10]:
df.to_json("dataset/8.Данные_АСУПР_с_диспетчерскими_ОДС.json", orient="records")

# upload command
```bash
mongoimport --uri mongodb://user:password@host:27027/production --collection dispatch_services --file dataset/8.Данные_АСУПР_с_диспетчерскими_ОДС.json --jsonArray --numInsertionWorkers 8 --writeConcern "{w: 0}"
```