In [2]:
import pandas as pd

In [3]:
df = pd.read_excel("dataset/11.Выгрузка_ОДПУ_отопление_ВАО_20240522.xlsx")

# sql represetation
```sql 
create table if not exists property_metering_devices(
    id bigserial primary key,
    external_id bigint,
    -- ID YY
    external_ty_id bigint,
    -- ID ТУ
    country text,
    -- Округ
    district text,
    -- Район
    consumer text,
    -- Потребители
    consumer_group text,
    -- Группа МКД
    unom bigint references address_registry(unom)  on delete cascade,
    -- UNOM
    address text,
    -- Адрес
    central_heating_circuit text,
    -- Центральное отопление(контур)
    metering_device_brand text,
    -- Марка счетчика
    metering_device_serial_number text,
    -- Серия/Номер счетчика
    metering_device_hours numeric,
    -- Наработка часов счётчика
    measurment_date date,
    -- Дата
    measurment_datetime timestamp,
    -- Месяц/Год
    measurment_units text,
    -- Unit
    -- Объём поданого теплоносителя в систему ЦО (float64)
    coolant_supplied_to_central_system numeric,
    -- Volume of coolant supplied to the central heating system
    -- Объём обратного теплоносителя из системы ЦО
    coolant_returned_to_central_system numeric,
    -- Разница между подачей и обраткой(Подмес)
    coolant_supplied_difference_mixture numeric,
    -- Разница между подачей и обраткой(Утечка)
    coolant_supplied_difference_leakage numeric,
    -- Температура подачи
    coolant_supplied_temperature numeric,
    -- Температура обратки
    coolant_returned_temperature numeric,
    -- Расход тепловой энергии
    thermal_energy_consumption numeric,
    -- Расход тепловой энергии
    errors text -- Ошибки
);

```

In [4]:
df.head()

Unnamed: 0,ID УУ,ID ТУ,Округ,Район,Потребители,Группа,UNOM,Адрес,Центральное отопление(контур),Марка счетчика,...,Unit,Объём поданого теплоносителя в систему ЦО,Объём обратного теплоносителя из системы ЦО,Разница между подачей и обраткой(Подмес),Разница между подачей и обраткой(Утечка),Температура подачи,Температура обратки,Наработка часов счётчика,Расход тепловой энергии,Ошибки
0,5005,16213,ВАО,Новокосино,"ГБУ ""ЖИЛИЩНИК РАЙОНА НОВОКОСИНО""",МКД,82024,"Новокосинская ул., д. 12, к. 5",ЦО1,АТ-Т-2,...,Гкал,0.0,0.0,,,22.447302,25.240633,24.0,0.0,
1,5005,16213,ВАО,Новокосино,"ГБУ ""ЖИЛИЩНИК РАЙОНА НОВОКОСИНО""",МКД,82024,"Новокосинская ул., д. 12, к. 5",ЦО1,АТ-Т-2,...,Гкал,0.0,0.0,,,21.497137,24.861193,24.0,0.0,
2,5005,16213,ВАО,Новокосино,"ГБУ ""ЖИЛИЩНИК РАЙОНА НОВОКОСИНО""",МКД,82024,"Новокосинская ул., д. 12, к. 5",ЦО1,АТ-Т-2,...,Гкал,154.291015,153.603515,,0.6875,51.143951,43.469711,23.999512,1.200073,
3,5005,16213,ВАО,Новокосино,"ГБУ ""ЖИЛИЩНИК РАЙОНА НОВОКОСИНО""",МКД,82024,"Новокосинская ул., д. 12, к. 5",ЦО1,АТ-Т-2,...,Гкал,277.146485,275.65625,,1.490235,52.515797,43.451427,24.0,2.520966,
4,5005,16213,ВАО,Новокосино,"ГБУ ""ЖИЛИЩНИК РАЙОНА НОВОКОСИНО""",МКД,82024,"Новокосинская ул., д. 12, к. 5",ЦО1,АТ-Т-2,...,Гкал,118.464844,117.742188,,0.722656,52.272053,36.320469,24.0,1.893432,


In [5]:
df.columns

Index(['ID УУ', 'ID ТУ', 'Округ', 'Район', 'Потребители', 'Группа', 'UNOM',
       'Адрес', 'Центральное отопление(контур)', 'Марка счетчика ',
       'Серия/Номер счетчика', 'Дата', 'Месяц/Год', 'Unit',
       'Объём поданого теплоносителя в систему ЦО',
       'Объём обратного теплоносителя из системы ЦО',
       'Разница между подачей и обраткой(Подмес)',
       'Разница между подачей и обраткой(Утечка)', 'Температура подачи',
       'Температура обратки', 'Наработка часов счётчика',
       'Расход тепловой энергии ', 'Ошибки'],
      dtype='object')

In [6]:
pg_mapping = {
    "ID YY": "external_id",
    "ID ТУ": "external_ty_id",
    "Округ": "country",
    "Район": "district",
    "Потребители": "consumer",
    "Группа": "consumer_group",
    "UNOM": "unom",
    "Адрес": "address",
    "Центральное отопление(контур)": "central_heating_circuit",
    "Марка счетчика ": "metering_device_brand",
    "Серия/Номер счетчика": "metering_device_serial_number",
    "Наработка часов счётчика": "metering_device_hours",
    "Дата": "measurment_date",
    "Месяц/Год": "measurment_datetime",
    "Unit": "measurment_units",
    "Объём поданого теплоносителя в систему ЦО": "coolant_supplied_to_central_system",
    "Объём обратного теплоносителя из системы ЦО": "coolant_returned_to_central_system",
    "Разница между подачей и обраткой(Подмес)": "coolant_supplied_difference_mixture",
    "Разница между подачей и обраткой(Утечка)": "coolant_supplied_difference_leakage",
    "Температура подачи": "coolant_supplied_temperature",
    "Температура обратки": "coolant_returned_temperature",
    "Расход тепловой энергии ": "thermal_energy_consumption",
    "Ошибки": "errors",
}

In [7]:
df = df.rename(columns=pg_mapping)

In [8]:
df.head(2)

Unnamed: 0,ID УУ,external_ty_id,country,district,consumer,consumer_group,unom,address,central_heating_circuit,metering_device_brand,...,measurment_units,coolant_supplied_to_central_system,coolant_returned_to_central_system,coolant_supplied_difference_mixture,coolant_supplied_difference_leakage,coolant_supplied_temperature,coolant_returned_temperature,metering_device_hours,thermal_energy_consumption,errors
0,5005,16213,ВАО,Новокосино,"ГБУ ""ЖИЛИЩНИК РАЙОНА НОВОКОСИНО""",МКД,82024,"Новокосинская ул., д. 12, к. 5",ЦО1,АТ-Т-2,...,Гкал,0,0.0,,,22.447302,25.240633,24.0,0,
1,5005,16213,ВАО,Новокосино,"ГБУ ""ЖИЛИЩНИК РАЙОНА НОВОКОСИНО""",МКД,82024,"Новокосинская ул., д. 12, к. 5",ЦО1,АТ-Т-2,...,Гкал,0,0.0,,,21.497137,24.861193,24.0,0,


In [9]:
# count NaN values
df.isna().sum()

ID УУ                                       0
external_ty_id                              0
country                                     0
district                                    0
consumer                                    0
consumer_group                              0
unom                                        0
address                                     0
central_heating_circuit                     0
metering_device_brand                       0
metering_device_serial_number               0
measurment_date                             0
measurment_datetime                         0
measurment_units                            0
coolant_supplied_to_central_system       7638
coolant_returned_to_central_system       8008
coolant_supplied_difference_mixture    541191
coolant_supplied_difference_leakage    502456
coolant_supplied_temperature             9455
coolant_returned_temperature             9486
metering_device_hours                    7319
thermal_energy_consumption        

In [11]:
df["metering_device_hours"] = df["metering_device_hours"].fillna(0.0)

In [12]:
df.to_json("dataset/11.Выгрузка_ОДПУ_отопление_ВАО_20240522.json", orient="records")

# upload command
```bash
mongoimport --uri mongodb://user:password@host:27027/production --collection property_metering_devices --file dataset/11.Выгрузка_ОДПУ_отопление_ВАО_20240522.json --jsonArray --numInsertionWorkers 8 --writeConcern "{w: 0}"
```