# Предобработка данных

Отработка алгоритма решения задачи предобработки данных. 

Датасет <code>dtp_last.csv</code> содержит информацию о ДТП в Российской Федерации в 2018 году.

<li>'reg_code' - код региона (октмо)
<li>'регион' - название региона
<li>'road_code' - код дороги
<li>'Дорога' -  название дороги
<li>'road_type' - тип дороги
<li>'address' -  адрес
<li>'crash_type_name' -тип ДТП
<li>'crash_date' - дата ДТП
<li>'crash_time' - время ДТП
<li>'crash reason' - причина ДТП
<li>'fatalities_amount' - число погибших
<li>'victims_amount' - число пострадавших
<li>'vehicles_amount' - число транспортных средств
<li>'participants_amount' - число участников



Задача: Подготовить данные для дальнейшего исследования.
1. Изучите общую информацию.
2. Осуществите предобработку заголовков.
3. Заполните пропуски.
4. Найдите проблемы в данных.
5. Преобразуйте типы данных. Добавьте столбец datetime из имеющихся столбцов, используя разделитель T. Преобразуйте к типу данных "дата/время".
6. Удалите дубликаты.
7. Добавьте столбец с днями недели на русском языке.
8. Экспортируйте результат в excel.
9. Сформулируйте общий вывод по работе.

Работу сопроводите выводами и комментариями к коду.

### Загрузка данных. Общая информация

In [177]:
import pandas as pd
df = pd.read_csv('dtp_last.csv', sep = ';')
df.head(40)

Unnamed: 0,reg_code,регион,road_code,Дорога,road_type,address,crash_type_name,crash_date,crash_time,crash reason,fatalities_amount,victims_amount,vehicles_amount,participants_amount
0,46,Московская область,,мкр. Авиационный-Лямцино-ММК,Региональная или межмуниципальная дорога общег...,"ЦФО, Московская область, Городской округ Домод...",Опрокидывание,20181231,23:55:00,Другие нарушения ПДД водителями,1,0,1,12
1,53,Оренбургская область,53К-2118000,Обход г. Оренбурга,Региональная или межмуниципальная дорога общег...,"ПФО, Оренбургская область, Оренбург",Наезд на препятствие,20181231,23:55:00,Другие нарушения ПДД водителями,1,0,1,2
2,46,Московская область,А-107,"""Московское малое кольцо"" Икша - Ногинск - Бро...",Федеральная дорога общего пользования,"ЦФО, Московская область, Дмитровский район",Опрокидывание,20181231,23:40:00,Превышение установленной скорости движения,1,0,1,2
3,8,Хабаровский край,А-375,"""Восток"" Хабаровск - Красный Яр - Ариадное - Ч...",Федеральная дорога общего пользования,"ДФО, Хабаровский край, Хабаровский район",Наезд на пешехода,20181231,23:20:00,Нахождение на проезжей части без цели её перех...,0,1,1,2
4,35,Республика Крым,35Н-076,Симферополь - Севастополь - Бахчисарай,Региональная или межмуниципальная дорога общег...,"ЮФО, Республика Крым, Бахчисарайский район",Наезд на пешехода,20181231,23:00:00,Нарушение правил проезда пешеходного перехода,1,0,1,2
5,26,Республика Ингушетия,Р-217,"""Кавказ"" автомобильная дорога М-4 ""Дон"" - Влад...",Федеральная дорога общего пользования,"СКФО, Республика Ингушетия, Назрановский",Столкновение,20181231,21:50:00,Выезд на полосу встречного движения,1,0,5,5
6,1,Алтайский край,,Вторая Каменка - Гилево,Региональная или межмуниципальная дорога общег...,"СФО, Алтайский край, Локтевский район, Гилевск...",Наезд на пешехода,20181231,21:40:00,Несоответствие скорости конкретным условиям дв...,1,0,1,2
7,80,Республика Башкортостан,М-7,"""Волга"" Москва - Владимир - Нижний Новгород - ...",Федеральная дорога общего пользования,"ПФО, Республика Башкортостан, Кушнаренковский ...",Столкновение,20181231,21:40:00,Нарушение правил обгона,2,0,2,3
8,56,Пензенская область,,"""Автодорога """"р.п. Беково - с. Варварино - р.п...",Региональная или межмуниципальная дорога общег...,"ПФО, Пензенская область, Бековский район, Верт...",Наезд на пешехода,20181231,21:20:00,Переход через проезжую часть в неустановленном...,1,0,1,2
9,35,Республика Крым,35К-023,Восточный обход г. Симферополя,Региональная или межмуниципальная дорога общег...,"ЮФО, Республика Крым, Симферополь",Наезд на пешехода,20181231,21:10:00,"Другие нарушения ПДД водителями, Переход через...",1,0,1,2


In [178]:
df.shape

(39102, 14)

In [179]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 39102 entries, 0 to 39101
Data columns (total 14 columns):
 #   Column               Non-Null Count  Dtype 
---  ------               --------------  ----- 
 0   reg_code             39102 non-null  int64 
 1   регион               39083 non-null  object
 2   road_code            20777 non-null  object
 3   Дорога               38910 non-null  object
 4   road_type            38910 non-null  object
 5   address              39102 non-null  object
 6   crash_type_name      39102 non-null  object
 7   crash_date           39102 non-null  int64 
 8   crash_time           39102 non-null  object
 9   crash reason         38467 non-null  object
 10  fatalities_amount    39102 non-null  int64 
 11  victims_amount       39102 non-null  int64 
 12  vehicles_amount      39102 non-null  int64 
 13  participants_amount  39102 non-null  object
dtypes: int64(5), object(9)
memory usage: 4.2+ MB


### Выводы:

1. датасет содержит 39102 строки и 14 столбцов
2. возможно, коды (ОКТМО) не соответсвуют названиям регионов, надо проверять
3. в некоторых стобцах, например "road_code", есть отсутсвующие значения
4. необходимо поменять тип данных столбца "crash_date"
5. заголовки необходимо сделать на одном языке

### Предобработка заголовков

In [180]:
df = df.rename(columns={
    'reg_code': 'Код региона',
    'регион': 'Регион',
    'road_code': 'Код дороги',
    'Дорога': 'Название дороги',
    'road_type': 'Тип дороги',
    'address': 'Адрес',
    'crash_type_name': 'Тип ДТП',
    'crash_date': 'Дата ДТП',
    'crash_time': 'Время ДТП',
    'crash_reason': 'Причина ДТП',
    'crash reason': 'Причина ДТП',
    'fatalities_amount': 'Число погибших',
    'victims_amount': 'Число пострадавших',
    'vehicles_amount': 'Число транспортных средств',
    'participants_amount': 'Число участников'
})

In [181]:
df.head()

Unnamed: 0,Код региона,Регион,Код дороги,Название дороги,Тип дороги,Адрес,Тип ДТП,Дата ДТП,Время ДТП,Причина ДТП,Число погибших,Число пострадавших,Число транспортных средств,Число участников
0,46,Московская область,,мкр. Авиационный-Лямцино-ММК,Региональная или межмуниципальная дорога общег...,"ЦФО, Московская область, Городской округ Домод...",Опрокидывание,20181231,23:55:00,Другие нарушения ПДД водителями,1,0,1,12
1,53,Оренбургская область,53К-2118000,Обход г. Оренбурга,Региональная или межмуниципальная дорога общег...,"ПФО, Оренбургская область, Оренбург",Наезд на препятствие,20181231,23:55:00,Другие нарушения ПДД водителями,1,0,1,2
2,46,Московская область,А-107,"""Московское малое кольцо"" Икша - Ногинск - Бро...",Федеральная дорога общего пользования,"ЦФО, Московская область, Дмитровский район",Опрокидывание,20181231,23:40:00,Превышение установленной скорости движения,1,0,1,2
3,8,Хабаровский край,А-375,"""Восток"" Хабаровск - Красный Яр - Ариадное - Ч...",Федеральная дорога общего пользования,"ДФО, Хабаровский край, Хабаровский район",Наезд на пешехода,20181231,23:20:00,Нахождение на проезжей части без цели её перех...,0,1,1,2
4,35,Республика Крым,35Н-076,Симферополь - Севастополь - Бахчисарай,Региональная или межмуниципальная дорога общег...,"ЮФО, Республика Крым, Бахчисарайский район",Наезд на пешехода,20181231,23:00:00,Нарушение правил проезда пешеходного перехода,1,0,1,2


### Обработка пропущенных значений

In [182]:
print(df.isnull().sum()) #проверка наличия пропущенных значений

Код региона                       0
Регион                           19
Код дороги                    18325
Название дороги                 192
Тип дороги                      192
Адрес                             0
Тип ДТП                           0
Дата ДТП                          0
Время ДТП                         0
Причина ДТП                     635
Число погибших                    0
Число пострадавших                0
Число транспортных средств        0
Число участников                  0
dtype: int64


In [183]:
# заполнение пропущенных значений в столбцах нулями или информацией об отсутствии данных
for col in df.columns:
    if df[col].dtype == 'int64':
        df[col].fillna(0, inplace=True)
    elif df[col].dtype == 'object':
        df[col].fillna('Нет данных', inplace=True)
# проверка наличия пропущенных значений после заполнения
print(df.isnull().sum())

Код региона                   0
Регион                        0
Код дороги                    0
Название дороги               0
Тип дороги                    0
Адрес                         0
Тип ДТП                       0
Дата ДТП                      0
Время ДТП                     0
Причина ДТП                   0
Число погибших                0
Число пострадавших            0
Число транспортных средств    0
Число участников              0
dtype: int64


### Поиск проблем в данных

In [184]:
#список кодов ОКТМО
region_table = [
    (1, 'Алтайский край'),
    (3, 'Краснодарский край'),
    (4, 'Красноярский край'),
    (5, 'Приморский край'),
    (7, 'Ставропольский край'),
    (8, 'Хабаровский край'),
    (10, 'Амурская область'),
    (11, 'Архангельская область'),
    (12, 'Астраханская область'),
    (14, 'Белгородская область'),
    (15, 'Брянская область'),
    (17, 'Владимирская область'),
    (18, 'Волгоградская область'),
    (19, 'Вологодская область'),
    (20, 'Воронежская область'),
    (22, 'Нижегородская область'),
    (24, 'Ивановская область'),
    (25, 'Иркутская область'),
    (26, 'Республика Ингушетия'),
    (27, 'Калининградская область'),
    (28, 'Тверская область'),
    (29, 'Калужская область'),
    (30, 'Камчатская область'),
    (32, 'Кемеровская область'),
    (33, 'Кировская область'),
    (34, 'Костромская область'),
    (35, 'Республика Крым'),
    (36, 'Самарская область'),
    (37, 'Курганская область'),
    (38, 'Курская область'),
    (40, 'Город Санкт-Петербург'),
    (41, 'Ленинградская область'),
    (42, 'Липецкая область'),
    (44, 'Магаданская область'),
    (45, 'Город Москва'),
    (46, 'Московская область'),
    (47, 'Мурманская область'),
    (49, 'Новгородская область'),
    (50, 'Новосибирская область'),
    (52, 'Омская область'),
    (53, 'Оренбургская область'),
    (54, 'Орловская область'),
    (56, 'Пензенская область'),
    (57, 'Пермский край'),
    (58, 'Псковская область'),
    (60, 'Ростовская область'),
    (61, 'Рязанская область'),
    (63, 'Саратовская область'),
    (64, 'Сахалинская область'),
    (65, 'Свердловская область'),
    (66, 'Смоленская область'),
    (67, 'Город Севастополь'),
    (68, 'Тамбовская область'),
    (69, 'Томская область'),
    (70, 'Тульская область'),
    (71, 'Тюменская область'),
    (73, 'Ульяновская область'),
    (75, 'Челябинская область'),
    (76, 'Забайкальский край'),
    (77, 'Чукотский автономный округ'),
    (78, 'Ярославская область'),
    (79, 'Республика Адыгея (Адыгея)'),
    (80, 'Республика Башкортостан'),
    (81, 'Республика Бурятия'),
    (82, 'Республика Дагестан'),
    (83, 'Кабардино-Балкарская Р-ка'),
    (84, 'Республика Алтай'),
    (85, 'Республика Калмыкия'),
    (86, 'Республика Карелия'),
    (87, 'Республика Коми'),
    (88, 'Республика Марий Эл'),
    (89, 'Республика Мордовия'),
    (90, 'Р-ка Северная Осетия-Алания'),
    (91, 'Карачаево-Черкесская Р-ка'),
    (92, 'Республика Татарстан'),
    (93, 'Республика Тыва'),
    (94, 'Удмуртская Республика'),
    (95, 'Республика Хакасия'),
    (96, 'Чеченская Республика'),
    (97, 'Чувашская Республика'),
    (98, 'Республика Саха (Якутия)'),
    (99, 'Еврейская автономная область'),
    (718, 'Ханты-Мансийский автономный округ — Югра'),
    (719, 'Ямало-Ненецкий автономный округ')
]

In [185]:
def checkRegion(row):
    for region in region_table:
        key = region[0]
        value = region[1]
        if row['Код региона'] == key:
            # if row['Регион'] != value:
            # print(row['Код региона'], row['Регион'], value) #- здесь можно посмотреть что было изменено
            return value
    print(row['Код региона'], row['Регион'])  # - здесь можно посмотреть что не нашлось в таблице.
    # 718 Ханты-Мансийский автономный округ — Югра
    # 719 Ямало-Ненецкий автономный округ
    # видим что в таблице нет этих регионов, добавляем их
    return "Отсутствует в таблице"


df['Регион'] = df.apply(checkRegion, axis=1)
# проблема с 718 и 719. таких регионов нет в таблице
# print(df[df['Регион'] == 'Отсутствует в таблице']) # пусто, так как все нашлось

In [186]:
df

Unnamed: 0,Код региона,Регион,Код дороги,Название дороги,Тип дороги,Адрес,Тип ДТП,Дата ДТП,Время ДТП,Причина ДТП,Число погибших,Число пострадавших,Число транспортных средств,Число участников
0,46,Московская область,Нет данных,мкр. Авиационный-Лямцино-ММК,Региональная или межмуниципальная дорога общег...,"ЦФО, Московская область, Городской округ Домод...",Опрокидывание,20181231,23:55:00,Другие нарушения ПДД водителями,1,0,1,12
1,53,Оренбургская область,53К-2118000,Обход г. Оренбурга,Региональная или межмуниципальная дорога общег...,"ПФО, Оренбургская область, Оренбург",Наезд на препятствие,20181231,23:55:00,Другие нарушения ПДД водителями,1,0,1,2
2,46,Московская область,А-107,"""Московское малое кольцо"" Икша - Ногинск - Бро...",Федеральная дорога общего пользования,"ЦФО, Московская область, Дмитровский район",Опрокидывание,20181231,23:40:00,Превышение установленной скорости движения,1,0,1,2
3,8,Хабаровский край,А-375,"""Восток"" Хабаровск - Красный Яр - Ариадное - Ч...",Федеральная дорога общего пользования,"ДФО, Хабаровский край, Хабаровский район",Наезд на пешехода,20181231,23:20:00,Нахождение на проезжей части без цели её перех...,0,1,1,2
4,35,Республика Крым,35Н-076,Симферополь - Севастополь - Бахчисарай,Региональная или межмуниципальная дорога общег...,"ЮФО, Республика Крым, Бахчисарайский район",Наезд на пешехода,20181231,23:00:00,Нарушение правил проезда пешеходного перехода,1,0,1,2
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
39097,80,Республика Башкортостан,80Н-069,Аскарово - Альмухаметово - Сибай,Региональная или межмуниципальная дорога общег...,"ПФО, Республика Башкортостан, Абзелиловский ра...",Наезд на животное,20180401,1:55:00,Нарушение правил расположения ТС на проезжей ч...,2,0,1,4
39098,79,Республика Адыгея (Адыгея),Нет данных,Подъезд к а.Вочепший,Региональная или межмуниципальная дорога общег...,"ЮФО, Республика Адыгея, Теучежский район",Наезд на животное,20180401,1:30:00,Другие нарушения ПДД водителями,0,1,1,12
39099,3,Краснодарский край,Р-217,Подъезд к городу Майкоп от а/д Р-217,Федеральная дорога общего пользования,"ЮФО, Краснодарский край, Новокубанский район",Столкновение,20180401,1:00:00,"Выезд на полосу встречного движения в местах, ...",2,0,2,3
39100,76,Забайкальский край,А-350,Чита - Забайкальск - граница с Китайской Народ...,Федеральная дорога общего пользования,"СФО, Забайкальский край, Читинский район, Ново...",Опрокидывание,20180401,0:30:00,Нарушение правил расположения ТС на проезжей ч...,3,1,1,4


### Преобразование типов данных

In [187]:
df = df.astype({
    'Код региона': 'category',
    'Регион': 'category',
    'Код дороги': 'category',
    'Название дороги': 'category',
    'Тип дороги': 'category',
    'Адрес': 'object',
    'Тип ДТП': 'category',
    'Причина ДТП': 'category',
    'Число погибших': 'object',
    'Число пострадавших': 'object',
    'Число транспортных средств': 'object',
    'Число участников': 'object'
})
df['Дата ДТП'] = pd.to_datetime(df['Дата ДТП'], format='%Y%m%d')
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 39102 entries, 0 to 39101
Data columns (total 14 columns):
 #   Column                      Non-Null Count  Dtype         
---  ------                      --------------  -----         
 0   Код региона                 39102 non-null  category      
 1   Регион                      39102 non-null  category      
 2   Код дороги                  39102 non-null  category      
 3   Название дороги             39102 non-null  category      
 4   Тип дороги                  39102 non-null  category      
 5   Адрес                       39102 non-null  object        
 6   Тип ДТП                     39102 non-null  category      
 7   Дата ДТП                    39102 non-null  datetime64[ns]
 8   Время ДТП                   39102 non-null  object        
 9   Причина ДТП                 39102 non-null  category      
 10  Число погибших              39102 non-null  object        
 11  Число пострадавших          39102 non-null  object    

In [188]:
df.head()

Unnamed: 0,Код региона,Регион,Код дороги,Название дороги,Тип дороги,Адрес,Тип ДТП,Дата ДТП,Время ДТП,Причина ДТП,Число погибших,Число пострадавших,Число транспортных средств,Число участников
0,46,Московская область,Нет данных,мкр. Авиационный-Лямцино-ММК,Региональная или межмуниципальная дорога общег...,"ЦФО, Московская область, Городской округ Домод...",Опрокидывание,2018-12-31,23:55:00,Другие нарушения ПДД водителями,1,0,1,12
1,53,Оренбургская область,53К-2118000,Обход г. Оренбурга,Региональная или межмуниципальная дорога общег...,"ПФО, Оренбургская область, Оренбург",Наезд на препятствие,2018-12-31,23:55:00,Другие нарушения ПДД водителями,1,0,1,2
2,46,Московская область,А-107,"""Московское малое кольцо"" Икша - Ногинск - Бро...",Федеральная дорога общего пользования,"ЦФО, Московская область, Дмитровский район",Опрокидывание,2018-12-31,23:40:00,Превышение установленной скорости движения,1,0,1,2
3,8,Хабаровский край,А-375,"""Восток"" Хабаровск - Красный Яр - Ариадное - Ч...",Федеральная дорога общего пользования,"ДФО, Хабаровский край, Хабаровский район",Наезд на пешехода,2018-12-31,23:20:00,Нахождение на проезжей части без цели её перех...,0,1,1,2
4,35,Республика Крым,35Н-076,Симферополь - Севастополь - Бахчисарай,Региональная или межмуниципальная дорога общег...,"ЮФО, Республика Крым, Бахчисарайский район",Наезд на пешехода,2018-12-31,23:00:00,Нарушение правил проезда пешеходного перехода,1,0,1,2


### Поиск дубликатов

In [189]:
df.duplicated().sum()


17

In [190]:
df.loc[df.duplicated(keep=False)]


Unnamed: 0,Код региона,Регион,Код дороги,Название дороги,Тип дороги,Адрес,Тип ДТП,Дата ДТП,Время ДТП,Причина ДТП,Число погибших,Число пострадавших,Число транспортных средств,Число участников
37226,22,Нижегородская область,22К-0016,Семенов - Ковернино,Региональная или межмуниципальная дорога общег...,"ПФО, Нижегородская область, Городской округ Се...",Столкновение,2018-04-21,14:40:00,Неправильный выбор дистанции,1,0,3,4
37227,22,Нижегородская область,22К-0016,Семенов - Ковернино,Региональная или межмуниципальная дорога общег...,"ПФО, Нижегородская область, Городской округ Се...",Столкновение,2018-04-21,14:40:00,Неправильный выбор дистанции,1,0,3,4
39070,61,Рязанская область,М-5,"""Урал"" Москва - Рязань - Пенза - Самара - Уфа ...",Федеральная дорога общего пользования,"ЦФО, Рязанская область, Шацкий район",Наезд на препятствие,2018-04-01,5:20:00,Нарушение правил расположения ТС на проезжей ч...,8,0,1,8
39071,46,Московская область,Нет данных,МКАД-Крутицы-Железнодорожный-Ликино-Дулево,Региональная или межмуниципальная дорога общег...,"ЦФО, Московская область, Железнодорожный",Наезд на пешехода,2018-04-01,4:15:00,Нахождение на проезжей части без цели её перехода,0,1,1,2
39072,61,Рязанская область,Р-22,"«Каспий» автомобильная дорога М-4 ""Дон"" - Тамб...",Федеральная дорога общего пользования,"ЦФО, Рязанская область, Михайловский район",Столкновение,2018-04-01,4:00:00,"Выезд на полосу встречного движения в местах, ...",1,1,4,4
39073,27,Калининградская область,27А-007,Северный обход г. Калининграда,Региональная или межмуниципальная дорога общег...,"СЗФО, Калининградская область, Гурьевский район",Наезд на пешехода,2018-04-01,3:50:00,Ходьба вдоль проезжей части попутного направле...,1,0,1,2
39074,32,Кемеровская область,Р-255,Подъезд к городу Томск от а/д Р-255,Федеральная дорога общего пользования,"СФО, Кемеровская область, Юргинский район",Столкновение,2018-04-01,3:50:00,Выезд на полосу встречного движения,1,0,2,2
39075,61,Рязанская область,Р-132,Калуга - Тула - Михайлов - Рязань,Федеральная дорога общего пользования,"ЦФО, Рязанская область, Рязань, Железнодорожный",Наезд на препятствие,2018-04-01,3:30:00,Нарушение правил расположения ТС на проезжей ч...,1,0,3,3
39076,86,Республика Карелия,А-121,"""Сортавала"" Санкт-Петербург - Сортавала - авто...",Федеральная дорога общего пользования,"СЗФО, Республика Карелия, Лахденпохский район,...",Наезд на пешехода,2018-04-01,3:20:00,Иные нарушения ПДД пешеходом,0,1,1,2
39077,56,Пензенская область,М-5,"""Урал"" Москва - Рязань - Пенза - Самара - Уфа ...",Федеральная дорога общего пользования,"ПФО, Пензенская область, Кузнецкий район, Евла...",Столкновение,2018-04-01,3:10:00,Выезд на полосу встречного движения,1,0,3,2


In [191]:
df.drop_duplicates(inplace=True)
df.duplicated().sum()

0

### Добавление столбцов.

In [192]:
# объединение столбцов crash_date и crash_time в один столбец datetime
df['datetime'] = pd.to_datetime(df['Дата ДТП'].astype(str) + 'T' + df['Время ДТП'].astype(str))

df = df.rename(columns={'datetime': 'Дата и время'})

In [193]:
# Добавление столбца с названиями дней недели на русском языке
df['День недели'] = df['Дата ДТП'].dt.day_name()


# Определение функции для замены названий дней недели
def translate_weekday(day):
    if day == 'Monday':
        return 'Понедельник'
    elif day == 'Tuesday':
        return 'Вторник'
    elif day == 'Wednesday':
        return 'Среда'
    elif day == 'Thursday':
        return 'Четверг'
    elif day == 'Friday':
        return 'Пятница'
    elif day == 'Saturday':
        return 'Суббота'
    elif day == 'Sunday':
        return 'Воскресенье'


# Замена английских названий дней недели на русские с помощью функции translate_weekday()
df['День недели'] = df['День недели'].apply(translate_weekday)
df

Unnamed: 0,Код региона,Регион,Код дороги,Название дороги,Тип дороги,Адрес,Тип ДТП,Дата ДТП,Время ДТП,Причина ДТП,Число погибших,Число пострадавших,Число транспортных средств,Число участников,Дата и время,День недели
0,46,Московская область,Нет данных,мкр. Авиационный-Лямцино-ММК,Региональная или межмуниципальная дорога общег...,"ЦФО, Московская область, Городской округ Домод...",Опрокидывание,2018-12-31,23:55:00,Другие нарушения ПДД водителями,1,0,1,12,2018-12-31 23:55:00,Понедельник
1,53,Оренбургская область,53К-2118000,Обход г. Оренбурга,Региональная или межмуниципальная дорога общег...,"ПФО, Оренбургская область, Оренбург",Наезд на препятствие,2018-12-31,23:55:00,Другие нарушения ПДД водителями,1,0,1,2,2018-12-31 23:55:00,Понедельник
2,46,Московская область,А-107,"""Московское малое кольцо"" Икша - Ногинск - Бро...",Федеральная дорога общего пользования,"ЦФО, Московская область, Дмитровский район",Опрокидывание,2018-12-31,23:40:00,Превышение установленной скорости движения,1,0,1,2,2018-12-31 23:40:00,Понедельник
3,8,Хабаровский край,А-375,"""Восток"" Хабаровск - Красный Яр - Ариадное - Ч...",Федеральная дорога общего пользования,"ДФО, Хабаровский край, Хабаровский район",Наезд на пешехода,2018-12-31,23:20:00,Нахождение на проезжей части без цели её перех...,0,1,1,2,2018-12-31 23:20:00,Понедельник
4,35,Республика Крым,35Н-076,Симферополь - Севастополь - Бахчисарай,Региональная или межмуниципальная дорога общег...,"ЮФО, Республика Крым, Бахчисарайский район",Наезд на пешехода,2018-12-31,23:00:00,Нарушение правил проезда пешеходного перехода,1,0,1,2,2018-12-31 23:00:00,Понедельник
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
39081,80,Республика Башкортостан,80Н-069,Аскарово - Альмухаметово - Сибай,Региональная или межмуниципальная дорога общег...,"ПФО, Республика Башкортостан, Абзелиловский ра...",Наезд на животное,2018-04-01,1:55:00,Нарушение правил расположения ТС на проезжей ч...,2,0,1,4,2018-04-01 01:55:00,Воскресенье
39082,79,Республика Адыгея (Адыгея),Нет данных,Подъезд к а.Вочепший,Региональная или межмуниципальная дорога общег...,"ЮФО, Республика Адыгея, Теучежский район",Наезд на животное,2018-04-01,1:30:00,Другие нарушения ПДД водителями,0,1,1,12,2018-04-01 01:30:00,Воскресенье
39083,3,Краснодарский край,Р-217,Подъезд к городу Майкоп от а/д Р-217,Федеральная дорога общего пользования,"ЮФО, Краснодарский край, Новокубанский район",Столкновение,2018-04-01,1:00:00,"Выезд на полосу встречного движения в местах, ...",2,0,2,3,2018-04-01 01:00:00,Воскресенье
39084,76,Забайкальский край,А-350,Чита - Забайкальск - граница с Китайской Народ...,Федеральная дорога общего пользования,"СФО, Забайкальский край, Читинский район, Ново...",Опрокидывание,2018-04-01,0:30:00,Нарушение правил расположения ТС на проезжей ч...,3,1,1,4,2018-04-01 00:30:00,Воскресенье


### Экспорт результатов

In [196]:
df.to_excel('/Users/olgazavyalova/Documents/dtp_ready.xlsx', index=False)