# Использование Pandas

## Описание работы
Данная работа посвящена использованию Pandas для анализа данных. В работе будут 
использоваться источники данных для анализа, взятые с портала data.gov.ru («Открытые данные 
России»). В частности, используется набор данных «Государственный реестр сертифицированных 
средств защиты информации» (https://data.gov.ru/opendata/7701350013-reesszi). Предстоит 
ответить на ряд вопросов используя этот набор данных.

# Задачи
    1. Выполнить загрузку CSV-файла в память посредством Pandas.
    2. Показать список уникальных наименований документов, требованиям которых
    соответствуют представленные средства защиты информации.
    3. Отобразить список наименований средств, соответствующих двум любым документам с
    требованиями по сертификации.
    4. Показать наименования тех средств, которые имеют просроченные сертификаты (на 
    момент выполнения задания).
    5. Показать наименования тех средств, которые имеют просроченные сертификаты, но при 
    этом обязаны оказывать поддержку (столбец «Информация об окончании срока 
    технической поддержки, полученная от заявителя»).
    6. Показать наименования всех средств, которые проходили испытания в частных
    организациях (форма организации ООО, ЗАО, ПАО, АО).

## Отчет
Отчет должен содержать выражения на языке Python, соответствующие каждому заданию, а 
также примеры выходных данных (их часть).
В качестве защиты работы студент должен дать пояснения по существующим выражениям, а 
также реализовать дополнительный запрос по требованию преподавателя.

1. Выполнить загрузку CSV-файла в память посредством Pandas.

In [194]:
import pandas as pd
import random

data = pd.read_csv("data.csv")
columns = data.columns
print({i: columns[i] for i in range(len(columns))})

data.head()

{0: '№\r\nсертификата', 1: 'Дата\r\nвнесения\r\nв реестр', 2: 'Срок\r\nдействия\r\nсертификата', 3: 'Наименование\r\nсредства (шифр)', 4: 'Наименования документов, требованиям которых соответствует средство', 5: 'Схема\r\nсертификации', 6: 'Испытательная\r\nлаборатория', 7: 'Орган по\r\nсертификации', 8: 'Заявитель', 9: 'Реквизиты заявителя\r\n(индекс, адрес, телефон)', 10: 'Информация об окончании срока технической поддержки, полученная от заявителя'}


Unnamed: 0,№\r\nсертификата,Дата\r\nвнесения\r\nв реестр,Срок\r\nдействия\r\nсертификата,Наименование\r\nсредства (шифр),"Наименования документов, требованиям которых соответствует средство",Схема\r\nсертификации,Испытательная\r\nлаборатория,Орган по\r\nсертификации,Заявитель,"Реквизиты заявителя\r\n(индекс, адрес, телефон)","Информация об окончании срока технической поддержки, полученная от заявителя"
0,17/1,26.07.2002,01.08.2020,фильтр сетевой помехоподавляющий ФСПК-100(200)...,Соответствует требованиям документов: Требован...,серия,ЦКБИ ФГУП «СНПО «Элерон»,АО Центр «Атомзащитаинформ»,ООО НПП «ЭЛКОМ»,"249192, Калужская обл., г. Обнинск, пос. Кабиц...",31.12.2034
1,21/2,25.06.2013,25.06.2019,программный комплекс защиты информации от НСД ...,Соответствует требованиям документов: РД СВТ(2),1,АО «Информационные спутниковые системы» имени ...,,АО «Информационные спутниковые системы» имени ...,"662972, Красноярский край, ЗАТО Железногорск, ...",
2,27/1,24.05.2005,24.05.2020,устройство «Корунд»,Соответствует требованиям документов: ТУ,серия,ЗАО «НПП «БИТ»,,ООО «Реном»,"125438, г. Москва, ул. Автомоторная, д. 7, (49...",
3,32/1,20.04.1996,17.04.2021,система защиты информации от несанкционированн...,Соответствует требованиям документов: РД СВТ(2),1,ФГУП «СКЦ Росатома»,АО Центр «Атомзащитаинформ»,ФГУП «ПО «Маяк»,"456784, Челябинская обл., г. Озерск, пр-т Лени...",31.12.2035
4,32/2,20.04.1996,17.04.2021,система защиты информации от несанкционированн...,Соответствует требованиям документов: РД СВТ(2),1,ФГУП «СКЦ Росатома»,АО Центр «Атомзащитаинформ»,ФГУП «ПСЗ им. К.А.Володина»,"456080, Челябинская обл., г. Трехгорный, ул. З...",31.12.2035


2. Показать список уникальных наименований документов, требованиям которых
соответствуют представленные средства защиты информации.

In [210]:
column = 'Наименования документов, требованиям которых соответствует средство'

raw_docs = [k.split("Соответствует требованиям документов: ")[-1] for k in data[column].unique()]
raw_docs = [d.split(", ") for d in raw_docs]

docs = []

for d in raw_docs:
    docs.extend(d)

docs = set(docs)
print(docs)


{'Профиль защиты МЭ(Г четвертого класса защиты. ИТ.МЭ.Г4.ПЗ)', 'РД МЭ(2)', 'РД СЗЗ(3)', 'на соответствие РД СПФ и ТУ', 'РД САЗ ПЭМИН-87', 'РД НДВ(3)', 'Требования к МЭ', 'Профиль защиты МЭ(А третьего класса защиты. ИТ.МЭ.А3.ПЗ)', 'Профиль защиты СКН(контроля подключения съемных машинных носителей информации шестого класса защиты. ИТ.СКН.П6.ПЗ)', 'Временная методика КИ ОТСС-ВТСС', 'Требования к СДЗ', 'Требования к СЗИ от DDoS(4)', 'Профиль защиты СДЗ(базовой системы ввода-вывода четвертого класса защиты. ИТ.СДЗ.УБ4.ПЗ)', 'Средство защиты информации Security Studio 6 – Trusted Boot Loader. RU.40308570.501410.002 -  по 3 уровню контроля отсутствия НДВ и ТУ', 'Профиль защиты МЭ(А второго класса защиты. ИТ.МЭ.А2.ПЗ)', 'Профиль защиты САВЗ(Б четвертого класса защиты. ИТ.САВЗ.Б4.ПЗ)', 'Профили защиты СОВ(узла второго класса защиты. ИТ.СОВ.У2.ПЗ)', 'РД СЗЗ(9)', 'Требования доверия(6)', 'Профиль защиты МЭ(А пятого класса защиты. ИТ.МЭ.А5.ПЗ)', 'Профиль защиты ОС(А пятого класса защиты. ИТ.ОС.А5

3. Отобразить список наименований средств, соответствующих двум любым документам с
требованиями по сертификации.

In [233]:
column = 'Наименования документов, требованиям которых соответствует средство'

# automatic selection of requirements
# requirements = [random.choice(list(docs)) for i in range(2)]
# manual selection is used instead of automatic selection due to the optimal display of data

requirements = ["РД САЗ ПЭМИН-87", "ТУ"]
print("\n".join(requirements))
mask = (data[column].str.contains(requirements[0]) | \
        data[column].str.contains(requirements[1]) )

data[mask]


РД САЗ ПЭМИН-87
ТУ


Unnamed: 0,№\r\nсертификата,Дата\r\nвнесения\r\nв реестр,Срок\r\nдействия\r\nсертификата,Наименование\r\nсредства (шифр),"Наименования документов, требованиям которых соответствует средство",Схема\r\nсертификации,Испытательная\r\nлаборатория,Орган по\r\nсертификации,Заявитель,"Реквизиты заявителя\r\n(индекс, адрес, телефон)","Информация об окончании срока технической поддержки, полученная от заявителя",is_private_company
2,27/1,24.05.2005,2020-05-24,устройство «Корунд»,Соответствует требованиям документов: ТУ,серия,ЗАО «НПП «БИТ»,,ООО «Реном»,"125438, г. Москва, ул. Автомоторная, д. 7, (49...",,True
5,41/5/10,30.03.2011,2020-03-30,система защиты «Гром-ЗИ-4»,Соответствует требованиям документов: РД САЗ П...,1,ЗАО «НПП «БИТ»,,Министерство культуры Республики Бурятия,"670000, г. Улан-Удэ, ул. Ленина, д. 30, (3012)...",,True
6,41/5/17,18.04.2013,2019-04-18,система защиты «Гром-ЗИ-4»,Соответствует требованиям документов: РД САЗ П...,1,АО «ФНПЦ «ННИИРТ»,,ПАО «Завод корпусов»,"607061, Нижегородская область, г. Выкса, ул. З...",,True
7,41/6/5,09.03.2011,2020-09-03,система защиты «Гром-ЗИ-4А»,Соответствует требованиям документов: РД САЗ П...,1,ООО по защите информации «Секрет-Сервис»,,ФГБУН Институт геохимии им. А.П. Виноградова С...,"664033, г. Иркутск, ул. Фаворского, д. 1А, (39...",,True
8,41/6/47,30.10.2012,2018-10-30,система защиты «Гром-ЗИ-4А»,Соответствует требованиям документов: РД САЗ П...,1,АО «ФНПЦ «ННИИРТ»,,Администрация города Дзержинска Нижегородской ...,"606000, Нижегородская область, г. Дзержинск, п...",,True
...,...,...,...,...,...,...,...,...,...,...,...,...
1917,4508,17.01.2022,2027-01-17,программа поиска и гарантированного уничтожени...,Соответствует требованиям документов: Требован...,серия,АО «БИТК»,ФАУ «ГНИИИ ПТЗИ ФСТЭК России»,АО «ЦБИ-сервис»,"141090, Московская область, городской округ Ко...",,True
1918,4509,26.01.2022,2027-01-26,программное обеспечение «Avanpost WebSSO»,Соответствует требованиям документов: Требован...,серия,АО «НПО «Эшелон»,ФАУ «ГНИИИ ПТЗИ ФСТЭК России»,ООО «Аванпост»,"109129, г. Москва, ул. 8-я Текстильщиков, д. 1...",,True
1920,4513,19.01.2022,2027-01-19,"программное обеспечение SAP S/4HANA, версия 1909",Соответствует требованиям документов: Требован...,серия,ООО «Газинформсервис»,ООО «ЦБИ»,ООО «САП СНГ»,"115054, г. Москва, Космодамианская наб., д. 52...",,True
1921,4514,20.01.2022,2027-01-20,"программное обеспечение SAP Marketing, версия ...",Соответствует требованиям документов: Требован...,серия,ООО «Газинформсервис»,ООО «ЦБИ»,ООО «САП СНГ»,"115054, г. Москва, Космодамианская наб., д. 52...",,True


4. Показать наименования тех средств, которые имеют просроченные сертификаты (на 
момент выполнения задания).

In [234]:
import datetime 
now = datetime.datetime.now()

column = 'Срок\r\nдействия\r\nсертификата'



# удаление некорректных данных
data = data.drop(data[data[column] == "#Н/Д"].index)
data[column] = pd.to_datetime(data[column])

# просрочены
expired = data[data[column] < now]
expired

Unnamed: 0,№\r\nсертификата,Дата\r\nвнесения\r\nв реестр,Срок\r\nдействия\r\nсертификата,Наименование\r\nсредства (шифр),"Наименования документов, требованиям которых соответствует средство",Схема\r\nсертификации,Испытательная\r\nлаборатория,Орган по\r\nсертификации,Заявитель,"Реквизиты заявителя\r\n(индекс, адрес, телефон)","Информация об окончании срока технической поддержки, полученная от заявителя",is_private_company
0,17/1,26.07.2002,2020-01-08,фильтр сетевой помехоподавляющий ФСПК-100(200)...,Соответствует требованиям документов: Требован...,серия,ЦКБИ ФГУП «СНПО «Элерон»,АО Центр «Атомзащитаинформ»,ООО НПП «ЭЛКОМ»,"249192, Калужская обл., г. Обнинск, пос. Кабиц...",31.12.2034,False
1,21/2,25.06.2013,2019-06-25,программный комплекс защиты информации от НСД ...,Соответствует требованиям документов: РД СВТ(2),1,АО «Информационные спутниковые системы» имени ...,,АО «Информационные спутниковые системы» имени ...,"662972, Красноярский край, ЗАТО Железногорск, ...",,True
2,27/1,24.05.2005,2020-05-24,устройство «Корунд»,Соответствует требованиям документов: ТУ,серия,ЗАО «НПП «БИТ»,,ООО «Реном»,"125438, г. Москва, ул. Автомоторная, д. 7, (49...",,True
3,32/1,20.04.1996,2021-04-17,система защиты информации от несанкционированн...,Соответствует требованиям документов: РД СВТ(2),1,ФГУП «СКЦ Росатома»,АО Центр «Атомзащитаинформ»,ФГУП «ПО «Маяк»,"456784, Челябинская обл., г. Озерск, пр-т Лени...",31.12.2035,False
4,32/2,20.04.1996,2021-04-17,система защиты информации от несанкционированн...,Соответствует требованиям документов: РД СВТ(2),1,ФГУП «СКЦ Росатома»,АО Центр «Атомзащитаинформ»,ФГУП «ПСЗ им. К.А.Володина»,"456080, Челябинская обл., г. Трехгорный, ул. З...",31.12.2035,False
...,...,...,...,...,...,...,...,...,...,...,...,...
1401,3973,25.07.2018,2021-07-25,межсетевой экран серии Cisco ASA 5500-X (модел...,Соответствует требованиям документов: Требован...,серия,АО «ДОКУМЕНТАЛЬНЫЕ СИСТЕМЫ»,ФАУ «ГНИИИ ПТЗИ ФСТЭК России»,ООО «САТЕЛ»,"127106, г. Москва, Гостиничный проезд, д. 4Б, ...",,True
1402,3974,25.07.2018,2021-07-25,эксклюзивная голографическая фольга горячего т...,Соответствует требованиям документов: РД СЗЗ(3),серия,ФАУ «ГНИИИ ПТЗИ ФСТЭК России»,ФСТЭК России,АО «НПО «Криптен»,"141980, Московская обл., г. Дубна, ул. Приборо...",,False
1404,3976,27.07.2018,2021-07-27,программный комплекс «Аркан»,Соответствует требованиям документов: Требован...,серия,АО «НПО «Эшелон»,ФАУ «ГНИИИ ПТЗИ ФСТЭК России»,ООО «АСП Лабс»,"121205, г. Москва, территория инновационного ц...",01.01.2026,True
1405,3977,01.08.2018,2021-01-08,программный комплекс управления конфигурациями...,Соответствует требованиям документов: РД НДВ(4...,серия,АО «ДОКУМЕНТАЛЬНЫЕ СИСТЕМЫ»,ФАУ «ГНИИИ ПТЗИ ФСТЭК России»,ООО «Газинформсервис»,"198096, г. Санкт-Петербург, ул. Кронштадтская,...",01.08.2022,True


5. Показать наименования тех средств, которые имеют просроченные сертификаты, но при этом обязаны оказывать поддержку (столбец «Информация об окончании срока технической поддержки, полученная от заявителя»).

In [235]:
"""
"""
column = "Информация об окончании срока технической поддержки, полученная от заявителя"

expired = expired.dropna(subset=[column], how='all')

expired[column] = pd.to_datetime(expired[column], errors='drop')

# просрочены, но обязаны оказывать поддержку
expired[expired[column] > now]

AssertionError: 

6. Показать наименования всех средств, которые проходили испытания в частных
организациях (форма организации ООО, ЗАО, ПАО, АО).

In [None]:
"""    

"""

def check(name):
    forms = ["ООО", "ЗАО", "ПАО", "АО"]
    for f in forms:
        if f in name:
            return True
    
    return False

column = 'Испытательная\r\nлаборатория'

data["is_private_company"] = data[column].apply(check)

# частные компании
data[data["is_private_company"] == True]


Unnamed: 0,№\r\nсертификата,Дата\r\nвнесения\r\nв реестр,Срок\r\nдействия\r\nсертификата,Наименование\r\nсредства (шифр),"Наименования документов, требованиям которых соответствует средство",Схема\r\nсертификации,Испытательная\r\nлаборатория,Орган по\r\nсертификации,Заявитель,"Реквизиты заявителя\r\n(индекс, адрес, телефон)","Информация об окончании срока технической поддержки, полученная от заявителя",is_private_company
1,21/2,25.06.2013,2019-06-25,программный комплекс защиты информации от НСД ...,Соответствует требованиям документов: РД СВТ(2),1,АО «Информационные спутниковые системы» имени ...,,АО «Информационные спутниковые системы» имени ...,"662972, Красноярский край, ЗАТО Железногорск, ...",,True
2,27/1,24.05.2005,2020-05-24,устройство «Корунд»,Соответствует требованиям документов: ТУ,серия,ЗАО «НПП «БИТ»,,ООО «Реном»,"125438, г. Москва, ул. Автомоторная, д. 7, (49...",,True
5,41/5/10,30.03.2011,2020-03-30,система защиты «Гром-ЗИ-4»,Соответствует требованиям документов: РД САЗ П...,1,ЗАО «НПП «БИТ»,,Министерство культуры Республики Бурятия,"670000, г. Улан-Удэ, ул. Ленина, д. 30, (3012)...",,True
6,41/5/17,18.04.2013,2019-04-18,система защиты «Гром-ЗИ-4»,Соответствует требованиям документов: РД САЗ П...,1,АО «ФНПЦ «ННИИРТ»,,ПАО «Завод корпусов»,"607061, Нижегородская область, г. Выкса, ул. З...",,True
7,41/6/5,09.03.2011,2020-09-03,система защиты «Гром-ЗИ-4А»,Соответствует требованиям документов: РД САЗ П...,1,ООО по защите информации «Секрет-Сервис»,,ФГБУН Институт геохимии им. А.П. Виноградова С...,"664033, г. Иркутск, ул. Фаворского, д. 1А, (39...",,True
...,...,...,...,...,...,...,...,...,...,...,...,...
1918,4509,26.01.2022,2027-01-26,программное обеспечение «Avanpost WebSSO»,Соответствует требованиям документов: Требован...,серия,АО «НПО «Эшелон»,ФАУ «ГНИИИ ПТЗИ ФСТЭК России»,ООО «Аванпост»,"109129, г. Москва, ул. 8-я Текстильщиков, д. 1...",,True
1920,4513,19.01.2022,2027-01-19,"программное обеспечение SAP S/4HANA, версия 1909",Соответствует требованиям документов: Требован...,серия,ООО «Газинформсервис»,ООО «ЦБИ»,ООО «САП СНГ»,"115054, г. Москва, Космодамианская наб., д. 52...",,True
1921,4514,20.01.2022,2027-01-20,"программное обеспечение SAP Marketing, версия ...",Соответствует требованиям документов: Требован...,серия,ООО «Газинформсервис»,ООО «ЦБИ»,ООО «САП СНГ»,"115054, г. Москва, Космодамианская наб., д. 52...",,True
1922,4516,25.01.2022,2027-01-25,программное обеспечение JaCarta Management Sys...,Соответствует требованиям документов: Требован...,серия,ООО НТЦ «Фобос-НТ»,ФАУ «ГНИИИ ПТЗИ ФСТЭК России»,АО «Аладдин Р.Д.»,"129226, г. Москва, ул. Докукина, д. 16, стр. 1...",,True
