In [25]:
"""
Проверка Соответствие по целевому назначению и категории защитности
"""
import pandas as pd
import openpyxl
from openpyxl.utils.dataframe import dataframe_to_rows
from openpyxl.styles import Alignment
import time
pd.options.mode.chained_assignment = None  # default='warn'

In [26]:
def combine(x):
    # Функция для группировки всех значений в строку разделенную ;
    return  ';'.join(x)

def check_unique(x):
    # Функция для нахождения разночтений в площади выделенного гектара
    # создаем список разделяя по точке с запятой
    temp_lst = x.split(';')
    # Создаем множество оставляя только уникальные значения
    temp_set = set(temp_lst)
    return 'Значения совпадают' if len(temp_set) == 1 else 'Ошибка!!! Значения не совпадают'

In [27]:
def clean_purpose_column(x):
    """
    Функция для извлечения значений из столбца целевого назначения для того чтобы можно было
    найти все значения равные 1 и сопоставить со значением в категории
    """
    temp_lst = x.split(';') # Создаем список разделя строку по ;
    temp_set = set(temp_lst) # Превращаем во множество

    if len(temp_set) == 1:
        temp_value = list(temp_set)[0] # получаем единственное значение
        if temp_value == 'nan':
            return 0
        try:
            value_purpose = float(temp_value) # конвертируем в число

            return value_purpose
        except ValueError:
            return 0
    else:
        return 0
    
    
    

In [None]:
def prepare_column_purpose_category(df,name_columns):
    """
    Функция для предобработки колонок с целевым назначением и категорией лесов
    Нужно очистить от пробелов, nan, сконвертировать во флоат,инт и снова в строку
    :param df: датафрейм содержащий в себе реестр
    :param name_columns: название обрабаытваемой колонки
    """
    try:
        # Приводим колонку к типу str чтобы очистить от лишних символов и заменить пустые вещи на нули
        df[name_columns] = df[name_columns].astype(str)
        df[name_columns] = df[name_columns].apply(lambda x: x.replace('nan', '0'))
        df[name_columns] = df[name_columns].apply(lambda x: x.replace(' ', '0'))
        df[name_columns] = df[name_columns].apply(lambda x: x.strip())
        # конвертируем во флоат, затем в инт чтобы потом в строке не было значений с дробной частью
        df[name_columns] = df[name_columns].astype(float)
        df[name_columns] = df[name_columns].astype(int)
        df[name_columns] = df[name_columns].astype(str)
    except KeyError as e:
        
        messagebox.showerror('Артемида 1.2',f'Не найдена колонка {e.args} Проверьте файл на наличие этой колонки')
    except ValueError as e:
        messagebox.showerror('Артемида 1.2', f'Возникла ошибка при обработке значения {e.args}\n'
                                             f'в колонках целевого назначения и категории должны быть только цифры!')

In [28]:
path_reest_upp = 'data/2022-10-27_64_Реестр УПП с дополнительными колонками..xlsx'
path_to_end_folder = 'data/'

In [29]:
df = pd.read_excel(path_reest_upp,skiprows=8) # считываем датафрейм пропуская первые 8 строк

In [30]:
"""
Соответствие названий колонок используемым в программе номерам колонок
Лесничество -1
Участковое лесничество- 2
Урочище - 3
Номер лесного квартала -4
Номер лесотаксационного выдела -5
Целевое назначение лесов - 12
Категория защитных лесов (код) - 13
"""

'\nСоответствие названий колонок используемым в программе номерам колонок\nЛесничество -1\nУчастковое лесничество- 2\nУрочище - 3\nНомер лесного квартала -4\nНомер лесотаксационного выдела -5\nЦелевое назначение лесов - 12\nКатегория защитных лесов (код) - 13\n'

In [31]:
# Приводим названия колонок к строковому виду, чтобы избежать возможных проблем с названиями колонок
df.columns = list(map(str,list(df.columns)))
# на всякий случай очищаем от пробельных символов
df.columns = list(map(lambda x:x.replace(" ",""),list(df.columns)))

In [32]:
df.rename(columns={'1':'Лесничество','2':'Участковое лесничество','3':'Урочище','4':'Номер лесного квартала','5':'Номер лесотаксационного выдела',
                  '12':'Целевое назначение лесов','13':'Категория защитных лесов (код)',},inplace=True)

In [33]:
# заполняем пропущенные места в графе урочища чтобы группировка прошла корректно
df['Урочище'] = df['Урочище'].fillna('Название урочища не заполнено')


In [34]:
# Меняем тип столбца на строку чтобы создать строку включающую в себя все значения разделенные ;заменяем нан на нули и очищаем от пробельных символов
df['Целевое назначение лесов'] = df['Целевое назначение лесов'].astype(str)
df['Целевое назначение лесов'] = df['Целевое назначение лесов'].apply(lambda x: x.replace('nan','0'))
df['Целевое назначение лесов'] = df['Целевое назначение лесов'].apply(lambda x: x.replace(' ','0'))
df['Целевое назначение лесов'] = df['Целевое назначение лесов'].apply(lambda x:x.strip())

df['Категория защитных лесов (код)'] = df['Категория защитных лесов (код)'].astype(str)
df['Категория защитных лесов (код)'] = df['Категория защитных лесов (код)'].apply(lambda x: x.replace('nan','0'))
df['Категория защитных лесов (код)'] = df['Категория защитных лесов (код)'].apply(lambda x: x.replace(' ','0'))
df['Категория защитных лесов (код)'] = df['Категория защитных лесов (код)'].apply(lambda x:x.strip())

checked_pl = df.groupby(['Лесничество', 'Участковое лесничество', 'Урочище', 'Номер лесного квартала',
                               'Номер лесотаксационного выдела']).agg(
    {'Целевое назначение лесов': combine,'Категория защитных лесов (код)':combine})

In [35]:
# Извлекаем индекс
out_df= checked_pl.reset_index()

In [36]:
# Применяем функцию проверяющую количество уникальных значений в столбце, если больше одного то значит есть ошибка в данных
out_df['Контроль правильности заполнения целевого назначения лесов'] = out_df['Целевое назначение лесов'].apply(
    check_unique)
out_df['Контроль правильности заполнения категории защитных лесов'] = out_df['Категория защитных лесов (код)'].apply(
    check_unique)

In [37]:
out_df['Контроль назначения лесов'] = out_df['Целевое назначение лесов'].apply(clean_purpose_column)

In [38]:
out_df['Контроль назначения лесов'] = out_df['Контроль назначения лесов'].astype(int) # Приводим на всякий случай к инту


In [39]:
out_df['Контроль категории защитных лесов'] = out_df['Категория защитных лесов (код)'].apply(clean_purpose_column)
out_df['Контроль категории защитных лесов'] = out_df['Контроль категории защитных лесов'].astype(int) # Приводим на всякий случай к инту

In [40]:
out_df.rename(columns ={'Целевое назначение лесов':'Показатели целевого назначения для данного выдела',
                       'Категория защитных лесов (код)':'Показатели категории защитных лесов для данного выдела'},inplace=True)

In [41]:
out_df['Итоговый контроль защитных лесов'] = (out_df['Контроль назначения лесов'] == 1) & (out_df['Контроль категории защитных лесов'] == 0)

In [42]:
out_df['Итоговый контроль защитных лесов'] = out_df['Итоговый контроль защитных лесов'].apply(
    lambda x: 'Ошибка, проверьте целевое назначение или категорию защитных лесов' if x == True else 'Все в порядке') 

In [43]:
out_df.head()

Unnamed: 0,Лесничество,Участковое лесничество,Урочище,Номер лесного квартала,Номер лесотаксационного выдела,Показатели целевого назначения для данного выдела,Показатели категории защитных лесов для данного выдела,Контроль правильности заполнения целевого назначения лесов,Контроль правильности заполнения категории защитных лесов,Контроль назначения лесов,Контроль категории защитных лесов,Итоговый контроль защитных лесов
0,Ангоянское,Ангоянское,Название урочища не заполнено,32,1,1.0,4,Значения совпадают,Значения совпадают,1,4,Все в порядке
1,Ангоянское,Ангоянское,Название урочища не заполнено,32,2,1.0,4,Значения совпадают,Значения совпадают,1,4,Все в порядке
2,Ангоянское,Ангоянское,Название урочища не заполнено,32,3,1.0,4,Значения совпадают,Значения совпадают,1,4,Все в порядке
3,Ангоянское,Ангоянское,Название урочища не заполнено,32,5,3.0,0,Значения совпадают,Значения совпадают,3,0,Все в порядке
4,Ангоянское,Ангоянское,Название урочища не заполнено,32,7,3.0;3.0;3.0,0;0;0,Значения совпадают,Значения совпадают,3,0,Все в порядке


In [44]:
# Получаем текущую дату
current_time = time.strftime('%H_%M_%S %d.%m.%Y')
# Сохраняем отчет
# Для того чтобы увеличить ширину колонок для удобства чтения используем openpyxl
wb = openpyxl.Workbook() # Создаем объект
# Записываем результаты
for row in dataframe_to_rows(out_df,index=False,header=True):
    wb['Sheet'].append(row)

# Форматирование итоговой таблицы
# Ширина колонок
wb['Sheet'].column_dimensions['A'].width = 15
wb['Sheet'].column_dimensions['B'].width = 20
wb['Sheet'].column_dimensions['C'].width = 36
wb['Sheet'].column_dimensions['F'].width = 15
wb['Sheet'].column_dimensions['G'].width = 15
wb['Sheet'].column_dimensions['H'].width = 15
wb['Sheet'].column_dimensions['I'].width = 15
wb['Sheet'].column_dimensions['J'].width = 15
wb['Sheet'].column_dimensions['K'].width = 15
wb['Sheet'].column_dimensions['L'].width = 15
# Перенос строк для заголовков
wb['Sheet']['F1'].alignment = Alignment(wrap_text=True)
wb['Sheet']['G1'].alignment = Alignment(wrap_text=True)
wb['Sheet']['H1'].alignment = Alignment(wrap_text=True)
wb['Sheet']['I1'].alignment = Alignment(wrap_text=True)
wb['Sheet']['L1'].alignment = Alignment(wrap_text=True)


wb.save(f'{path_to_end_folder}/Проверка правильности ввода целевого назначения лесов и категории защитных лесов {current_time}.xlsx')