In [3]:
import pandas as pd
from itertools import groupby

# Загрузка исходного файла Excel
file_path = 'TRU.xlsx'  # укажите путь к вашему файлу
df = pd.read_excel(file_path)

# Просмотр первых строк для проверки
print("Исходные данные:")
print(df.head())
print(f"\nВсего строк: {len(df)}")

def create_hierarchical_structure(df):
    """
    Создает иерархическую структуру из плоского справочника
    """
    # Сортируем данные для правильной группировки
    sorted_df = df.sort_values(['Бизнес-сегмент', 'Функциональное направление ТРУ', 'Область', 'Тип'])
    
    hierarchical_data = []
    
    # Группировка по уровням иерархии
    for i, (business_segment, business_group) in enumerate(sorted_df.groupby('Бизнес-сегмент'), 1):
        # Уровень 1: Бизнес-сегмент
        level1_code = f"{i:02d}."
        hierarchical_data.append({
            '1 уровень': level1_code,
            'Бизнес-сегмент': business_segment,
            '2 уровень': '',
            'Функциональное направление ТРУ ': '',
            '3 уровень': '',
            'Область': '',
            '4 уровень': '',
            'Тип': '',
            'Категория ТРУ': ''
        })
        
        for j, (functional_direction, functional_group) in enumerate(business_group.groupby('Функциональное направление ТРУ'), 1):
            # Уровень 2: Функциональное направление ТРУ
            level2_code = f"{level1_code}{j:02d}."
            hierarchical_data.append({
                '1 уровень': '',
                'Бизнес-сегмент': '',
                '2 уровень': level2_code,
                'Функциональное направление ТРУ': functional_direction,
                '3 уровень': '',
                'Область': '',
                '4 уровень': '',
                'Тип': '',
                'Категория ТРУ': ''
            })
            
            for k, (area, area_group) in enumerate(functional_group.groupby('Область'), 1):
                # Уровень 3: Область
                level3_code = f"{level2_code}{k:02d}"
                hierarchical_data.append({
                    '1 уровень': '',
                    'Бизнес-сегмент': '',
                    '2 уровень': '',
                    'Функциональное направление ТРУ': '',
                    '3 уровень': level3_code,
                    'Область': area,
                    '4 уровень': '',
                    'Тип': '',
                    'Категория ТРУ': ''
                })
                
                for m, (type_val, type_group) in enumerate(area_group.groupby('Тип'), 1):
                    # Уровень 4: Тип
                    level4_code = f"{level3_code}.{m:02d}"
                    
                    # Добавляем строки для каждой категории ТРУ в этом типе
                    for n, (_, row) in enumerate(type_group.iterrows(), 1):
                        hierarchical_data.append({
                            '1 уровень': '',
                            'Бизнес-сегмент': '',
                            '2 уровень': '',
                            'Функциональное направление ТРУ': '',
                            '3 уровень': '',
                            'Область': '',
                            '4 уровень': level4_code,
                            'Тип': type_val,
                            'Категория ТРУ': row['Категория ТРУ']
                        })
    
    return pd.DataFrame(hierarchical_data)

# Создаем иерархическую структуру
hierarchical_df = create_hierarchical_structure(df)

# Просмотр результата
print("\nИерархическая структура (первые 20 строк):")
print(hierarchical_df.head(20))

# Сохранение в Excel
output_file = 'иерархический_справочник.xlsx'
hierarchical_df.to_excel(output_file, index=False, sheet_name='Иерархический справочник')

print(f"\nИерархическая структура сохранена в файл: {output_file}")
print(f"Всего строк в иерархической структуре: {len(hierarchical_df)}")

# Дополнительная информация о структуре
print("\nСтатистика по уровням:")
print(f"Бизнес-сегментов: {df['Бизнес-сегмент'].nunique()}")
print(f"Функциональных направлений: {df['Функциональное направление ТРУ'].nunique()}")
print(f"Областей: {df['Область'].nunique()}")
print(f"Типов: {df['Тип'].nunique()}")
print(f"Категорий ТРУ: {df['Категория ТРУ'].nunique()}")


Исходные данные:
   № п/п ТРУ-было            Бизнес-сегмент Функциональное направление ТРУ  \
0               1  Геологоразведка и добыча                        Бурение   
1               2  Геологоразведка и добыча                        Бурение   
2               3  Геологоразведка и добыча                        Бурение   
3               4  Геологоразведка и добыча                        Бурение   
4               5  Геологоразведка и добыча                        Бурение   

                                             Область              Тип  \
0                                           Бурение   Работы и Услуги   
1                      ЗБС (Зарезка бокового ствола)  Работы и Услуги   
2  Сопутствующие услуги, связанные с бурением скв...  Работы и Услуги   
3  Сопутствующие услуги, связанные с бурением скв...  Работы и Услуги   
4  Сопутствующие услуги, связанные с бурением скв...  Работы и Услуги   

                                       Категория ТРУ  
0                   

In [21]:
import pandas as pd
from itertools import groupby

# Загрузка исходного файла Excel
file_path = 'TRU.xlsx'  # укажите путь к вашему файлу
df = pd.read_excel(file_path)

# Просмотр первых строк для проверки
print("Исходные данные:")
print(df.head())
print(f"\nВсего строк: {len(df)}")
print(f"Колонки: {list(df.columns)}")

def create_hierarchical_structure(df):
    """
    Создает иерархическую структуру из плоского справочника
    """
    # Сортируем данные для правильной группировки
    sorted_df = df.sort_values(['Бизнес-сегмент', 'Функциональное направление ТРУ', 'Область', 'Тип'])
    
    hierarchical_data = []
    
    # Группировка по уровням иерархии
    for i, (business_segment, business_group) in enumerate(sorted_df.groupby('Бизнес-сегмент'), 1):
        # Уровень 1: Бизнес-сегмент
        level1_code = f"{i:02d}."
        hierarchical_data.append({
            '1 уровень': level1_code,
            'Бизнес-сегмент': business_segment,
            '2 уровень': '',
            'Функциональное направление ТРУ': '',
            '3 уровень': '',
            'Область': '',
            '4 уровень': '',
            'Тип': '',
            'Категория ТРУ': '',
            'Перечень': ''
        })
        
        for j, (functional_direction, functional_group) in enumerate(business_group.groupby('Функциональное направление ТРУ'), 1):
            # Уровень 2: Функциональное направление ТРУ
            level2_code = f"{level1_code}{j:02d}."
            hierarchical_data.append({
                '1 уровень': '',
                'Бизнес-сегмент': '',
                '2 уровень': level2_code,
                'Функциональное направление ТРУ': functional_direction,
                '3 уровень': '',
                'Область': '',
                '4 уровень': '',
                'Тип': '',
                'Категория ТРУ': '',
                'Перечень': ''
            })
            
            for k, (area, area_group) in enumerate(functional_group.groupby('Область'), 1):
                # Уровень 3: Область
                level3_code = f"{level2_code}{k:02d}"
                hierarchical_data.append({
                    '1 уровень': '',
                    'Бизнес-сегмент': '',
                    '2 уровень': '',
                    'Функциональное направление ТРУ': '',
                    '3 уровень': level3_code,
                    'Область': area,
                    '4 уровень': '',
                    'Тип': '',
                    'Категория ТРУ': '',
                    'Перечень': ''
                })
                
                # Группируем по Типу и Перечню для уровня 4
                type_groups = area_group.groupby(['Тип', 'Категория ТРУ'])
                
                for m, ((type_val, kategoria), type_group) in enumerate(type_groups, 1):
                    # Уровень 4: Тип и Перечень - УВЕЛИЧИВАЕМ СЧЕТЧИК для каждой уникальной комбинации
                    level4_code = f"{level3_code}.{m:02d}"
                    
                    # Добавляем строки для каждой категории ТРУ в этой комбинации Тип+Перечень
                    for n, (_, row) in enumerate(type_group.iterrows(), 1):
                        hierarchical_data.append({
                            '1 уровень': '',
                            'Бизнес-сегмент': '',
                            '2 уровень': '',
                            'Функциональное направление ТРУ': '',
                            '3 уровень': '',
                            'Область': '',
                            '4 уровень': level4_code,
                            'Тип': type_val,
                            'Категория ТРУ':kategoria,
                            'Перечень': row['Перечень']
                        })
    
    return pd.DataFrame(hierarchical_data)

# Создаем иерархическую структуру
hierarchical_df = create_hierarchical_structure(df)

# Просмотр результата
print("\nИерархическая структура (первые 25 строк):")
print(hierarchical_df.head(25))

# Сохранение в Excel
output_file = 'иерархический_справочник.xlsx'
hierarchical_df.to_excel(output_file, index=False, sheet_name='Иерархический справочник')

print(f"\nИерархическая структура сохранена в файл: {output_file}")
print(f"Всего строк в иерархической структуре: {len(hierarchical_df)}")

# Дополнительная информация о структуре
print("\nСтатистика по уровням:")
print(f"Бизнес-сегментов: {df['Бизнес-сегмент'].nunique()}")
print(f"Функциональных направлений: {df['Функциональное направление ТРУ'].nunique()}")
print(f"Областей: {df['Область'].nunique()}")
print(f"Типов: {df['Тип'].nunique()}")
print(f"Перечней: {df['Перечень'].nunique()}")
print(f"Категорий ТРУ: {df['Категория ТРУ'].nunique()}")


Исходные данные:
   № п/п            Бизнес-сегмент Функциональное направление ТРУ  \
0      1  Геологоразведка и добыча                        Бурение   
1      2  Геологоразведка и добыча                        Бурение   
2      3  Геологоразведка и добыча                        Бурение   
3      4  Геологоразведка и добыча                        Бурение   
4      5  Геологоразведка и добыча                        Бурение   

                                             Область              Тип  \
0                                           Бурение   Работы и Услуги   
1                      ЗБС (Зарезка бокового ствола)  Работы и Услуги   
2  Сопутствующие услуги, связанные с бурением скв...  Работы и Услуги   
3  Сопутствующие услуги, связанные с бурением скв...  Работы и Услуги   
4  Сопутствующие услуги, связанные с бурением скв...  Работы и Услуги   

                                       Категория ТРУ  Перечень  
0                          Бурение скважин по тарифу         3  