# Обработка shape-файла и извлечение информации для дальнейшего анализа

Обработка shape-файла производится при создании экземпляра класса `ThinSection` из модуля "thin_section_class.py".

In [1]:
import numpy as np
import os
import pickle
from thin_section_class import ThinSection

In [2]:
# путь до директории с папками, в которых хранятся .shp файлы 
path_to_shape_files = '.\\shp_files\\'

# путь до папки, в которую сохраняются объекты класса ThinSection
path_to_pickle_files = '.\\saved_objects\\'

## Чтение shape-файла и сохранение координат трещин 

In [6]:
def get_shp_filename(path_to_shape_files, file_directory):
    """
    Ищет .shp файл в папке и возвращает его название
    :param path_to_shape_files: путь до директории с папками, в которых лежат shape файлы
    :param file_directory: название конкретной папки
    :return: название файла "file_name.shp"
    """
    p = os.path.join(path_to_shape_files, file_directory)
    
    for name in os.listdir(p):
        if name[-4:] == '.shp':
            return name

In [8]:
def read_shapefile_and_save_lines_sample(name, 
                                        path_to_shape_files,
                                        path_lines_sample,
                                        left=-np.inf, right=np.inf, 
                                        bottom=-np.inf, top=np.inf):
    """
    Создает объект класса ThinSection и сохраняет 
    текстовый файл с координатами трещин.
    Обрезает изображение по заданным координатам, если требуется.
    
    :param name: название папки с данным shape файлом
                 (далее также используется в качестве префикса в названиях других файлов, связанных с этим shape файлом)
    :param path_to_shape_files: путь до директории с папками, в которых лежат shape файлы
    :param path_lines_sample: путь до директории, к которой хранятся текстовые файлы с координатами трещин
    :param left: левая граница для обрезки изображения (мм)
    :param right: правая граница для обрезки изображения (мм)
    :param bottom: нижняя граница для обрезки изображения (мм)
    :param top: верхняя граница для обрезки изображения (мм)
    :return: None
    """
    # название .shp файла
    shp_filename = get_shp_filename(path_to_shape_files, name)
    # полный путь до .shp файла
    path_to_shp = os.path.join(path_to_shape_files, name, shp_filename)
    # чтение данных
    data = ThinSection(path_to_shp,
                       left, right, bottom, top)
    
    # сохранение координат в текстовый файл
    filename_lines_sample = name + '_lines_sample.txt'
    data.save_lines_sample_txt(path_lines_sample, filename_lines_sample)

In [9]:
name = '55_1'

read_shapefile_and_save_lines_sample(name, path_to_shape_files, path_lines_sample)

## Вычисление количества пересечений

Далее по сохраненным в текстовом файле координатам программа на C++ вычисляет количество пересечений для каждой трещины (см. директорию `cpp_intersections_counts`, файл `main.cpp`)

## Сохранение объекта ThinSection для дальнейшей работы

In [10]:
def save_pickle_file(name, path_to_shape_files,
                           path_to_pickle_files, 
                           path_counts,
                           left=-np.inf, right=np.inf, bottom=-np.inf, top=np.inf):
    """
    Создает объект класса ThinSection, 
    считывает уже подсчитанную выборку числа пересечений,
    сохраняет полученный объект в виде pickle-файла
    
    :param name: название папки с данным shape файлом
                 (далее также используется в качестве префикса в названиях других файлов, связанных с этим shape файлом)
    :param path_to_shape_files: путь до директории с папками, в которых лежат shape файлы
    :param path_to_pickle_files: путь до директории, в которой будут лежать pickle объекты
    :param path_counts: путь до директории, в которой хранятся текстовые файлы с числом пересечений
    :param left: левая граница для обрезки изображения (мм)
    :param right: правая граница для обрезки изображения (мм)
    :param bottom: нижняя граница для обрезки изображения (мм)
    :param top: верхняя граница для обрезки изображения (мм)
    :return: None
    """
    # название .shp файла
    shp_filename = get_shp_filename(path_to_shape_files, name)
    # полный путь до .shp файла
    path_to_shp = os.path.join(path_to_shape_files, name, shp_filename)
    # чтение данных
    data = ThinSection(path_to_shp,
                       left, right, bottom, top)

    
    # чтение выборки пересечений
    counts_filename = name + '_counts.txt'
    data.read_count_intersections_sample(path=path_counts, filename=counts_filename)
    assert data.counts_sample is not None

    # сохранение pickle объекта
    object_name = name + '_object'
    path_to_object = os.path.join(path_to_pickle_files, object_name) 
    file = open(path_to_object, 'wb')
    pickle.dump(data, file)
    file.close()

In [11]:
name = '55_1'

save_pickle_file(name, path_to_shape_files, path_to_pickle_files, path_counts)

Анализ сохраненного объекта будет представлен в следующих .ipynb файлах