<br>

# Introdução

In [1]:
import os
import pprint
import shutil
import fnmatch
import pandas as pd
import geopandas as gpd

In [2]:
from osgeo import ogr
from folium import plugins
from zipfile import ZipFile

In [3]:
from traquitanas.geo import layers as tt

In [4]:
from paths import *

Pasta do Projeto é: /home/michel/Codes/open_gaema/acp-399-01


<br>

Inicialmente extraímos todos os arquivos de dentro do zip "Shape.zip".

In [5]:
shutil.rmtree(temp_path, ignore_errors=True)

In [6]:
zipfile_path = input_path / 'Shapes.zip'

with ZipFile(zipfile_path, 'r') as zip_obj:    
    zip_obj.extractall(temp_path)

<br>

Uma vez com os arquivos soltos, foi possível observar grande desorganização dos arquivos. Não há qualquer padrão de nomenclatura. Alguns *shapefiles* existem para algumas nascentes, enquanto para outra snão existe.<br>
Como o objetivo principal do trabalho é identificar a localização das 56 nascentes que são mencionadas no TAC, optou-se por concentrar os esforços nestas feições.

In [7]:
list_shps = list(set([x.name for x in list(temp_path.glob('Nascente*/**/*.shp'))]))
list_shps.sort()
pprint.pprint(list_shps)

['APP.shp',
 'APP_nascente.shp',
 'APP_total.shp',
 'Area_Drenagem.shp',
 'Area_conservacao.shp',
 'Area_drenagem.shp',
 'Geologia.shp',
 'Nascente.shp',
 'Pontos_geofisica.shp',
 'Recomposicao.shp',
 'Uso_solo_APP.shp',
 'Uso_solo_app_curso_dagua.shp',
 'Uso_solo_app_nasc.shp',
 'Uso_solo_area_drenagem.shp',
 'area_Conservacao.shp',
 'area_drenagem.shp']


In [8]:
list_files = list(set([x.name for x in list(temp_path.glob(f'Nascente*'))]))
list_files

['Nascente 23',
 'Nascente 29',
 'Nascente 44',
 'Nascente 35',
 'Nascente 48',
 'Nascente 51',
 'Nascente 20',
 'Nascente 37',
 'Nascente 53',
 'Nascente 6',
 'Nascente 25',
 'Nascente 8',
 'Nascente 33',
 'Nascente 5',
 'Nascente 12',
 'Nascente 55',
 'Nascente 42',
 'Nascente 10',
 'Nascente 15',
 'Nascente 52',
 'Nascente 36',
 'Nascente 56',
 'Nascente 1',
 'Nascente 24',
 'Nascente 22',
 'Nascente 54',
 'Nascente 19',
 'Nascente 11',
 'Nascente 13',
 'Nascente 38',
 'Nascente 41',
 'Nascente 16',
 'Nascente 14',
 'Nascente 2',
 'Nascente 30',
 'Nascente 4',
 'Nascente 49',
 'Nascente 28',
 'Nascente 32',
 'Nascente 7',
 'Nascente 50',
 'Nascente 18',
 'Nascente 46',
 'Nascente 9',
 'Nascente 45',
 'Nascente 31',
 'Nascente 39',
 'Nascente 21',
 'Nascente 47',
 'Nascente 27',
 'Nascente 34',
 'Nascente 17',
 'Nascente 3',
 'Nascente 43',
 'Nascente 40',
 'Nascente 26']

<br>

## Junta shapefiles por Nome

Com a lista dos possíveis nomes de shapefiles, juntou-se todos os arquivos.

In [9]:
def merge_shp_by_name(shp, in_path, out_path):
    """
    in_path: pasta root que tem os shapefiles
    out_path: pasta que salva
    
    """
    # Create List Shapefiles
    list_files = list(set([x for x in list(in_path.glob(f'Nascente*/**/{shp}'))]))
        
    # Combine all shapefiles
    gdf = gpd.GeoDataFrame(
        pd.concat(
            [gpd.read_file(i) for i in list_files],
            ignore_index=True
        ),
        crs=gpd.read_file(list_files[0]).crs
    )
    
    # ddd
    #print(gdf.head())
    #print(gdf.columns)

    # Adjust Columns
    gdf.columns = [x.lower() for x in gdf.columns]
    
    # Delete Fields
    gdf.drop(
        [
            'area',
            'id',
            'in_path',
            'numero',
            'x',
            'y',
            'buff_dist',
            'nascente_1'
            'nascente_1',
            'nascente_2',
            'nascente_3',
            'nascente_4',
            'nascente_5',
            'na',
            'uso',
        ],
        axis=1,
        errors='ignore',
        inplace=True,
    )

    # Save Output
    geopackage = shp.replace('shp', 'gpkg')
    geopackage_filepath = out_path / f'{geopackage}'
    geopackage_filepath.unlink(missing_ok=True)
    gdf.to_file(
        geopackage_filepath,
        driver='GPKG',
    )    
    return gdf

In [10]:
for shp in list_shps:
    print(shp)
    
    # Add Fields
    for i in temp_path.glob(f'Nascente*/**/{shp}'):
        #print(i)
        # Read Data
        gdf = gpd.read_file(i)

        # Delete Column
        gdf.drop(
            ['nascente','Nascente', 'path'],
            axis=1,
            errors='ignore',
            inplace=True,
        )
        # Add Fields
        gdf['nascente'] = str(i.parent.name)
        gdf['path'] = str(i.parent)

        # Save Data
        gdf.to_file(i)
    
    # Merge Data
    gdf = merge_shp_by_name(shp, temp_path, geo_path)

APP.shp
APP_nascente.shp
APP_total.shp
Area_Drenagem.shp
Area_conservacao.shp
Area_drenagem.shp
Geologia.shp
Nascente.shp
Pontos_geofisica.shp
Recomposicao.shp
Uso_solo_APP.shp
Uso_solo_app_curso_dagua.shp
Uso_solo_app_nasc.shp
Uso_solo_area_drenagem.shp
area_Conservacao.shp
area_drenagem.shp


<br>

## Junta shapefiles Específicos

Após juntar todos os shapefiles em pastas, notei a existência de shapefiles que tem o mesmo tema, porém continham nomes distintos (por exemplo, "app.shp" e "App.shp").<br>
Esse problema na nomenclatura dos arquivos, impediu que os arquivos fossem unificados e, portanto, foi necessário escrever uma função que juntava os shapefiles, mantendo apenas o primeiro e deletando os restantes.

In [11]:
def merge_shp_specific(list_files):
    """
    Une shapefiles específicos, sobrepondo o primeiro da lista...
    Deletando os demais...
    """
    # Concatena
    gdf = gpd.GeoDataFrame(
        pd.concat(
            [gpd.read_file(i) for i in list_files],
            ignore_index=True
        ),
        crs=gpd.read_file(list_files[0]).crs
    )
    
    # Delete
    for file in list_files[1:]:
        if file.exists:
            file.unlink()
            print(f'"{file}" deletado!!')
        else:
            print(f'"{file}" não existe!')    

    # Save Output
    gdf.to_file(os.path.join(list_files[0]))
    return gdf.explore()

In [12]:
extension = 'gpkg'

In [13]:
merge_shp_specific(
    [
        geo_path / f'APP.{extension}',
        geo_path / f'APP_nascente.{extension}',
    ]
)

"/home/michel/Codes/open_gaema/acp-399-01/data/output/geo/APP_nascente.gpkg" deletado!!


In [14]:
merge_shp_specific(
    [
        geo_path / f'Area_conservacao.{extension}',
        geo_path / f'area_Conservacao.{extension}',
    ]
)

"/home/michel/Codes/open_gaema/acp-399-01/data/output/geo/area_Conservacao.gpkg" deletado!!


In [15]:
merge_shp_specific(
    [
        geo_path / f'area_drenagem.{extension}',
        geo_path / f'Area_Drenagem.{extension}',
        geo_path / f'Area_drenagem.{extension}',
    ]
)

"/home/michel/Codes/open_gaema/acp-399-01/data/output/geo/Area_Drenagem.gpkg" deletado!!
"/home/michel/Codes/open_gaema/acp-399-01/data/output/geo/Area_drenagem.gpkg" deletado!!


<br>

## Deleta Shapefiles

Após juntar o material que considerei útil para a etapa do meu trabalho, foi possível deletar o restante do material.

In [19]:
shutil.rmtree(temp_path, ignore_errors=True)