# Uso do solo

**Descrição:** importação dos dados de uso do solo de todos os municípios do Brasil.

**Fonte:** arquivo XLS com soma de áreas por categoria para todos os municípios do Brasil de 1985 a 2022 obtidos junto ao MabBiomas.

**Saída:** arquivos CSV o total de área por município assim como os totais por categpria apenas os municípios do estado de São Paulo.

## Conexão ao Google Drive

In [None]:
from google.colab import drive
drive.mount('/content/drive', force_remount=True)


## Leitura das variáveis de ambiente

In [None]:
!pip install python-dotenv

In [None]:
from dotenv import load_dotenv
from pathlib import Path
import os

caminho_env = open("drive/MyDrive/caminho_env.txt").readline()

# indicação do caminho do env
dotenv_path = Path(caminho_env)

load_dotenv(dotenv_path=dotenv_path)

# indicar o caminho de leitura dos arquivos de entrada
input = os.getenv("DADOS_ENTRADA_CONTEXTO")
# pasta onde serão armazenados os arquivos csv
output = os.getenv("DADOS_SAIDA")

## Importação do arquivo no formato XLSX

In [None]:
import pandas as pd

# esse arquivo não está salvo no repositório por conta do seu tamanho grande. Mas você pode baixá-lo direto do site do MapBiomas (ver referências no readme).
df = pd.read_excel(input + "estats_mapbiomas.xlsx", sheet_name="LAND COVER")

df.head()

In [None]:
df.columns = ['state',       'city',   'geo_code', 'feature_id',      'index',
         'class_id',    'level_0',    'level_1',    'level_2',    'level_3',
          'level_4',      'color',   'category',         '1985',        '1986',
               '1987',         '1988',         '1989',         '1990',         '1991',
               '1992',         '1993',         '1994',         '1995',         '1996',
               '1997',         '1998',         '1999',         '2000',         '2001',
               '2002',         '2003',         '2004',         '2005',         '2006',
               '2007',         '2008',         '2009',         '2010',         '2011',
               '2012',         '2013',         '2014',         '2015',         '2016',
               '2017',         '2018',         '2019',         '2020']

## Seleção dos municípios de SP

In [None]:
df=df[df.state=='SP']
df=df[df.category=='city']

In [None]:
df = df[['city','level_0','level_1','level_2','level_3','level_4','2015','2016','2017','2018','2019']]
df.fillna(0,inplace = True)
df.head()

## Cálculo da área total considerando o ano de 2015

Por que 2015? Ano inicial do período utilizado na pesquisa. Você pode escolher um ano mais recente, dependendo do seu objetivo.

In [None]:
dfarea = pd.DataFrame(df.groupby(["city"])["2015"].sum()).reset_index()
dfarea.columns = ["nome", "area"]
dfarea

## Armazenamento dos dados de área

In [None]:
dfarea.to_csv(output + "lista_area_SP.csv")

## Armazenamento dos dados por categoria

Obs: Antes foi necessário realizar uma transformação nos nomes de quatro municípios, devido a divergências nas grafias entre as bases.

In [None]:
df['city'] = df['city'].str.replace('Florinea','Florínia')
df['city'] = df['city'].str.replace('São Luis do Paraitinga','São Luís do Paraitinga')
df['city'] = df['city'].str.replace('Biritiba Mirim','Biritiba-Mirim')
df['city'] = df['city'].str.replace('Itaoca','Itaóca')

# armazenamento
df.to_csv(output + "lista_uso_solo.csv")