# Filtering and Describing Geospatial Data

Neste notebook vamos definir as funçoes de descriçao e filtragem dos dados a partir das classes definidas na bilbioteca GeoPandas e Matplotlib

[Mapping and Plotting Tools](https://geopandas.org/docs/user_guide/mapping.html)

[Matplotlib](https://matplotlib.org/stable/tutorials/introductory/usage.html#sphx-glr-tutorials-introductory-usage-py)


 *IMPORTANTE*
- Com as funçoes definidas e testadas neste notebook, criaremos um arquivo .py no diretorio .scr/ para armazená-las, possibilitando assim, sua utilizaçao com a funçao import.

In [1]:
import pandas as pd

import geopandas as gpd 
import fiona

In [97]:
# Origem do banco de dados
from src.geopandas_custom import gdb

gdb()

'/home/ggrl/geodatabase/'

In [3]:
path = gdb('geodatabase.gpkg')

In [4]:
# Parametro para plot interativo
%matplotlib widget

## Importando os vetores do banco de dados criado no notebook passado.
- Escolha de camada e mapa
    - Caso nao tenha o mapa selecionado retorne lista de mapas disponiveis para aquela escala.
    - Caso nao escolha um mapa retorne todos os vetores daquela camada.

In [5]:
# IMPORTADOR DE LITOLOGIAS POR ESCALA --------------------------------------------------------------------------#
def importar_geometrias(camada, mapa=False):
    '''
    Recebe:
        camada      : camada vetorial a ser lida do geopackage.
        mapa        : nome do mapa presente na camada vetorial;

    Retorna:
        Objeto GeoDataFrame.
        
    Se houver seleçao de mapa retornara apenas as geometrias que possuem o nome escolhido na coluna ['MAPA']
    Se Retornar camada vazia recebera a lista das camadas veotoriais diposniveis
    Se mapa == False: retorna todos os objetos presente nesta camada vetorial
    '''
    lito =  gpd.read_file(path,
                        driver= 'GPKG',
                        layer= camada)

    if mapa:
        folha = lito[lito.MAPA == 'Carta geológica da folha ' + mapa]             # df[df.series]
        
        if folha.empty:

            print("O mapa escolhido nao est'a presente na coluna MAPA da camada veotiral. Os mapas disponiveis serao listados a seguir.")
            print('# Selecionando apenas os caracteres apos ''folha'' (SEM ESPAÇO)')
            print(f"# -- Lista de mapas: {list(lito.MAPA.unique())}")

            lista_mapas = list(lito.MAPA.unique())
            return lista_mapas

        else:    
            return(folha)

    else:
        return(lito)

###  Utilizando as funçoes definidas acima para importar os dados

In [6]:
# Abrindo os vetores descritivos dos projetos aerogeofisicos
proj_geof = importar_geometrias('proj_aerogeof')

In [7]:
df = proj_geof

In [8]:
df.ESPACAMENT

0       2.5
1       500
2      1500
3      1000
4       500
       ... 
291     2,5
292     250
293    1000
294    1000
295     500
Name: ESPACAMENT, Length: 296, dtype: object

In [9]:
#df[df.ESPACAMENT]

In [10]:
list(fiona.listlayers(gdb('geodatabase.gpkg')))

['litologia_1kk',
 'litologia_250k',
 'litologia_100k',
 'litologia_50k',
 'ocorr_min_cprm',
 'aflora',
 'am_petro',
 'proj_cprm',
 'proj_aerogeof',
 'socorro_250k']

In [11]:
proj_geof.columns

Index(['ID_PROJETO', 'TITULO', 'METODOS', 'ALTURA_VOO', 'AREA_LEVAN',
       'QUILOMETRA', 'DIRECAO_LV', 'DIRECAO_LC', 'ESPACAMENT', 'ESPACAME_1',
       'ID_SERIE', 'SERIE', 'DISPONIBIL', 'IMAGENS', 'SHAPE_AREA', 'SHAPE_LEN',
       'geometry'],
      dtype='object')

In [12]:
print(f'Lista de espaçamentos disponíveis: {list(proj_geof.ESPACAMENT.unique())}')

Lista de espaçamentos disponíveis: ['2.5', '500', '1500', '1000', '3000', '2000', '3', '0', '250', '150', '200', '2500', '100', '4000', '2', '125', '400', '300', '1', '5', '4', '2,5', '6000', '8000', '6', '1,5', '7']


In [13]:
litologia_1kk = importar_geometrias('litologia_1kk')
# litologia_100k = importar_geometrias('litologia_100k')
# litologia_50k = importar_geometrias('litologia_50k')

## Descrevendo as caracteristicas dos dados

In [14]:
litologia_1kk.head(5)

Unnamed: 0,ID_UNIDADE,SIGLA,HIERARQUIA,NOME,AMBIENTE_T,SUB_AMBIEN,SIGLA_PAI,NOME_PAI,LEGENDA,ESCALA,...,ERA_MIN,ERA_MAX,SISTEMA_MI,SISTEMA_MA,EPOCA_MIN,EPOCA_MAX,SIGLAS_HIS,SHAPE_AREA,SHAPE_LEN,geometry
0,1506,Q1t,Unidade,Unidade Terraços fluviais,Cobertura superficial,Cobertura transportada(Clástica),,,Correspondem a amplos depósitos sedimentares c...,1:1.000.000,...,Cenozóico,Cenozóico,Neogeno,Neogeno,Superior,Superior,,0.002355,0.326835,"POLYGON ((-72.72785 -8.38730, -72.73120 -8.384..."
1,2054,K2ra,Formação,Formação Rio Azul,,,,,Folhelho cinza a castanho e arenito fino com n...,1:1.000.000,...,Mesozóico,Mesozóico,Cretáceo,Cretáceo,Inferior,Inferior,,0.005557,0.499255,"POLYGON ((-73.73806 -7.33994, -73.73616 -7.343..."
2,214,N12s,Formação,Formação Solimões,,,,,"Sedimento pelítico, flúvio lacustre, contendo ...",1:1.000.000,...,Cenozóico,Cenozóico,Neogeno,Neogeno,Superior,Superior,E2N2s,0.276915,3.84733,"MULTIPOLYGON (((-72.00000 -8.00000, -72.03095 ..."
3,1506,Q1t,Unidade,Unidade Terraços fluviais,Cobertura superficial,Cobertura transportada(Clástica),,,Correspondem a amplos depósitos sedimentares c...,1:1.000.000,...,Cenozóico,Cenozóico,Neogeno,Neogeno,Superior,Superior,,0.03378,1.492084,"POLYGON ((-72.00000 -7.25284, -72.00048 -7.253..."
4,214,N12s,Formação,Formação Solimões,,,,,"Sedimento pelítico, flúvio lacustre, contendo ...",1:1.000.000,...,Cenozóico,Cenozóico,Neogeno,Neogeno,Superior,Superior,E2N2s,2.23993,16.631079,"POLYGON ((-68.99004 -8.79511, -68.98310 -8.798..."


In [15]:
print(litologia_1kk.columns)

Index(['ID_UNIDADE', 'SIGLA', 'HIERARQUIA', 'NOME', 'AMBIENTE_T', 'SUB_AMBIEN',
       'SIGLA_PAI', 'NOME_PAI', 'LEGENDA', 'ESCALA', 'MAPA', 'LITOTIPOS',
       'RANGE', 'IDADE_MIN', 'IDADE_MAX', 'EON_MIN', 'EON_MAX', 'ERA_MIN',
       'ERA_MAX', 'SISTEMA_MI', 'SISTEMA_MA', 'EPOCA_MIN', 'EPOCA_MAX',
       'SIGLAS_HIS', 'SHAPE_AREA', 'SHAPE_LEN', 'geometry'],
      dtype='object')


In [16]:
meta_lito_1kk = pd.DataFrame(litologia_1kk.dtypes)
meta_lito_1kk['Valores null'] = litologia_1kk.isnull().sum()
meta_lito_1kk['Valores unicos'] = litologia_1kk.nunique()
meta_lito_1kk                                                                   # NEED TO CREATE A SYSTEM TO GENERATE A DATAFRAME FOR EACH LITOSTRATIGRAPHIC LAYER
                                                                                # TO DO SO, WE COULD CREATE AN UPPER INDEX FOR EACH LAYER CONTAINING ALL THIS INDECES.

Unnamed: 0,0,Valores null,Valores unicos
ID_UNIDADE,int64,0,2334
SIGLA,object,0,2334
HIERARQUIA,object,0,30
NOME,object,0,2299
AMBIENTE_T,object,30843,9
SUB_AMBIEN,object,37895,28
SIGLA_PAI,object,31035,380
NOME_PAI,object,31035,380
LEGENDA,object,13,2095
ESCALA,object,0,1


### Here we can define a function to execute this operation for any layer

In [17]:
def metadataframe(GeoDataFrame):
    '''
    Recebe : 
        GeoDataFrame Object : Camadas vetoriais de unidades litoestratigráficas;
        
        Retorna :
            DataFrame Object: Planílha com metanálise das camadas vetoriais;
    '''
    print(f'# -- Gerando MetaDataFrame Litoestratigráfico')
    type_dataframe = pd.DataFrame(GeoDataFrame.dtypes)               # Describe the dtype of each column from the DataFrame or, better saying, GeoDataFrame;

    type_dataframe['Valores null']   = GeoDataFrame.isnull().sum()   # Describe the sum of each null value from our object
    type_dataframe['Valores unicos'] = GeoDataFrame.nunique()        # Describe the number of unique values from our object, that is a GeoDataFrame

    meta_dataframe_litologico = type_dataframe.rename(columns = {0 : 'dType'})       # Rename the first column to 'dtype', the name of the function we used.

    print('')
    
    return meta_dataframe_litologico

In [19]:
# The above function was inserted inside the /sources/descricao.py file;
# So we can import the funcion with this command wennerver we need it

In [20]:
litologia_250k = importar_geometrias('litologia_250k')
metadataframe(litologia_250k)
#metadataframe(litologia_100k)
#metadataframe(litologia_50k)


# -- Gerando MetaDataFrame Litoestratigráfico



Unnamed: 0,dType,Valores null,Valores unicos
ID_UNIDADE,int64,0,916
SIGLA,object,0,916
HIERARQUIA,object,0,19
NOME,object,0,912
AMBIENTE_T,object,12105,8
SUB_AMBIEN,object,13724,35
SIGLA_PAI,object,10240,211
NOME_PAI,object,10240,211
LEGENDA,object,10,902
ESCALA,object,0,1


### We can observe and analyse by the same means our aerogeophysical metadata.

In [21]:
metadataframe(proj_geof)       # WE CONCLUDE BY OBSERVING THIS DATAFRAME THAT THE 'TITULO' COLUMN EATHER HAS AN DUPLICATED VALUE
                               # BECAUSE WE HAVE 296 GEOMETRIES AND 295 DIFERENT TITLES

# -- Gerando MetaDataFrame Litoestratigráfico



Unnamed: 0,dType,Valores null,Valores unicos
ID_PROJETO,int64,0,296
TITULO,object,0,295
METODOS,object,0,15
ALTURA_VOO,object,31,21
AREA_LEVAN,object,0,264
QUILOMETRA,object,94,199
DIRECAO_LV,object,0,32
DIRECAO_LC,object,0,34
ESPACAMENT,object,0,27
ESPACAME_1,object,4,31


## Com os dados disponiveis na RAM podemos utilizar funçoes do built-in do Python ou funçoes disponibilizadas atravez das bibliotecas podemos produzir informaçoes importantes sobre o nosso dado.

#### Como por exemplo, calcular area de cobertura do dado.

In [22]:
area_lito_1kk = litologia_1kk[:].area.sum()
print(area_lito_1kk)

# We can observe that the calculation of the area should be done with a cartesian coordinate reference system instead of geographic for more accurate results
# Although, our coverage area is not inside only one UTM Zone, so we need to create a system to convert each geometry to it's correspodent Zone.

699.2119915387831



  area_lito_1kk = litologia_1kk[:].area.sum()


In [23]:
litologia_1kk['SHAPE_AREA'].sum() # We can observe that the area of the polygons have already been calculated and is stored at 'SHAPE_AREA' column

699.2119915384314

In [24]:
print(litologia_1kk['SHAPE_AREA'].sum() - area_lito_1kk) # The result is the difference between the Area calculated by the CRPM and the area calculated by the GeoPandas Function

-3.516333890729584e-10


In [25]:
# SELECTING AEROGEOPHYSICAL PROJECTS BY ITS FLIGHT LINE SPACEMENT [RESOLUTION]
proj_geof_500m = proj_geof[proj_geof['ESPACAMENT'] == '500']
proj_geof_1000m = proj_geof[proj_geof['ESPACAMENT'] == '1000']

In [26]:
print(f" The total coverage area of projects with 500 m resolution: {proj_geof_500m['SHAPE_AREA'].sum()}")
print(f" The total coverage area of projects with 1000 m resolution: {proj_geof_1000m['SHAPE_AREA'].sum()}")

 The total coverage area of projects with 500 m resolution: 325.81878046663854
 The total coverage area of projects with 1000 m resolution: 100.8120406558254


In [27]:
print(f" The total coverage area of projects with 500 m resolution: {proj_geof_500m[:].area.sum()}")

print(f" The total coverage area of projects with 1000 m resolution: {proj_geof_1000m[:].area.sum()}")

 The total coverage area of projects with 500 m resolution: 325.81878041879565
 The total coverage area of projects with 1000 m resolution: 100.81204065019355



  print(f" The total coverage area of projects with 500 m resolution: {proj_geof_500m[:].area.sum()}")

  print(f" The total coverage area of projects with 1000 m resolution: {proj_geof_1000m[:].area.sum()}")


In [28]:
print(f"Percentage of aerogeophysical data coverage of the continental area with 500m resolution: {(proj_geof_500m['SHAPE_AREA'].sum()  / litologia_1kk['SHAPE_AREA'].sum()) * 100} %")
print(f"Percentage of aerogeophysical data coverage of the continental area with 1000m resolution: {(proj_geof_1000m['SHAPE_AREA'].sum() / litologia_1kk['SHAPE_AREA'].sum()) * 100} %")

Percentage of aerogeophysical data coverage of the continental area with 500m resolution: 46.597996660463494 %
Percentage of aerogeophysical data coverage of the continental area with 1000m resolution: 14.417950761115398 %


### Listando atributos geologicos das geometrias importadas.

In [29]:
# Abrindo os vetores litológicos de um unico mapa utilizando a função definida acima
#varginha_100k = importar_geometrias('litologia_100k','Varginha - UFRJ')
#varginha_100k.head(5)

In [30]:
# com estas funçoes utilizadas asssimas, podemos definir uma funçao que descreve o nosso dado vetorial
def describe_geologico(gdf):
    lista_colunas = list(gdf.columns)
    lista_litotipos = list(gdf.LITOTIPOS.unique())
    lista_legenda = list(gdf.LEGENDA.unique())

    dic_litologico = {'lista_colunas': lista_colunas,
                      'lista_litotipos': lista_litotipos,
                      'lista_legenda': lista_legenda}
    return dic_litologico   

In [31]:
dic_litoligico = describe_geologico(litologia_1kk)

### Reconhecendo as litologia mapeadas em suas escalas
- Faremos um filtro na coluna LEGENDA e LITOTIOPOS para selecionar as classes de interesse e, com estas geometrias, selecionaremos os mapas que as contém.
- Assim podemos identificar quais cartas geológicas e suas escalas podemos trabalhar.

In [32]:
def filtro(gdf,mineral):
    filtrado = gdf[gdf['LITOTIPOS'].str.contains(mineral)]
    if filtrado.empty:
        print(f"{list(gdf['LITOTIPOS'].unique())}")
    else:
        return filtrado

In [33]:
litologia_grafitosa_1kk = filtro(litologia_1kk,'graf')

In [34]:
litotipos_vazio = litologia_1kk[litologia_1kk.LITOTIPOS.isna()]
litotipos_vazio.LITOTIPOS

Series([], Name: LITOTIPOS, dtype: object)

In [35]:
#Foi necessário inserir a str 'Vazio' em celas que não continham valores para que a função de filtro funcionasse corretamente na coluna LEGENDA.

litologia_1kk.fillna('Vazio',inplace=True)
litologia_250k.fillna('Vazio',inplace=True)

litologia_100k = importar_geometrias('litologia_100k')
litologia_100k.fillna('Vazio',inplace=True)

litologia_50k = importar_geometrias('litologia_50k')
litologia_50k.fillna('Vazio',inplace=True)

In [38]:
litologia_1kk.to_file(gdb('geodatabase.gpkg'),
              driver='GPKG',
              layer='litologia_1kk')

litologia_250k.to_file(gdb('geodatabase.gpkg'),
              driver='GPKG',
              layer='litologia_250k')

litologia_100k.to_file(gdb('geodatabase.gpkg'),
              driver='GPKG',
              layer='litologia_100k')

litologia_50k.to_file(gdb('geodatabase.gpkg'),
              driver='GPKG',
              layer='litologia_50k')

In [67]:
Grafita_xistos_1kk = filtro(litologia_1kk,'Graf')

In [68]:
dicionario_grafitoso = describe_geologico(Grafita_xistos_1kk)

In [71]:
len(dicionario_grafitoso['lista_litotipos'])

29

In [73]:
lista_grafita = dicionario_grafitoso['lista_litotipos']

In [90]:
associacao_grafitosa=[]

for i in lista_grafita:
    split = i.split(",")
    associacao_grafitosa.append(split)    

In [96]:
associacao_grafitosa[:10]

[['Anfibolito', ' Grafita xisto', ' Metapelito', ' Quartzito'],
 ['Formação ferrífera bandada',
  ' Grafita xisto',
  ' Metachert',
  ' Rocha metassedimentar',
  ' Rocha metavulcânica ultramáfica',
  ' Serpentinito'],
 ['Biotita-anfibólio xisto',
  ' Biotita-quartzo xisto',
  ' Filito',
  ' Grafita xisto',
  ' Mármore calcítico',
  ' Mármore dolomítico',
  ' Metatufo',
  ' Quartzo-mica xisto',
  ' Rocha calcissilicática',
  ' Xisto carbonático'],
 ['Clorita xisto',
  ' Grafita xisto',
  ' Hornblenda gnaisse',
  ' Metacalcário',
  ' Muscovita quartzito',
  ' Muscovita-biotita xisto',
  ' Quartzito ferruginoso',
  ' Talco xisto'],
 ['Clorita xisto',
  ' Grafita xisto',
  ' Metachert',
  ' Metadacito',
  ' Metatufo',
  ' Xisto'],
 ['Biotita gnaisse',
  ' Gnaisse',
  ' Gondito',
  ' Grafita xisto',
  ' Granada gnaisse',
  ' Kinzigito',
  ' Mármore',
  ' Muscovita quartzito',
  ' Quartzito',
  ' Rocha calcissilicática',
  ' Sericita xisto',
  ' Xisto'],
 ['Grafita xisto',
  ' Metachert',
  

#### Desafio desnecessário para provar meus conhecimentos com for loops:

In [42]:
mapas_lito_gr_100k = litologia_100k

In [46]:
indice=0
for i in mapas_lito_gr_100k:
    print(i)
    list_gr_100k[indice] = litologia_100k[litologia_100k['MAPA'].str.contains("i")]
    indice+=1


ID_UNIDADE


ValueError: Wrong number of items passed 27, placement implies 1

In [47]:
len(list_gr_100k)

59268

In [48]:
lista_mapa = list(litologia_1kk.MAPA.unique())
print(len(lista_mapa))
lista_nome=[]

for mapa in lista_mapa:
    trash=0
    Mapa=[]
    
    for letra in mapa:
        if trash<25:
            trash+=1
            
        else:
            Mapa+=letra
            
    lista_nome += [''.join(Mapa)]

45


In [57]:
lista_nome

[                                                                                  geometry  \
 MAPA                                                                                         
 Carta geológica da folha Paulo Saldanha  POLYGON ((-62.00000 -11.97996, -62.00000 -12.0...   
 
                                          ID_UNIDADE   SIGLA HIERARQUIA  \
 MAPA                                                                     
 Carta geológica da folha Paulo Saldanha        3844  MP3rbm    Unidade   
 
                                                                    NOME  \
 MAPA                                                                      
 Carta geológica da folha Paulo Saldanha  Unidade Rio Branco, metamáfica   
 
                                         AMBIENTE_T SUB_AMBIEN SIGLA_PAI  \
 MAPA                                                                      
 Carta geológica da folha Paulo Saldanha      Vazio      Vazio     MP3rb   
 
                          

In [50]:
folha=lista_nome
indice=0

for i in lista_nome:
    print(i)
    folha[indice] = litologia_1kk[litologia_1kk['MAPA'].str.contains(i)].dissolve('MAPA')
    indice+=1

Contamana
Javari
Rio Branco
Juruá
Içá
Pico da Neblina
Guaporé
Porto Velho
Purus
Manaus
Boa Vista
Corumbá
Cuiabá
Juruena
Tapajós
Santarém
Tumucumaque
Uruguaiana
Campo Grande
Asunción
Lagoa Mirim
Porto Alegre
Curitiba
Paranapanema
Goiânia
Goiás
Tocantins
Araguaia
Belém
Macapá
Iguape
Rio de Janeiro
Belo Horizonte
Brasília
Rio São Francisco
Teresina
São Luis
Vitória
Rio Doce
Salvador
Aracaju
Jaguaribe
Fortaleza
Recife
Natal


In [51]:
folha[31].plot()

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

<AxesSubplot:>

In [52]:
lista_mapa = list(litologia_100k.MAPA.unique())
lista_mapa

['Carta geológica da folha Paulo Saldanha',
 'Carta geológica da folha Rio Tanaru - SD.20-X-B-IV',
 'Carta geológica da folha Roncador',
 'Carta geológica da folha Rio Pardo',
 'Carta geológica da folha Pimenta Bueno',
 'Carta geológica da folha Serra da Providência',
 'Carta geológica da folha Ji Paraná',
 'Carta geológica da folha Vila Nova',
 'Carta geológica da folha Vila de Tepequém',
 'Carta geológica da folha Betânia - UFMT',
 'Carta geológica da folha Rio Escondido',
 'Carta geológica da folha Ilha do Porto',
 'Carta geológica da folha Porto Triunfo SD.20-X-B-V',
 'Carta geológica da folha NA-20-Z-D-III',
 'Carta geológica da folha Novo Paraíso',
 'Carta geológica da folha Santa Rita - UFMT',
 'Carta geológica da folha Santa Barbara - UFMT',
 'Carta geológica da folha Serra da Borda',
 'Carta geológica da folha Rio Novo',
 'Carta geológica da folha Rio Pindaituba - UFMT',
 'Carta geológica da folha Vila Oeste',
 'Carta geológica da folha Jauru - UFMT',
 'Carta geológica da folh

In [64]:
lista_nome=[]

for mapa in lista_mapa:
    trash=0
    Mapa=[]
    
    for letra in mapa:
        if trash<25:
            trash+=1
            
        else:
            Mapa+=letra
            
    lista_nome += [''.join(Mapa)]

In [65]:
len(lista_nome)

311

In [66]:
folha=lista_nome
indice=0

for i in lista_nome:
    print(i)
    folha[indice] = litologia_100k[litologia_100k['MAPA'].str.contains(i)].dissolve('MAPA')
    indice+=1

Paulo Saldanha
Rio Tanaru - SD.20-X-B-IV
Roncador
Rio Pardo
Pimenta Bueno
Serra da Providência
Ji Paraná
Vila Nova
Vila de Tepequém
Betânia - UFMT
Rio Escondido
Ilha do Porto
Porto Triunfo SD.20-X-B-V
NA-20-Z-D-III
Novo Paraíso
Santa Rita - UFMT
Santa Barbara - UFMT
Serra da Borda
Rio Novo
Rio Pindaituba - UFMT
Vila Oeste
Jauru - UFMT
Rio Branco - UFMT
Ilha Porto Escondido
Colônia São Lourenço
Fazenda Santa Otília
Aldeia Tomázia
Rio Perdido
Fazenda Margarida
Vila Campão
São Domingos
Rio Ratão
Cuiú-Cuiú
Cachoeira Seca
Vila Planalto
Ilha Mambuai
Uruá
Barão de Melgaço - UFMT
Rio Nhandu
Jardim do Ouro
Igrejinha - UNISINOS
Bagé
Aceguá
Lagoa da Meia Lua
Brasilândia
Cacimba
Paranatinga
Rio Braço Sul
Serra do Cachimbo
Curral de Pedras
Arroio Grande
Jaguarão
Passo São Diogo
Hulha Negra
Pinheiro Machado
Lavras do Sul
Santa Maria - RS
Sobradinho
Agudo
Três Passos
Frederico Westphalen
Matarazzo
Pelotas
Pedro Osório
Placa Nativa
Nova Xavantina
Rio Bacajá - UFPR
Gravataí - UFRGS
Sanclerlândia
Rio In

KeyboardInterrupt: 

In [58]:
len(folha)

311