# Desafios 
- Tentar importar mais moradas e melhorar a qualidade do endereço de input
- Importar o Ficheiro "Ensino_Nao_Superior_Amadora.xlsx" utilizando Google ou Nomantim:
    - Ver o codigo de importar utilizando Bing, com a seguinte diferença
    ~~~Python
    # Inicializar o o geocodificador com o serviço Google
    geolocator = GoogleV3(api_key=google_api_key)

    # Funcao get_location_info para geocodificar endereco
    def get_location_info(address):
        try:
            location = geolocator.geocode(address)
            return location, location.raw['types']
        except:
            return None, None
    ~~~
    - Ver o codigo de importar utilizando Bing, com a seguinte diferença
    ~~~Python
    # Inicializar o o geocodificador com o serviço Nominatim
    geolocator = Nominatim(user_agent="my_geocoder")

    # Funcao get_location_info para geocodificar endereco
    def get_location_info(address):
        try:
            location = geolocator.geocode(address)
            return location, location.raw['osm_type']  # Adjust according to the response structure
        except:
            return None, None

    ~~~
    - Ajuda Geocoders GeoPY: https://geopy.readthedocs.io/en/latest/#geocoders
- Importar as escolas de Amadora utilizando o OSMnx (tag amenity e school)
    - Ver o exemplo neste notebook
- Visualizar os diferentes Resultados obtidos:
    - É possivel de utilizar o MatplotLib para visualizar, codigo exemplo (será necessário adicionar as outras gdf
    ~~~Python
    import contextily as ctx
    from shapely.geometry import Point

    # Criar variáveis para a figura
    f, ax = plt.subplots(1, figsize=(9, 9))

    # Visualizar a GDF
    gdfBing.plot(legend = False,
                   ax = ax,
                  color= 'green' )

    # Add basemap do contextily
    ctx.add_basemap(
        ax,
        crs=gdfGoogle.crs,
        source=ctx.providers.CartoDB.VoyagerNoLabels,
    )
    ~~~


**Atenção:** Cuidado com a quantidade de endereços a georrefenciar

## GeoReferenciar Dados Utilizando Google

Informação GeoPY e Nominatim: https://geopy.readthedocs.io/en/latest/#googlev3


In [None]:
import pandas as pd
from geopy.geocoders import GoogleV3
import geopandas as gpd
from shapely.geometry import Point

# Importar os Dados
inputfile = r"c:\temp\Ensino_Nao_Superior_Amadora.xlsx"
google_api_key = 'AIzaSyC-tGOoI4QrYNS3AgRuzOOMb_51Gd0RTic'

# Colunas CTT_COD e CTT_AUX são importados como números
columns_para_string = ['CTT_COD', 'CTT_AUX']

# Ler EXCEl e indicar que colunas CTT_COD e CTT_AUX são texto
df = pd.read_excel(inputfile, dtype={col: str for col in columns_para_string})

# Criar nova coluna com endereco
df['endereco'] = df['MORADA'] + ', ' + df['CTT_COD'] + ' ' + df['CTT_AUX'] + ', ' + df['LOCALIDADE']

# Importar apenas alguns registos
df = df.head(20)

# Inicializar o o geocodificador com o serviço Google
geolocator = GoogleV3(api_key=google_api_key)

# Funcao get_location_info para geocodificar endereco
def get_location_info(address):
    try:
        location = geolocator.geocode(address)
        return location, location.raw['types']
    except:
        return None, None

# Aplicando a função para obter a localização e a qualidade da resposta
df['location_info'] = df['endereco'].apply(get_location_info)

# Extraindo as coordenadas e a qualidade da resposta para colunas separadas
# Atenção a ordem longitude (x) e latitude (y)!
df['coordinates'] = df['location_info'].apply(lambda loc: (loc[0].longitude, loc[0].latitude) if loc[0] else None)
df['quality'] = df['location_info'].apply(lambda loc: loc[1] if loc[1] else None)

# Criar o GeoDataFrame com base nas coordenadas obtidas
geometry = [Point(xy) if xy else None for xy in df['coordinates']]
# Criar gdf de resultado - com indicação do CRS
gdfGoogle = gpd.GeoDataFrame(df, geometry=geometry, crs="EPSG:4326")

# Corrigir para registos onde não existe GeoMetry
# Neste caso a coluna geometry is Null
mask_valid_geometry = gdfGoogle['geometry'].notnull()

# Selecione os registros com geometria válida
gdfGoogle = gdfGoogle[mask_valid_geometry]

print (f"Nº de Registos do ficheiro: {len(df)}","\n",
      f"Nº de Registos resultado: {len(gdfGoogle)}")



# Mostrar parte do Resultado
print(gdfGoogle.head())



In [None]:
# Apagar atributo location_info 
gdfGoogle = gdfGoogle.drop(columns=['location_info'])
gdfGoogle.explore(marker_type = 'marker',edgecolor = 'black')

## Importar Dados Nominatim

Informação GeoPY e Nominatim: https://geopy.readthedocs.io/en/latest/#nominatim



In [None]:
import pandas as pd
from geopy.geocoders import Nominatim
import geopandas as gpd
from shapely.geometry import Point

# Importar os Dados
inputfile = r"c:\temp\Ensino_Nao_Superior_Amadora.xlsx"

# Colunas CTT_COD e CTT_AUX são importados como números
columns_para_string = ['CTT_COD', 'CTT_AUX']

# Ler EXCEl e indicar que colunas CTT_COD e CTT_AUX são texto
df = pd.read_excel(inputfile, dtype={col: str for col in columns_para_string})

# Criar nova coluna com endereco
df['endereco'] = df['MORADA'] + ', ' + df['CTT_COD'] + ' ' + df['CTT_AUX'] + ', ' + df['LOCALIDADE']

# Importar apenas alguns registos
df = df.head(20)

# Inicializar o o geocodificador com o serviço Nominatim
geolocator = Nominatim(user_agent="my_geocoder")

# Funcao get_location_info para geocodificar endereco
def get_location_info(address):
    try:
        location = geolocator.geocode(address)
        return location, location.raw['osm_type']  # Adjust according to the response structure
    except:
        return None, None

# Aplicando a função para obter a localização e a qualidade da resposta
df['location_info'] = df['endereco'].apply(get_location_info)

# Extraindo as coordenadas e a qualidade da resposta para colunas separadas
# Atenção a ordem longitude (x) e latitude (y)!
df['coordinates'] = df['location_info'].apply(lambda loc: (loc[0].longitude, loc[0].latitude) if loc[0] else None)
df['quality'] = df['location_info'].apply(lambda loc: loc[1] if loc[1] else None)

# Criar o GeoDataFrame com base nas coordenadas obtidas
geometry = [Point(xy) if xy else None for xy in df['coordinates']]
# Criar gdf de resultado - com indicação do CRS
gdfNominatim = gpd.GeoDataFrame(df, geometry=geometry, crs="EPSG:4326")

# Corrigir para registos onde não existe GeoMetry
# Neste caso a coluna geometry is Null
mask_valid_geometry = gdfNominatim['geometry'].notnull()

# Selecione os registros com geometria válida
gdfNominatim = gdfNominatim[mask_valid_geometry]

print (f"Nº de Registos do ficheiro: {len(df)}","\n",
      f"Nº de Registos resultado: {len(gdfNominatim)}")


# Mostrar GDf Resultado
print(gdfNominatim.head())



In [None]:
# Google não tem problema com o atributo location_info
gdfNominatim = gdfNominatim.drop(columns=['location_info'])
gdfNominatim.explore(marker_type = 'marker',edgecolor = 'black')

## Importar Dados BING





In [None]:
import pandas as pd
from geopy.geocoders import Bing
import geopandas as gpd
from shapely.geometry import Point

# Seus dados
inputfile = r"c:\temp\Ensino_Nao_Superior_Amadora.xlsx"
bing_api_key = 'At0TxnfnmV0hqD99JAtRPIZfPfQarPox_JCIPgRERq-cY99c1HLvqryhnkMLwIK0'

# Colunas CTT_COD e CTT_AUX são importados como numero
columns_para_string = ['CTT_COD', 'CTT_AUX']

# Leitura do arquivo Excel especificando os tipos de dados das colunas
df = pd.read_excel(inputfile, dtype={col: str for col in columns_para_string})

# Concatenando os atributos desejados para formar o endereço
df['endereco'] = df['MORADA'] + ', ' + df['CTT_COD'] + ' ' + df['CTT_AUX'] + ', ' + df['LOCALIDADE']

# Importar apenas alguns registos
df = df.head(20)

# Inicializando o geocodificador com o serviço Bing
geolocator = Bing(api_key=bing_api_key)

# Função para obter a localização e a qualidade da resposta
def get_location_info(address):
    try:
        location = geolocator.geocode(address)
        return location, location.raw['confidence']
    except:
        return None, None

# Aplicando a função para obter a localização e a qualidade da resposta
df['location_info'] = df['endereco'].apply(get_location_info)


# Extraindo as coordenadas e a qualidade da resposta para colunas separadas
# Atenção a ordem longitude (x) e latitude (y)!
df['coordinates'] = df['location_info'].apply(lambda loc: (loc[0].longitude, loc[0].latitude) if loc[0] else None)
df['quality'] = df['location_info'].apply(lambda loc: loc[1] if loc[1] else None)

# Criando o GeoDataFrame com base nas coordenadas obtidas
geometry = [Point(xy) if xy else None for xy in df['coordinates']]
# Criar gdf de resultado - com indicação do CRS
gdfBing = gpd.GeoDataFrame(df, geometry=geometry, crs="EPSG:4326")



# Corrigir para registos onde não existe GeoMetry
# Neste caso a coluna geometry is Null
mask_valid_geometry = gdfBing['geometry'].notnull()

# Selecione os registros com geometria válida
gdfBing = gdfBing[mask_valid_geometry]

print (f"Nº de Registos do ficheiro: {len(df)}","\n",
      f"Nº de Registos resultado: {len(gdfBing)}")


# Mostrar GeoDataFrame resultante
print(gdfBing.head())

gdfBing = gdfBing.drop(columns=['location_info'])
gdfBing.explore(marker_type = 'marker',edgecolor = 'black')


## Importar Dados OSM

Informação Tags: https://wiki.openstreetmap.org/wiki/Tag:amenity%3Dschool


In [None]:
import osmnx as ox
import geopandas as gpd
import matplotlib.pyplot as plt

# Definir o lugar para qual queremos dados
place = "Amadora, PT"

# Verificar Existencia Place
try:
    result = ox.geocoder.geocode(place)
    print(f"The geocoded result for {place} is: {result}")
except Exception as e:
    print(f"O place não existe: {place}")
    
tags = {"amenity": "school"}

try:
    gdf_school = ox.features_from_place(place, tags)
except Exception as e:
    print(f"Não existem elementos para este tag: {tags}")    

    
gdf_school.explore(marker_type = 'marker',
                  edgecolor = 'black')

## Mostrar todos os Resultados

_Codigo dá aviso, para evitar será necessário complicar bastante o código_


In [None]:
import contextily as ctx
from shapely.geometry import Point

# Criar variáveis para a figura
f, ax = plt.subplots(1, figsize=(9, 9))


# Visualizar a GDF
gdfBing.plot(label = 'Bing',
               ax = ax,
              color= 'green' )

# Visualizar a GDF
gdfNominatim.plot(label = 'Nomatim',
               ax = ax,
              color= 'purple' )

# Visualizar a GDF
gdfGoogle.plot(label = 'Google',
               ax = ax,
              color= 'red' )


# Visualizar a GDF
gdf_school.plot(label = 'OSM',
               ax = ax,
              color= 'blue' )

# Add basemap do contextily
ctx.add_basemap(
    ax,
    crs=gdfGoogle.crs,
    source=ctx.providers.CartoDB.VoyagerNoLabels,
)

ax.legend()
ax.set_axis_off()