**Entendendo o H3**

Fonte: https://h3geo.org/docs/library/index/cell

O h3 location_id = 8aa8a02c355ffff é um identificador único de uma célula em um determinado nível de resolução na grade H3. Para entender o que ele significa, vamos decompor o índice conforme descrito:
- Bits reservados e configurados para 0 (1 bit): O primeiro bit do índice é reservado e sempre será 0.
- Modo do H3 Cell (4 bits): A seguir, há 4 bits que indicam o modo. O modo para um H3 Cell index é 1, o que identifica o índice como um hexágono ou pentágono.
- Bits reservados e configurados para 0 (3 bits): Estes 3 bits são reservados e sempre são 0.
- Resolução da célula (4 bits): Depois, há 4 bits que indicam a resolução da célula. A resolução pode variar de 0 a 15. A resolução determina o tamanho do hexágono: *quanto maior a resolução, menor o hexágono*.
- Base cell (7 bits): A base cell é identificada pelos próximos 7 bits, variando de 0 a 121. Cada base cell corresponde a um hexágono de nível 0 na grade H3.
- Subsequente de dígitos (45 bits no total): Finalmente, temos 3 bits para cada dígito subsequente que identificam as células em níveis de resolução maiores. Para resoluções não utilizadas, os bits são preenchidos com 7.

O valor hexadecimal "8aa8a02c355ffff" convertido para binário é:
0000100010101010100010100000001011000011010101011111111111111111
De acordo com a estrutura do H3 Cell index:
- 1 bit reservado e configurado para 0: 0
- 4 bits para o modo: 0001 (indica o modo H3 Cell)
- 3 bits reservados e configurados para 0: 000
- 4 bits para a resolução da célula: 1010 (resolução 10)
- 7 bits para a base cell: 1010101 (base cell 85)
- 3 bits para cada dígito subsequente até a resolução 15(não usada)

Resumo dos componentes:
- Modo: 1 (H3 Cell)
- Resolução: 10
- Base Cell: 85
- Dígitos subsequentes: 000, 000, 010, 110, 000, 011, 010, 101, 101, 111, 111 (até a resolução 10)

Resolução 10 (RJ):
Quando dizemos que a resolução é 10, estamos nos referindo a um hexágono que é muito mais detalhado do que aqueles em resoluções mais baixas. Especificamente, a cada aumento de resolução, um hexágono é subdividido em 7 hexágonos de nível mais alto, tornando-os menores.

Ha resoluções diferentes para outras áreas do Brasil 
Resoluções encontradas: [10  8 12  5  6]

Este tamanho de hexágono é utilizado para mapear áreas relativamente pequenas com alta precisão geoespacial, como bairros ou pequenas porções de uma cidade. É útil para aplicações que requerem análise espacial detalhada, como rastreamento de mobilidade humana ou análise de padrões urbanos.

**H3 Index Inspector**

https://observablehq.com/@nrabinowitz/h3-index-inspector?collection=@nrabinowitz/h3

"8aa8a02c355ffff"
- cellArea	15,522.990 m2
- avg edge length	77.336366 m

"8aa884084077fff"
- cellArea	15,843.914 m2
- avg edge length	78.121905 m

centro do RIO: "8aa8a06a0c6ffff"

In [None]:
import pandas as pd
# Carregar o arquivo com os índices H3
# file_path = '/Users/andreza/mobility_economics_climate/data/h3_visitation_daily_RJ.csv'
# df = pd.read_csv(file_path)
file_path = '/Users/andreza/mobility_economics_climate/data/h3_visitation_daily.parquet'
df = pd.read_parquet(file_path)

In [None]:
def h3_resolution(h3_index):
    """Função para extrair a resolução de um índice H3."""
    # Converte o índice H3 de hexadecimal para binário
    h3_bin = bin(int(h3_index, 16))[2:].zfill(64)
    # Os bits 16 a 19 (baseado em zero) são a resolução (posição 12 a 15 em notação zero-indexed)
    resolution_bits = h3_bin[12:16]
    return int(resolution_bits, 2)

# Aplicando a função à coluna location_id
df['resolucao'] = df['location_id'].apply(h3_resolution)

# Verifica se todos os índices têm a mesma resolução
resolutions = df['resolucao'].unique()
print("Resoluções encontradas:", resolutions)

# Salvar o DataFrame com as resoluções em um novo arquivo CSV
#df.to_csv('output_resolutions.csv', index=False)

# verificar se todas as resoluções são iguais a 10:
if all(df['resolucao'] == 10):
    print("Todos os índices têm resolução 10.")
else:
    print("Existem índices com resoluções diferentes de 10.")


In [None]:
pip install h3

In [None]:
pip install geopy

In [None]:
from shapely.geometry import Point
import h3
from geopy.distance import geodesic

# Coordenadas aproximadas da capital Rio de Janeiro
rio_de_janeiro_coords = (-22.9068, -43.1729)  # (latitude, longitude)

# Função para calcular a distância geodésica entre dois pontos
def calculate_distance(point_coords, reference_coords):
    return geodesic(point_coords, reference_coords).meters

# Função para extrair a latitude e longitude do ponto da coluna 'geometry'
def extract_coords(geometry):
    point = Point(map(float, geometry.strip('POINT ()').split()))
    return (point.y, point.x)

# Extrair as coordenadas de cada ponto e calcular a distância para o Rio de Janeiro
df['coords'] = df['geometry'].apply(extract_coords)
df['distance_to_rio'] = df['coords'].apply(lambda x: calculate_distance(x, rio_de_janeiro_coords))

# Identificar o hexágono com a menor distância
closest_hexagon = df.loc[df['distance_to_rio'].idxmin()]

print("O hexágono mais próximo do Rio de Janeiro tem o location_id:", closest_hexagon['location_id'])
print("Distância:", closest_hexagon['distance_to_rio'], "metros")

# salvar o DataFrame atualizado
#df.to_csv('output_with_distances.csv', index=False)


**testando as visualizações **

Fonte: https://github.com/uber/h3-py-notebooks/blob/master/notebooks/usage.ipynb

In [None]:
from h3 import h3
import folium

def visualize_hexagons(hexagons, color="red", folium_map=None):
    """
    hexagons is a list of hexcluster. Each hexcluster is a list of hexagons. 
    eg. [[hex1, hex2], [hex3, hex4]]
    """
    polylines = []
    lat = []
    lng = []
    for hex in hexagons:
        polygons = h3.h3_set_to_multi_polygon([hex], geo_json=False)
        # flatten polygons into loops.
        outlines = [loop for polygon in polygons for loop in polygon]
        polyline = [outline + [outline[0]] for outline in outlines][0]
        lat.extend(map(lambda v:v[0],polyline))
        lng.extend(map(lambda v:v[1],polyline))
        polylines.append(polyline)
    
    if folium_map is None:
        m = folium.Map(location=[sum(lat)/len(lat), sum(lng)/len(lng)], zoom_start=13, tiles='cartodbpositron')
    else:
        m = folium_map
    for polyline in polylines:
        my_PolyLine=folium.PolyLine(locations=polyline,weight=8,color=color)
        m.add_child(my_PolyLine)
    return m
    

def visualize_polygon(polyline, color):
    polyline.append(polyline[0])
    lat = [p[0] for p in polyline]
    lng = [p[1] for p in polyline]
    m = folium.Map(location=[sum(lat)/len(lat), sum(lng)/len(lng)], zoom_start=13, tiles='cartodbpositron')
    my_PolyLine=folium.PolyLine(locations=polyline,weight=8,color=color)
    m.add_child(my_PolyLine)
    return m

In [None]:
h3_address = h3.geo_to_h3(-22.90735663821551, -43.172684427576876, 10) # lat, lng, hex resolution  
#(37.3615593, -122.0553238, 9)

m = visualize_hexagons([h3_address])
display(m)

In [None]:
# h3_address = (-22.90735663821551, -43.172684427576876, 10) # lat, lng, hex resolution                                                                                                        
h3_address = ('8aa8a06a0c6ffff') # index h3
hex_center_coordinates = h3.h3_to_geo(h3_address) # array of [lat, lng]                                                                                                                  
hex_boundary = h3.h3_to_geo_boundary(h3_address) # array of arrays of [lat, lng]                                                                                                                                                                                                                                                         
m = visualize_hexagons(list(h3.k_ring_distances(h3_address, 4)[3]), color="purple")
m = visualize_hexagons(list(h3.k_ring_distances(h3_address, 4)[2]), color="blue", folium_map=m)
m = visualize_hexagons(list(h3.k_ring_distances(h3_address, 4)[1]), color="green", folium_map=m)
m = visualize_hexagons(list(h3.k_ring_distances(h3_address, 4)[0]), color = "red", folium_map=m)
display(m)

In [None]:
# indexes vizinhos rio centro
# 8aa8a06a0137fff, 8aa8a06a0c47fff, 8aa8a06a0c4ffff, 8aa8a06a0897fff, 8aa8a06a089ffff, 8aa8a06a0c67fff

# Defina os índices H3
h3_indexes = [
    "8aa8a06a0137fff",
    "8aa8a06a0c47fff",
    "8aa8a06a0c4ffff",
    "8aa8a06a0897fff",
    "8aa8a06a089ffff",
    "8aa8a06a0c67fff"
]

# Crie o mapa centrado na média dos hexágonos
lat_lng = [h3.h3_to_geo(h) for h in h3_indexes]
avg_lat = sum([coord[0] for coord in lat_lng]) / len(lat_lng)
avg_lng = sum([coord[1] for coord in lat_lng]) / len(lat_lng)
m = folium.Map(location=[avg_lat, avg_lng], zoom_start=13, tiles='cartodbpositron')

# Adicione cada hexágono ao mapa
for h in h3_indexes:
    hex_boundary = h3.h3_to_geo_boundary(h, geo_json=False)
    hex_boundary = list(hex_boundary)  # Converte a lista de tuplas para uma lista de listas
    hex_boundary.append(hex_boundary[0])  # Feche o loop do polígono
    my_PolyLine = folium.PolyLine(locations=hex_boundary, weight=8, color='red')
    m.add_child(my_PolyLine)

# Exibir o mapa
m



In [None]:
from h3 import h3
import folium

# Carregar o arquivo CSV
file_path = '/Users/andreza/mobility_economics_climate/data/h3_visitation_daily_RJ.csv'
df = pd.read_csv(file_path)


# Criar o mapa centrado na média dos hexágonos
hex_ids = df['location_id'].unique()
lat_lng = [h3.h3_to_geo(h) for h in hex_ids]
avg_lat = sum([coord[0] for coord in lat_lng]) / len(lat_lng)
avg_lng = sum([coord[1] for coord in lat_lng]) / len(lat_lng)
m = folium.Map(location=[avg_lat, avg_lng], zoom_start=12, tiles='cartodbpositron')

# Adicionar cada hexágono ao mapa
for h in hex_ids:
    hex_boundary = h3.h3_to_geo_boundary(h, geo_json=False)
    hex_boundary = list(hex_boundary)  # Converte a lista de tuplas para uma lista de listas
    hex_boundary.append(hex_boundary[0])  # Fechar o loop do polígono
    my_PolyLine = folium.PolyLine(locations=hex_boundary, weight=2, color='blue')
    m.add_child(my_PolyLine)

# Exibir o mapa
m


In [None]:
#exemplo original - San Francico 
geoJson = {'type': 'Polygon',
 'coordinates': [[[37.813318999983238, -122.4089866999972145], 
                  [ 37.7866302000007224, -122.3805436999997056 ], 
                  [37.7198061999978478, -122.3544736999993603], 
                  [ 37.7076131999975672, -122.5123436999983966 ], 
                  [37.7835871999971715, -122.5247187000021967],  
                  [37.8151571999998453, -122.4798767000009008]]] }

polyline = geoJson['coordinates'][0]
polyline.append(polyline[0])
lat = [p[0] for p in polyline]
lng = [p[1] for p in polyline]
m = folium.Map(location=[sum(lat)/len(lat), sum(lng)/len(lng)], zoom_start=13, tiles='cartodbpositron')
my_PolyLine=folium.PolyLine(locations=polyline,weight=8,color="green")
m.add_child(my_PolyLine)

hexagons = list(h3.polyfill(geoJson, 8))
polylines = []
lat = []
lng = []
for hex in hexagons:
    polygons = h3.h3_set_to_multi_polygon([hex], geo_json=False)
    # flatten polygons into loops.
    outlines = [loop for polygon in polygons for loop in polygon]
    polyline = [outline + [outline[0]] for outline in outlines][0]
    lat.extend(map(lambda v:v[0],polyline))
    lng.extend(map(lambda v:v[1],polyline))
    polylines.append(polyline)
for polyline in polylines:
    my_PolyLine=folium.PolyLine(locations=polyline,weight=8,color='red')
    m.add_child(my_PolyLine)
display(m)

**Genrando shapefile dos hexagonos**

In [20]:
import pandas as pd
import geopandas as gpd
from shapely.geometry import Polygon
import h3

# Carregar o arquivo Parquet
file_path = '/Users/andreza/mobility_economics_climate/data/h3_visitation_daily.parquet'
df = pd.read_parquet(file_path)

# file_path = '/Users/andreza/mobility_economics_climate/data/h3_visitation_daily_RJ.csv'
# df = pd.read_csv(file_path)

# Função para converter um índice H3 em um polígono (shapely Polygon)
def h3_to_polygon(h):
    try:
        boundary = h3.h3_to_geo_boundary(h, geo_json=True)
        return Polygon(boundary)
    except Exception as e:
        print(f"Erro ao converter o índice H3 {h}: {e}")
        return None

# Aplicar a função a todos os hexágonos no DataFrame
df['geometry'] = df['location_id'].apply(h3_to_polygon)

# Verificar se há algum valor nulo na coluna 'geometry'
nulos = df['geometry'].isnull().sum()
if nulos > 0:
    print(f"Atenção: {nulos} hexágonos não puderam ser convertidos para polígonos.")

# Filtrar para remover registros com geometria nula
df = df.dropna(subset=['geometry'])

# Converter o DataFrame em um GeoDataFrame
gdf = gpd.GeoDataFrame(df, geometry='geometry')

# Definir o sistema de coordenadas (WGS84)
gdf.set_crs(epsg=4326, inplace=True)

# Salvar o GeoDataFrame como um shapefile
output_file = '/Users/andreza/mobility_economics_climate/data/shapefile/h3_visitation_daily.shp'
gdf.to_file(output_file, driver='ESRI Shapefile')

print(f"Shapefile salvo em: {output_file}")




Shapefile salvo em: /Users/andreza/mobility_economics_climate/data/shapefile/h3_visitation_daily.shp


**visualização dos shapefiles**

In [None]:
import geopandas as gpd
import matplotlib.pyplot as plt

# Recarregar o shapefile gerado para verificação
gdf = gpd.read_file('/Users/andreza/mobility_economics_climate/data/shapefile/RJ/h3_visitation_daily_RJ.shp')

# Plotar com bordas para verificar se os hexágonos estão corretos
fig, ax = plt.subplots(figsize=(50, 50))
gdf.boundary.plot(ax=ax, linewidth=1, color='black')
gdf.plot(ax=ax, alpha=0.5, cmap='viridis')

# Adicionar título e labels
ax.set_title('Verificação dos Hexágonos H3 - Rio de Janeiro')
ax.set_xlabel('Longitude')
ax.set_ylabel('Latitude')
# Mostrar o gráfico
plt.show()



In [None]:
# Listar as colunas disponíveis no GeoDataFrame
print(gdf.columns)


In [None]:
# Definindo os índices H3 para visualizar
h3_indexes = [
    "8aa8a06a0137fff",
    "8aa8a06a0c47fff",
    "8aa8a06a0c4ffff",
    "8aa8a06a0897fff",
    "8aa8a06a089ffff",
    "8aa8a06a0c67fff"
]

# Caminho para o shapefile gerado
shapefile_path = '/Users/andreza/mobility_economics_climate/data/shapefile/RJ/h3_visitation_daily_RJ.shp'

# Carregar o shapefile usando geopandas
gdf = gpd.read_file(shapefile_path)

# Filtrar o GeoDataFrame para incluir apenas os hexágonos dos índices H3 especificados
filtered_gdf = gdf[gdf['location_i'].isin(h3_indexes)]

# Plotar os hexágonos filtrados
fig, ax = plt.subplots(figsize=(10, 10))
filtered_gdf.boundary.plot(ax=ax, linewidth=1, color='black')
filtered_gdf.plot(ax=ax, alpha=0.5, cmap='viridis')

# Adicionar título e labels
ax.set_title('Visualização dos Hexágonos H3 Específicos')
ax.set_xlabel('Longitude')
ax.set_ylabel('Latitude')

# Mostrar o gráfico
plt.show()


In [None]:
# Verificar quais hexágonos especificados estão presentes no GeoDataFrame
present_hexagons = gdf[gdf['location_i'].isin(h3_indexes)]
missing_hexagons = set(h3_indexes) - set(present_hexagons['location_i'])

print("Hexágonos presentes no shapefile:", present_hexagons['location_i'].tolist())
print("Hexágonos ausentes no shapefile:", missing_hexagons)


In [None]:
import geopandas as gpd
import matplotlib.pyplot as plt

# Coordenadas aproximadas do centro do Rio de Janeiro
rio_de_janeiro_center = [-22.9068, -43.1729]

# Carregar o shapefile usando geopandas
gdf = gpd.read_file(shapefile_path)

# Filtrar os hexágonos especificados
present_hexagons = gdf[gdf['location_i'].isin(h3_indexes)]

# Plotar todos os hexágonos para contexto e os hexágonos especificados em destaque
fig, ax = plt.subplots(figsize=(10, 10))

# Plotar todos os hexágonos para contexto
gdf.boundary.plot(ax=ax, linewidth=1, color='gray')

# Plotar apenas os hexágonos especificados
present_hexagons.boundary.plot(ax=ax, linewidth=2, color='red')

# Centralizar o mapa no Rio de Janeiro
ax.set_xlim([rio_de_janeiro_center[1] - 0.1, rio_de_janeiro_center[1] + 0.1])
ax.set_ylim([rio_de_janeiro_center[0] - 0.1, rio_de_janeiro_center[0] + 0.1])

# Adicionar título e labels
ax.set_title('Hexágonos H3 Específicos no Contexto do Rio de Janeiro')
ax.set_xlabel('Longitude')
ax.set_ylabel('Latitude')

plt.show()
