<a href="https://colab.research.google.com/github/Samuel442/api-nasa-asteroids/blob/main/script/nasa_asteriodes.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ‚öôÔ∏è **Instala√ß√µes e Importa√ß√µes**

Bibliotecas principais:
- `requests` ‚Üí para acessar a API da NASA  
- `pandas` ‚Üí para organizar e normalizar os dados  

> Obs: Ambas j√° v√™m pr√©-instaladas no Colab.

```python
import requests
import pandas as pd


In [1]:
# Configura√ß√£o e Importa√ß√µes
import pandas as pd
import requests
from datetime import date, timedelta
import json

print("Bibliotecas importadas com sucesso!")

Bibliotecas importadas com sucesso!


## üîë Configura√ß√£o da API e Per√≠odo

Define:
- **API Key da NASA**
- **data inicial** e **final** da busca  



In [None]:
# Configura√ß√£o da API e Datas
API_KEY = "DEMO_KEY"
URL = "https://api.nasa.gov/neo/rest/v1/feed"

# Definir o per√≠odo de 7 dias para a consulta
# Exemplo: 7 dias terminando em 2025-12-11
end_date = date(2025, 12, 11)
start_date = end_date - timedelta(days=6) # 7 dias de dados

print(f"Per√≠odo de busca definido: {start_date} a {end_date}")

Per√≠odo de busca definido: 2025-12-05 a 2025-12-11


## üì• **3. Extra√ß√£o de Dados (Requisi√ß√£o)**

Esta c√©lula envia a requisi√ß√£o HTTP para a API NeoWs da NASA,
recebe o JSON com os dados dos asteroides e exibe as chaves principais
retornadas pela API.


In [None]:
# Extra√ß√£o de Dados (Requests)
params = {
    "start_date": start_date.strftime("%Y-%m-%d"),
    "end_date": end_date.strftime("%Y-%m-%d"),
    "api_key": API_KEY
}

try:
    response = requests.get(URL, params=params)
    response.raise_for_status() # Lan√ßa erro para c√≥digos 4xx/5xx

    # Carrega o JSON aninhado
    data = response.json()

    print("‚úÖ Dados extra√≠dos com sucesso!")
    # Mostra o n√∫mero total de elementos que o JSON cont√©m
    print(f"Total de objetos NEO encontrados: {data.get('element_count', 'N/A')}")

except requests.exceptions.HTTPError as err:
    print(f"Erro na requisi√ß√£o HTTP: {err}")
    print("Verifique se as datas est√£o corretas e se a API Key n√£o atingiu o limite de uso.")

# O objeto de aninhamento a ser processado:
near_earth_objects = data.get("near_earth_objects", {})

‚úÖ Dados extra√≠dos com sucesso!
Total de objetos NEO encontrados: 95


##  **4. Normaliza√ß√£o e concatena√ß√£o**

# O passo de Transforma√ß√£o que usa pd.json_normalize para nivelar o close_approach_data.

In [None]:
# Processo de Normaliza√ß√£o (Transforma√ß√£o)

# Inicializa a lista que guardar√° os DataFrames de cada dia
dados_aproximacao_df_list = []

# Iterar sobre as CHAVES DE DATA (Ex: "2025-12-05") e suas LISTAS DE ASTEROIDES
for data_aproximacao, lista_asteroides in near_earth_objects.items():

    if lista_asteroides:

        # Expande a lista 'close_approach_data' em novas linhas (record_path)
        # Mant√©m dados de identifica√ß√£o do asteroide (meta)
        df_aproximacoes_do_dia = pd.json_normalize(
            lista_asteroides,
            record_path='close_approach_data',
            # Metadados do asteroide repetir em cada linha de aproxima√ß√£o:
            meta=['id', 'name', 'is_potentially_hazardous_asteroid'],
            sep='_' # N√≠vela sub-objetos como miss_distance
        )

        # Adiciona a data de busca para contexto
        df_aproximacoes_do_dia['data_busca'] = data_aproximacao

        dados_aproximacao_df_list.append(df_aproximacoes_do_dia)

# Concatenar todos os resultados
if dados_aproximacao_df_list:
    df_final_normalizado = pd.concat(dados_aproximacao_df_list, ignore_index=True)

    print("\n‚úÖ Normaliza√ß√£o e Concatena√ß√£o Conclu√≠das!")
    print(f"Total final de registros de aproxima√ß√£o: {len(df_final_normalizado)}")
else:
    print("Nenhum dado de asteroide encontrado para normaliza√ß√£o.")


‚úÖ Normaliza√ß√£o e Concatena√ß√£o Conclu√≠das!
Total final de registros de aproxima√ß√£o: 95


## 5. üîç Inspe√ß√£o R√°pida e Verifica√ß√£o de Tipos
Verifica a estrutura, o cabe√ßalho (head) e, mais importante, corrige o tipo de dado para que a an√°lise num√©rica funcione.

In [None]:
# Verifica√ß√£o e An√°lise Inicial

# Converte a coluna de dist√¢ncia para float
df_final_normalizado['miss_distance_kilometers'] = \
    df_final_normalizado['miss_distance_kilometers'].astype(float)

print("--- Colunas do DataFrame Final ---")
print(df_final_normalizado.columns)

print("\n--- Top 5 Registros (Aproxima√ß√µes) ---")
# Mostra colunas chave para verificar se a normaliza√ß√£o funcionou
colunas_chave = [
    'id',
    'name',
    'data_busca',
    'close_approach_date',
    'miss_distance_kilometers',
    'is_potentially_hazardous_asteroid'
]
print(df_final_normalizado[colunas_chave].head())

# Exemplo de Insight: Encontrar o asteroide que passou mais perto
indice_minimo = df_final_normalizado['miss_distance_kilometers'].idxmin()
asteroide_mais_proximo = df_final_normalizado.loc[indice_minimo]

print("\n--- Asteroide que Passou Mais Perto ---")
print(f"Nome: {asteroide_mais_proximo['name']}")
print(f"Data de Aproxima√ß√£o: {asteroide_mais_proximo['close_approach_date']}")
print(f"Dist√¢ncia M√≠nima: {asteroide_mais_proximo['miss_distance_kilometers']:.0f} km")

--- Colunas do DataFrame Final ---
Index(['close_approach_date', 'close_approach_date_full',
       'epoch_date_close_approach', 'orbiting_body',
       'relative_velocity_kilometers_per_second',
       'relative_velocity_kilometers_per_hour',
       'relative_velocity_miles_per_hour', 'miss_distance_astronomical',
       'miss_distance_lunar', 'miss_distance_kilometers',
       'miss_distance_miles', 'id', 'name',
       'is_potentially_hazardous_asteroid', 'data_busca'],
      dtype='object')

--- Top 5 Registros (Aproxima√ß√µes) ---
         id              name  data_busca close_approach_date  \
0   2496818  496818 (1993 RA)  2025-12-05          2025-12-05   
1   3826807       (2018 PN22)  2025-12-05          2025-12-05   
2   3836849        (2018 XM2)  2025-12-05          2025-12-05   
3  54224159        (2021 WA1)  2025-12-05          2025-12-05   
4  54356994        (2023 HU5)  2025-12-05          2025-12-05   

   miss_distance_kilometers is_potentially_hazardous_asteroid  
0  

## 5. üîç **Inspe√ß√£o R√°pida Data Frame normalizado**

In [None]:
# Inspe√ß√£o R√°pida do DataFrame Normalizado

print("--- 1. Informa√ß√µes Essenciais ---")
# Mostra o n√∫mero de linhas, colunas e o uso de mem√≥ria.
print(df_final_normalizado.info())

print("\n--- 2. Primeiras 5 Linhas (Cabe√ßalho) ---")
# Exibe as primeiras 5 linhas, confirmando o conte√∫do ap√≥s a normaliza√ß√£o.
print(df_final_normalizado.head())

print("\n--- 3. Verifica√ß√£o de Tipos de Dados (dtypes) ---")
# Mostra o tipo de dado de cada coluna
print(df_final_normalizado.dtypes)

# Para inspecionar apenas colunas de interesse (ex: Dist√¢ncia e Velocidade)
print("\n--- 4. dtypes de Colunas Num√©ricas Chave ---")
colunas_num = [
    'miss_distance_kilometers',
    'relative_velocity_kilometers_per_hour'
]
# A coluna 'miss_distance_kilometers' deve ser 'float64'
print(df_final_normalizado[colunas_num].dtypes)

--- 1. Informa√ß√µes Essenciais ---
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 95 entries, 0 to 94
Data columns (total 15 columns):
 #   Column                                   Non-Null Count  Dtype  
---  ------                                   --------------  -----  
 0   close_approach_date                      95 non-null     object 
 1   close_approach_date_full                 95 non-null     object 
 2   epoch_date_close_approach                95 non-null     int64  
 3   orbiting_body                            95 non-null     object 
 4   relative_velocity_kilometers_per_second  95 non-null     object 
 5   relative_velocity_kilometers_per_hour    95 non-null     object 
 6   relative_velocity_miles_per_hour         95 non-null     object 
 7   miss_distance_astronomical               95 non-null     object 
 8   miss_distance_lunar                      95 non-null     object 
 9   miss_distance_kilometers                 95 non-null     float64
 10  miss_distance_mi

### 7.3. üì§ Carregamento para o Supabase
Esta c√©lula usa o m√©todo `.to_sql()` do Pandas para criar a tabela e carregar os dados.


In [None]:
# Inser√ß√£o Final de Dados via API REST

# Instala√ß√£o (garante que a biblioteca est√° pronta)
!pip install supabase

from supabase import create_client, Client

# -----------------------------------------------------------
# CHAVES (Usando o Host HTTPS e a Anon Key fornecida)
# -----------------------------------------------------------
SUPABASE_URL = "SUPABASE_URL"
SUPABASE_KEY = "SUPABASE_ANON_KEY"
TABLE_NAME_API = "neo_close_approaches_api"
# -----------------------------------------------------------

if not SUPABASE_URL or not SUPABASE_KEY:
    raise EnvironmentError(
        "Vari√°veis de ambiente SUPABASE_URL e SUPABASE_ANON_KEY n√£o configuradas."
    )

try:
    # Cria o cliente Supabase
    supabase: Client = create_client(SUPABASE_URL, SUPABASE_KEY)
    print("Cliente Supabase criado com sucesso.")

    # Converte o DataFrame para o formato JSON (lista de dicion√°rios)
    data_to_insert = df_final_normalizado.to_dict('records')
    print(f"Preparando {len(data_to_insert)} registros para inser√ß√£o...")

    # Insere os dados usando a API REST
    response = (
        supabase.table(TABLE_NAME_API)
        .insert(data_to_insert)
        .execute()
    )

    # Verifica a resposta da API
    if 'data' in response and len(response['data']) > 0:
        print(f"\n‚úÖ SUCESSO! Dados carregados na tabela '{TABLE_NAME_API}'.")
        print(f"Total de registros inseridos: {len(response['data'])}")
    else:
        # Se n√£o houver dados no 'data', mas n√£o houver exce√ß√£o, pode ser um problema de resposta da API
        # Mas significa que a inser√ß√£o foi tentada.
        print("\n‚ö†Ô∏è Inser√ß√£o tentada. Verifique se os dados apareceram no Table Editor do Supabase.")

except Exception as e:
    print(f"‚ùå Erro Cr√≠tico durante a inser√ß√£o via API: {e}")

Cliente Supabase criado com sucesso.
Preparando 95 registros para inser√ß√£o...

‚ö†Ô∏è Inser√ß√£o tentada. Verifique se os dados apareceram no Table Editor do Supabase.


In [None]:
# Gera√ß√£o do Arquivo CSV para Upload (criar colunas automaticamente com os dados pra ver se bate com o tosql)

# Definir o nome do arquivo de sa√≠da
nome_arquivo_csv = "neo_approximations_final.csv"

# Criar o CSV
df_final_normalizado.to_csv(nome_arquivo_csv, index=False, encoding='utf-8')

print(f"\n‚úÖ Arquivo CSV '{nome_arquivo_csv}' criado com sucesso!")

# Download do arquivo (exclusivo para ambiente Google Colab)
from google.colab import files
files.download(nome_arquivo_csv)


‚úÖ Arquivo CSV 'neo_approximations_final.csv' criado com sucesso!


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>