In [None]:
# ==========================================================
#  Importando as bibliotecas necess√°rias
# ==========================================================

import requests  # Biblioteca para fazer requisi√ß√µes HTTP, vamos usar para chamar a API de pa√≠ses
from pyspark.sql import SparkSession  # Para criar e manipular DataFrames no Spark

# Criando a sess√£o Spark
spark = SparkSession.builder \
    .appName("API REST Countries") \
    .getOrCreate()

print("üöÄ SparkSession criada com sucesso!")


# ==========================================================
# Definindo a URL da API REST Countries
# ==========================================================

url = "https://restcountries.com/v3.1/all"  # Endpoint que retorna informa√ß√µes de todos os pa√≠ses
print(f"üîó URL da API: {url}")

# ==========================================================
# Fazendo a requisi√ß√£o para a API
# ==========================================================

response = requests.get(url)  # Enviando uma requisi√ß√£o GET para a API

# ==========================================================
# Verificando se a requisi√ß√£o foi bem-sucedida
# ==========================================================

if response.status_code == 200:
    print("‚úÖ Requisi√ß√£o feita com sucesso!")
    
    # ==========================================================
    # Convertendo a resposta da API para formato JSON
    # ==========================================================

    countries_data = response.json()  # A resposta vem como texto, ent√£o transformamos para um objeto Python (lista de dicion√°rios)

    print(f"üìä Total de pa√≠ses retornados: {len(countries_data)}")

    # ==========================================================
    # Preparando os dados para criar um DataFrame Spark
    # ==========================================================

    # Vamos criar uma lista vazia para armazenar as informa√ß√µes que queremos
    countries_list = []

    # Vamos percorrer cada pa√≠s na resposta da API
    for country in countries_data:
        # Extraindo o nome comum do pa√≠s
        nome_resumido = country.get('cca2', 'N√£o informado')

        # Extraindo o nome comum do pa√≠s
        name = country.get("name", {}).get("common")

        # Extraindo o nome oficial do pa√≠s
        official_name = country.get("name", {}).get("official")

        # Extraindo a capital, que pode ser uma lista (ou n√£o existir)
        capital = country.get("capital", ["N√£o informado"])[0] if country.get("capital") else "N√£o informado"

        # Extraindo a regi√£o do pa√≠s (ex: Europe, Asia)
        region = country.get("region")

        # Extraindo a sub-regi√£o (ex: Western Europe)
        subregion = country.get("subregion", "N√£o informado")

        # Popula√ß√£o do pa√≠s
        population = country.get("population")

        # √Årea do pa√≠s em km¬≤
        area = country.get("area")

        # Idiomas falados no pa√≠s (pode ter v√°rios, ent√£o juntamos em uma string)
        languages = ", ".join(country.get("languages", {}).values()) if country.get("languages") else "N√£o informado"

        # Moedas usadas no pa√≠s (juntamos o nome das moedas em uma string)
        currencies = ", ".join([v.get("name") for v in country.get("currencies", {}).values()]) if country.get("currencies") else "N√£o informado"

        # URL da imagem da bandeira
        flag = country.get("flags", {}).get("png", "N√£o informado")

        # Adicionamos os dados coletados na nossa lista como uma tupla
        countries_list.append((nome_resumido,name, official_name, capital, region, subregion, population, area, languages, currencies, flag))

    # ==========================================================
    #  Criando o DataFrame Spark com os dados coletados
    # ==========================================================

    # Definimos os nomes das colunas para o DataFrame
    df_countries = spark.createDataFrame(
        countries_list,
        ["nome_resumido","nome", "nome_oficial", "capital", "regiao", "subregiao", "populacao", "area_km2", "idiomas", "moedas", "bandeira_url"]
    )

    # ==========================================================
    # Exibindo o DataFrame para visualiza√ß√£o
    # ==========================================================

    display(df_countries)  # Comando para visualizar os dados em tabela

    # ==========================================================
    # Criando uma Temp View para consultas SQL
    # ==========================================================

    print("‚úÖ df_countries criado com sucesso!")

else:
    # Caso a requisi√ß√£o falhe, exibimos o status code
    print(f"‚ùå Erro na requisi√ß√£o. Status code: {response.status_code}")
