In [0]:
# Biblioteca(s)
import json
from pyspark.sql import DataFrame
from requests.models import Response



In [0]:
def fn_request_response_to_dataframe(response: Response) -> DataFrame:
    """
    Converte a resposta JSON de uma solicitação HTTP em um DataFrame do PySpark.
    
    Args:
    response (Response): O objeto de resposta obtido por uma solicitação HTTP usando a biblioteca requests.
    
    Returns:
    DataFrame: Um DataFrame do PySpark contendo os dados extraídos da resposta JSON.
    
    Exemplo de uso:
    >>> import requests
    >>> url = "https://api.exemplo.com/dados"
    >>> response = requests.get(url)
    >>> df = fn_request_response_to_dataframe(response)
    >>> df.show()
    
    Note que a URL usada no exemplo acima deve ser substituída por uma URL real de onde você está fazendo a solicitação HTTP.
    """
    
    # Converte a resposta JSON em um dicionário Python
    payload = json.loads(json.dumps(response.text))
    
    # Cria um RDD a partir do payload usando o contexto do Spark
    payload_rdd = spark.sparkContext.parallelize([payload])
    
    # Lê o RDD como um DataFrame
    df = spark.read.json(payload_rdd)
    
    return df

In [0]:
def create_database_if_not_exists(db_name: str, table_path: str) -> None:
    """
    Função para verificar e criar o database, se não existir.
    
    Args:
    db_name (str): O nome do database.
    table_path (str): O caminho onde a tabela será criada.
    """
    # Criação do database se não existir
    print(f"Verificando se o database {db_name} existe. O mesmo será criado em {table_path} caso não exista")
    spark.sql(f"CREATE DATABASE IF NOT EXISTS {db_name} LOCATION '{table_path}';")