# Importar Bibliotecas Necesarias
Este bloque de código importa las bibliotecas esenciales para manejar y procesar datos desde un archivo JSON, analizar la información util izando pandas, realizar solicitudes HTTP para obtener datos externos, gestionar directorios locales, crear visualizaciones y manejar bases de datos. Además, establece las rutas locales para los archivos de entrada y salida.



In [12]:
# Importar las bibliotecas necesarias
import json  # Para manejar archivos JSON
import pandas as pd  # Para manipulación de datos
import requests  # Para realizar solicitudes HTTP
import os  # Para gestionar rutas y directorios
import matplotlib.pyplot as plt  # Para generar gráficos
import sqlite3  # Para interactuar con bases de datos SQLite

# Establecer las rutas de los archivos
local_path = os.getcwd()  # Obtener el directorio actual
file_path = local_path + r"CoinGecko.json"  # Ruta del archivo JSON
file_path_csv = local_path + r"CoinGecko_dataframe.csv"  # Ruta del archivo CSV

# Definir el directorio para guardar los gráficos
graph_dir = os.path.join(os.getcwd(), "Graphs")
db_path = os.path.join(os.getcwd(), "CoinGecko.db")  # Ruta de la base de datos



# Extracción
Este bloque de código realiza una solicitud GET a un endpoint de CoinGecko para obtener información global del mercado de criptomonedas, verifica si la solicitud fue exitosa y, en caso afirmativo, guarda los datos en un archivo JSON local. Si la solicitud falla, se muestra un mensaje de error con el código de estado.



In [3]:

# Endpoint para obtener la información global del mercado
url = "https://api.coingecko.com/api/v3/global"

# Realizamos la solicitud GET al endpoint
response = requests.get(url)

# Verificamos si la solicitud fue exitosa (código 200)
if response.status_code == 200:
    # Parseamos la respuesta JSON
    data = response.json()
    
    # Aseguramos que la carpeta existe para guardar el archivo
    os.makedirs(os.path.dirname(file_path), exist_ok=True)
    
    # Guardamos los datos en el archivo CoinGecko.json
    with open(file_path, "w") as json_file:
        json.dump(data, json_file, indent=4)
    
    print(f"Datos guardados en {file_path}")  # Confirmación de guardado
else:
    print(f"Error: {response.status_code}")  # Mensaje de error si la solicitud falla


Datos guardados en c:\Users\user\Documents\Python_Scripts\Prueba_APLATAM\CoinGeckoCoinGecko.json


# Cargar Archivo JSON
Este bloque de código carga los datos almacenados previamente en el archivo JSON (CoinGecko.json) y los guarda en una variable llamada data para su posterior uso en el análisis o procesamiento.

In [4]:
with open(file_path, 'r') as f:
    data = json.load(f)


# Mostrar Contenido del Archivo JSON
Este fragmento de código extrae una pequeña muestra de los primeros 5 elementos del archivo JSON para poder echar un vistazo rápido a la estructura y contenido de los datos. Esto resulta útil cuando queremos inspeccionar el archivo de forma ágil sin procesar todo el contenido de una vez.



In [5]:
# Mostrar una muestra del contenido del archivo JSON cargado
muestra_datos_json = {k: data[k] for k in list(data)[:5]}  # Obtener los primeros 5 elementos
muestra_datos_json

{'data': {'active_cryptocurrencies': 16457,
  'upcoming_icos': 0,
  'ongoing_icos': 49,
  'ended_icos': 3376,
  'markets': 1205,
  'total_market_cap': {'btc': 37177399.57246562,
   'eth': 1007222642.2737082,
   'ltc': 32112652540.800873,
   'bch': 7802624301.720322,
   'bnb': 5187617347.261401,
   'eos': 4039098651661.451,
   'xrp': 1533155987399.0347,
   'xlm': 8231211466496.609,
   'link': 154612709009.45792,
   'dot': 473809260441.1388,
   'yfi': 413876620.9514622,
   'usd': 3697336973989.122,
   'aed': 13580318705462.043,
   'ars': 3808624968237704.0,
   'aud': 5941598333178.675,
   'bdt': 448569440348748.3,
   'bhd': 1391880990543.0747,
   'bmd': 3697336973989.122,
   'brl': 22842887292699.594,
   'cad': 5324956472656.767,
   'chf': 3361751880881.9736,
   'clp': 3709921840174392.5,
   'cny': 27095934013879.28,
   'czk': 90089682441916.34,
   'dkk': 26736027838157.23,
   'eur': 3584937929979.853,
   'gbp': 2972470362901.581,
   'gel': 10393210536546.443,
   'hkd': 28749660408920.26

# Exploración
Obtener las claves principales del diccionario JSON cargado

In [6]:
data.keys()


dict_keys(['data'])

Este comando imprime en consola el contenido de la clave 'data' dentro del archivo JSON cargado, mostrando los datos principales que contienen la información de las criptomonedas.



In [7]:
print (data['data'])

{'active_cryptocurrencies': 16457, 'upcoming_icos': 0, 'ongoing_icos': 49, 'ended_icos': 3376, 'markets': 1205, 'total_market_cap': {'btc': 37177399.57246562, 'eth': 1007222642.2737082, 'ltc': 32112652540.800873, 'bch': 7802624301.720322, 'bnb': 5187617347.261401, 'eos': 4039098651661.451, 'xrp': 1533155987399.0347, 'xlm': 8231211466496.609, 'link': 154612709009.45792, 'dot': 473809260441.1388, 'yfi': 413876620.9514622, 'usd': 3697336973989.122, 'aed': 13580318705462.043, 'ars': 3808624968237704.0, 'aud': 5941598333178.675, 'bdt': 448569440348748.3, 'bhd': 1391880990543.0747, 'bmd': 3697336973989.122, 'brl': 22842887292699.594, 'cad': 5324956472656.767, 'chf': 3361751880881.9736, 'clp': 3709921840174392.5, 'cny': 27095934013879.28, 'czk': 90089682441916.34, 'dkk': 26736027838157.23, 'eur': 3584937929979.853, 'gbp': 2972470362901.581, 'gel': 10393210536546.443, 'hkd': 28749660408920.266, 'huf': 1489804960299177.0, 'idr': 5.9900721479337736e+16, 'ils': 13505750813370.63, 'inr': 317298153

# Visualizar Datos del JSON
Primero extraemos datos clave relacionados con el mercado, como la capitalización total, volumen y porcentaje de capitalización. Luego, organizamos esos datos en dos DataFrames de pandas con nombres de columnas más legibles. Después, también obtenemos información global como el cambio porcentual del mercado y estadísticas sobre las criptomonedas activas. Finalmente, almacenamos esos datos en un DataFrame separado para su posterior uso.

In [8]:

# Extraemos los datos de total_market_cap, total_volume y market_cap_percentage
total_market_cap = data['data']['total_market_cap']
total_volume = data['data']['total_volume']
market_cap_percentage = data['data']['market_cap_percentage']

# Creamos el primer DataFrame (market_cap_df) con columnas renombradas
market_cap_df = pd.DataFrame({
    'Moneda': total_market_cap.keys(),
    'Total_Market_Cap': total_market_cap.values(),
    'Total_Volume': [total_volume.get(currency, None) for currency in total_market_cap.keys()]
})

# Creamos el DataFrame de market_cap_percentage
market_cap_percentage_df = pd.DataFrame({
    'Moneda': total_market_cap.keys(),
    'Market_Cap_Percentage': [market_cap_percentage.get(currency, None) for currency in total_market_cap.keys()]
}).dropna()

# Extraemos los datos globales
global_data = {
    'Market_Cap_Change_Percentage_24h_USD': data['data']['market_cap_change_percentage_24h_usd'],
    'Updated_At': data['data']['updated_at'],
    'Active_Cryptocurrencies': data['data']['active_cryptocurrencies'],
    'Upcoming_ICOs': data['data']['upcoming_icos'],
    'Ongoing_ICOs': data['data']['ongoing_icos'],
    'Ended_ICOs': data['data']['ended_icos'],
    'Markets': data['data']['markets']
}

# Creamos el DataFrame de datos globales
global_data_df = pd.DataFrame([global_data])

En este segmento de código, realizamos una evaluación inicial de market_cap_df. Primero, mostramos las primeras 5 filas para tener una idea rápida de cómo luce el conjunto de datos. Luego, generamos un resumen estadístico que nos da una visión general de la distribución numérica de los datos, como los promedios, máximos y mínimos. También consultamos la estructura del DataFrame para confirmar que no haya valores nulos o errores en los tipos de datos. Finalmente, verificamos la existencia de valores nulos en las columnas, lo que es clave para asegurar que los datos estén completos antes de hacer análisis o transformaciones adicionales.

In [9]:
# Ver las primeras 5 filas
print(market_cap_df.head())

# Resumen estadístico de las columnas numéricas
print(market_cap_df.describe())

# Ver información del DataFrame (como los tipos de datos y valores no nulos)
print(market_cap_df.info())
# Verificar si hay valores nulos en el DataFrame
print(market_cap_df.isnull().sum())




  Moneda  Total_Market_Cap  Total_Volume
0    btc      3.717740e+07  1.047942e+06
1    eth      1.007223e+09  2.839120e+07
2    ltc      3.211265e+10  9.051790e+08
3    bch      7.802624e+09  2.199374e+08
4    bnb      5.187617e+09  1.462265e+08
       Total_Market_Cap  Total_Volume
count      6.200000e+01  6.200000e+01
mean       3.074814e+15  8.667165e+13
std        1.401678e+16  3.950994e+14
min        3.717740e+07  1.047942e+06
25%        3.069791e+12  8.653007e+10
50%        1.599945e+13  4.509864e+11
75%        2.007955e+14  5.659947e+12
max        9.387679e+16  2.646163e+15
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 62 entries, 0 to 61
Data columns (total 3 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   Moneda            62 non-null     object 
 1   Total_Market_Cap  62 non-null     float64
 2   Total_Volume      62 non-null     float64
dtypes: float64(2), object(1)
memory usage: 1.6+ KB
None
Moneda            

Primero, genera dos histogramas para mostrar la distribución de los valores de Total_Market_Cap y Total_Volume, lo que nos permite observar cómo se distribuyen esos valores en el conjunto de datos. Luego, se ordenan los datos en dos formas distintas: primero por volumen (Total_Volume) de mayor a menor, y luego por la capitalización total (Total_Market_Cap), también de mayor a menor. Esto nos ayuda a identificar rápidamente las criptomonedas más relevantes en términos de volumen y capitalización de mercado.

In [10]:

os.makedirs(graph_dir, exist_ok=True)  # Crear el directorio si no existe

# Guardar el histograma de 'Total_Market_Cap'
plt.figure()
market_cap_df['Total_Market_Cap'].hist(bins=20)
plt.title('Distribución de Total Market Cap')
plt.xlabel('Total Market Cap (USD)')
plt.ylabel('Valor')
plt.savefig(os.path.join(graph_dir, 'distribucion_total_market_cap.png'))  # Guardar el gráfico
plt.close()  # Cerrar la figura para liberar memoria

# Guardar el histograma de 'Total_Volume'
plt.figure()
market_cap_df['Total_Volume'].hist(bins=20)
plt.title('Distribución de Total Volume')
plt.xlabel('Market Cap Percentage (%)')
plt.ylabel('Volumen')
plt.savefig(os.path.join(graph_dir, 'distribucion_total_volume.png'))  # Guardar el gráfico
plt.close()  # Cerrar la figura para liberar memoria

# Ordenar el DataFrame por el volumen más alto y guardarlo
sorted_volume_df = market_cap_df.sort_values(by='Total_Volume', ascending=False)
sorted_volume_df.to_csv(os.path.join(graph_dir, 'sorted_by_volume.csv'))  # Guardar como archivo CSV

# Ordenar el DataFrame por la capitalización más alta y guardarlo
sorted_market_cap_df = market_cap_df.sort_values(by='Total_Market_Cap', ascending=False)
sorted_market_cap_df.to_csv(os.path.join(graph_dir, 'sorted_by_market_cap.csv'))  # Guardar como archivo CSV

# Mensaje de confirmación
print("Gráficos y archivos ordenados guardados en:", graph_dir)


Gráficos y archivos ordenados guardados en: c:\Users\user\Documents\Python_Scripts\Prueba_APLATAM\CoinGecko\Graphs


# Transformación y Limpieza

Innecesaria

# Conclusión


# Revisión de las tablas finales

In [11]:
print("market_cap_percentage1 -\n", market_cap_percentage_df.dtypes)

print("global_data_df -\n", global_data_df.dtypes)

print("market_cap_df -\n", market_cap_df.dtypes)

market_cap_percentage1 -
 Moneda                    object
Market_Cap_Percentage    float64
dtype: object
global_data_df -
 Market_Cap_Change_Percentage_24h_USD    float64
Updated_At                                int64
Active_Cryptocurrencies                   int64
Upcoming_ICOs                             int64
Ongoing_ICOs                              int64
Ended_ICOs                                int64
Markets                                   int64
dtype: object
market_cap_df -
 Moneda               object
Total_Market_Cap    float64
Total_Volume        float64
dtype: object


# Escritura en tablas de BD

In [13]:
# Conectar a la base de datos de CoinGecko
conn = sqlite3.connect(db_path)

# Inserción de datos del DataFrame market_cap_percentage_df en la tabla market_cap_percentage_df
market_cap_percentage_df.to_sql('market_cap_percentage_df', conn, if_exists='append', index=False)

# Inserción de datos del DataFrame global_data_df en la tabla global_data_df
global_data_df.to_sql('global_data_df', conn, if_exists='replace', index=False)

# Inserción de datos del DataFrame market_cap_df en la tabla market_cap_df
market_cap_df.to_sql('market_cap_df', conn, if_exists='replace', index=False)

# Confirmar los cambios y cerrar la conexión
conn.commit()


# Revisión de escritura en BD

In [14]:
# Consulta SQL para obtener todos los registros de la tabla 'prediccion'
query_1 = "SELECT * FROM global_data_df"
query_2 = "SELECT * FROM market_cap_df"

# Ejecutar la consulta y cargar los resultados en un DataFrame
global_data_df_sql = pd.read_sql_query(query_1, conn)
market_cap_df_sql = pd.read_sql_query(query_2, conn)

# Mostrar los primeros registros
print(global_data_df_sql)
print(market_cap_df_sql)
conn.close()

   Market_Cap_Change_Percentage_24h_USD  Updated_At  Active_Cryptocurrencies  \
0                             -0.688597  1736140650                    16457   

   Upcoming_ICOs  Ongoing_ICOs  Ended_ICOs  Markets  
0              0            49        3376     1205  
   Moneda  Total_Market_Cap  Total_Volume
0     btc      3.717740e+07  1.047942e+06
1     eth      1.007223e+09  2.839120e+07
2     ltc      3.211265e+10  9.051790e+08
3     bch      7.802624e+09  2.199374e+08
4     bnb      5.187617e+09  1.462265e+08
..    ...               ...           ...
57    xdr      2.831088e+12  7.980161e+10
58    xag      1.250465e+11  3.524762e+09
59    xau      1.403176e+09  3.955219e+07
60   bits      3.717740e+13  1.047942e+12
61   sats      3.717740e+15  1.047942e+14

[62 rows x 3 columns]
