### Análisis de Criptomonedas
#### Datos de estudio:
- Fecha: Fecha de observación del precio 00:00:00 horas.
- Precio: Precio por fecha y hora.
- Volumen de transacciones: Cantidad de transacciones por día.
- Precio (market_cap): Precio de las criptomonedas en el mercado con relación
al USD.
- Nombre de la moneda.
##### Fuente:
- https://www.kaggle.com/datasets/sudalairajkumar/cryptocurrency-historical-prices-
coingecko

In [2]:
import pandas as pd
import matplotlib.pyplot as plt
import os
import seaborn as sns
import numpy as np

#### Concatenacion de Datasets

In [None]:
data_folder = "Datasets"

crypto_files = [
    "bitcoin.csv",
    "solana.csv",
    "binancecoin.csv",
    "cardano.csv",
    "avalanche-2.csv",
    "tether.csv",
    "shiba-inu.csv",
    "usd-coin.csv",
    "dai.csv",
    "ethereum.csv"
]

all_data = []

for crypto_file in crypto_files:
    filepath = os.path.join(data_folder, crypto_file)

    df = pd.read_csv(filepath)

    all_data.append(df)

combined_df = pd.concat(all_data, ignore_index=True)

output_file = "crypto.csv"
combined_df.to_csv(output_file, index=False)

print(f"Archivo {output_file} creado correctamente.")




#### Formateo de la columna Date

In [4]:
df = pd.read_csv('crypto.csv')

def clear_dates(str_date):
    if len(str_date) > 10:
        return str_date[:10]
    else:
        return str_date
    
df['date'] = df['date'].apply(clear_dates)

df.to_csv('crypto.csv', index=False)

#### Eliminación de Valores Nulos

In [None]:
df = pd.read_csv('crypto.csv')

df = df.dropna(axis=0, inplace=True)
print('done')

#### Seteo de Fechas en Orden Ascendente

In [None]:
df = pd.read_csv('crypto.csv')

df['date'] = pd.to_datetime(df['date'])

df.sort_values('date', inplace=True)
df.to_csv('crypto.csv', index=False)

print(df.head(10))


#### Volumen de Capitalización.
- Volumen de Datos en comparación del Valor o Capitalización en dólares para el mercado, intentando analizar el comportamiento proporcional entre ambos.

In [None]:
df = pd.read_csv('crypto.csv')

cryptos = ['bitcoin', 'ethereum']
df_filtered = df[df['coin_name'].isin(cryptos)]

fig, axs = plt.subplots(2, 1, figsize=(12, 8))

for crypto in cryptos:
    crypto_data = df_filtered[df_filtered['coin_name'] == crypto]
    x = crypto_data.index.values
    y = crypto_data['market_cap']
    z = crypto_data['total_volume']

    axs[0].plot(x, y, label=f'{crypto} Market Cap')
    axs[1].plot(x, z, label=f'{crypto} Total Volume')

axs[0].set_title('Market Cap')
axs[0].legend()

axs[1].set_title('Total Volume')
axs[1].legend()

plt.tight_layout()
plt.show()


#### Preprocesado  de Datos.

- Preprocesado de datos identificando los valores faltantes o nulos, su corrección, y el cambio del tipo de datos (astype); además con el comando str.upper() poner los index en mayúsculas, separar por grupos (usar comando groupby) dependiendo del valor de mercado en la fecha 1 de Enero de 2015 y organizarlos por valor ascendente.

##### Valores nulos por columna

In [None]:
df = pd.read_csv('crypto.csv')

null_values = df.isnull().sum()

print(f'Total de valores nulos por columna: {null_values}')

##### Se completan los campos nulos con la media.

In [None]:
mean = df['market_cap'].mean()
df['market_cap'] = df['market_cap'].fillna(mean)
null_values = df.isnull().sum()
df.to_csv('crypto.csv', index=False)
print(f'Total de valores nulos por columna: {null_values}')

##### Se cambia el tipo de datos de la columna 'date' y 'coin_name'

In [None]:
df = pd.read_csv('crypto.csv')

print(f'Cambio del tipo de datos del DataFrame. \n\n Antes del cambio:\n {df.dtypes}\n')

# Conversion de la columna fecha de 'object' a 'datetime'
df['date'] = pd.to_datetime(df['date'])
#df['date'] = df['date'].astype('date64[pyarrow]')

# Conversion de la columna coin_name de 'object' a 'str'
df['coin_name'] = df['coin_name'].astype(str)

print(f'Después del cambio:\n {df.dtypes}\n')

df.to_csv('crypto.csv', index=False)

##### Se establece como índice la columna 'coin_name' y se utiliza el método str.upper() sobre la misma.

In [None]:
df = pd.read_csv('crypto.csv')

df.set_index('coin_name', inplace=True)
df.index = df.index.str.upper()

df.to_csv('crypto.csv')

print(df.head(5))

##### Se separa por grupos dependiendo del valor de mercado en la fecha 1 de Enero de 2015 organizandolos de manera ascendente.

In [None]:
df = pd.read_csv('crypto.csv')

df = df[df['date'] == '2015-01-01']
df = df.sort_values('market_cap')

print(df.head(5))

#### Top 3 Criptomonedas con su Precio en 2015.

In [None]:
df = pd.read_csv('crypto.csv')
df['date'] = pd.to_datetime(df['date'])
df_2024 = df[df['date'].dt.year == 2024]

df_filtered = df_2024[df_2024['coin_name'].isin(cryptos)]

cryptos_mean = df_filtered.groupby('coin_name')['price'].mean()

pivot_df = df.pivot(index='date', columns='coin_name', values='price')
cryptos_deseados = ['BITCOIN', 'ETHEREUM', 'BINANCECOIN', 'TETHER']
pivot_df_filtrado = pivot_df[cryptos_deseados]

pivot_df_filtrado.plot(figsize=(15, 8), title='Precios de Criptomonedas en 2015')
plt.xlabel('Fecha')
plt.ylabel('Precio')
plt.legend(title='Criptomoneda')
plt.show()

# for crypto in cryptos:
#     #crypto_data = df_filtered[df_filtered['coin_name'] == crypto]
#     pivot_data = pivot_df[pivot_df[crypto]]
#     x = pivot_data['date']
#     y = pivot_data['price'] #/ cryptos_mean[crypto]

#     ax.plot(x, y, label=f'{crypto} Price')

# ax.set_title('Comparación Precio de las Criptomonedas')
# ax.legend()

# print(df_filtered.head())

# plt.tight_layout()
# plt.show()

#### Media de las criptomonedas en 2015 y la menor desviación estándar entre ellas.

In [None]:
df = pd.read_csv('crypto.csv')

df['date'] = pd.to_datetime(df['date'])
df_2015 = df[df['date'].dt.year == 2015]

cryptos = ['BITCOIN', 'TETHER', 'ETHEREUM'] 
df_filtered = df_2015[df_2015['coin_name'].isin(cryptos)]

print(f'Criptomonedas activas en el año 2015: {df_2015["coin_name"].unique()}\n')

# Media de las criptomonedas
crypto_mean = df_2015.groupby('coin_name')['price'].mean()
print(f'Media de las criptomonedas del 2015: {crypto_mean}')

# Desviación estándar
crypto_desv = df_2015.groupby('coin_name')['price'].std()
print(f'\nDesviación estándar de las criptomonedas del 2015: {crypto_desv}')

# Criptomoneda con la desviación estándar más baja
crypto_min_desv = crypto_desv.idxmin()
print(f'\nDesviación estándar más baja de las criptomonedas del 2015: {crypto_min_desv}')


#### Criptomonedas por encima de la media.

In [None]:
mean_price = df['price'].mean()
df["media"] = mean_price

# Crear el lienzo
fig, ax = plt.subplots(figsize=(12, 8))

# Graficar
sns.barplot(x="coin_name", y="price", data=df)

# Agregar línea de la media
plt.axhline(y=mean_price, color="red", linestyle="dashed", label="Media")

# Personalizar
plt.title("Precio de todas las criptomonedas")
plt.xlabel("Criptomoneda")
plt.ylabel("Precio (USD)")
plt.legend()
plt.tight_layout()
plt.show()

##### Criptomoneda con Media más Alta.

In [None]:
df = pd.read_csv('crypto.csv')

total_mean = df['price'].mean()

above_mean_cryptos = df.groupby('coin_name')['price'].mean().loc[lambda x: x > total_mean]

for crypto, mean in above_mean_cryptos.items():
    print(f"Criptomoneda con Media más alta: {crypto}, Media: {mean}")


##### Mayor valor en el mercado en los últimos 3 meses de diciembre.

In [None]:
df = pd.read_csv('crypto.csv')

df['date'] = pd.to_datetime(df['date'])

quarter = df.query('date.dt.year == 2015 and date.dt.month >= 10')

crypto_max_value = quarter.groupby('coin_name')['price'].max()

max_crypto = crypto_max_value.nlargest(5)

print(f'Criptomonedas con mayor valor en los últimos 3 meses de 2015: {max_crypto}')

##### Se determina la criptomoneda más volátil del 2015

In [None]:
volatile = df_2015.groupby('coin_name')['price'].apply(lambda x: x.max() - x.min())

crypto_max_volatile = volatile.idxmax()
max_volatile = volatile.max()

print(f'La criptomoneda más volátil de 2015 fue: {crypto_max_volatile}, con una fluctuación de: {max_volatile}')

#### Se determina la criptomoneda más estable del 2015.

In [None]:
crypto_desv = df_2015.groupby('coin_name')['price'].std()

stable_crypto = crypto_desv.idxmin()
min_crypto_desv = crypto_desv.min()

print(f'La criptomoneda más estable de 2015 fue: {stable_crypto}, con una desviación estándar de: {min_crypto_desv}')