<b><h1>Proyecto</h1></b>

Integrantes:


<br>Luis Tapia 8-972-748</br>
<br>Nediel Quintero 8-1025-1920</br>
<br>Josue Parfait 8-1007-583</br>
<br>Lizmarie Camacho 8-966-2340</br>

<br>Titulo: Las 5 criptomonedas más negociadas por los traders y su impacto en el mercado.</br>

<br>Introducción: En el vertiginoso mundo de las criptomonedas, la negociación activa es una actividad fundamental que impulsa el mercado y define la viabilidad de cada activo digital. Con el crecimiento exponencial de la industria de las criptomonedas, la atención se centra en identificar las monedas más negociadas por los traders, ya que esto no solo refleja su popularidad, sino también su potencial de inversión.</br>

<br>Objetivo: Identificar y clasificar las 5 criptomonedas más negociadas por los traders dentro de un conjunto de datos que incluye 50 monedas criptográficas, utilizando técnicas de análisis de datos para determinar la volatilidad, correlación y tendencia de negociación de cada criptomoneda en un período de tiempo específico.</br>

<br> Lapso del tiempo a analizar: A partir del 2022.</br>

<br> Fecha de finalización del análisis de datos: A finales del mes de marzo del 2024.

<br>Datos del dataset:</br>

Columnas:

- date: Esta columna representa la fecha en la que se registraron los datos relacionados con una criptomoneda específica.

- price: Esta columna indica el precio de la criptomoneda en una fecha, determinada.

- total_volume: Esta columna muestra el volumen total de la criptomoneda negociada en el período de tiempo especificado.

- market_cap: Esta columna representa la capitalización de mercado de la criptomoneda en una fecha específica.

- coin_name: Esta columna proporciona el nombre de la criptomoneda a la que pertenecen los datos registrados en las otras columnas. Cada fila del dataset está asociada con una criptomoneda específica, y esta columna identifica cuál es.

________________________________________________________________________________

<b>Visualización de los tipos de datos dentro del dataset, conversión de estos datos al formato adecuado y limpieza de los mismos.</b>

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# Cargar el dataset
df = pd.read_csv('Criptomonedas.csv')

# Convertir datos de notación cientifica a formato flotante
df['total_volume'] = df['total_volume'].astype(float)
df['market_cap'] = df['market_cap'].astype(float)

# Configuración para mostrar números en formato decimal estándar
pd.set_option('display.float_format', '{:.2f}'.format)

# Verificar el tipo de los datos

print(df.dtypes)

# Mostrar el head del dataset
print('\n')
print("Head del dataset:")
print(df.head())

# Analizar cuántos campos son nulos por columnas
print("\nNúmero de campos nulos por columna:")
print(df.isnull().sum())

#Imprimir el porcentaje de información faltante
print("\nPorcentaje de campos nulos por columna:")
print(df.isnull().sum()/len(df)*100)

# Imprimir cuantas filas de datos tiene el dataset
print("\nNúmero total de filas antes de eliminar nulos:", len(df))

# Eliminar las filas que contengan valores nulos
df = df.dropna()

# Imprimir cuantas filas tiene el dataset una vez borradas las filas con valores nulos
print("\nNúmero total de filas después de eliminar nulos:", len(df))


Se hizo las operaciones debidas de limpiado de datos que consistía en:

- Convertir los datos a formatos manejables.
- Conocer el tipo de datos de cada columna, una vez que los mismos se convitieran a datos manejables.  
- Saber que columnas contaban con datos nulos.
- Conocer el porcentaje de datos nulos para cada columna.
- Eliminar los datos nulos.
- Conocer la cantidad de columnas antes de borrar los datos nulos y una vez borrados estos datos.


________________________________________________________________________________

¿Porqué escoger las 5 monedas más negociadas por los traders?

Analizar las cinco monedas más negociadas proporciona a los traders una base sólida para tomar decisiones informadas, aprovechar oportunidades de trading y gestionar el riesgo de manera efectiva en el mercado de divisas.


A continuación, se presentará las 5 monedas más negociadas, de acuerdo a nuestro dataset a partir del 2022:

In [None]:
# Convertir la columna de fecha a tipo datetime si no está en ese formato
df['date'] = pd.to_datetime(df['date'])

# Filtrar los datos a partir del año 2022
df = df[df['date'].dt.year >= 2022]

# Agrupar los datos por "coin_name" y suma el volumen total negociado
volume_by_coin = df.groupby('coin_name')['total_volume'].sum()

# Ordenar los resultados en orden descendente según el volumen total
volume_by_coin_sorted = volume_by_coin.sort_values(ascending=False)

# Seleccionar las 5 monedas más negociadas
top_5_coins = volume_by_coin_sorted.head(5)

# Imprimir las 5 monedas más negociadas
print("Las 5 monedas más negociadas a partir de 2022 son:")
print(top_5_coins)


________________________________________________________________________________
<b>Distribución de los precios entre las 5 criptomonedas.</b>

Al graficar el precio de cada criptomoneda en función de la fecha para ver  su variación con el tiempo, nos ayuda a plantear una tendencia entre el alza y baja de los precios.

La representación gráfica de la evolución de los precios de las criptomonedas a lo largo del tiempo nos brinda una valiosa perspectiva sobre su comportamiento y tendencias. Al analizar estas gráficas, podemos identificar patrones y realizar observaciones más detalladas.

En primer lugar, es importante examinar la volatilidad de cada criptomoneda. Algunas pueden exhibir fluctuaciones más pronunciadas que otras, lo que podría indicar una mayor sensibilidad a los eventos del mercado o a las noticias relacionadas. Las criptomonedas más volátiles representan mayores riesgos, pero también mayores oportunidades de ganancias potenciales.

In [None]:
# Función para calcular la volatilidad de una serie de precios
def calcular_volatilidad(precios):
    return precios.std()

# Convertir la columna de fecha a tipo datetime si no está en ese formato
df['date'] = pd.to_datetime(df['date'])

# Filtrar los datos a partir del año 2022
df = df[df['date'].dt.year >= 2022]

# Filtrar los datos para las cinco criptomonedas solicitadas
criptomonedas_filtradas = ['tether', 'bitcoin', 'ethereum', 'usd-coin', 'binance-usd']
df_filtered = df[df['coin_name'].isin(criptomonedas_filtradas)]

# Elegir una paleta de colores para asignar a cada criptomoneda
palette = sns.color_palette("husl", len(criptomonedas_filtradas))

# Crear un gráfico para cada criptomoneda en subplots
fig, axes = plt.subplots(nrows=len(criptomonedas_filtradas), ncols=1, figsize=(12, 6*len(criptomonedas_filtradas)))

for i, criptomoneda in enumerate(criptomonedas_filtradas):
    datos_cripto = df_filtered[df_filtered['coin_name'] == criptomoneda]
    axes[i].plot(datos_cripto['date'], datos_cripto['price'], color=palette[i])
    axes[i].set_title(f'Precio de {criptomoneda}')
    axes[i].set_xlabel('Fecha')
    axes[i].set_ylabel('Precio')

    # Calcular volatilidad y mostrarla
    volatilidad = calcular_volatilidad(datos_cripto['price'])
    axes[i].text(0.05, 0.9, f'Volatilidad: {volatilidad:.2f}', transform=axes[i].transAxes, fontsize=10, verticalalignment='top')

plt.tight_layout()
plt.show()

Las gráficas muestran los precios históricos de las principales 5 criptomonedas más negociadas por los traders. Tether, bitcoin, ethereum, usd-coin, binance-usd desde enero de 2022 hasta marzo de 2024. Se puede observar varios patrones interesantes:

Tether: Se mantiene casi completamente estable alrededor de 1.0000, con pequeñas fluctuaciones despreciables. Esto se debe a que Tether es una criptomoneda estable (stablecoin) diseñada para mantener su valor cercano a 1 dólar estadounidense.

Bitcoin: Muestra una alta volatilidad con grandes fluctuaciones. Comienza en niveles cercanos a los 40.000 dólares, cae a mínimos por debajo de 20.000 a mediados de 2022, se recupera gradualmente y luego experimenta un fuerte aumento hacia finales de 2023 superando los 60.000 dólares.

Ethereum: También exhibe alta volatilidad, aunque menor que Bitcoin. Parte de niveles bajos alrededor de 1.500 dólares, se recupera gradualmente hasta superar los 3.000 a finales de 2023 y luego crece exponencialmente hasta casi 4.000 dólares en marzo de 2024.

USD-Coin: Al igual que Tether, se mantiene estrictamente estable en 1.0000 dólar, con mínimas fluctuaciones, dado que es otra criptomoneda estable respaldada por el dólar estadounidense.

Binance-USD: Presenta un comportamiento similar a Tether y USD Coin, manteniendo un valor casi constante de 1.0000 dólar, con insignificantes oscilaciones, al ser también una stablecoin ligada al dólar.

________________________________________________________________________________
<b>Correlación entre los precios de estas criptomonedas.</b>

In [None]:
# Convertir la columna de fecha a tipo datetime si no está en ese formato
df['date'] = pd.to_datetime(df['date'])

# Filtrar los datos a partir del año 2022
df = df[df['date'].dt.year >= 2022]

# Filtrar los datos para las cinco criptomonedas solicitadas
criptomonedas_filtradas = ['tether', 'bitcoin', 'ethereum', 'usd-coin', 'binance-usd']
df_filtered = df[df['coin_name'].isin(criptomonedas_filtradas)]

# Crear un DataFrame solo con los precios de las criptomonedas
df_precios = df_filtered.pivot(index='date', columns='coin_name', values='price')

# Calcular la matriz de correlación
correlacion_precios = df_precios.corr()

# Graficar el mapa de calor de la correlación
plt.figure(figsize=(10, 8))
sns.heatmap(correlacion_precios, annot=True, cmap='coolwarm', fmt=".2f")
plt.title('Correlación entre precios de criptomonedas')
plt.xlabel('Criptomoneda')
plt.ylabel('Criptomoneda')
plt.show()

La matriz muestra las correlaciones entre los precios de cinco criptomonedas: Tether, bitcoin, ethereum, usd-coin, binance-usd. Estas correlaciones se representan mediante un mapa de colores, donde un valor cercano a 1 (en rojo) indica una correlación fuerte y positiva, mientras que un valor cercano a 0 (en azul) indica una correlación débil o nula.

Algunas observaciones destacadas:

La diagonal principal tiene valores de 1, lo cual es correcto, ya que cada criptomoneda tiene una correlación perfecta consigo misma.

Las criptomonedas Binance-USD y Bitcoin tienen una correlación relativamente baja de 0.15, lo que sugiere que sus precios no están fuertemente relacionados.

Ethereum y Bitcoin tienen una correlación más alta de 0.92, lo que indica que sus precios tienden a moverse en la misma dirección.

Tether tiene una correlación baja con la mayoría de las otras criptomonedas, excepto con USD-Coin, con la que tiene una correlación de 0.28.

USD-Coin tiene una correlación baja con las demás criptomonedas, lo que sugiere que su precio no está estrechamente vinculado a las fluctuaciones de las otras criptomonedas representadas, solo con Tether.


________________________________________________________________________________



<b>Análisis de Capitalización de Mercado vs. Volumen de Operaciones.</b>



In [None]:
# Filtrar datos a partir del año 2022 y para las criptomonedas especificadas
df = df[(df['date'].dt.year >= 2022) & (df['coin_name'].isin(['tether', 'bitcoin', 'ethereum', 'usd-coin', 'binance-usd']))]

# Elegir una paleta de colores para asignar a cada moneda
palette = sns.color_palette("husl", len(['tether', 'bitcoin', 'ethereum', 'usd-coin', 'binance-usd']))

# Crear un gráfico de dispersión para cada criptomoneda
for i, coin in enumerate(['tether', 'bitcoin', 'ethereum', 'usd-coin', 'binance-usd']):
    coin_data = df[df['coin_name'] == coin]
    plt.figure(figsize=(8, 6))
    plt.scatter(coin_data['total_volume'], coin_data['market_cap'], alpha=0.5, color=palette[i])
    plt.title(f'Análisis de {coin.capitalize()}: Capitalización de Mercado vs. Volumen de Operaciones')
    plt.xlabel('Volumen de Operaciones')
    plt.ylabel('Capitalización de Mercado')
    plt.grid(True)
    plt.tight_layout()
    plt.show()



De acuerdo con las gráficas que muestran la capitalización de mercado frente al volumen de operaciones para las criptomonedas, se pueden hacer las siguientes observaciones:

Tether: La gráfica muestra una distribución dispersa con una tendencia ascendente general, lo que sugiere que a mayor volumen de operaciones, mayor capitalización de mercado, aunque la correlación no es perfecta. La mayoría de los puntos se concentran en valores más bajos.

Bitcoin: Se observa una correlación positiva más clara y definida entre el volumen y la capitalización. La distribución tiene forma de nube elongada, indicando que a medida que aumenta el volumen, también lo hace la capitalización, con una mayor dispersión en los valores más altos.

Ethereum: Similar a Bitcoin, pero con una mayor dispersión. Hay una correlación positiva general, pero con más variabilidad en los valores más altos de volumen y capitalización.

Usd-coin: Presenta una distribución más estrecha y alargada, lo que indica una correlación positiva más fuerte y lineal entre el volumen y la capitalización. La mayoría de los puntos se agrupan a lo largo de una línea ascendente bien definida.

Binance-usd: Muestra una fuerte correlación positiva con una distribución de datos más compacta y una relación más lineal en comparación con las demás criptomonedas. A medida que aumenta el volumen, también lo hace la capitalización de manera consistente.

Llegamos a una conclusión la cual es que, todas las gráficas demuestran una correlación positiva general entre el volumen de operaciones y la capitalización de mercado, aunque la fuerza de esta relación y la dispersión de los datos varía. Las criptomonedas como Usd-coin y Binance-usd presentan correlaciones más fuertes y lineales, mientras que otras como Tether y Ethereum muestran mayor dispersión y variabilidad en los datos.

________________________________________________________________________________

<b>Correlación entre el volumen total y la capitalización de mercado.</b>

In [None]:
# Convertir la columna de fecha a tipo datetime
df['date'] = pd.to_datetime(df['date'])

# Filtrar los datos a partir del año 2022
df = df[df['date'].dt.year >= 2022]

# Seleccionar las 5 criptomonedas específicas
criptomonedas_seleccionadas = ['tether', 'bitcoin', 'ethereum', 'usd-coin', 'binance-usd']
df = df[df['coin_name'].isin(criptomonedas_seleccionadas)]

# Correlación entre volumen total y capitalización de mercado para las 5 criptomonedas
correlation_matrix = df.pivot_table(index='coin_name', values=['total_volume', 'market_cap'], aggfunc='mean').corr()

plt.figure(figsize=(8, 6))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', linewidths=.5)
plt.title('Correlación entre Volumen Total y Capitalización de Mercado de las 5 Criptomonedas')
plt.show()


Esta matriz muestra la correlación entre el volumen total de operaciones y la capitalización de mercado de las 5 principales criptomonedas. Los dos valores representados son market_cap (capitalización de mercado) y total_volume (volumen total).

la correlación entre el volumen total y la capitalización de mercado es moderada y positiva, con un valor de 0.29. Esto sugiere que un aumento en el volumen total se asocia con un aumento en la capitalización de mercado y viceversa.
________________________________________________________________________________