# Análisis de Mercado de Criptodivisas

### **Presentación del problema específico**

Desde un tiempo a la fecha, nace una nueva economía de criptomonedas como un sistema en constante evolución, con nuevas criptomonedas y tecnologías emergentes. Aunque todavía en sus primeros días, muchos expertos creen que las criptomonedas tienen el potencial de transformar la forma en que hacemos transacciones financieras y manejamos nuestro dinero, sin embargo, la economía de criptomonedas también presenta desafíos, como la volatilidad de los precios y la falta de regulación y adopción generalizada. Es importante investigar y entender cuidadosamente las criptomonedas antes de invertir en ellas.

La capitalización de mercado es el valor en dólares total de todas las acciones de una empresa o, en el caso de Bitcoin u otra criptomoneda, de todas las monedas que se han extraído. En el mundo de las criptomonedas, la capitalización de mercado se calcula multiplicando la cantidad total de monedas extraídas por el precio de una única moneda en un momento determinado.

Imagine que la capitalización de mercado es un indicador aproximado que le dice la estabilidad probable de un activo. (No hay que dejar de lado el hecho de que incluso Bitcoin, la criptomoneda con mayor capitalización de mercado, también sufre volatilidad). De la misma forma en la que un barco más grande puede navegar con seguridad durante una tormenta, es más probable que una criptomoneda con una capitalización de mercado mucho más grande sea una inversión estable, en comparación con una que tenga una capitalización de mercado mucho menor. Por el contrario, las monedas digitales con capitalizaciones de mercado más pequeñas son susceptibles a los caprichos del mercado y, por ende, pueden generar grandes ganancias, pero también pérdidas drásticas.

Ahora bien, con el análisis de la variación del precio de los principales activos con mayor capitalización desde - hasta -, vamos a presentar las principales preguntas y objetivos del análisis en cuestión.

> ##### **Fuentes: https://acortar.link/XBmaCO**

### **Preguntas y objetivos de la investigación**

**Objetivos general**

Desarrollar un modelo de datos predictivo que pueda, a partir de factores vinculados a la variación de precios y capitalización del mercado, determinar el riesgo que un determinado activo tiene en función de sus OCHL (Open Close High Low Prices). 

**Objetivos particulares**

* Armar un modelo predictivo de datos capaz de dar resultados certeros a partir del análisis de su variación o capitalización de mercado.

* Publicar resultados, con el fin de contribuir con un sistema de fácil implementación, que complemente el análisis técnico o fundamental del mercado en cuestión.


### **Preguntas de investigación** 

* ¿La capitalización del mercado influye en la variación del precio?

* ¿Es posible predecir un precio estimado en función de la capitalización del mercado?

* ¿Cuál/es son las variables que impactan con mayor fuerza en la probabilidad de que el precio aumente?

### **Equipo de trabajo**

  - Matías Herrera

### **Fuente del dataset** 

La base de datos que Juan Poma ha generado colaborativamente fue publicada en el sitio Kaggle:
*https://acortar.link/muXijY*

### **Exploración de Datos**

**Hay un solo tipo de características de entrada:**
* Objetivo: información fáctica

| Parametro | Tipo de dato | Variable      | Tipo Valor |
|---------|--------------|---------------|------------|
| Slug | - | id | text |
| Symbol | - | symbol | text |
| Name | - | name | text |
| Date | Objetivo | date | text |
| Ranknow | Objetivo | ranknow | float |
| Open Price | Objetivo | open_price | float |
| High Price | Objetivo | high_price | float |
| Low Price | Objetivo | low_price | float |
| Close Price | Objetivo | close_price | float |
| Volume | Objetivo | volume | float |
| Market | Objetivo | market | int |
| Close Ratio | Objetivo | close_ratio | float |
| Spread | Objetivo | spread | float |


In [3]:
# Importar librerias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as Rectangle

# Setear para que los gráficos se muestren dentro del mismo notebook:
%matplotlib inline

# Mostrar los números con 2 decimales
pd.options.display.float_format = '{:,.2f}'.format

In [6]:
# Importar el dataset por medio de un repositorio de Github

df = pd.read_csv('/home/codespace/.ipython/profile_default/Coderhouse1/data/Capitalización de Mercado.csv')

In [7]:
df

Unnamed: 0,slug,symbol,name,date,ranknow,open,high,low,close,volume,market,close_ratio,spread
0,bitcoin,BTC,Bitcoin,2013-04-28,1.00,135.30,135.98,132.10,134.21,0.00,1488566728.00,0.54,3.87
1,bitcoin,BTC,Bitcoin,2013-04-29,1.00,134.44,147.49,134.00,144.54,0.00,1603768865.00,0.78,13.49
2,bitcoin,BTC,Bitcoin,2013-04-30,1.00,144.00,146.93,134.05,139.00,0.00,1542813125.00,0.38,12.88
3,bitcoin,BTC,Bitcoin,2013-05-01,1.00,139.00,139.89,107.72,116.99,0.00,1298954594.00,0.29,32.17
4,bitcoin,BTC,Bitcoin,2013-05-02,1.00,116.38,125.60,92.28,105.21,0.00,1168517495.00,0.39,33.32
...,...,...,...,...,...,...,...,...,...,...,...,...,...
34401,bitshares,BTS,BitShares,2017-04-27,41.00,0.01,0.01,0.01,0.01,715142.00,34374854.00,0.66,0.00
34402,bitshares,BTS,BitShares,2017-04-28,41.00,0.01,0.01,0.01,0.01,1010360.00,36277754.00,0.93,0.00
34403,bitshares,BTS,BitShares,2017-04-29,41.00,0.01,0.02,0.01,0.02,2456690.00,40120274.00,0.75,0.00
34404,bitshares,BTS,BitShares,2017-04-30,41.00,0.02,0.02,0.02,0.02,3028980.00,42758144.00,0.57,0.00


### Datos Duplicados y Nulos

In [11]:
# Realizar el drop() de la columan "slug" ya que en este caso no aporta ningun dato valioso al análisis a realizar.

df.drop(labels = "slug", axis = 1, inplace = True)

In [13]:
# Determinar la cantidad de datos nulos (correspondientes a la última fila)
cont_nulos = 0
for column in df.columns:
  cont_nulos += df[column].isna().sum()

print('Hay en total una cantidad de {0} datos nulos en el dataset'.format(cont_nulos))

Hay en total una cantidad de 12 datos nulos en el dataset


In [14]:
# Determinar la cantidad de datos duplicados
cant_duplicados = df.duplicated().sum()
if(cant_duplicados):
  print('La cantidad de datos duplicados en el dataset es {0}.'.format(cant_duplicados))
else:
  print('El dataset no cuenta con datos duplicados.')

El dataset no cuenta con datos duplicados.


In [16]:
print("Tras haber eliminado los datos duplicados, el dataset cuenta con {0} entradas.".format(df.shape[0]))

Tras haber eliminado los datos duplicados, el dataset cuenta con 34406 entradas.
