# NOTEBOOK IA DE INVERSIÓN

## Recolección de datos

In [2]:
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
import seaborn as sns
sns.set_style('whitegrid')
plt.style.use("fivethirtyeight")
%matplotlib inline

ModuleNotFoundError: No module named 'matplotlib'

In [None]:
# Para leer stocks de Yahoo finance
from pandas_datareader.data import DataReader
import yfinance as yf
from pandas_datareader import data as pdr

yf.pdr_override()

In [None]:
# "Datetime" nos ayuda a concretar un tiempo
from datetime import datetime

In [None]:
# El tipo de empresas que cogemos, en este caso, empresas que venden moviles
tech_list = ['AAPL', 'MSI', 'XIACF']

In [None]:
# Damos un  inicio y un final al tiempo para la recolección de datos
tech_list = ['AAPL', 'MSI', 'XIACF']

end = datetime.now()
start = datetime(end.year - 1, end.month, end.day)

for stock in tech_list:
    globals()[stock] = yf.download(stock, start, end)
    

company_list = [AAPL, MSI, XIACF]
company_name = ["APPLE", "MOTOROLA", "XIAOMI"]

for company, com_name in zip(company_list, company_name):
    company["company_name"] = com_name
    
df = pd.concat(company_list, axis=0)
df.tail(10)

# Visualización de datos

.describe genera estadisticas descriptivas para resumir la tendencia general, la dispersión y así ver mejor la distribución del dataset; excluyendo los valores NaN

Open-High-Low-Close(OHLC) es una de las practicas que se utilizan para recolectar puntos claves de datos pertinentes de una empresa 

In [None]:
AAPL.describe()

Tenemos un total de 255 dias, ya que no estan los fines de semana. La bolsa opera de lunes a viernes. 

In [None]:
# Para visualizar información general
AAPL.info()

## Precio de cierre

El precio de cierre es el último precio al que se cotiza la acción durante el día de negociación habitual. El precio de cierre de una acción es el punto de referencia estándar que utilizan los inversores para seguir su rendimiento a lo largo del tiempo.


In [None]:
# En estos graficos vemos el historico del precio de cierre 
plt.figure(figsize=(15, 10))
plt.subplots_adjust(top=1.25, bottom=1.2)

for i, company in enumerate(company_list, 1):
    plt.subplot(2, 2, i)
    company['Adj Close'].plot()
    plt.ylabel('Adj Close')
    plt.xlabel(None)
    plt.title(f"Closing Price of {tech_list[i - 1]}")
    
plt.tight_layout()

## Volumen de ventas

El volumen es la cantidad de un activo o valor que cambia de manos durante un período de tiempo, a menudo en el transcurso de un día. 

Por ejemplo, el volumen de negociación de acciones se referiría a la cantidad de acciones de un valor negociadas entre su apertura y cierre diarios. 

El volumen de negociación y los cambios en el volumen a lo largo del tiempo son datos importantes para los indicadores técnicos.

In [None]:
# Ahora haremos algunos graficos con el volumen total de acciones que se negocian cada día.
plt.figure(figsize=(15, 10))
plt.subplots_adjust(top=1.25, bottom=1.2)

for i, company in enumerate(company_list, 1):
    plt.subplot(2, 2, i)
    company['Volume'].plot()
    plt.ylabel('Volume')
    plt.xlabel(None)
    plt.title(f"Sales Volume for {tech_list[i - 1]}")
    
plt.tight_layout()

## Indicador tecnico: Moving average

Es una herramienta de analisis tecnico simple (indicador), nos da una tendencia del precio, lo cual suaviza los cambios de precio ya que nos da un precio promedio.

Este promedio se da en un periodo de tiempo especifico (20 minutos, 10 dias, 30 dias, 1 año...)

In [None]:
ma_day = [5, 10, 30]

for ma in ma_day:
    for company in company_list:
        column_name = f"MA for {ma} days"
        company[column_name] = company['Adj Close'].rolling(ma).mean()
        

fig, axes = plt.subplots(nrows=2, ncols=2)
fig.set_figheight(10)
fig.set_figwidth(15)

AAPL[['Adj Close', 'MA for 5 days', 'MA for 10 days', 'MA for 30 days']].plot(ax=axes[0,0])
axes[0,0].set_title('APPLE')

XIACF[['Adj Close', 'MA for 5 days', 'MA for 10 days', 'MA for 30 days']].plot(ax=axes[0,1])
axes[0,1].set_title('XIAOMI')

MSI[['Adj Close', 'MA for 5 days', 'MA for 10 days', 'MA for 30 days']].plot(ax=axes[1,0])
axes[1,0].set_title('MOTOROLA')

fig.tight_layout()

Vemos que 30 dias se desplaza algo mas, mientras que los 5 y 10 dias capturan mejor la tendencia.

## Rendimiento promedio diario de las acciones

Ahora que hemos realizado un análisis de referencia, creo que podemos profundizar un poco más. 

Analizaremos el riesgo de las acciones. Para ello, tendremos que observar más de cerca los cambios diarios de las acciones, y no solo su valor absoluto. 

Utilizaremos Pandas para recuperar los rendimientos diarios de las acciones de Apple.

In [None]:
# Usaremos pct_change para encontrar el cambio en porcentajes para cada día.
for company in company_list:
    company['Daily Return'] = company['Adj Close'].pct_change()

# Sacareos los porcentajes del rendimiento
fig, axes = plt.subplots(nrows=2, ncols=2)
fig.set_figheight(10)
fig.set_figwidth(15)

AAPL['Daily Return'].plot(ax=axes[0,0], legend=True, linestyle='--', marker='o')
axes[0,0].set_title('APPLE')

MSI['Daily Return'].plot(ax=axes[0,1], legend=True, linestyle='--', marker='o')
axes[0,1].set_title('MOTOROLA')

XIACF['Daily Return'].plot(ax=axes[1,0], legend=True, linestyle='--', marker='o')
axes[1,0].set_title('XIAOMI')

fig.tight_layout()

Ahora que hemos visto el rendimiento general utilizando un histograma, utilizaremos seaborn para crear un histograma y un kde plot en la misma figura

In [None]:
plt.figure(figsize=(12, 9))

for i, company in enumerate(company_list, 1):
    plt.subplot(2, 2, i)
    company['Daily Return'].hist(bins=50)
    plt.xlabel('Daily Return')
    plt.ylabel('Counts')
    plt.title(f'{company_name[i - 1]}')
    
plt.tight_layout()

## Correlación entre precios de cierre

La correlación es una estadística que mide el grado en que dos variables se mueven entre sí y tiene un valor que debe estar entre -1,0 y +1,0. 

La correlación mide la asociación, pero no muestra si x causa y o viceversa, o si la asociación es causada por un tercer factor

In [None]:
# Obtenemos todos los precios de cierre de la lista de acciones en un solo DataFrame

closing_df = pdr.get_data_yahoo(tech_list, start=start, end=end)['Adj Close']

# Y hacemos el nuevo DataFrame
tech_rets = closing_df.pct_change()
tech_rets.head()

In [None]:
# Comparar a una empresa con si misma deberia darnos una relación lineal perfecta. Aqui podemos ver un ejemplo
sns.jointplot(x='MSI', y='MSI', data=tech_rets, kind='scatter', color='seagreen')

In [None]:
# We'll use joinplot to compare the daily returns of Google and Microsoft
sns.jointplot(x='MSI', y='XIACF', data=tech_rets, kind='scatter')

Aquí podemos ver si dos empresas de inversión estan alineadas y si lo están de forma positiva. 

In [None]:
# Podemos simplemente llamar a pairplot en nuestro DataFrame para un análisis visual automático 
# de todas las comparaciones


sns.pairplot(tech_rets, kind='reg')

Arriba podemos ver las relaciones entre las diferentes empresas.

A diferencia del notebook original, nosotros vemos pocas relaciones entre ellas.
Como mucho parece tenerla Apple y Motorola, que lo hace de forma mas o menos positiva, aunque con mucha dispersión

In [None]:
# Set up our figure by naming it returns_fig, call PairPLot on the DataFrame
return_fig = sns.PairGrid(tech_rets.dropna())

# Using map_upper we can specify what the upper triangle will look like.
return_fig.map_upper(plt.scatter, color='purple')

# We can also define the lower triangle in the figure, inclufing the plot type (kde) 
# or the color map (BluePurple)
return_fig.map_lower(sns.kdeplot, cmap='cool_d')

# Finally we'll define the diagonal as a series of histogram plots of the daily return
return_fig.map_diag(plt.hist, bins=30)

In [None]:
# Set up our figure by naming it returns_fig, call PairPLot on the DataFrame
returns_fig = sns.PairGrid(closing_df)

# Using map_upper we can specify what the upper triangle will look like.
returns_fig.map_upper(plt.scatter,color='purple')

# We can also define the lower triangle in the figure, inclufing the plot type (kde) or the color map (BluePurple)
returns_fig.map_lower(sns.kdeplot,cmap='cool_d')

# Finally we'll define the diagonal as a series of histogram plots of the daily return
returns_fig.map_diag(plt.hist,bins=30)

Pero a parte de las graficas, podemos verlo también de forma numérica

In [None]:
plt.figure(figsize=(12, 10))

plt.subplot(2, 2, 1)
sns.heatmap(tech_rets.corr(), annot=True, cmap='summer')
plt.title('Correlation of stock return')

plt.subplot(2, 2, 2)
sns.heatmap(closing_df.corr(), annot=True, cmap='summer')
plt.title('Correlation of stock closing price')

Aqui podemos ver de forma más clara la diferencia. La relación mas fuerte o positiva la encontramos entre Motorola y Xiaomi en su reación en su cierre de precios

## CALCULAR EL RIESGO

Hay muchas maneras de calcular el riesgo de una inversión, en este caso se utiliza el retorno diario en porcentajes y comprandolo con el rendimiento esperado con la desviación estandar del retorno estandar.

In [None]:
rets = tech_rets.dropna()

area = np.pi * 20

plt.figure(figsize=(10, 8))
plt.scatter(rets.mean(), rets.std(), s=area)
plt.xlabel('Expected return')
plt.ylabel('Risk')

for label, x, y in zip(rets.columns, rets.mean(), rets.std()):
    plt.annotate(label, xy=(x, y), xytext=(50, 50), textcoords='offset points', ha='right', va='bottom', 
                 arrowprops=dict(arrowstyle='-', color='blue', connectionstyle='arc3,rad=-0.3'))


In [None]:
# Plot the data
train = data[:training_data_len]
valid = data[training_data_len:]
valid['Predictions'] = predictions
# Visualize the data
plt.figure(figsize=(16,6))
plt.title('Model')
plt.xlabel('Date', fontsize=18)
plt.ylabel('Close Price USD ($)', fontsize=18)
plt.plot(train['Close'])
plt.plot(valid[['Close', 'Predictions']])
plt.legend(['Train', 'Val', 'Predictions'], loc='lower right')
plt.show()

In [None]:
# Show the valid and predicted prices
valid