In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import plotly.graph_objects as go
import plotly.express as px
import yfinance as yf
from yfapi import YahooFinanceAPI, Interval
import datetime as dt

Cargamos el archivo CSV previamente generado

In [None]:
df_symbols = pd.read_csv('sp500.csv', sep=',')
df_symbols.drop(columns='Unnamed: 0', inplace=True)
df_symbols.fillna(0, inplace=True)

In [None]:
df_symbols.head()

In [None]:
df_symbols_2018 = df_symbols[df_symbols.Year.between(2018,2021, inclusive='both')]

## Análisis

1. Mejor día para invertir teniendo en cuenta el retorno de los: 
 - `Movimiento gap`
 - `Movimientos intradiarios`

Agrupamos por día de la semana para obtener el `promedio` de los mismos.<br>
Ordenamos el resultado para obtener de mayor a menor, los días de la semana con mayor resultado en ambos campos y obtenemos que...

In [None]:
data = df_symbols.groupby(['DayOfWk'])

#Retorno Gap
df_retGap = pd.DataFrame(data['RetGap'].mean().sort_values(ascending=False))
df_retGap.reset_index(inplace=True)

#Retorno Intradiario
df_retIntra = pd.DataFrame(data['RetIntra'].mean().sort_values(ascending=False))
df_retIntra.reset_index(inplace=True)

Datos desde 2000 hasta 2021

In [None]:
print(f'''El mejor día de la semana para invertir, teniendo en cuenta el: 
Retorno Gap es {df_retGap['DayOfWk'][0]}
Retorno Intradiario es {df_retIntra['DayOfWk'][0]}''')

Gráficamente podemos observar...

In [None]:
#Función para graficar Retorno Gap e Intradiario
def graficoRetorno( p_x, p_y, p_text, p_title ):
    colors_list = ['Red','Orange', 'Blue', 'Purple', 'Green']
    plt.figure(figsize=(10,8))
    graph = plt.bar( p_x,p_y, color = colors_list)
    plt.xlabel('Día de la Semana')
    plt.title(p_title)
    for i, p in enumerate(graph):
        width = p.get_width()
        height = p.get_height()
        x, y = p.get_xy()
        plt.text(x+width/2,y+height*1.01,s=str(round(p_text[i],6))+'%',ha='center',weight='bold')
    plt.show()

In [None]:
graficoRetorno(p_x=df_retGap['DayOfWk'], p_y=df_retGap['RetGap'], p_text=df_retGap['RetGap'], p_title='Retorno Gap por Día de la Semana')

In [None]:
graficoRetorno(p_x=df_retIntra['DayOfWk'], p_y=df_retIntra['RetIntra'], p_text=df_retIntra['RetIntra'], p_title='Retorno Intradiario por Día de la Semana')

Mismo análisis, datos desde el 2018 hasta 2021

In [None]:
data = df_symbols_2018.groupby(['DayOfWk'])
#Retorno Gap
df_retGap = pd.DataFrame(data['RetGap'].mean().sort_values(ascending=False))
df_retGap.reset_index(inplace=True)
#Retorno Intradiario
df_retIntra = pd.DataFrame(data['RetIntra'].mean().sort_values(ascending=False))
df_retIntra.reset_index(inplace=True)

In [None]:
print(f'''El mejor día de la semana para invertir, teniendo en cuenta el: 
Retorno Gap es {df_retGap['DayOfWk'][0]}
Retorno Intradiario es {df_retIntra['DayOfWk'][0]}''')

Gráficamente...

In [None]:
graficoRetorno(p_x=df_retGap['DayOfWk'], p_y=df_retGap['RetGap'], p_text=df_retGap['RetGap'], p_title='Retorno Gap por Día de la Semana')

In [None]:
graficoRetorno(p_x=df_retIntra['DayOfWk'], p_y=df_retIntra['RetIntra'], p_text=df_retIntra['RetIntra'], p_title='Retorno Intradiario por Día de la Semana')

2. Mejores industrias para invertir dentro del `S&P500`

Agrupamos por industria para determinar el promedio de los indicadores para cada una de ellas.<br>
A partir de aquí, ordenamos el resultado de mayor a menor teniendo en cuenta:
- `Retorno Gap, Retorno Intradiario y Variación.`<br>
Nótese que descartamos `Volatilidad` cómo indicador. Esto es debido a que consideramos que cuando las acciones de una empresa son más estables, es decir, menos volátiles, será una inversión más segura y recomendable.

In [None]:
df = df_symbols.groupby(by=['Industry'])
df_ind_porc = df[['RetGap','RetIntra','Var','Volat']].mean().sort_values(by=['RetGap','RetIntra','Var'], ascending=False)
df_ind_porc.reset_index(inplace=True)

Datos desde 2000 hasta 2021

In [None]:
n = 3
print(f'A partir de este análisis, podemos decir que las {n} mejores industrias para invertir son:')
for i, industry in enumerate(list(df_ind_porc['Industry'][:n])):
    print(f'{i+1}- {industry}')

Gráficamente podemos constatar...

In [None]:
width = 0.4
industries = list(df_ind_porc['Industry'])
gaps = list(df_ind_porc['RetGap'])
intra = list(df_ind_porc['RetIntra'])
vars = list(df_ind_porc['Var'])

n = np.arange(len(industries))

In [None]:
def chartIndustries():
    plt.figure(figsize=(30,12.5))
    plt.bar(n, gaps, width=width, label='Retorno Gap')
    plt.bar(n+width, intra, width=width, label='Retorno Intradiario')
    plt.bar(n-width, vars, width=width, label='Varianza')
    plt.legend()
    plt.xticks(n, industries)
    plt.show()

In [None]:
chartIndustries()

Mismo análisis, datos desde 2018 hasta 2021

In [None]:
df = df_symbols_2018.groupby(by=['Industry'])
df_ind_porc = df[['RetGap','RetIntra','Var','Volat']].mean().sort_values(by=['RetGap','RetIntra','Var'], ascending=False)
df_ind_porc.reset_index(inplace=True)

In [None]:
n = 3
print(f'A partir de este análisis, podemos decir que las {n} mejores industrias para invertir son:')
for i, industry in enumerate(list(df_ind_porc['Industry'][:n])):
    print(f'{i+1}- {industry}')

In [None]:
width = 0.4
industries = list(df_ind_porc['Industry'])
gaps = list(df_ind_porc['RetGap'])
intra = list(df_ind_porc['RetIntra'])
vars = list(df_ind_porc['Var'])

n = np.arange(len(industries))

In [None]:
chartIndustries()

3. Momentos de `alta volatilidad` que afectaron al `SP500`
Agrupamos por fecha y calculamos el promedio de la volatilidad

In [None]:
data = df_symbols.groupby(by=['Date'])
alta_volat = pd.DataFrame( data['Volat'].mean().sort_values(ascending=False) )
alta_volat.reset_index(inplace=True)

Datos desde 2000 hasta 2021

In [None]:
alta_volat.head()

In [None]:
from PIL import Image

In [None]:
fig = px.histogram(df_symbols, x='Date', y='Volat', title='Volatilidad desde 2000 hasta 2021' )
fig.show()

Mismo análisis, datos desde 2018 hasta 2021

In [None]:
data = df_symbols_2018.groupby(by=['Date'])
alta_volat = pd.DataFrame( data['Volat'].mean().sort_values(ascending=False) )
alta_volat.reset_index(inplace=True)

In [None]:
alta_volat.head()

In [None]:
fig = px.histogram(df_symbols_2018, x='Date', y='Volat', title='Volatilidad desde 2018 hasta 2021' )
fig.show()

4. Nueve `mejores` empresas para invertir dentro del `S&P500`

Tomamos cómo sustento los indicadores Retorno Gap, Intradiario, y Varianza

In [None]:
data = df_symbols.groupby(by=['Name'])
nueve_mjs = data[['RetGap','RetIntra','Var','Volat']].mean().sort_values(by=['RetGap','RetIntra','Var'], ascending=False).iloc[:9]
nueve_mjs.reset_index(inplace=True)

Datos desde 2000 hasta 2021

In [None]:
nueve_mjs

In [None]:
fig = px.bar(nueve_mjs, x="Name", y=['RetGap','RetIntra','Var'], barmode='group', title="Indicadores por Empresa 2000 a 2021")
fig.show()

In [None]:
data = df_symbols_2018.groupby(by=['Name'])
nueve_mjs = data[['RetGap','RetIntra','Var','Volat']].mean().sort_values(by=['RetGap','RetIntra','Var'], ascending=False).iloc[:9]
nueve_mjs.reset_index(inplace=True)

Mismo análisis, datos desde 2018 hasta 2021

In [None]:
nueve_mjs

In [None]:
fig = px.bar(nueve_mjs, x="Name", y=['RetGap','RetIntra','Var'], barmode='group', title="Indicadores por Empresa 2018 a 2021")
fig.show()