# Modelo
Objetivo del Modelo: Estimar la probabilidad de tener ganancias o pérdidas de capital de una acción en la BMV.

    Y = Gana o pierde valor una acción.
    X1 = Razón ganancia/capital (nivel de endeudamiento).
    X2 = Número de acciones de esa empresa en circulación. (tengo dudas de donde sacar datos de esta…)
    X3 = Rendimientos históricos de la bolsa (BMV).
    X4 = Riesgo país.**
    X5 = Rendimientos históricos de la acción.**
    X6 = Tasa impositiva histórica aplicable**


# Objetivo de la investigación


El objetivo del presente trabajo es determinar la probabilidad de que un inversionista obtenga ganancias de capital al participar en la Bolsa Mexicana de Valores, aplicando el modelo de regresión logística a una serie de variables de corte económico-financiero.

# Motivación de la investigación



Las inversiones siempre han sido una gran fuente de ingresos y han sido la base del crecimiento de todas las economías, porque permiten a las empresas, por medio de distintos mecanismos de financiamiento, innovar procesos, sacar nuevos productos y adquirir activos. Los mercados donde se lleva a cabo dicha actividad tienen como objetivo incrementar el valor de las empresas y retribuir a aquellos participantes que financiaron a las mismas. Creemos que la idea de transferir capitales se fundamenta en que los participantes del mercado ven grandes incentivos para maximizar sus beneficios, pero en este punto entra un factor clave, el riesgo. Por tanto, nuestra motivación es crear un método, usando herramientas y conocimientos adquiridos a lo largo de la carrera, que le permita a cualquier potencial inversionista saber, en promedio, si sus inversiones, en nuestro país, darán o no frutos.

#  Por qué y para qué es importante este proyecto.

Como bien sabemos, el panorama económico actual en el ambiente de inversión, no es nada alentador. Aunado a eso hay un consenso generalmente aceptado que dicta que todos los modelos truenan cuando hay crisis. Sin embargo creemos que esta situación es temporal y, a pesar de que la recuperación lleve mucho tiempo, hay una ventana de oportunidad. Para reactivar la economía se necesita certidumbre (seguridad de que se obtendrán ganancias a la hora de invertir el ingreso disponible), es decir, se necesita un método o modelo que determine la probabilidad promedio de ganar o perder. Lo que buscamos es dar una idea que permita tomar buenas decisiones de inversión a cualquier persona o empresa que guste usar sus ahorros o ingresos en la bolsa mexicana o, en su defecto, en otras.

# Especificación del modelo.

Tal como se dijo en los objetivos se usará el modelo logístico:


$ Prob (Y=1)= \frac{1}{1+e^(-z)}$ 

donde $z=α+β_{k} x_{ki}+u_{i}$

Donde:
	
    Y = Obtener ganancias o pérdidas de capital al invertir en la BMV.
	X1 = Nivel de endeudamiento histórico de las empresas participantes en la BMV.
    X2 = Rendimientos históricos de la BMV.
	X3 = Riesgo país histórico.
	X4 = Rendimientos históricos de las acciones en la BMV.
	X5 = Tasa impositiva histórica aplicable.



Por tanto la especificación del modelo es la siguiente:


$z=G(α+β_{1}Endeudamiento_{it}+β_{2}rm_{t}+β_{3}R.País_{t}+β_{4}r de acción_{it}+β_{5}Tx_{t}+u_{i})$

# Justificación del modelo

Como se puede observar, el modelo propuesto en este trabajo trata de integrar las ideas expuestas en el marco teórico. La selección de estas variables fue por:

    •	Nivel de endeudamiento.- Medido con el ratio Deuda-Capital, se eligió porque una empresa con altos niveles de deuda generalmente tiene un riesgo mayor, lo que genera normalmente un rendimiento más alto. 

    •	Rendimientos históricos de la BMV.- También llamado rendimiento de mercado, será medido con el Índice de Precios y Cotizaciones (quien toma como referencia a las 33-35 emisoras más representativas de la economía). Se eligió porque al momento de invertir las sociedades y fondos de inversión lo toman como referencia para comparar acciones y portafolios en específico, si el rendimiento particular es menor, generalmente no se invierte en ese activo, generando una pérdida en su valor.

    •	Riesgo País histórico.- Al representar la posibilidad de que la nación donde se realizará el ejercicio no cumpla con sus obligaciones financieras, pensamos que es una variable de interés ya que a priori existe una relación entre la situación económica gubernamental con la situación empresarial. Las políticas tomadas por el primero afectan la confianza y decisiones del segundo.

    •	Rendimientos históricos de las acciones de la BMV.- El comportamiento histórico (tendencia) puede darnos una idea sobre el comportamiento actual y futuro del valor de las acciones.

    •	Tasa impositiva.- En cualquier actividad formal de la economía se debe pagar impuestos, obtener ganancias de capital no es una excepción, introducir esta variable vuelve más realista el escenario. No considerar el impuesto conllevaría sesgar los niveles de utilidades.

    •	Para finalizar las ganancias o pérdidas serán medidas como la diferencia en precios entre los periodos t-(t-1). 


# Marco teórico

Existen modelos que sirven para determinar la rentabilidad de los activos financieros con el fin de asignarlos a un portafolio o para invertir directamente en ellos. El Capital Asset Pricing Model (CAPM) es muy útil para fines de inversión, al representar una de las mejores alternativas para el cálculo de la tasa de retorno exigida por los inversionistas (Ross, Westerfield & Jaffe, 1995).
Este método fue desarrollado por William F. Sharpe (1964), John Lintner (1965) y Jan Mossin (1966), en base a los trabajos de Harry Markowitz. Para ellos los inversionistas optan por aquellas inversiones que dan el mayor rendimiento esperado para un determinado nivel de riesgo, considerando que siempre hay una opción de inversión libre de riesgo. El CAPM puede estimarse con la siguiente regresión:



$r_{i}=r_{0}+β_{1}(E(r)_{m}-r_{0})+ε$

Donde:
    
    ri = Rendimiento esperado de la inversión
    r0 = Tasa libre de riesgo.
    E(rm) = Tasa de rendimiento promedio de los activos disponibles en el mercado

Otro modelo que también sirve para la estimación de los rendimientos de un activo es la Teoría de Valoración por Arbitraje o APT, propuesta por Stephen A. Ross en 1976, para este autor el retorno esperado de los activos con riesgo depende de una combinación lineal de K factores, es decir, la utilidad de un activo se representa como una función lineal de K elementos. 

De manera básica la APT considera un retorno mínimo en ausencia de riesgo (tasa libre de riesgo), la tasa de desempleo para cada periodo estudiado, el índice de la Bolsa a estudiar (símil del rendimiento esperado de mercado en el modelo CAPM), la tasa de inflación (medida con el INPC de los periodos a estudiar) y el riesgo país de la bolsa a estudiar. Como se puede observar el rendimiento de un activo es influenciado por el riesgo sistemático, es decir, por las fluctuaciones en variables macroeconómicas no controladas por el público inversor.
Por otro lado, está el famoso de Teorema de Modigliani Miller que, en su segunda proposición en un mercado de capitales imperfecto (cuando hay impuestos corporativos y no hay una libre entrada y salida de oferentes y demandantes), se puede determinar el costo del capital accionario, es decir, la tasa de rendimiento que piden los inversionistas para invertir en una empresa tomando como variables explicativas a la tasa fiscal, el ratio deuda-capital, el costo de la deuda (tasa de interés que cobran los acreedores o prestamistas). 

# Posibles extensiones del modelo propuesto.

Tal como se observa en el marco teórico, nuestro modelo podría incorporar nuevas variables como las tasas de inflación, es decir, considerar los ajustes en los precios a lo largo del tiempo como un factor explicativo de las pérdidas o ganancias de un activo en la BMV.
Considerar a las tasas de desempleo como variable explicativa también suena interesante. A priori puede existir una relación entre la situación operativa de una empresa, el aumento o contracción del número de trabajadores y el valor de sus acciones.



Bibliografía :
       
       •De Sousa S. Fernando (2013). Modelos de Valoración de activos financieros (CAPM) y teoría de valoración por arbitraje (APT): Un test empírico. Universidade do Estado de Minas Gerais. Brasil.

    •Francisco C. Berenice, Francisco P. Abel (2016). Aplicación de la Teoría del Teorema Modigliani-Miller. Universidad Nacional Pedro Henríquez Ureña. República Dominicana


# Muestra

Para la realizacion de esta muestra se  obtendran las variables antes mencionadas de las 4 empresas con mayor volumen de acciones dentro de la Bolsa Mexiaana de Valores estas empresas son :
    
   
    America Movil (AMXL)
    BIMBO (BIMBOA)
    CEMEX (CEMEXCPO)
    Grupo Mexico (GMEXICOB)
    
Los precios que se ocuparan serán del 2017/03/01 al 2019/12/31 esto implica que la muestra en lo que respecta a la variable de precios tendra un número de observaciones de 708 por empresa. 

Para el nivel de endeudamiento como la tasa impositiva aplicable se podra extraer a partir de un analisis de. la información financiera que cada empresa publica,dicha información financiera se obtendra apartir de la página de internet de la Bolsa Mexicana de Valores

In [1]:
import investpy
import pandas as pd
import statsmodels.api as sm
import numpy as np
from sklearn.linear_model import LogisticRegression 
from sklearn.metrics import classification_report, confusion_matrix

# Precios Acciones 

In [2]:
df_CEMEXCPO=investpy.get_stock_historical_data(stock='CEMEXCPO',
                                        country='mexico',
                                        from_date='27/03/2017',
                                        to_date='31/12/2019')

df_BIMBOA=investpy.get_stock_historical_data(stock='BIMBOA',
                                        country='mexico',
                                        from_date='27/03/2017',
                                        to_date='31/12/2019')

df_AMXL=df_bimboa=investpy.get_stock_historical_data(stock='AMXL',
                                        country='mexico',
                                        from_date='27/03/2017',
                                        to_date='31/12/2019')

df_GMEXICOB=investpy.get_stock_historical_data(stock='GMEXICOB',
                                        country='mexico',
                                        from_date='27/03/2017',
                                        to_date='31/12/2019')

df_CEMEXCPO=df_CEMEXCPO.loc[:,["Close","Volume"]]
df_BIMBOA=df_BIMBOA.loc[:,["Close","Volume"]]
df_AMXL=df_AMXL.loc[:,["Close","Volume"]]
df_GMEXICOB=df_GMEXICOB.loc[:,["Close","Volume"]]



# IPC

In [3]:
df_IPC = investpy.get_index_historical_data(index='S&P/BMV IPC',
                                        country='mexico',
                                        from_date='27/03/2017',
                                        to_date='31/12/2019')

df_IPC =df_IPC.loc[:,["Close","Volume"]]


# Tipo de cambio 

In [4]:
df_usdmxn= investpy.get_currency_cross_historical_data(currency_cross='USD/MXN',
                                                 from_date='27/03/2017',
                                                 to_date='31/12/2019')
df_usdmxn =df_usdmxn.loc[:,"Close"]


# Tasa libre de riesgo

In [5]:
df_bonds=investpy.get_bond_historical_data(bond='Mexico 1M', 
                                  from_date='27/03/2017', to_date='31/12/2019')
df_bonds=df_bonds.loc[:,"Close"]


# Data Frame Base

In [6]:
df_base = pd.concat([df_CEMEXCPO,df_BIMBOA,df_AMXL,df_GMEXICOB,df_IPC,df_usdmxn,df_bonds],axis=1,
                    keys=("CEMEXCPO","BIMBOA","AMXL","GMEXICOB","IPC","USD/MXN","MX 1M"))
df_base=df_base.dropna()
df_base=pd.DataFrame(df_base)



# Data Frame CEMEXCPO

In [7]:
dfcemex = pd.concat([df_CEMEXCPO,df_IPC,df_usdmxn,df_bonds,],axis=1,
                    keys=("CEMEXCPO","IPC","USD/MXN","MX 1M"))
dfcemex = dfcemex.dropna()


# Y Binaria CEMEXCPO  

In [8]:
Y_cemex=dfcemex.pct_change()
Y_cemex= Y_cemex.fillna(1)
Y_cemex=Y_cemex.loc[:,"CEMEXCPO"]
Y_cemex=Y_cemex.loc[:,"Close"]
Y_cemex=pd.DataFrame(Y_cemex)

In [9]:
y_cemex= []
for i in range(len(Y_cemex)):
    crec = Y_cemex['Close'][i]
    if crec <= 0:
        y_cemex.append(0)
    else:
        y_cemex.append(1)

# HACIENDO REGRESIÓN CEMEXCPO

In [10]:
Xcemex=dfcemex
Ycemex=y_cemex
resultadocemex=sm.Logit(Ycemex,Xcemex).fit()
resultadocemex.summary()

Optimization terminated successfully.
         Current function value: 0.681819
         Iterations 4


0,1,2,3
Dep. Variable:,y,No. Observations:,656.0
Model:,Logit,Df Residuals:,650.0
Method:,MLE,Df Model:,5.0
Date:,"Thu, 14 May 2020",Pseudo R-squ.:,0.008181
Time:,10:44:35,Log-Likelihood:,-447.27
converged:,True,LL-Null:,-450.96
Covariance Type:,nonrobust,LLR p-value:,0.194

0,1,2,3,4,5,6
,coef,std err,z,P>|z|,[0.025,0.975]
CEMEXCPO_Close,0.0332,0.059,0.559,0.576,-0.083,0.149
CEMEXCPO_Volume,3.051e-09,6.82e-09,0.447,0.655,-1.03e-08,1.64e-08
IPC_Close,-4.012e-05,4.58e-05,-0.876,0.381,-0.000,4.96e-05
IPC_Volume,1.624e-09,1.72e-09,0.945,0.345,-1.74e-09,4.99e-09
USD/MXN_Close,0.0793,0.095,0.834,0.404,-0.107,0.266
MX 1M_Close,-0.0845,0.177,-0.478,0.633,-0.431,0.262


In [23]:
np.corrcoef(Xcemex)

array([[1.        , 0.9983707 , 0.99998854, ..., 0.9992526 , 0.99999623,
        0.99766505],
       [0.9983707 , 1.        , 0.99863244, ..., 0.99541897, 0.99852287,
        0.99993647],
       [0.99998854, 0.99863244, 1.        , ..., 0.99905609, 0.99999785,
        0.99798057],
       ...,
       [0.9992526 , 0.99541897, 0.99905609, ..., 1.        , 0.99914334,
        0.99427994],
       [0.99999623, 0.99852287, 0.99999785, ..., 0.99914334, 1.        ,
        0.99784806],
       [0.99766505, 0.99993647, 0.99798057, ..., 0.99427994, 0.99784806,
        1.        ]])

# Data Frame BIMBOA

In [11]:
dfbimboa = pd.concat([df_BIMBOA,df_IPC,df_usdmxn,df_bonds],axis=1,
                    keys=("BIMBOA","IPC","USD/MXN","MX 1M"))
dfbimboa = dfbimboa.dropna()

# Y Binaria BIMBOA  

In [12]:
Y_bimboa=dfbimboa.pct_change()
Y_bimboa= Y_bimboa.fillna(1)
Y_bimboa=Y_bimboa.loc[:,"BIMBOA"]
Y_bimboa=Y_bimboa.loc[:,"Close"]
Y_bimboa=pd.DataFrame(Y_bimboa)

In [13]:
y_bimboa=[]
for i in range(len(Y_bimboa)):
    crec = Y_bimboa['Close'][i]
    if crec <= 0:
        y_bimboa.append(0)
    else:
        y_bimboa.append(1)

# HACIENDO REGRESIÓN BIMBOA

In [14]:
X_bimboa=dfbimboa
Ybimboa=y_bimboa
resultadobimboa=sm.Logit(Ybimboa,X_bimboa).fit()
resultadobimboa.summary()

Optimization terminated successfully.
         Current function value: 0.688090
         Iterations 4


0,1,2,3
Dep. Variable:,y,No. Observations:,656.0
Model:,Logit,Df Residuals:,650.0
Method:,MLE,Df Model:,5.0
Date:,"Thu, 14 May 2020",Pseudo R-squ.:,0.006336
Time:,10:44:35,Log-Likelihood:,-451.39
converged:,True,LL-Null:,-454.27
Covariance Type:,nonrobust,LLR p-value:,0.3306

0,1,2,3,4,5,6
,coef,std err,z,P>|z|,[0.025,0.975]
BIMBOA_Close,0.0536,0.032,1.694,0.090,-0.008,0.116
BIMBOA_Volume,8.395e-08,5.56e-08,1.509,0.131,-2.51e-08,1.93e-07
IPC_Close,-4.088e-05,3.36e-05,-1.219,0.223,-0.000,2.49e-05
IPC_Volume,-9.872e-10,1.37e-09,-0.719,0.472,-3.68e-09,1.7e-09
USD/MXN_Close,-0.0360,0.087,-0.413,0.679,-0.207,0.135
MX 1M_Close,0.0392,0.160,0.245,0.806,-0.274,0.352


# Data Frame AMXL

In [15]:
dfAMXL = pd.concat([df_AMXL,df_IPC,df_usdmxn,df_bonds],axis=1,
                    keys=("AMXL","IPC","USD/MXN","MX 1M"))
dfAMXL = dfAMXL.dropna()

# Y Binaria AMXL 

In [16]:
Y_amxl=dfAMXL.pct_change()
Y_amxl= Y_amxl.fillna(1)
Y_amxl=Y_amxl.loc[:,"AMXL"]
Y_amxl=Y_amxl.loc[:,"Close"]
Y_amxl=pd.DataFrame(Y_amxl)

In [17]:
y_amxl= []
for i in range(len(Y_amxl)):
    crec = Y_cemex['Close'][i]
    if crec <= 0:
        y_amxl.append(0)
    else:
        y_amxl.append(1)

# HACIENDO REGRESIÓN AMXL

In [18]:
Xamxl=dfAMXL
Yamxl=y_amxl
resultadoamxl=sm.Logit(Yamxl,Xamxl).fit()
resultadoamxl.summary()

Optimization terminated successfully.
         Current function value: 0.681537
         Iterations 4


0,1,2,3
Dep. Variable:,y,No. Observations:,656.0
Model:,Logit,Df Residuals:,650.0
Method:,MLE,Df Model:,5.0
Date:,"Thu, 14 May 2020",Pseudo R-squ.:,0.008591
Time:,10:44:35,Log-Likelihood:,-447.09
converged:,True,LL-Null:,-450.96
Covariance Type:,nonrobust,LLR p-value:,0.1707

0,1,2,3,4,5,6
,coef,std err,z,P>|z|,[0.025,0.975]
AMXL_Close,0.0139,0.083,0.168,0.866,-0.148,0.176
AMXL_Volume,-5.99e-09,6.67e-09,-0.898,0.369,-1.91e-08,7.09e-09
IPC_Close,-2.031e-05,2.88e-05,-0.705,0.481,-7.67e-05,3.61e-05
IPC_Volume,4.085e-09,2.26e-09,1.808,0.071,-3.44e-10,8.51e-09
USD/MXN_Close,0.0564,0.090,0.630,0.528,-0.119,0.232
MX 1M_Close,-0.1314,0.165,-0.798,0.425,-0.454,0.191


# Data Frame GMEXICOB

In [19]:
dfgmexicob = pd.concat([df_GMEXICOB,df_IPC,df_usdmxn,df_bonds],axis=1,
                    keys=("GMEXICOB","IPC","USD/MXN","MX 1M"))
dfgmexicob = dfgmexicob.dropna()

# Y Binaria GMEXICOB 

In [20]:
Y_gmexicob=dfgmexicob.pct_change()
Y_gmexicob= Y_gmexicob.fillna(1)
Y_gmexicob=Y_gmexicob.loc[:,"GMEXICOB"]
Y_gmexicob=Y_gmexicob.loc[:,"Close"]
Y_gmexicob=pd.DataFrame(Y_gmexicob)

In [21]:
y_gmexicob= []
for i in range(len(Y_cemex)):
    crec = Y_cemex['Close'][i]
    if crec <= 0:
        y_gmexicob.append(0)
    else:
        y_gmexicob.append(1)

# HACIENDO REGRESIÓN GMEXICOB

In [22]:
Xgmexicob=dfgmexicob
Ygmexicob=y_gmexicob
resultadogmexicob=sm.Logit(Ygmexicob,Xgmexicob).fit()
resultadogmexicob.summary()

Optimization terminated successfully.
         Current function value: 0.681215
         Iterations 4


0,1,2,3
Dep. Variable:,y,No. Observations:,656.0
Model:,Logit,Df Residuals:,650.0
Method:,MLE,Df Model:,5.0
Date:,"Thu, 14 May 2020",Pseudo R-squ.:,0.00906
Time:,10:44:35,Log-Likelihood:,-446.88
converged:,True,LL-Null:,-450.96
Covariance Type:,nonrobust,LLR p-value:,0.1471

0,1,2,3,4,5,6
,coef,std err,z,P>|z|,[0.025,0.975]
GMEXICOB_Close,-0.0138,0.018,-0.759,0.448,-0.049,0.022
GMEXICOB_Volume,1.509e-08,2.16e-08,0.699,0.484,-2.72e-08,5.74e-08
IPC_Close,1.082e-06,3.14e-05,0.034,0.973,-6.05e-05,6.26e-05
IPC_Volume,1.651e-09,1.39e-09,1.189,0.234,-1.07e-09,4.37e-09
USD/MXN_Close,0.0490,0.089,0.552,0.581,-0.125,0.223
MX 1M_Close,-0.1141,0.162,-0.703,0.482,-0.432,0.204


# Exploracion de Datos 

In [26]:
pip install plotly==4.7.1

Collecting plotly==4.7.1
[?25l  Downloading https://files.pythonhosted.org/packages/d7/78/eb6cbe96c8379c54819592bb228c58ed7386fcc60a55eca7db99432fdf14/plotly-4.7.1-py2.py3-none-any.whl (11.5MB)
[K     |████████████████████████████████| 11.5MB 2.4MB/s eta 0:00:01
[?25hCollecting retrying>=1.3.3 (from plotly==4.7.1)
  Downloading https://files.pythonhosted.org/packages/44/ef/beae4b4ef80902f22e3af073397f079c96969c69b2c7d52a57ea9ae61c9d/retrying-1.3.3.tar.gz
Building wheels for collected packages: retrying
  Building wheel for retrying (setup.py) ... [?25ldone
[?25h  Created wheel for retrying: filename=retrying-1.3.3-cp37-none-any.whl size=11429 sha256=73ca6b29a1497a277d91688fde3a34b17dbb39f41ff59089227ae5669832fa08
  Stored in directory: /Users/manueldiaz/Library/Caches/pip/wheels/d7/a9/33/acc7b709e2a35caa7d4cae442f6fe6fbf2c43f80823d46460c
Successfully built retrying
Installing collected packages: retrying, plotly
Successfully installed plotly-4.7.1 retrying-1.3.3
Note: you may need

In [33]:
Xgmexicob

Unnamed: 0_level_0,GMEXICOB,GMEXICOB,IPC,IPC,USD/MXN,MX 1M
Unnamed: 0_level_1,Close,Volume,Close,Volume,Close,Close
Date,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2
2017-03-26,58.22,16789636.0,49312.99,181241648.0,18.8905,6.400
2017-03-27,56.61,13514367.0,49339.24,167514368.0,19.0252,6.451
2017-03-28,58.17,10323328.0,49036.52,189357664.0,18.7092,6.390
2017-03-29,57.54,6801787.0,48863.30,146154288.0,18.7190,6.531
2017-03-30,56.28,12876243.0,48541.56,250132560.0,18.7250,6.460
...,...,...,...,...,...,...
2019-12-23,53.40,702425.0,44157.97,13691800.0,18.9810,7.230
2019-12-25,54.21,1862661.0,44300.17,32194100.0,18.9405,7.190
2019-12-26,53.78,2333090.0,44261.51,59475000.0,18.8394,7.150
2019-12-29,51.89,2252623.0,43657.48,81802896.0,18.9315,7.190


In [27]:
import plotly.express as px

In [42]:
px.scatter(resultadogmexicob)

ValueError: DataFrame constructor not properly called!