# Rendimiento vs. Riesgo. ¿Cómo medirlos?

<img style="float: left; margin: 15px 15px 15px 15px;" src="http://www.creative-commons-images.com/clipboard/images/return-on-investment.jpg" width="300" height="100" />
<img style="float: right; margin: 15px 15px 15px 15px;" src="https://upload.wikimedia.org/wikipedia/commons/5/5a/Risk-dice-example.jpg" title="github" width="300" height="100" />

# Necesito definir con ustedes un horario para reposición de clases.

> En mercados competitivos, **rendimientos esperados** más altos solo se dan a un precio: necesitas asumir un **riesgo** mayor.

*Objetivos:*
- Recordar elementos básicos de probabilidad.
- Entender el equilibrio entre rendimiento y riesgo.
- Entender el concepto de riesgo.
- Desarrollar medidas cuantitativas de rendimiento y riesgo para activos.

Referencia general:
Notas del curso "Portfolio Selection and Risk Management", Rice University, disponible en Coursera.
___

## 0. Antes de empezar... recorderis de probabilidad

### 0.1. Variables aleatorias
En teoría de probabilidad, una variable aleatoria (cantidad aleatoria o variable estocástica) es una variable cuyos posibles valores dependen del resultado de un fenómeno aleatorio.

Es común que dichos resultados dependan de ciertas variables físicas (o económicas) que no están del todo entendidas o conocidas. Por ejemplo, cuando se tira una moneda justa, el resultado final de cara o sello depende de ciertas cantidades físicas con incertidumbre.

Referencia: https://en.wikipedia.org/wiki/Probability_theory

En mercados financieros, los precios de las acciones responden a como el mercado agrega información (ese proceso depende de la calidad del mercado). Incluso, aunque ese proceso sea conocido, hay eventos que no podemos anticipar. De modo que los precios y rendimientos de los instrumentos los tratamos como variables aleatorias.

### 0.2. Función discreta de probabilidad
Consideramos un conjunto finito (o contable) $\Omega$ de todos los posibles resultados (o realizaciones) de una variable aleatoria $X$. Entonces a cada elemento en $x\in\Omega$ se le asocia una probabilidad intrínseca $P(X=x)$ que satisface:

1. $0\leq P(X=x)\leq1$ para cada $x\in\Omega$,
2. $\sum_{x\in\Omega} P(X=x)=1$.

Referencia: https://en.wikipedia.org/wiki/Probability_theory

Para nuestros fines, el conjunto $\Omega$ lo estimaremos con un conjunto finito de la forma $\Omega=\left\lbrace x_j\,:\,j=1,\dots,m\right\rbrace$. Entonces, la segunda condición se puede escribir como

$$\sum_{j=1}^m P(X=x_j)=1.$$

Equivalentemente, si definimos $p_j=P(X=x_j)$

$$\sum_{j=1}^m p_j=1.$$

### 0.3. Valor esperado

<img style="float: left; margin: 0px 15px 15px 15px;" src="https://upload.wikimedia.org/wikipedia/commons/f/f9/Largenumbers.svg" width="400" height="200" />

El valor esperado de una variable aleatoria es, intuitivamente, el valor promedio a largo plazo de las repeticiones del experimento que representa. Informalmente, la ley de los grandes números afirma que la media aritmética de los resultados de un experimento aleatorio converge al valor esperado cuando el número de repeticiones tiende a infinito. *Ver ejemplo del dado*.

Para una variable aleatoria discreta $X$

$$E[X]=\sum_{x\in\Omega} xP(X=x).$$

En el caso finito

$$E[X]=\sum_{j=1}^{m} p_jx_j.$$

### 0.4. Varianza

<img style="float: right; margin: 0px 15px 15px 15px;" src="https://upload.wikimedia.org/wikipedia/commons/f/f9/Comparison_standard_deviations.svg" width="400" height="200" />

La varianza es el valor esperado de la desviación al cuadrado de una variable aleatoria de su media. Informalmente, mide que tan dispersos (lejos) están los datos de su valor esperado. La desviación estándar es la raiz cuadrada de la varianza.

Para una variable aleatoria discreta $X$

$$Var(X)=\sigma_X^2=E[(X-E[X])^2]=\sum_{x\in\Omega} P(X=x)(x-E[X])^2.$$

En el caso finito

$$\sigma_X^2=\sum_{j=1}^{m} p_j(x_j-E[X])^2.$$
___

## 1. Introducción

### 1.1. Compensación rendimiento/riesgo
- Cuando se realiza una inversión, pobablemente se anticipan ciertos rendimientos (esperados) futuros. 
- Sin embargo, dichos rendimientos futuros no pueden ser predichos con precisión.
- Siempre hay cierto riesgo asociado.
- El rendimiento real casi siempre se desviará de lo que inicialmente se esperaba al inicio del periodo de inversión.

**Ejemplo:** 
<img style="float: right; margin: 15px 15px 15px 15px;" src="https://upload.wikimedia.org/wikipedia/commons/7/7e/S_and_P_500_chart_1950_to_2016_with_averages.png" title="github" width="300" height="100" />
- ¿Qué es el índice S&P500?
- En su peor año, el índice S&P500 cayó un 46% (1926).
- En el 2010, el índice subió un 55%.

Los inversionistas nunca anticiparon estos resultados extremos cuando realizaron sus inversiones en estos periodos.

- Obviamente, todos nosotros preferimos los rendimientos esperados de inversión más altos posibles.

- En economía no hay torta gratis. Si deseamos renimientos esperados más altos, nos sometemos a un nivel de riesgo más alto. ¿Porqué? Intuitivamente:
 - Si pudiéramos obtener más rendimiento sin riesgo extra en un activo: todo el mundo compraría este activo, el precio aumentaría y el rendimiento caería.
 - Si los rendimientos no estuvieran correlacionados con el riesgo,todo el mundo vendería activos con riesgo: ¿para qué tener activos riesgosos si los rendimientos no están relacionados con el riesgo? mejor tener activos con el mismo rendimiento y sin riesgo.

**Conclusión: hay una compensación de equilibrio entre rendimiento y riesgo.**

### 1.2. Concepto de riesgo

<img style="float: left; margin: 0px 15px 15px 15px;" src="https://upload.wikimedia.org/wikipedia/commons/0/09/Playing-risk-venezuela.JPG" title="github" width="300" height="100" />

Hasta acá todo bien, pero, ¿qué es **riesgo**?, ¿cómo se mide?

- Riesgo significa que en realidad no sabemos qué es lo que va a pasar (incertidumbre).
- "Más cosas pueden pasar de las que pasarán en realidad".
- Existen varias posibilidades pero no sabemos cuál será el resultado.

Instintivamente, asociamos riesgo con peligro. Sin embargo, solo porque más cosas pueden pasar de las que pasarán, no significa que cosas malas pasarán: el resultado puede ser mejor de lo que inicialmente esperamos.

- Piensen en la expresión "me arriesgué".

- Ahora, de acuerdo a lo anterior, ¿cómo podríamos cuantificar el riesgo?
- Debe tener relación con la *dispersión* de los rendimientos de un activo (fluctuación).
- Esta es una parte de la historia; cuando combinamos activos en un portafolio, también debemos pensar cómo los rendimientos de los activos se mueven en relación a los demás.
___

## 2. Midiendo el rendimiento

### 2.1. Rendimiento medio geométrico

El **rendimiento** que se obtiene al invertir en un activo sobre un periodo se puede calcular directamente.

**Ejemplo:** 
- Suponga que usted invierte en un fondo de acciones. Cada acción se vende actualmente en $\$100$. 
- Suponga que su horizonte de inversión es de un año. Si el precio de la acciónal final del año es $\$110$ y los dividendos en el año son $\$5$, ¿cuál es su rendimiento en el periodo de tenencia?

**Ejemplo:** suponga que tiene una serie de rendimientos anuales para el índice S&P500

In [1]:
# Importamos la librería pandas
import pandas as pd

In [10]:
# Creamos tabla
tabla = pd.DataFrame(columns=['ret', '1+ret', 'cumm'], index=range(1,6))
tabla.index.name = 'year'
tabla['ret']=[-0.15,-0.2,0.3,0.2,0.1]

# Llenar celdas faltantes
tabla['1+ret']=tabla['ret']+1
tabla['cumm']=tabla['1+ret'].cumprod()
tabla

Unnamed: 0_level_0,ret,1+ret,cumm
year,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1,-0.15,0.85,0.85
2,-0.2,0.8,0.68
3,0.3,1.3,0.884
4,0.2,1.2,1.0608
5,0.1,1.1,1.16688


In [11]:
tabla['cumm'].std

<bound method Series.std of year
1    0.85000
2    0.68000
3    0.88400
4    1.06080
5    1.16688
Name: cumm, dtype: float64>

1. ¿Cuál es el rendimiento en el periodo de tenencia de los cinco años?

2. ¿Cuál es el rendimiento promedio anual a través de los cinco años?

In [12]:
tabla['ret'].std

<bound method Series.std of year
1   -0.15
2   -0.20
3    0.30
4    0.20
5    0.10
Name: ret, dtype: float64>

In [13]:
ret_summary = pd.DataFrame(tabla={'Mean':ret.mean(),
                                 'Volatility':ret.std()},index=ret.columns)
ret_summary

NameError: name 'ret' is not defined

In [50]:
# Respuesta a la pregunta 1
r05 = tabla.iloc[-1,-1]-1
r05

0.16688000000000036

In [51]:
# Respuesta a la pregunta 2
rg = tabla.iloc[-1,-1]**(1/5)-1
rg

0.0313480202103642

En general, el **rendimiento medio geométrico** $\bar{r}_g$ satisface

$$(1+\bar{r}_g)^T=\prod_{i=1}^{T}(1+r_i),$$

o equivalentemente

$$\bar{r}_g=\left[\prod_{i=1}^{T}(1+r_i)\right]^{1/T}-1.$$

### 2.2. Rendimiento medio aritmético

Si pudiéramos obtener escenarios probables para la economía, asociados con ciertas probabilidades, podríamos calcular el **rendimiento esperado** como el promedio ponderado (valor esperado) por probabilidad de los posibles resultados.

Esto es

$$E[r]=\sum_{j=1}^{m}p_jr_j,$$

donde $r_j$ para $j=1,2,\dots,m$ son los posibles rendimientos y $p_j$ es la probabilidad asociada a que ocurra el rendimiento $r_j$.

**Ejemplo:**
- Suponga que usted invierte en un fondo de acciones. Cada acción se vende actualmente en \$100.
- Suponga que hay cuatro posibles estados futuros de la economía, los cuales se resumen en la siguiente tabla

In [17]:
# Creamos tabla
tabla2 = pd.DataFrame(columns=['prob', 'price', 'div', 'ret'], index=['excellent', 'good', 'poor', 'crash'])
tabla2.index.name = 'state'
tabla2['prob']=[0.25,0.45,0.25,0.05]
tabla2['price']=[126.50,110.00,89.75,46.00]
tabla2['div']=[4.50,4.00,3.50,2.00]
# Llenar celdas faltantes
tabla2['ret']=(tabla2['price']+tabla2['div']-100)/100
tabla2

Unnamed: 0_level_0,prob,price,div,ret
state,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
excellent,0.25,126.5,4.5,0.31
good,0.45,110.0,4.0,0.14
poor,0.25,89.75,3.5,-0.0675
crash,0.05,46.0,2.0,-0.52


Calcular el rendimiento esperado

In [18]:
(tabla2['prob']*tabla2['ret']).sum()

0.09762500000000002

**Ejemplo:** para la serie de rendimientos anuales para el índice S&P500, podríamos considerar cada uno de los rendimientos observados como posibles resultados igualmente probables...

In [35]:
tabla

Unnamed: 0_level_0,ret,1+ret,cumm
year,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1,-0.1,0.9,0.9
2,0.2,1.2,1.08
3,0.3,1.3,1.404


Entonces el rendimiento esperado se obtiene simplemente como el promedio aritmético de los rendimientos

In [36]:
Er=tabla['ret'].sum()/len(tabla)
Er

0.13333333333333333

In [40]:
Er=tabla['ret'].mean()
Er

0.13333333333333333

Primer momento alrededor del cero es la media o valor esperado de la variable aleatoria. La media de una variable aleatoria se considera como una cantidad numérica alrededor de la cual los valores de la variable aleatoria tienden a agruparse. Por lo tanto, la media es una medida de tendencia central.

**Conclusión: los rendimientos esperados están relacionados con la media (valor esperado) o primer momento alrededor del cero. **

### 2.3. Ejercicios

En esta sección se dejarán algunos ejercicios para ustedes. Si alcanza el tiempo, se harán en clase.

**Ejercicio.** Considere el siguiente reporte de rendimientos de cierta acción en los últimos tres años

| Año | Rendimiento |
| --- | ----------- |
| 1   | -0.10       |
| 2   | 0.20        |
| 3   | 0.30        |

- Calcular el rendimiento medio geométrico. ¿Cuál es su significado?
- Calcular el rendimiento medio aritmético. ¿Cuál es su significado?

In [7]:
# importamos pandas
import pandas as pd

In [8]:
# Creamos data frame


In [9]:
# rendimiento medio geometrico


In [10]:
# rendimiento medio aritmetico


## 3. Midiendo el riesgo

### 3.1. La volatilidad como medida de riesgo
Dado que el riesgo está estrechamente relacionado con *cuánto no sabemos* acerca de lo que va a pasar, lo podemos cantificar con alguna medida de dispersión de la variable aleatoria de rendimientos.

**Ejemplo:** 
- Tiramos una moneda que no está cargada. 
- Definimos la variable aleatoria $X$, la cual toma el valor de $+1$ cuando la moneda cae cara y el valor de $-1$ cuando cae sello. 
- Como la moneda no está cargada, los eventos tienen igual probabilidad $P(X=1)=P(X=-1)=0.5$.

El valor esperado de la variable aleatoria $X$ es:

$$E[X]=0.5\times(+1)+0.5\times(-1)=0.$$

Aunque el resultado real nunca va a ser cero, el resultado esperado es cero. *Necesitamos otra medida adicional para describir la distribución*.

**Ejemplo:**
- Suponga que cada acción de la compañía XYZ en $t=0$ cuestan \$100.
- Existen tres posibilidades para el precio de una acción de XYZ en $t=1$:
 - El precio subirá a \$140 (probabilidad del 25%)
 - El precio subirá a \$110 (probabilidad del 50%)
 - El precio bajará a \$80 (probabilidad del 25%)

Entonces, ¿cómo describimos una distribución de rendimiento?
1. Tendencia central:
 - Usaremos el valor esperado de los rendimientos como su tendencia central (ya vimos porqué).
2. Medida de dispersión:
 - Usaremos la desviación estándar (volatilidad) o varianza como medida de dispersión para las distribuciones de rendimiento...

En el ejemplo anterior

In [22]:
# Creamos tabla
tabla_A=pd.DataFrame(columns=['Prob','Precio','Rend'],index=range(1,4))
tabla_A['Prob']=[0.25,0.5,0.25]
tabla_A['Precio']=[140,110,80]
tabla_A['Rend']=(tabla_A['Precio']-100)/100
tabla_A

Unnamed: 0,Prob,Precio,Rend
1,0.25,140,0.4
2,0.5,110,0.1
3,0.25,80,-0.2


In [52]:
# Importamos librería numpy
import numpy as np

In [30]:
# Calculamos rendimiento esperado
Er=(tabla_A['Prob']*tabla_A['Rend']).sum()
Er

0.10000000000000002

In [1]:
# Calculamos varianza
sr2=(((tabla['ret']-Er)**2).sum())**0.5
sr2

NameError: name 'tabla' is not defined

In [54]:
# Calculamos volatilidad
sr=np.sqrt(sr2)
sr

0.47404875511092975

**Conclusión: la varianza y la desviación estándar nos brindad una medida de riesgo (incertidumbre, dispersión, volatilidad) en las realizaciones.**

### 3.2. Ejercicios

En esta sección se dejarán algunos ejercicios para ustedes. Si alcanza el tiempo, se harán en clase.

**Ejercicio 1.** A partir del análisis de un asesor financiero, se obtuvieron los siguientes datos de rendimientos de activos de cómputo y de telecomunicaciones, relativos a posibles situaciones económicas futuras

| Condición  económica | Rendimiento activo de cómputo | Rendimiento activo telecomunicaciones | Probabilidad |
| -------------------- | ----------------------------- | ------------------------------------- | ------------ |
| Declive              | -0.04                         | 0.07                                  | 0.2          |
| Estable              | 0.02                          | 0.04                                  | 0.5          |
| Mejora               | 0.10                          | 0.03                                  | 0.3          |

Calcular, para cada activo, su rendimiento esperado y volatilidad.

**Ejercicio 2.** Con base en la siguiente distribución de rendimientos para el activo A, calcular la desviación estándar.

| Probabilidad | Rendimiento |
| ------------ | ----------- |
| 0.3          | 0.10        |
| 0.4          | 0.05        |
| 0.3          | 0.30        |

In [16]:
# Creamos tabla


### 3.3. Más acerca de medición de riesgo

- Entonces, con lo que hemos visto hasta ahora, la distribución de rendimientos de un activo se puede describir simplemente con el rendimiento esperado y la desviación estándar.
- Esto es porque todos los análisis en finanzas se simplifican increiblemente si podemos aproximar los rendimientos con una distribución nomal.

Pero, ¿qué pasa si la distribución de rendimientos difiere significativamente de una distribución normal?

**Ejemplo.**

Referencia: Asset Management: A Systematic Approach to Factor Investing. Andrew Ang, 2014. ISBN: 9780199959327.

Las siguientes gráficas presentan la riqueza acumulada de una inversión de \$1 en el índice S&P500, y en una estrategia de volatilidad sobre el mismo índice.

![image1](figures/VolStrat_S&P500_1)

- Una *estrategia de volatilidad* es una estrategia de inversión que recibe primas durante periodos estables, pero tiene amplias pérdidas en periodos volátiles.
- Veamos histogramas de los rendimientos de las diferentes estrategias

<img style="float: left; margin: 15px 15px 15px 15px;" src="figures/VolStrat_S&P500_2" width="450" height="100" />
<img style="float: right; margin: 15px 15px 15px 15px;" src="figures/VolStrat_S&P500_3" width="450" height="100" />

¿Diferencias notables?

Se resumen los cuatro momentos para cada uno de los rendimientos en las siguientes tablas.

| Medida         | Estrategia Vol. | Índice S&P500 |
| -------------- | ----------------| ------------- |
| Media          | 0.099           | 0.097         |
| Desv. Estándar | 0.152           | 0.151         |
| Asimetría      | -8.3            | -0.6          |
| Curtosis       | 104.4           | 4.0           |

**Asimetría (Skewness):**
- Una distribución normal tiene medida de asimetría de cero.
- Cuando una distribución es asimétrica hacia la izquierda, los valores negativos extremos (lejos de la media a la izquierda) dominan y la medida es negativa.
- Cuando una distribución es asimétrica hacia la derecha, los valores positivos extremos (lejos de la media a la derecha) dominan y la medida es positiva.
- La volatilidad subestima el riesgo cuando hay asimetría significativa.

¿Es siempre inconveniente tener asimetría?, ¿cuando sí?, ¿cuando no?

**Curtosis (Kurtosis):**
- Es una medida de cuán pesadas son las colas.
- Una distribución normal tiene medida de curtosis de 3.
- Colas pesadas implican que hay mayor probabilidad de ocurrencia de eventos extremos (lejos de la media).
- De nuevo, la desviación estándar subestima el riesgo cuando hay curtosis significativa.

### Recapitulando...

No es que la desviación estándar sólo aplique para distribuciones normales. Más bien, la volatilidad no captura bien la probabilidad de eventos extremos para distribuciones no normales.

- Para rendimientos normalmente distribuidos, un rendimiento alejado $2\sigma$ del rendimiento esperado es muy poco probable. Un rendimiento alejado $5\sigma$ del rendimiento esperado es casi imposible que suceda.
- Sin embargo, para ciertas estrategias de cobertura, $E[r]\pm 2\sigma$ es común y $E[r]\pm 5\sigma$ podría llegar a pasar.

Entonces, la volatilidad es una buena medida de riesgo, siempre y cuando tengamos distribuciones simétricas y sin mucho riesgo de eventos extremos. En otro caso, no es una medida apropiada.

Otras medidas de riesgo que intentan capturar estos fenómenos son:
- VaR (valor en riesgo)
- CVaR (valor en riesgo condicional)

# Anuncios parroquiales

## 1. Recordar tarea de Markdown para hoy.

## 2. Quiz la siguiente clase... ¡llegar temprano!

<script>
  $(document).ready(function(){
    $('div.prompt').hide();
    $('div.back-to-top').hide();
    $('nav#menubar').hide();
    $('.breadcrumb').hide();
    $('.hidden-print').hide();
  });
</script>

<footer id="attribution" style="float:right; color:#808080; background:#fff;">
Created with Jupyter by Esteban Jiménez Rodríguez.
</footer>