# Clase 3, entendiendo los conceptos de riesgo

- Repaso de probabilidad
- Diferentes medidas de rendimiento y riesgo 


Referencia general:
Notas del curso "Portfolio Selection and Risk Management", Rice University, disponible en Coursera.


<img style="float: left; margin: 15px 15px 15px 15px;" src="http://www.creative-commons-images.com/clipboard/images/return-on-investment.jpg" width="300" height="100" />
<img style="float: right; margin: 15px 15px 15px 15px;" src="https://upload.wikimedia.org/wikipedia/commons/5/5a/Risk-dice-example.jpg" title="github" width="300" height="100" />



###  Función discreta de probabilidad
Consideramos un conjunto finito (o contable) $\Omega$ de todos los posibles resultados (o realizaciones) de una variable aleatoria $X$. Entonces a cada elemento en $x\in\Omega$ se le asocia una probabilidad intrínseca $P(X=x)$ que satisface:

1. $0\leq P(X=x)\leq1$ para cada $x\in\Omega$,
2. $\sum_{x\in\Omega} P(X=x)=1$.

Referencia: https://en.wikipedia.org/wiki/Probability_theory

Para nuestros fines, el conjunto $\Omega$ lo estimaremos con un conjunto finito de la forma $\Omega=\left\lbrace x_j\,:\,j=1,\dots,m\right\rbrace$. Entonces, la segunda condición se puede escribir como

$$\sum_{j=1}^m P(X=x_j)=1.$$

Equivalentemente, si definimos $p_j=P(X=x_j)$

$$\sum_{j=1}^m p_j=1.$$

Ejemplo:

Tiro una moneda, 

$\Omega$ = {Aguila, Sello}

$P(moneda) = Aguila = 0.5$

$P(moneda) = Sello = 0.5$

$P(moneda) = Sello + P(moneda) = Aguila = 1$

Se cumple que:

$\sum_{j=1}^m p_j=1.$


### Valor esperado


El valor esperado de una variable aleatoria es, intuitivamente, el valor promedio a largo plazo de las repeticiones del experimento que representa. Informalmente, la ley de los grandes números afirma que la media aritmética de los resultados de un experimento aleatorio converge al valor esperado cuando el número de repeticiones tiende a infinito. 
Para una variable aleatoria discreta $X$

$$E[X]=\sum_{j=1}^{m} p_jx_j.$$

Ejemplo, ¿cual es el valor esperado de esta apuesta?

- Gano 100 si sale Aguila
- Pierdo 100 si sale Sello

$\Omega$ = {Aguila, Sello}

$P(y = Aguila) +  P(y = Sello) = 1 $

$E[X] = P(y = Aguila) * 100 + P(y= Sello) * -100 $

$E[X] = 0.5 * 100 + 0.5 * -100  = 0 $

In [1]:
import random
import pandas as pd
import numpy as np
from random import choices
import matplotlib.pyplot as plt

## Ejemplo, Doy un prestamo de $1000 con un interes de 10%.

El modelo de riesgos me dice que hay un 10% de probabilidad que el cliente no me pague. ¿Cuál es el valor esperado?

$\Omega$ = {pago, mora}

- Si el clinte paga, gano $100 

- Si el cliente no me paga, pierdo $1,000


Calcula el valor esperado teoríco y empirico 

In [4]:
### Calcula los valores esperados
100 * 0.9 - 1000 * 0.1

-10.0

In [6]:
200 * 0.9 - 1000 * 0.1

80.0

In [5]:
# Ahora prob de que no pague es 5%
100 * 0.95 - 1000 * 0.05

45.0

In [20]:
### Simula el prestamo para 1000 casos y aparte calcula el valor esperado teoríco 
prestamo=[]
for i in range(100000):
    prestamo.append(random.choices([100,-1000], weights=(90,10))[0])
np.sum(prestamo)

-1110000

In [21]:
np.mean(prestamo)

-11.1

In [22]:
prestamo=[]
for i in range(100000):
    prestamo.append(random.choices([100,-1000], weights=(95,5))[0])
np.sum(prestamo)

4504400

In [23]:
np.mean(prestamo)

45.044

### Varianza

<img style="float: right; margin: 0px 15px 15px 15px;" src="https://upload.wikimedia.org/wikipedia/commons/f/f9/Comparison_standard_deviations.svg" width="400" height="200" />

La varianza es el valor esperado de la desviación al cuadrado de una variable aleatoria de su media. Informalmente, mide que tan dispersos (lejos) están los datos de su valor esperado. La desviación estándar es la raiz cuadrada de la varianza.

Para una variable aleatoria discreta $X$

$$Var(X)=\sigma_X^2=E[(X-E[X])^2]=\sum_{x\in\Omega} P(X=x)(x-E[X])^2.$$



$$Var(P) = P(pague) * (X_1 - E[X])^2  + P(no) * (X_2 - E[X])^2 $$

Calcula la varianza del préstamo 



In [24]:
# Teoríco
# Prestamo 1
ve1= 100 * 0.9 - 1000 * 0.10

# var = ve(X- E[X])**2
var= 0.9 * (100-ve1)**2 + 0.1 * (-1000-ve1)**2
volatilidad=np.sqrt(var)

ve1,volatilidad

(-10.0, 330.0)

In [27]:
# Empirico
prestamo=[]
for i in range(100000):
    prestamo.append(random.choices([100,-1000], weights=(90,10))[0])
np.mean(prestamo),np.std(prestamo)

(-9.076, 328.76439318150017)

In [31]:
# Prestamo2
ve2= 200 * 0.9 - 1000 * 0.1

# var = ve(X- E[X])**2
var= 0.9 * (200-ve2)**2 + 0.1 * (-1000-ve2)**2
volatilidad=np.sqrt(var)

ve2,volatilidad

(80.0, 360.0)

In [32]:
prestamo=[]
for i in range(100000):
    prestamo.append(random.choices([200,-1000], weights=(90,10))[0])
np.mean(prestamo),np.std(prestamo)

(80.204, 359.72783932300814)

In [33]:
ve3= 100 * 0.95 - 1000 * 0.05

# var = ve(X- E[X])**2
var= 0.95 * (100-ve3)**2 + 0.05 * (-1000-ve3)**2
volatilidad=np.sqrt(var)

ve3,volatilidad

(45.0, 239.73944189473704)

In [34]:
prestamo=[]
for i in range(100000):
    prestamo.append(random.choices([100,-1000], weights=(95,5))[0])
np.mean(prestamo),np.std(prestamo)

(44.846, 240.0571521200733)

### 1.1. Compensación rendimiento/riesgo
- Cuando se realiza una inversión, pobablemente se anticipan ciertos rendimientos (esperados) futuros. 
- Sin embargo, dichos rendimientos futuros no pueden ser predichos con precisión.
- Siempre hay cierto riesgo asociado.
- Todo el mundo quiere la mayor cantidad de rendimientos

**Ejemplo:** 
<img style="float: right; margin: 15px 15px 15px 15px;" src="https://upload.wikimedia.org/wikipedia/commons/7/7e/S_and_P_500_chart_1950_to_2016_with_averages.png" title="github" width="300" height="100" />
- ¿Qué es el índice S&P500?
- En su peor año, el índice S&P500 cayó un 46% (1926).
- En el 2010, el índice subió un 55%.

Los inversionistas nunca anticiparon estos resultados extremos cuando realizaron sus inversiones en estos periodos.

¿Más riesgo es más rendimiento? ¿Por qué? ¿Según quien o que? Todo tiene que ver con el precio

### 1.2. Concepto de riesgo

<img style="float: left; margin: 0px 15px 15px 15px;" src="https://upload.wikimedia.org/wikipedia/commons/0/09/Playing-risk-venezuela.JPG" title="github" width="300" height="100" />

Hasta acá todo bien, pero, ¿qué es **riesgo**?, ¿cómo se mide?

- Riesgo significa que en realidad no sabemos qué es lo que va a pasar (incertidumbre).
- "Más cosas pueden pasar de las que pasarán en realidad".
- Existen varias posibilidades pero no sabemos cuál será el resultado.
- ¿Cómo le hacemos para cuantificar el riesgo? Pues adaptamos la teoría de probabilidad a la forma en que medimos el riesgo 

## 2. Midiendo el rendimiento

El **rendimiento** que se obtiene al invertir en un activo sobre un periodo se puede calcular directamente.

**Ejemplo:** 
- Suponga que usted invierte en un fondo de acciones. Cada acción se vende actualmente en $\$100$. 
- Suponga que su horizonte de inversión es de un año. Si el precio de la acciónal final del año es $\$110$ y los dividendos en el año son $\$5$, ¿cuál es su rendimiento en el periodo de tenencia?

$$\frac{S_1 - S_0}{S_0}$$

$$\frac{115 - 100}{100} = 0.15$$


**Ejemplo:** suponga que tiene una serie de rendimientos anuales para el índice S&P500

In [35]:
# Creamos tabla
tabla = pd.DataFrame(columns=['ret'], index=range(1, 6))
tabla.index.name = 'year'
tabla['ret'] = [-0.1189, -0.2210, 0.2869, 0.1088, 0.0491]

In [36]:
tabla

Unnamed: 0_level_0,ret
year,Unnamed: 1_level_1
1,-0.1189
2,-0.221
3,0.2869
4,0.1088
5,0.0491


1. ¿Cuál es el rendimiento en el periodo de tenencia de los cinco años?

In [37]:
## Calcula el rendimiento final
(1+tabla.ret[1]) * (1+tabla.ret[2]) * (1+tabla.ret[3]) * (1+tabla.ret[4]) * (1+tabla.ret[5])

1.0274899060099962

In [40]:
### Ahora con Pandas
rendimiento = (1+tabla.ret).prod()
rendimiento

1.0274899060099962

In [41]:
### Cuanto dinero se hubiera ganadocomn una inversión de $10,000
10000 * rendimiento

10274.899060099962

2. ¿Cuál es el rendimiento promedio anual a través de los cinco años?

En general, el **rendimiento medio geométrico** $\bar{r}_g$ satisface

$$(1+\bar{r}_g)^T=\prod_{i=1}^{T}(1+r_i),$$

o equivalentemente

$$\bar{r}_g=\left[\prod_{i=1}^{T}(1+r_i)\right]^{1/T}-1.$$

In [43]:
t = 5
rendimiento_geometrico=((1 + tabla.ret).prod()) ** (1/t) -1 
rendimiento_geometrico

0.005438503962722274

In [44]:
# Respuesta a la pregunta 2
# ESTO ESTA MAL
np.mean(tabla.ret)

0.02098

In [45]:
### Verifica que esto está bien 
(1 + rendimiento_geometrico) ** t

1.0274899060099967

### 2.2. Rendimiento medio aritmético

Si pudiéramos obtener escenarios probables para la economía, asociados con ciertas probabilidades, podríamos calcular el **rendimiento esperado** como el promedio ponderado (valor esperado) por probabilidad de los posibles resultados.

Esto es

$$E[r]=\sum_{j=1}^{m}p_jr_j,$$

donde $r_j$ para $j=1,2,\dots,m$ son los posibles rendimientos y $p_j$ es la probabilidad asociada a que ocurra el rendimiento $r_j$.


**Ejemplo:**
- Suponga que usted invierte en un fondo de acciones. Cada acción se vende actualmente en \$100.
- Suponga que hay cuatro posibles estados futuros de la economía, los cuales se resumen en la siguiente tabla

In [46]:
# Creamos tabla
tabla2 = pd.DataFrame(columns=['prob', 'price', 'div', 'ret'], 
                      index=['excellent', 'good', 'poor', 'crash'])
tabla2.index.name = 'state'
tabla2['prob'] = [0.25, 0.45, 0.25, 0.05]
tabla2['price'] = [126.50, 110.00, 89.75, 46.00]
tabla2['div'] = [4.50, 4.00, 3.50, 2.00]
tabla2

Unnamed: 0_level_0,prob,price,div,ret
state,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
excellent,0.25,126.5,4.5,
good,0.45,110.0,4.0,
poor,0.25,89.75,3.5,
crash,0.05,46.0,2.0,


In [47]:
# Calcular rendimiento de cada escenario
tabla2['ret']=(tabla2['div'] + tabla2['price'] - 100)/100
tabla2

Unnamed: 0_level_0,prob,price,div,ret
state,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
excellent,0.25,126.5,4.5,0.31
good,0.45,110.0,4.0,0.14
poor,0.25,89.75,3.5,-0.0675
crash,0.05,46.0,2.0,-0.52


Dada las probabilidades anteriores, ¿cuál es el rendimiento esperado?

In [53]:
valor_esperado=(tabla2['prob'] * tabla2['ret']).sum()
valor_esperado

0.09762500000000002

In [50]:
# ¿Que pasaría si todo tiene la misma probabilidad? Calcula ese rendimientio 
tabla2['prob1'] = [0.25, 0.25, 0.25, 0.25]
tabla2

Unnamed: 0_level_0,prob,price,div,ret,prob1
state,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
excellent,0.25,126.5,4.5,0.31,0.25
good,0.45,110.0,4.0,0.14,0.25
poor,0.25,89.75,3.5,-0.0675,0.25
crash,0.05,46.0,2.0,-0.52,0.25


In [51]:
(tabla2['prob1'] * tabla2['ret']).sum()

-0.034375

In [56]:
# Sacando la volatilidad
varianza = np.sum(tabla2.prob * (-valor_esperado+tabla2.ret)**2)
volatilidad = np.sqrt(varianza)
valor_esperado, volatilidad

(0.09762500000000002, 0.194867703519593)

### 2.3. Ejercicios

En esta sección se dejarán algunos ejercicios para ustedes. Si alcanza el tiempo, se harán en clase.

**Ejercicio.** Considere el siguiente reporte de rendimientos de cierta acción en los últimos tres años

| Año | Rendimiento |
| --- | ----------- |
| 1   | -0.10       |
| 2   | 0.20        |
| 3   | 0.30        |

- Calcular el rendimiento geométrico. ¿Cuál es su significado?
- Calcular el rendimiento de la inversión, ¿Cuál es el significado?

In [57]:
tabla = pd.DataFrame({
    'year':[1,2,3],
    'rendimiento':[-0.10,0.20,0.30]
})
tabla

Unnamed: 0,year,rendimiento
0,1,-0.1
1,2,0.2
2,3,0.3


In [60]:
# Aritmetico
(1 + tabla.rendimiento).prod()

1.4040000000000001

In [63]:
# Geometrico 
t = 3
((1 + tabla.rendimiento).prod()) ** (1/t) -1 

0.1197533470451746

In [64]:
# Comprobacion
(1 + 0.12) * (1 + 0.12) * (1 + 0.12)

1.4049280000000004

# Midiendo el riesgo

### 3.1. La volatilidad como medida de riesgo
Dado que el riesgo está estrechamente relacionado con *cuánto no sabemos* acerca de lo que va a pasar, lo podemos cantificar con alguna medida de dispersión de la variable aleatoria de rendimientos.


**Ejemplo:** 
- Tiramos una moneda que no está cargada. 
- Definimos la variable aleatoria $X$, la cual toma el valor de $+1$ cuando la moneda cae cara y el valor de $-1$ cuando cae sello. 
- Como la moneda no está cargada, los eventos tienen igual probabilidad $P(X=1)=P(X=-1)=0.5$.

El valor esperado de la variable aleatoria $X$ es:

$$E[X]=P(X=1) \times (1) + P(X=-1) \times (-1)=0.5\times(1)+0.5\times(-1)=0.$$

Aunque el resultado real nunca va a ser cero, el resultado esperado es cero. *Necesitamos otra medida adicional para describir la distribución*.

**Ejemplo:**
- Suponga que cada acción de la compañía XYZ en $t=0$ cuestan \$100.
- Existen tres posibilidades para el precio de una acción de XYZ en $t=1$:
 - El precio subirá a \$140 (probabilidad del 25%)
 - El precio subirá a \$110 (probabilidad del 50%)
 - El precio bajará a \$80 (probabilidad del 25%)
 
 
 Entonces, ¿cómo describimos una distribución de rendimiento?
1. Tendencia central:
 - Usaremos el valor esperado de los rendimientos como su tendencia central (ya vimos porqué).
   $$E[r]=\sum_{j=1}^{m}p_jr_j.$$
2. Medida de dispersión:
 - Usaremos la desviación estándar (volatilidad) o varianza como medida de dispersión para las distribuciones de rendimiento...
   $$\sigma_r^2=\sum_{j=1}^{m} p_j(r_j-E[r])^2.$$
   $$\sigma_r=\sqrt{\sum_{j=1}^{m} p_j(r_j-E[r])^2}.$$

In [65]:
# Creamos tabla
tabla2

Unnamed: 0_level_0,prob,price,div,ret,prob1
state,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
excellent,0.25,126.5,4.5,0.31,0.25
good,0.45,110.0,4.0,0.14,0.25
poor,0.25,89.75,3.5,-0.0675,0.25
crash,0.05,46.0,2.0,-0.52,0.25


In [67]:
# Calculamos rendimiento esperado
valor_esperado = (tabla2.ret * tabla2.prob).sum()

In [71]:
# Calculamos varianza
varianza = np.sum(tabla2['prob']*(tabla2['ret'] - valor_esperado)**2)
volatilidad = np.sqrt(varianza)
volatilidad

0.194867703519593

**Conclusión: la varianza y la desviación estándar nos brindad una medida de riesgo (incertidumbre, dispersión, volatilidad) en las realizaciones.**

### 3.2. Ejercicios

En esta sección se dejarán algunos ejercicios para ustedes. Si alcanza el tiempo, se harán en clase.

**Ejercicio 1.** A partir del análisis de un asesor financiero, se obtuvieron los siguientes datos de rendimientos de activos de cómputo y de telecomunicaciones, relativos a posibles situaciones económicas futuras

| Condición  económica | Rendimiento activo de cómputo | Rendimiento activo telecomunicaciones | Probabilidad |
| -------------------- | ----------------------------- | ------------------------------------- | ------------ |
| Declive              | -0.04                         | 0.07                                  | 0.2          |
| Estable              | 0.02                          | 0.04                                  | 0.5          |
| Mejora               | 0.10                          | 0.03                                  | 0.3          |

Calcular, para cada activo, su rendimiento esperado y volatilidad.

In [72]:
df = pd.DataFrame()
df['probabilidad'] = [0.4,0.3,0.3]
df['computo'] = [-0.1, 0.08, 0.23]
df['telecom'] = [0.07, 0.04, 0.03]
df

Unnamed: 0,probabilidad,computo,telecom
0,0.4,-0.1,0.07
1,0.3,0.08,0.04
2,0.3,0.23,0.03


In [74]:
# Valor esperado computo
valor_esperado = (df.computo * df.probabilidad).sum()
valor_esperado

0.053

In [75]:
# Valor esperado telecom
valor_esperado2 = (df.telecom * df.probabilidad).sum()
valor_esperado2

0.04900000000000001

In [77]:
# Volatilidad computo
varianza = np.sum(df['probabilidad']*(df['computo'] - valor_esperado)**2)
volatilidad = np.sqrt(varianza)
volatilidad

0.13777155003846042

In [79]:
# Voaltilidad telecom
varianza = np.sum(df['probabilidad']*(df['telecom'] - valor_esperado2)**2)
volatilidad = np.sqrt(varianza)
volatilidad

0.01757839583124695