# Práctico 1-2: Repaso de Matemáticas


In [None]:
import numpy as np
#
# definiendo variables
#
# * 'a' abajo es una variable _escalar_
#    su valor inicial es 3
#
a = 3
#
# * esto abajo es una lista de 3 números de Python
# * NumPy interpreta a las listas como vectores
#
y = [0,1,1]
#
#
# todos los vectores y matrices en Python son internamente 'arrays' (arreglos)
# el argumento es una lista o tupla de valores
# en este caso, el 'array' x se inicializa con los valores de la lista [1,2,3]
#
x = np.array( [1,2,3] )
print('x=\n',x)
#
# A es una matriz de 2x3
# una forma de inicializarla es con una lista de listas, cada lista es una fila
#
A = np.array([[0,-1,1],[-1,1,0]])
#
# podemos separar la expresión en varias lineas para que sea más legible;
# esto es siempre una buena idea
#
A = np.array(
    [
     [1,2,3],
     [4,5,6]
    ]
  )
print('\nA=\n',A)




# Manipulación de vectores y matrices en NumPy

Ya vimos antes que para referirnos  a un valor particular de una lista utilizamos un índice. Para referirnos a un elemento de una matriz necesitamos _dos_ índices.

Al igual que con las listas, en lugar de referirnos a un sólo elemento, podemos referirnos a _subvectores_  o _submatrices_ usando _rangos_ de índices. El siguiente ejemplo es una muestra de algunas cosas que se pueden hacer. No es exhaustiva, y tampoco es necesario aprendérselo de memoria a esta altura.



In [None]:
#
# elemento de arriba a la izquierda (0,0) de la matriz A
# el primer índice, antes de la coma, indica la _fila_
# el segundo índice indica la _columna_
#
print(A[0,0])
#
# 'último' elemento de abajo a la derecha (fila 1, columna 2)
#
print(A[1,2])
#
# recordar: los índices negativos cuentan 'desde el final'
# por ej: primera fila (0), última columna (-1)
#
print(A[0,-1])
#
# submatrices: vamos a extraer la submatriz de 2x2 que comienza en la segunda columna
# el ":" sólo indica "todos los índices en esa dimensión"
# en este caso, ponemos ":" en el índice de las filas para indicar que queremos
# todas las filas de la matriz
# el "1:"  indica "de la columna 1 en adelante"
#
print( A[ :, 1: ] )



# Geometría y Álgebra lineal

La Geometría que más conocemos define abstracciones matemáticas relacionadas con estructuras que observamos en el espacio en que vivimos: puntos, rectas, planos, ubicaciones, distancias, figuras, áreas, volúmenes, etc.

Los espacios de alta dimensión son una abstracción que aparece casi siempre en el contexto de Aprendizaje Automático. Si bien intentaremos mantener la matemática al mínimo, tener estos conceptos claros es necesario para poder formar una intuición del funcionamiento de los métodos de AA que veremos o que pudieran encontrarse en la literatura específica de sus áreas.

Cuando se trabaja en espacios de dos o tres dimensiones, la Geometría Euclídea, en particular, es la que más se ajusta a los conceptos naturales de distancia, área, volumen, etc. Por eso resulta también bastante sencillo extrapolar esas nociones a espacios de más alta dimensión.

El Álgebra Lineal define las operaciones que pueden realizarse entre las abstracciones geométricas de punto, vector, matriz, y otras derivadas de ellas. Por ejemplo, un punto se define como una ubicación en el espacio;  un vector tiene magnitud y dirección; una matriz permite representar transformaciones en ese espacio. En adelante usaremos $n$ para indicar la dimensión del espacio. Todos los vectores en ese espacio tienen $n$ elementos.

Repasemos algunas operaciones algebraicas típicas:

*  suma de dos vectores $z = x + y$: $z_i = x_i + y_i, i = 1,\ldots,n$
*  producto de vector por escalar: $z = a \cdot x$: $z_i = a \cdot x_i, i=1,\ldots,n$
* producto elemento a elemento: $z = x \odot y$: $z_i = x_i \cdot y_i, i=1,\ldots,n$,
* producto escalar o interno entre vectores: $a = <x,y> = \sum_{i=1}^n x_i\cdot y_i$
* norma ("longitud") de un vector: $\|x\|_2 = \sqrt{<x,x>}=\sqrt{\sum_{i=1}^nx_i²}$
* producto matriz-vector con una matriz de $m$ filas y $n$ columnas: $z = Ax$, $z_i = \sum_{j=1}^{n} A_{ij}x_j , i=1,\ldots,m$

* producto matriz-vector con una matriz de $n$ filas y $k$ columnas: $z = x^TB$, $z_j = \sum_{i=1}^{n} x_i A_{ij}, j=1,\ldots,k$

* Transposición de una matriz: $B=A^T$: $B_{ij}= A_{ji}$

* Producto de dos matrices: $A$ de tamaño $m{\times}k$ y $B$ de tamaño $k{\times}n$: $C=A \cdot B$, $C_{ij}=\sum_{r=1}^{k} A_{ik} B_{kj}$.

* Producto elemento a elemento de dos matrices de igual tamaño: $C=A\odot B$, $C_{ij}=A_{ij} B_{ij}$.

Veamos ahora cómo realizar esas operaciones en NumPy


In [None]:

# NumPy se integra de manera muy natural a Python:...
xprima = x + y        # interpreta 'b' automáticamente como un vector
print('suma de vectores: x =',x,'y =',y,'x + y =', x+y)

# Podemos sumarle un valor a cada elemento de 'x':
print('multiplicación escalar: x =',x,'a =',a,'a*x =',a*x)

# El producto de dos vectores es ELEMENTO ELEMENTO
print('producto elemento a elemento: x =',x,'y =',y,'x*y =',x*y)

# El *producto interno* de dos vectores se hace con la función 'dot'
print('producto interno: x =',x,'y =',y,'x*y =', np.dot(x,y) )

#
# matriz por vector: deben coincidir la última dimensión de A con la de x!
#
print('\nA*x=',np.dot(A,x))
#
# podemos trasponer la matriz : A.T
#
print('\nA transpuesta=\n',A.T)
#
# esto NO va a funcionar! (pruebe descomentar a ver qué pasa)
#
#print('A.T*x=',np.dot(A.T,x))
#
# esto SI va a funcionar porque
# la última dimensión de x (3) coincide con la primera de A (3):
#
print('\nx*A.T=',np.dot(x,A.T))
#
# norma Euclídea de un vector
#
print('\n||x||_2 =',np.linalg.norm(x))
#
#
#
B = np.array(
    [
     [2,-2],
     [-3,3],
     [0, 4]
    ]
  )
#
# producto matricial A * B: (2x3) x (3x2) => (2x2)
# (se usa la función 'dot')
#
print('\nA =\n',A,'\nB =\n',B,'\nA·B =\n',np.dot(A,B))
#
# producto matricial B * A: (3x2) x (2x3) => (3x3)
#
print('\nA =\n',A,'\nB =',B,'\nB·A =\n',np.dot(B,A))
#
# suma, producto por escalar,y producto elemento a elemento se hacen con el operador '*'
# de manera análoga a los vectores
#
print('\na =',a,'\nA =\n',A,'\na·A =\n',a*A)
print('\nB =\n',B,'\nB·B =\n',B*B)



---
**Ejercicio**

*   Calcule y muestre el resultado de la _forma cuadrática_: $f = x^T·A^T·A·x + A\cdot x + a$
*   Se anima a crear una función $f(x)$ que tome $x$, $A$ y $a$ y calcule el valor de la forma cuadrática correspondiente?

---

In [None]:
# primera parte

# segunda parte
def f(x,A,a):
  return 0 # cambie esto por la expresión correspondiente


# Análisis Matemático y Cálculo

Al igual que el Álgebra y la Geometría, el Aprendizaje Automático basa buena parte de su maquinaria en elementos de Análisis Matemático y Cálculo Diferencial e Integral. Aquí haremos un muy breve repaso de los conceptos más básicos de todo esto.

## Series

Las series se utilizan para resumir y estudiar de manera compacta expresiones matemáticas que involucran la suma de muchos, a veces infinitos, términos. Por ejemplo

$$a = \sum_{i=1}^{100} i^2$$
nos dice que el valor de $a$ es la suma de todos los números del $1$ al $100$ inclusive.  Esto es muy fácil de hacer en Python:







In [None]:
# 'arange' nos devuelve un vector de NumPy con los valores en
# el rango especificado (el último valor _no_ se incluye)
#
# nota: el argumento 'dtype=float' abajo indica que el tipo
# de dato (dtype) de los elementos del vector debe ser _punto flotante_
# en lugar de enteros.
#

a = np.arange(1,11,dtype=float) # 1 a 10

print(a)
# suma de los elementos de aEntonces
print('suma al cuadrado',np.sum(a**2))

# suma de los inversos de a
print('inversos',np.sum(1/a))




# Funciones

Las funciones son mapeos entre dos conjuntos: el _dominio_ y el _codominio_. Por ejemplo, una función lineal $$f(x)=a\cdot x + b$$
tiene como dominio a todos los valores reales (el conjunto $\mathbb{R}$). Si $a \neq 0$, el codominio también es $\mathbb{R}$; de lo contrario, el codominio consiste en un sólo valor: $\{b\}$, ya que ese es el único valor que puede arrojar la función.

Otros ejemplos típicos son la parábola $f(x)=x^2$, cuyo codomino es el conjunto de los  reales no negativos, $\mathbb{R}^+$, la hipérbola $f(x)=1/x$, cuyo dominio excluye al $0$ ($\mathbb{R} \setminus \{0\}$), así como todas las funciones fundamentales: trigonmétricas (seno, coseno, etc.), potencias, logaritmos, etc.

Las funciones fundamentales están bien cubiertas en Python por la biblioteca estándar `math` y `numpy`. La primera sólo opera de a un valor a la vez.
NumPy ofrece versiones _vectorizadas_, es decir, si una función que toma un sólo valor y devuelve un sólo valor (función escalar) recibe en su lugar un vector o una matriz, el resultado es un vector o matriz del mismo tamaño en donde los elementos son el resultado de aplicar la función a cada elemento de la entrada.

Finalmente, como ya vimos antes, una de las cosas que podemos hacer con Python es definir nuestras propias funciones! Vamos a ver esto también:



In [None]:
import math
import numpy as np

print('cos(pi) =',math.cos(math.pi))

x = np.arange(-math.pi,math.pi,step=math.pi/4) # valores entre -pi y pi en pasos de pi/4
print('x=',x)

print('cos(x)',np.cos(x))
#
# la función np.round es muy útil para redondear a una cantidad
# determinada de dígitos decimales, en este caso 2:
# nota: estamos _componiendo_ 2 funciones en una expresión: round(cos(x))
#
print('[cos(x)]',np.round( np.cos(x), 2) )

# logaritmo en distintas bases:
print('log_2(10)', np.log2(10))
print('log(10)',   np.log(10))
print('log_10(10)',np.log10(10))

# sintaxis para definir una función en Python
#
# 'def nombre_de_funcion(argumento1, argumento2, ...):
#    sentencia1
#    sentencia2
#    ...
#    return valor

# nota: x aquí no es la variable 'x' que se definió arriba
# sino una variable _local_ que sólo existe durante la ejecución
# de la función.
# toma el valor del argumento que uno le pasa a la función
# cuando la _llama_
#
def parabola(x):
  return x**2

#
# algo bastante más complicado
#

print('parabola(x)',parabola(2)) # llamamos a la función con x=2


# Intermezzo: gráficas con Matplotlib

Este es un buen momento para introducir la biblioteca encargada de presentar datos de manera gráfica: matplotlib. Esta biblioteca permite hacer todo tipo de gráficas. Lo más elemental suele ser representar gráficamente los valores de una función continua, y eso es lo que hace el siguiente código.



In [None]:
import matplotlib.pyplot as plt
#
# gráfica de función cos(x)
#
x = np.arange(2*math.pi,step=math.pi/16) # valores entre 0 y 2*pi en pasos de pi/16
y = np.cos(x)

plt.figure()        # creamos la figura
plt.plot(x,y)       # dibujamos la curva formada por los puntos (x[i],y[i])
plt.grid(True)      # mostramos una grilla para facilitar la visualización
plt.xlabel('x')     # leyenda en el eje horizontal
plt.ylabel('f(x)')  # leyenda del eje vertical
plt.title('coseno') # título de la gráfica (aparece arriba)
plt.show()          # mostrar la figura generada

#
# se pueden mostrar varias gráficas superpuestas
#
x = np.arange(2*math.pi,step=math.pi/16) # valores entre 0 y 2*pi en pasos de pi/16
y2= np.sin(x)

plt.figure()        # creamos la figura
plt.plot(x,y)      # dibujamos la curva formada por los puntos (x[i],y1[i])
plt.plot(x,y2)      # dibujamos la curva formada por los puntos (x[i],y2[i])
plt.grid(True)      # mostramos una grilla para facilitar la visualización
plt.xlabel('x')     # leyenda en el eje horizontal
plt.title('coseno') # título de la gráfica (aparece arriba)
plt.legend(('cos(x)','sen(x)'))
plt.show()          # mostrar la figura generada


# Derivadas e integrales

Como muchas otras áreas de la matemática, el Cálculo Diferencial e Integral fue desarrollado primeramente por Isaac Newton como forma analítica de resolver problemas que se presentaron en sus estudios sobre la física y las ecuaciones dinámicas de su mecánica. Estas herramientas son ubicuas en las ciencias y la ingeniería, y forman la base de muchos métodos de Aprendizaje Automático.

Aquí nos limitaremos a repasar sus definiciones básicas para funciones de una variable, y cómo se pueden aplicar (numéricamente) utilizando numpy.

## Derivada

A grosso modo, la derivada de una función $f(x)$ es _otra_ función $f'(x)$ que nos indica cómo varia de manera instantánea la primera a medida que crece o decrece el valor de su argumento, $x$. La definición formal de $f'(x)$ es
$$f'(x) = \lim_{\delta\rightarrow 0} \frac{f(x+\delta)-f(x)}{\delta}.$$

Por ejemplo, la derivada de una función lineal, $f(x)=ax+b$ es su pendiente, $f'(x)=a$, que es constante. Para muchas funciones es posible calcular la derivada de forma analítica; hay miles de páginas (incluyendo Wikipedia) o apps de celular que tienen tabuladas las derivadas conocidas, así como reglas para calcularlas.

La función `np.diff`  permite aproximar derivadas de funciones a partir de sus valores consecutivos almacenados en un vector.

## Integral

La definición más sencilla de integral se da para  una función que toma valores no negativos como el área que encierra la curva de la función $y=f(x)$ por arriba, y la linea $y=0$ por debajo. En NumPy podemos aproximar la integral de una función a partir de valores consecutivos almacenados en un vector mediante la función `np.sum`, como veremos abajo.




In [None]:
delta = 0.01
x = np.arange(1,2,step=delta)
# derivada de 1/x es -1/x^2 (para x <> 0)
# integral de 1/x es ln(x) (para x > 0)
#
y = 1.0/x
#
# vemos la función y la tangente en uno de sus puntos
#
# calculamos la tangente en x0=1.5
# la pendiente es precisamente la derivada en x0
#
# t(x) = f(1.5) + f'(1.5)(x-1.5)
#
x0 = 1.5
t  = 1/x0 + (-1)/(x0**2)*(x-x0)
#
plt.figure()         # creamos la figura
plt.plot(x,y)        #
plt.plot(x,t,'--')   # dibujamos la tangente con linea punteada
plt.scatter(x0,1/x0) # ponemos un marcador en el punto de contacto de la tangente
plt.grid(True)
plt.xlabel('x')
plt.title('función 1/x')
plt.legend(('f(x)','t(x)'))
plt.show()          # mostrar la figura generada

#
# vemos la integral analítica (exacta) y la aproximación (numérica)
#
integral_num = delta*np.sum(y) # regla del trapecio
integral_ana = np.log(x[-1])-np.log(x[0])

print('\nintegral analítica:',integral_ana)
print('integral numérica :',integral_num)
print('error relativo    :',np.round(100*(integral_num-integral_ana)/integral_ana,2),'%')
print()

derivada_ana = -1/(x**2)
derivada_num = np.diff(y)/delta # diferencias finitas

plt.figure()        # creamos la figura
plt.plot(x,derivada_ana)
plt.plot(x[:-1],derivada_num)
plt.grid(True)      # mostramos una grilla para facilitar la visualización
plt.xlabel('x')     # leyenda en el eje horizontal
plt.title('derivada de 1/x') # título de la gráfica (aparece arriba)
plt.legend(('analítica','aproximada'))
plt.show()          # mostrar la figura generada


# Probabilidades

A seguir repasamos los conceptos básicos de Probabilidades.
Las probabilidades tales como las usamos normalmente en la práctica son un caso particular de lo que hoy se conoce como Teoría de la Medida. A pesar de que estos conceptos existen y se usan desde hace siglos, recién en el S. XX Kolmogorov estableció las bases axiomáticas de las Probabilidades.

Supongamos que tenemos un experimento cuyo resultado puede ser uno de un conjunto $\Omega$ de N posibles eventos $\Omega=\{\omega_1,\omega_2,\ldots,\omega_N\}$.

La probabilidad $P(\omega)$ de un evento $\omega$  es un número entre $0$ y $1$ que indica qué tan verosímil es que ocurra ese evento: si $P(\omega)=0$, el evento no ocurrirá nunca; si $P(\omega)=1$, el evento ocurrirá siempre; si $P(\omega)=1/2$,  el evento ocurrirá aproximadamente la mitad de las veces que realicemos el experimento. Claramente no puede ocurrir que $P(\omega)=1$ para dos eventos distintos, porque ambos no pueden ocurrir siempre simultáneamente.

Dados dos subconjuntos de eventos de $\Omega$, $A$ y $B$, una distribución de probabilidad válida debe cumplir:

1.   $P(A) \geq 0$ para todo $A \subseteq \Omega$
1.   $P(\Omega) = 1$
1.   $P(A \cup B) = P(A) + P(A)$  si $A \cap B = \emptyset$

El conjunto $\Omega$  no tiene por qué ser finito. De hecho no tiene ni por qué ser numerable. En esos casos la definición se vuelve más técnica pero de todos modos el espíritu es el mismo.

## Variables aleatorias

Una variable aleatoria $X$ es una función que mapea _eventos_ en _números_. Por ejemplo, en una secuencia de $n$ tiradas de moneda, el evento "hubo k caras y n-k cruces" puede representarse con el número $k$. Definimos entonces el valor de  $X$ para ese evento como $k$.

En el caso de que el evento es una medida, por ejemplo la altura o peso de una persona, el mapeo entre el evento $\omega$ y la variable $X$ es bastante natural. No siempre es así.

## Variables continuas: función de distribución y densidad

En la práctica trabajamos con dos tipos de probabilidades según el espacio de eventos en el que trabajamos: si los posibles eventos forman un conjunto _numerable_ (no necesariamente finito) de elementos, trabajamos con distribuciones de probabilidad como las que vimos antes.

Si el conjunto de eventos es infinito, la variable aleatoria puede tomar infinitos valores distintos (aunque dentro de un rango acotado). Un ejemplo puede ser la altura de una persona, una temperatura, etc.
En esos casos no tiene sentido hablar de la probabilidad de que ocurra un valor _exacto_. Estrictamente hablando, la probabilidad de que _justo_ ocurra la temperatura _exacta_ (con precisión infinita) $25$°C es _cero_. *Nadie mide _exactamente_ $1.75$m*.

Lo sí tiene sentido preguntar es, por ejemplo, si alguien mide _menos_ (o más) de $1.75$m, o si la altura de una persona está entre $1.60$m y $1.80$m.
Supongamos que definimos a nuestra variable aleatoria como el resultado de medir la altura de una persona. Para estos casos existe la llamada _función de distribución_ $F(x)$:
$$F(x) = P(X \leq x),$$
En el caso de la altura, esto nos permite dar una expresión numérica de la probabilidad del evento "la persona mide menos que $x$ centímetros". En inglés, $F(x)$ se conoce como CDF (cumulative density function).

La derivada de $F(x)$ es llamada _función de densidad de probabilidad_ (PDF--probability density function), y es lo que a menudo se usa (**y se abusa**) como "probabilidad" del valor de una variable aleatoria (v.a.) continua. A pesar de que esto no es formalmente correcto, a menudo se utiliza como forma de calcular la verosimilitud del valor de una v.a.

Notar que, por definición, la _integral_ de la PDF es la CDF.

La PDF suele escribirse con la letra $f(\cdot)$ o $p(\cdot)$. La distribución más famosa es la Normal o Gaussiana:

$$p(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-x^2/2}.$$

Ya que estamos, vamos a dibujar la  PDF Gaussiana y su CDF. Para esto usamos las funciones provistas por el paquete `stats`  de `scipy`:



In [None]:
from scipy import stats

x = np.arange(-5,5.1,step=0.1)
dist_normal = stats.norm
px = dist_normal.pdf(x)
Fx = dist_normal.cdf(x)


plt.figure()        # creamos la figura
plt.plot(x,px)
plt.plot(x,Fx)
plt.grid(True)      # mostramos una grilla para facilitar la visualización
plt.xlabel('x')     # leyenda en el eje horizontal
plt.title('distribución Normal') # título de la gráfica (aparece arriba)
plt.legend(('PDF','CDF'))
plt.show()          # mostrar la figura generada


# Más probabilidades

Vamos a repasar ahora algunas definiciones y propiedades básicas. Estas son muy importantes ya que muchos de los métodos de Aprendizaje Automático se basan en  estos cálculos.

## Probabilidad conjunta

La probabilidad conjunta de dos o más variables aleatorias se aplica a la co-ocurrencia un conjunto correspondiente de  valores de esas variables. Por ejemplo, para dos variables tenemos:
$$P(x,y) = P(X=x,Y=y).$$
De manera similar, si $X$ e $Y$ son continuas puede definirse la función de distribución $F(x,y)=P(X \leq x, Y \leq y)$ y la densidad conjunta, $p(x,y)$, aunque en este caso ya es necesario entrar en derivadas de funciones multivariadas (_gradientes_), cosa que no vimos.

## Probabilidad condicional

A menudo es imporante medir la probabilidad de que algo ocurra _condicionado_ a que haya ocurrido otra cosa. Para esto existe la llamada probabilidad condicional. La siguiente expresión nos indica la probabilidad de que ocurra $X=x$ dado que $Y=y$

$$P(X=x|Y=y) = \frac{P(X=x,Y=y)}{P(Y=y)}$$

Para un valor fijo $y$, $P(X|Y=y)$ es en sí una distribución de probabilidad.

## Probabilidad marginal

A veces al considerar eventos que involucran dos (o más) variables aleatorias, es necesario estudiar una de ellas de manera aislada. Por ejemplo, nosotros tenemos dada la distribución conjunta $P(X,Y)$, pero necesitamos saber $P(X)$. Este cálculo se llama _marginalización_, y el resultado es la _probabilidad marginal_  de una de las variables, por ejemplo $X$:

$$P(X=x) = \sum_{y} P(X=x|Y=y).$$

## Probabilidad total

De la expresión anterior es inmediato que:

$$P(X=x,Y=y) = P(X=x|Y=y)P(Y=y)$$

Si combinamos esto con la expresión de la probabilidad marginal, llegamos a la llamada _probabilidad total_ (que no es más que un nombre):

$$P(X=x) = \sum_y P(X=x|Y=y)P(Y=y).$$

La fórmula de la probabilidad total nos vincula la distribución marginal de una variable con la distribución condicional de esa variable respecto a las otras, y se usa mucho por ejemplo para hacer inferencia Bayesiana.

## Fórmula de Bayes

Hablando de Bayes, la fórmula que lleva su nombre permite relacionar las distribuciones condicionales de dos (o más) variables aleatorias. Esta fórmula se deriva de manera trivial de las que vimos antes:

$$P(Y=y|X=x) = \frac{P(X=x|Y=y)P(Y=y)}{P(X=x)}.$$

En la jerga de inferencia Bayesiana, los términos en la fórmula de Bayes tal como está escrita arriba adquieren nombres particulares:

*   $P(X=x|Y=y)$ función de _verosimilitud_
*   $P(Y=y)$     probabilidad _a priori_
*   $P(X=x)$     función de _partición_
*   $P(Y=y|X=x)$  probabilidad _a posteriori_

La lógica detrás de esos nombres es la siguiente:
*   _a priori_ indica qué tan probable es el evento $Y=y$ _antes_ de observar el evento $X=x$
*   _verosimilitud_ indica qué tan _verosímil es que haya ocurrido $X=x$ según el valor hipotético de $Y$
*   _a posteriori:_ probabilidad de que haya ocurrido $Y=y$ _luego_ de que ocurriera $X=x$
*   _partición:_  este término es necesario para garantizar que la expresión _a posteriori_  sea una distribución de probabilidad; a veces es muy difícil de calcular, pero también sucede a menudo  que es inconsecuente y puede no calcularse.



In [None]:
from numpy import random
import numpy as np

# Vamos a ejercitar los conceptos anteriores en Python
# en general todo lo anterior puede realizarse fácilmente con NumPy,
# ya que involucra sumas y productos

#
# generamos una distribución conjunta al azar
# sólo necesitamos una tabla de valores (x,y) que sean no negativos y sumen 1

# generamos una tabla de 5x3 números entre 0 y 1 al azar:
Pxy = random.rand(5,3)
# hacemos que la suma sea 1:
Pxy = Pxy/np.sum(Pxy)
# cada fila corresponde a un valor de X (0,1,2,3,4)
# cada columna a un valor de Y (0,1,2)
print('P(X,Y):')
print(Pxy)
#
# distribución marginal de Y: equivale a sumar las filas de P(x,y)
#
Px = np.sum(Pxy,axis=1) # axis=1 es 'sumar las filas'
print('\nP(X):')
print(Px)
#
# la de Y es la suma de las columnas:
#
Py = np.sum(Pxy,axis=0)
print('\nP(Y):')
print(Py)
#
# calculemos la distribución condicional de X dado Y=1
# esto es P(X=x,Y=1)/P(Y=1)
# el numerador es la fila 1 (*segunda* fila) de la matriz,
# que puede ser indexada como Pxy[:,1]
# el denominador es Py[1]
Px_1 = Pxy[:,1]/Py[1]
print('\nP(X|Y=1):')
print(Px_1)
#
# podemos hacer lo mismo para calcular P(Y|X=2)
#
Py_2 = Pxy[2,:]/Px[2]
print('\nP(Y|X=2):')
print(Py_2)


# Distribuciones

## Discreta

In [None]:
#
# distribución discreta
#
xd = np.arange(0,30)
binomial = stats.binom(30,0.3)
yd = binomial.pmf(xd)

plt.figure(figsize=(6,6))
plt.stem(xd,yd)
plt.grid(True)      # mostramos una grilla para facilitar la visualización
plt.xlabel('x')     # leyenda en el eje horizontal
plt.title('Binomial(100, 1/5)') # título de la gráfica (aparece arriba)
plt.ylabel('P(x)')
plt.savefig('binomial.png')
plt.show()          # mostrar la figura generada


## Continua

In [None]:

#
# función de distribucion continua (Normal o Gaussiana)
#
xc = np.arange(-5,5,step=0.1)
normal = stats.norm()
yc = normal.pdf(xc)

plt.figure(figsize=(6,6))
plt.plot(xc,yc)
plt.grid(True)      # mostramos una grilla para facilitar la visualización
plt.xlabel('x')     # leyenda en el eje horizontal
plt.title('Normal(0,1)') # título de la gráfica (aparece arriba)
plt.ylabel('p(x)')
plt.savefig('normal.png')
plt.show()          # mostrar la figura generada

plt.figure(figsize=(6,6))
plt.plot(xc,yc)
plt.stem([0],[normal.pdf(0)],markerfmt='ko',linefmt='--')
plt.grid(True)      # mostramos una grilla para facilitar la visualización
plt.xlabel('x')     # leyenda en el eje horizontal
plt.title('P(X=0)') # título de la gráfica (aparece arriba)
plt.ylabel('p(x)')
plt.savefig('normal_punto.png')
plt.show()          # mostrar la figura generada

fig = plt.figure(figsize=(6,6))
ax = fig.add_subplot()
ax = plt.axes()
xsub = np.arange(-1,1,step=0.01)
ax.fill_between(xsub,normal.pdf(xsub))
plt.plot(xc,yc,lw=2,color='black')
plt.grid(True)      # mostramos una grilla para facilitar la visualización
plt.xlabel('x')     # leyenda en el eje horizontal
plt.title('P( { -1 < X < 1 } )') # título de la gráfica (aparece arriba)
plt.ylabel('p(x)')
plt.savefig('normal_rango.png')
plt.show()          # mostrar la figura generada

normal = stats.norm()
zc = normal.cdf(xc)

plt.figure(figsize=(6,6))
plt.plot(xc,yc)
plt.plot(xc,zc,'k',lw=2)
plt.grid(True)      # mostramos una grilla para facilitar la visualización
plt.xlabel('x')     # leyenda en el eje horizontal
plt.title('Normal(0,1)') # título de la gráfica (aparece arriba)
plt.ylabel('p(x)')
plt.savefig('normal_densidad.png')
plt.show()          # mostrar la figura generada


# Estadísticas

Veamos primero una distribución continua típica: la Gamma

In [None]:
#
#ESTADISTICA
#
import numpy as np
from scipy import stats
from matplotlib import pyplot as plt
#
# distribución Gamma
#
xc = np.arange(0,5,step=0.01)
gamma = stats.gamma(2)
mediana = gamma.median()
media   = gamma.mean()
yc = gamma.pdf(xc)
fig = plt.figure(figsize=(6,6))
ax = fig.add_subplot()
xsub = np.arange(0,mediana,step=0.01)
ax.fill_between(xsub,gamma.pdf(xsub),color=(0,0,0,0.3))
ax.plot(xc,yc,lw=1,color='black')
hmed  = ax.stem([mediana],[gamma.pdf(mediana)],markerfmt='ko',linefmt='k--')
hmean = ax.stem([media],[gamma.pdf(media)],markerfmt='ro',linefmt='k--')
var   = gamma.var()
plt.grid(True)      # mostramos una grilla para facilitar la visualización
plt.xlabel('x')     # leyenda en el eje horizontal
plt.title('Resumen descriptivo') # título de la gráfica (aparece arriba)
plt.ylabel('p(x)')
plt.savefig('estadisticas1.png')
plt.legend((hmed,hmean),('mediana','media'))
plt.show()          # mostrar la figura generada


## Histograma

Ahora vamos a tomar muestras aleatorias de la distribución Gamma. Con ellas vamos a armar un histograma, que idealmente debería aproximarse (en forma) a la Gamma de la que surgieron sus muestras.


In [None]:
#
# histograma de muestras tomadas de la Gamma
#
plt.figure(figsize=(6,6))
X = gamma.rvs(size=200)
bins = np.arange(-0.5,5.5,1)
h = plt.hist(X,bins=bins)
plt.xlabel('x')     # leyenda en el eje horizontal
plt.title('histograma') # título de la gráfica (aparece arriba)
plt.ylabel('h(x)')
plt.savefig('hist.png')
plt.show()          # mostrar la figura generada

<hr>

**Ejercicio**: modifique las celdas anteriores para que la distribución mostrada sea la de Cauchy (o cualquier otra).

<hr>