# <span style="color:RoyalBlue">Introducción a librerías básicas para uso científico</span>

## <span style="color:CornflowerBlue">**NumPy**</span>

## Ejercitación 1

<img src="../images/problem_1.png" alt= “” width="800">

**Calcular la probabilidad de que salga un 6**

Posible solución tradicional

In [29]:
import random

def probabilidad_con_for(N):
    M = 0  # cantidad de veces que salió un 6

    for i in range(N):
        valor = random.randint(1, 6)  # lanzamos el dado
        if valor == 6:  # verificamos si es 6
            M += 1  # contamos un 6

    return M/N

Posible solución NumPy

In [30]:
import numpy as np

def probabilidad_con_np(N):
    tiradas = np.random.randint(1, 7, N)   # el 7 no lo incluye
    p = np.sum(tiradas == 6) / N
    return p

Llamamos a las funciones y tomamos el tiempo de ejecución

In [42]:
N = 1000000  # cantidad de lanzamientos

In [43]:
p_1 = probabilidad_con_for(N)
print('Probabilidad calculada con for: %.4f' % p_1)

Probabilidad calculada con for: 0.1668


In [44]:
p_2 = probabilidad_con_np(N)
print('Probabilidad calculada con NumPy: %.4f' % p_2)

Probabilidad calculada con NumPy: 0.1667


In [45]:
print('Probabilidad teórica: %.4f' % (1/6))

Probabilidad teórica: 0.1667


## Ejercitación 2

Estimar el valor de Pi utilizando la técnica de Monte Carlo

<img src="../images/pi-monte-carlo-square-circle.png" width=300>
$$
  \frac{N_c}{N_t}=\frac{\mathrm{Area\:circulo}}{\mathrm{Area\:cuadrado}}=\frac{\pi r^{2}}{(2r)^{2}}=\frac{\pi}{4}
$$
$$
    \pi = 4 \times \frac{N_c}{N_t}
$$

In [20]:
import random
import math

def estimar_pi_for(N_t):
    N_c = 0  # contador de puntos en el círculo

    for i in range(0, N_t):
        x = random.uniform(-1.0, 1.0)
        y = random.uniform(-1.0, 1.0)

        if math.sqrt(x*x + y*y) <= 1:  # verifica si cae dentro del círculo
            N_c += 1

    pi = 4 * N_c/N_t  # cálculo de Pi
    return pi

In [21]:
import numpy as np

def estimar_pi_numpy(N_t):    
    x = np.random.uniform(-1.0, 1.0, N_t)
    y = np.random.uniform(-1.0, 1.0, N_t)
    N_c = np.sum(np.sqrt(x*x + y*y) <= 1)
    pi = 4 * N_c / N_t
    return pi

In [25]:
N_t = 10000000

In [26]:
pi_1 = estimar_pi_for(N_t)
print("Estimación 1 de Pi: %.7f" % pi_1)

Estimación 1 de Pi: 3.1409632


In [27]:
pi_2 = estimar_pi_numpy(N_t)
print("Estimación 2 de Pi: %.7f" % pi_2)

Estimación 2 de Pi: 3.1416292


In [28]:
print("Valor de Pi:        %.7f" % math.pi)

Valor de Pi:        3.1415927


## Ejercitación 3

A partir de la base de datos del Personal de Ciencia y Tecnología de Argentina (extraído del SICYTAR) del año 2018, determinar:
- la cantidad de personas que trabajan en CyT, 
- el promedio de edad, 
- el promedio y desviación estándar de las producciones por persona en los último 4 años, y 
- el número máximo de producciones en los últimos 4 años de una persona.

*Ayuda*: utilizar la función `numpy.loadtext` para cargar el archivo con los datos. Columnas con índice 3 (edad) y 12 (producciones últimos 4 años).

In [1]:
import numpy as np

# Carga de datos
data = np.loadtxt('../datos/personal_cyt_2018.csv',  # ruta al archivo de datos
                  delimiter=',',  # separador de columnas en archivo
                  skiprows=1,  # no se carga texto de cabeceras 
                  usecols=[3, 12])  # columnas "edad" (3) y "producciones_ult_4_anios" (12) 

print(data)

[[43.  0.]
 [55.  6.]
 [37. 18.]
 ...
 [25. -1.]
 [23. -1.]
 [34. -1.]]


In [2]:
cant_filas, cant_cols = data.shape  # obtenemos la cantidad de filas y columnas de la matriz de datos
print("Cantidad de personas que trabajan en CyT: {}".format(cant_filas))

prom_edad = data[:,0].mean()
print("Promedio de edad: {0:.2f}".format(prom_edad))

prom_prod = data[:,1].mean()
print("Promedio de producciones por persona de los últimos 4 años: {0:.2f}".format(prom_prod))

std_prod = data[:,1].std()
print("Desviación estándar de producciones por persona de los últimos 4 años: {0:.2f}".format(std_prod))

max_prod = data[:,1].max()
print("Número máximo de producciones por persona en los últimos 4 años: {0:.2f}".format(max_prod))

Cantidad de personas que trabajan en CyT: 68552
Promedio de edad: 45.62
Promedio de producciones por persona de los últimos 4 años: 5.35
Desviación estándar de producciones por persona de los últimos 4 años: 9.26
Número máximo de producciones por persona en los últimos 4 años: 313.00
