<a href="https://colab.research.google.com/github/EnigmaticIndividual1/numpy_basico/blob/main/numpy_basico.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Numpy

¬øCu√°l es el hype de Numpy?

Hemos mencionado que es una paqueter√≠a utilizada ampliamente en la industria, pero ¬øqu√© la hace tan especial?

Comencemos explorando el objeto principal de Numpy: el `ndarray`.

## `ndarray`
**Un ndarray (N-dimensional array) es la estructura de datos principal de NumPy que permite almacenar y manipular arrays (arreglos) multidimensionales de forma eficiente. Proporciona operaciones r√°pidas y flexibles para realizar c√°lculos num√©ricos y transformaciones en grandes conjuntos de datos.**

En un ndarray podemos almacenar elementos de un mismo tipo de dato. Aqu√≠ uno podr√≠a preguntarse

**¬øcu√°l es la ventaja o el beneficio de usar un ndarray de Numpy sobre una lista ordinaria de Python?**

Numpy tiene ventajas significativas sobre listas ordinarias, descubr√°moslas con ejemplos pr√°cticos

---

## Crear un arreglo de Numpy
Hay m√°s de una forma (como es costumbre en Python) para crear un array. La m√°s com√∫n es pasarle una lista a la funci√≥n `np.array`

In [1]:
#Importamos numpy como np (SIEMPRE)
import numpy as np

In [2]:
lista = [0,1,2,3,4]
array_1d = np.array(lista)

#Checamos el tipo de dato de array_id
type(array_1d)

numpy.ndarray

In [3]:
type(1.2)

float

In [4]:
#contenido del array
array_1d

array([0, 1, 2, 3, 4])

##¬†Diferencia entre ndarray y lista

La diferencia principal entre un `array` y una `list` es que los `arrays` est√°n dise√±ados para procesar operaciones vectorizadas, mientras que una lista no tiene estas capacidades.

Sea $\vec{x}$ un vector tal que $\vec{x} = (0 , 1, 2, 3, 4)$

$$\vec{x} + a = (0 + a, 1 + a, 2 + a, 3 + a, 4 + a)$$

Entonces, si $a = 2$
$$ \vec{x} + 2 = (0 +2, 1 + 2, 2 + 2, 3 + 2, 4 + 2) $$
$$ \vec{x} + 2 = (2, 3, 4, 5, 6) $$

Esto significa que si aplicamos una funci√≥n a un `array` entonces la funci√≥n se va a aplicar a **cada elemento del array**

Veamos un ejemplo:

Si quisieramos sumar 2 a cada elemento de la `lista`, intuitivamente podr√≠amos intentar:

In [5]:
lista

[0, 1, 2, 3, 4]

In [91]:
import numpy as np

def to_float(x):
    try:
        return float(x)
    except:
        return np.nan

resultado = np.array([to_float(x) for x in lista]) + 2
resultado

array([ 3., nan])

In [83]:
result_array = array_1d * 3
display(result_array)

array([ 0,  3,  6,  9, 12])

Como podemos ver, no es posible hacer esto con listas. Probemos ahora con `array_1d`

In [33]:
array_1d + 2

array([2, 3, 4, 5, 6])

In [34]:
def multiplicar_matrices(A, B):
    # obtener dimensiones
    filas_A = len(A)
    cols_A = len(A[0])
    filas_B = len(B)
    cols_B = len(B[0])

    # checar si se pueden multiplicar A y B
    if cols_A != filas_B:
        raise ValueError("El n√∫mero de columnas de A debe ser igual al n√∫mero de filas de B")

    # Inicializar una matriz vac√≠a con ceros
    matriz_resultado = []
    for _ in range(filas_A):
        fila = []
        for _ in range(cols_B):
            fila.append(0)
        matriz_resultado.append(fila)

    # realizar multiplicaci√≥n
    for i in range(filas_A):
        for j in range(cols_B):
            for k in range(cols_A):
                matriz_resultado[i][j] += A[i][k] * B[k][j]

    return matriz_resultado

# Ejemplo
A = [
    [1, 2, 3],
    [4, 5, 6]
]
B = [
    [7, 8],
    [9, 10],
    [11, 12]
]
C = multiplicar_matrices(A, B)
print(C)

[[58, 64], [139, 154]]


**¬øNada mal no?**

Y de hecho se ejecut√≥ bastante r√°pido‚Ä¶ Pong√°mosle m√°s estr√©s a Python con multiplicaciones de matrices m√°s grandes, y contemos cu√°nto tarda en multiplicar cada una de ellas:

###¬†Funci√≥n para crear una matriz de NxN con n√∫meros aleatorios

In [35]:
import random

def generar_matriz_aleatoria(N):
    matriz = []
    for i in range(N):
        fila = []
        for j in range(N):
            fila.append(random.randint(1, 9))
        matriz.append(fila)
    return matriz


N = 5
matriz_aleatoria = generar_matriz_aleatoria(N)
for fila in matriz_aleatoria:
    print(fila)

[7, 9, 9, 8, 2]
[3, 1, 7, 1, 5]
[6, 8, 8, 6, 1]
[6, 4, 9, 7, 4]
[6, 5, 3, 9, 6]


###¬†Funci√≥n para imprimir una matriz en formato amigable

In [36]:
def imprimir_matriz(matriz):
    for fila in matriz:
        fila_formateada = ' '.join(f'{elemento:2}' for elemento in fila)
        print(fila_formateada)

###¬†Creaci√≥n e impresi√≥n de las matrices

In [37]:
print("Matr√≠z de 5x5:")
m_5 = generar_matriz_aleatoria(5)
imprimir_matriz(m_5)
print("====================")
print("Matr√≠z de 10x10:")
m_10 = generar_matriz_aleatoria(10)
imprimir_matriz(m_10)
print("====================")
print("Matr√≠z de 20x20:")
m_20 = generar_matriz_aleatoria(20)
imprimir_matriz(m_20)
print("====================")
m_100 = generar_matriz_aleatoria(100)

Matr√≠z de 5x5:
 7  7  4  5  4
 2  7  5  5  5
 4  6  8  5  5
 3  6  6  9  3
 3  8  9  8  4
Matr√≠z de 10x10:
 2  6  3  7  9  5  9  6  6  6
 6  4  2  6  9  2  7  5  8  7
 9  1  8  7  8  7  4  8  9  5
 8  5  9  2  5  2  9  6  6  9
 7  2  9  7  2  4  2  9  2  7
 9  6  3  5  6  5  4  1  9  5
 5  4  7  6  8  6  3  6  9  8
 2  9  9  1  2  9  1  4  5  8
 9  5  8  6  6  9  5  5  8  5
 3  9  7  6  7  8  2  2  3  9
Matr√≠z de 20x20:
 6  3  2  8  5  4  2  7  8  2  5  5  5  9  4  3  4  2  2  6
 8  9  4  2  9  1  4  6  2  5  6  3  4  5  1  9  5  4  2  3
 9  1  7  1  1  3  1  4  7  9  1  7  7  9  8  7  9  7  1  3
 3  5  7  5  2  2  5  2  5  2  6  5  2  1  3  1  4  3  3  4
 6  2  1  8  5  8  3  8  1  1  8  3  2  1  8  8  8  8  1  5
 1  3  1  8  9  2  3  8  3  1  1  8  3  3  5  8  6  6  7  6
 1  6  4  1  8  1  4  8  4  3  7  2  2  4  5  9  8  4  8  3
 7  1  3  9  5  6  7  1  6  1  4  6  7  4  7  9  2  8  2  8
 4  2  8  3  3  2  1  4  2  4  5  7  9  2  8  1  9  4  8  6
 6  9  7  3  5  5  5  6  5  7  9 

---
Ahora midamos el tiempo que tardamos en multiplicar cada una de las matrices por s√≠ misma. Utilizaremos c√≥digo como √©ste
```python
start = time.time()
# ejecutar c√≥digo
end = time.time()
tiempo = round(end - start, 5)
print(f"La ejecuci√≥n tard√≥ {tiempo} seg.")
```

In [38]:
import time

**Comencemos con la matrices de 5x5**

In [39]:
start = time.time()
multiplicar_matrices(m_5, m_5)
end = time.time()
tiempo = end - start
print(f"Multiplicar dos matrices de 5x5 tard√≥ {tiempo} seg.")

Multiplicar dos matrices de 5x5 tard√≥ 0.00010037422180175781 seg.


**Nada mal‚Ä¶ Veamos ahora 10x10**

In [40]:
start = time.time()
multiplicar_matrices(m_10, m_10)
end = time.time()
tiempo = end - start
print(f"Multiplicar dos matrices de 10x10 tard√≥ {tiempo} seg.")

Multiplicar dos matrices de 10x10 tard√≥ 0.0002014636993408203 seg.


**Parece que va bastante r√°pido... Intentemos ahora con una matriz de 1000x1000**

In [41]:
m_1000 = generar_matriz_aleatoria(1000)
start = time.time()
multiplicar_matrices(m_1000, m_1000)
end = time.time()
tiempo = end - start
print(f"Multiplicar dos matrices de 1000x1000 tard√≥ {tiempo} seg.")

Multiplicar dos matrices de 1000x1000 tard√≥ 136.12311625480652 seg.


# Tardamos m√°s de un minuto completo en multiplicar dos matrices de 1000x1000

---

## Implementaci√≥n con Numpy

Veamos qu√© tanto mejora el rendimiento de multiplicaci√≥n de matrices cuando implementamos numpy.

Primero, creemos una funci√≥n para generar matrices:

In [42]:
def generar_matriz_aleatoria_numpy(N):
    return np.random.randint(1, 10, size=(N, N))

**No te preocupes por la sintaxis de Numpy. La revisaremos m√°s adelante üòé**

In [43]:
m_1000 = generar_matriz_aleatoria_numpy(1000)

**Para multiplicar matrices en numpy, podemos utilizar la funci√≥n `np.dot`, o bien, el operador `@`**

In [44]:
start = time.time()
np.dot(m_1000, m_1000)
# o bien, m_1000 @ m_1000
end = time.time()
tiempo = end - start
print(f"Multiplicar dos matrices de 1000x1000 con Numpy tard√≥ {tiempo} seg.")

Multiplicar dos matrices de 1000x1000 con Numpy tard√≥ 1.852454662322998 seg.


---

## Arreglos de 2 dimensiones
Un arreglo de dos dimensiones es lo mismo que una matriz de $m \times n$. Una matriz es la forma m√°s adecauda de representar datos tabulares, Numpy hace su manejo sumamente f√°cil. Comencemos por crear una matriz de $3 \times 3$

Queremos hacer la siguiente matriz:
$$ \begin{bmatrix}
0 & 1 & 2 \\
3 & 4 & 5 \\
6 & 7 & 8
\end{bmatrix} $$

In [45]:
list2 = [[0,1,2], [3,4,5], [6,7,8]]
arr2d = np.array(list2)
arr2d

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

Podemos especificar el tipo de dato cuando creamos nuestro `ndarray`, por lo general Numpy infiere el tipo de dato

In [46]:
arr2d_f = np.array(list2, dtype='float')
arr2d_f

array([[0., 1., 2.],
       [3., 4., 5.],
       [6., 7., 8.]])

In [47]:
#convertir a enteros nuevamente
arr2d_f.astype('int')

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [48]:
# convertir a enteros y luego a strings
arr2d_f.astype('int').astype('str')

array([['0', '1', '2'],
       ['3', '4', '5'],
       ['6', '7', '8']], dtype='<U21')

Una diferencia importante entre listas y np.arrays es que una lista puede almacenar objetos de diferentes tipos de datos, mientras que un np.array debe ser consistente en el tipo de dato que almacena. Esto se debe al deseo que tenemos por realizar operaciones vectorizadas

In [49]:
# crear un arreglo de valroes l√≥gicos o bools
arr2d_b = np.array([1, 0, 10, 11, 12, -1, 0], dtype='bool')
arr2d_b

array([ True, False,  True,  True,  True,  True, False])

S√≠ existe una forma de mantener la ambig√ºedad en el tipo de dato de nuestro array. Esto lo podemos logar si especificamos que el tipo de dato es `object`

In [50]:
arr1d_obj = np.array([1, 'a'], dtype='object')
arr1d_obj

array([1, 'a'], dtype=object)

Por √∫ltimo: podemos convertir un `ndarray` a una lista en cualquier momento utilziando el m√©todo `tolist()`

In [51]:
lista = arr1d_obj.tolist()
lista

[1, 'a']

O bien `list(numpy.ndarray)`

In [52]:
list(arr1d_obj)

[1, 'a']

## Tama√±o y dimensi√≥n de un array
Un arreglo tiene dos propiedades b√°sicas que nos dicen mucho acerca de su estructura: tama√±o y dimensi√≥n.

Considemos el arreglo `arr2d`. √âste se cre√≥ a partir de una lista de listas. O sea, tiene dos dimensiones. Un arreglo de dos dimensiones se puede mostrar como renglones y columnas, i.e. una matriz.

Si hubi√©ramos creado el array a partir de una lista de lista de listas, entonces ser√≠an 3 dimensiones, i.e. un cubo.

Supogamos que recibimos un arreglo de numpy que no creamos nosotros. ¬øQu√© cosas queremos explorar para conocer bien este arreglo?

Bueno, unas buenas preguntas que querr√≠amos contestar son:
- ¬øCu√°l es la dimensi√≥n del arreglo? ¬øes de 1, 2 o m√°s dimensiones? `ndim`
- ¬øCu√°ntos elementos hay en cada dimensi√≥n? `shape`
- ¬øCu√°l es el tipo de dato? `dtype`
- ¬øCu√°l es el n√∫mero total de elementos? `size`
- Algunos ejemplos/elementos del arreglo

Comencemos

In [53]:
# Crear arreglo de dos dimensiones con 3 filas y 4 columnas
list2 = [[1, 2, 3, 4],[3, 4, 5, 6], [5, 6, 7, 8]]
arr2 = np.array(list2, dtype='float')
arr2

array([[1., 2., 3., 4.],
       [3., 4., 5., 6.],
       [5., 6., 7., 8.]])

In [54]:
# shape
print('Shape: ', arr2.shape)

# dtype
print('Datatype: ', arr2.dtype)

# size
print('Size: ', arr2.size)

# ndim
print('Num Dimensions: ', arr2.ndim)

Shape:  (3, 4)
Datatype:  float64
Size:  12
Num Dimensions:  2


---

## Acceder a los elementos del arreglo
Podemos extraer elementos o porciones espec√≠ficos de un arreglo utilizando √≠ndices o `indexing` empezando por $0$. Esto es similar a c√≥mo lo hacemos con listas en Python.

Pero a diferencia de las listas, los numpy arrays aceptan (opcionalmente) la misma cantidad de par√°metros para indexar que el n√∫mero de dimensiones que tiene el array.

Esto √∫ltimo es algo confuso, y no hay mejor manera que ilustrarlo que con un ejemplo:


In [55]:
arr2

array([[1., 2., 3., 4.],
       [3., 4., 5., 6.],
       [5., 6., 7., 8.]])

Podemos extraer un elemento espec√≠fico `(i, j)` en donde `i` es la fila y `j` la columna

In [56]:
arr2[1, 1]

np.float64(4.0)

Tambi√©n podemos extraer "rangos"

In [57]:
# Extraer las primeras 3 filas y las primeras 3 columnas
arr2[:3, :3]

array([[1., 2., 3.],
       [3., 4., 5.],
       [5., 6., 7.]])

Esto **no** se puede hacer en listas

In [85]:
import numpy as np

array2 = np.array(list2)
array2[:2, :2]

array([[1, 2],
       [3, 4]])

Adicionalmente, en los numpy arrays existe algo que se llama `boolean indexing` o indexaci√≥n l√≥gica. Un `boolean index` o √≠ndice l√≥gico.

Un array de √≠ndices l√≥gicos es de exactamente la misma forma (`shape`) que el array que estamos filtrando, s√≥lo que contiene √∫nicamente valores booleanos (`True` o `False`). Los valores que est√©n en los √≠ndices Verdaderos son los que va a arrojar nuestro filtro.

In [60]:
arr2

array([[1., 2., 3., 4.],
       [3., 4., 5., 6.],
       [5., 6., 7., 8.]])

In [61]:
#Obtengamos el output booleano de aplicar una comparaci√≥n a todo nuestro numpy array
b = arr2 > 4
b

array([[False, False, False, False],
       [False, False,  True,  True],
       [ True,  True,  True,  True]])

Como podemos ver, b ahora es una matriz de $3 \times 4$ con puros valores booleanos. El valor `True` est√° en todas las  posiciones en las que se cumpli√≥ que el elemento era $ > 4$

Con esta matriz de valores booleanos, podemos filtrar nuestra matriz original y obtener los valores que est√©n en posiciones verdaderas,

In [62]:
arr2[b]

array([5., 6., 5., 6., 7., 8.])

## Valores faltantes e infinitos
Es muy com√∫n recibir conjuntos de datos que tengan uno que otro valor en NA. Con numpy podemos representar valores faltantes con `np.nan` e infinitos con `np.inf`. Agreguemos algunos de estos valores a `arr2`

In [63]:
arr2[1,1] = np.nan  # no es un n√∫mero
arr2[1,2] = np.inf  # infinito
arr2

array([[ 1.,  2.,  3.,  4.],
       [ 3., nan, inf,  6.],
       [ 5.,  6.,  7.,  8.]])

Vamos a reemplazar todos los valores `nan` e `inf` con un $-1$

In [64]:
valores_faltantes_bool = np.isnan(arr2) | np.isinf(arr2)

In [65]:
valores_faltantes_bool

array([[False, False, False, False],
       [False,  True,  True, False],
       [False, False, False, False]])

In [66]:
arr2[valores_faltantes_bool] = -1
arr2

array([[ 1.,  2.,  3.,  4.],
       [ 3., -1., -1.,  6.],
       [ 5.,  6.,  7.,  8.]])

---

## Calcular media, m√≠nimo y m√°ximo

Un ndarray viene ya con algunos m√©todos √∫tiles. Unos de √©stos nos permiten calcular medidas b√°sicas

In [67]:
print("Hola mundo")

Hola mundo


In [68]:
arr2

array([[ 1.,  2.,  3.,  4.],
       [ 3., -1., -1.,  6.],
       [ 5.,  6.,  7.,  8.]])

In [69]:
print("Media: ", arr2.mean())
print("Valor m√°ximo: ", arr2.max())
print("Valor m√≠nimo: ", arr2.min())

Media:  3.5833333333333335
Valor m√°ximo:  8.0
Valor m√≠nimo:  -1.0


In [70]:
arr2

array([[ 1.,  2.,  3.,  4.],
       [ 3., -1., -1.,  6.],
       [ 5.,  6.,  7.,  8.]])

Sin embargo, estos valores exploraron toda la matriz. Podemos obtener los mismos valores pero para filas y columnas utilizando `np.amin`

In [71]:
print("Valores m√≠nimos en columnas", np.amin(arr2, axis=0))

Valores m√≠nimos en columnas [ 1. -1. -1.  4.]


In [72]:
print("Valores m√≠nimos en filas: ", np.amin(arr2, axis=1))

Valores m√≠nimos en filas:  [ 1. -1.  5.]


In [73]:
arr2

array([[ 1.,  2.,  3.,  4.],
       [ 3., -1., -1.,  6.],
       [ 5.,  6.,  7.,  8.]])

---

## Crear un arreglo a partir de otro arreglo
En Numpy la alocaci√≥n de memoria sigue la misma l√≥gica que en Python: si asignamos una porci√≥n de un array a una nueva variable, y modificamos elementos de esta nueva variable, entonces los cambios se ver√°n reflejados tambi√©n en nuestro array original. Para evitar este comportamiento (si eso es lo que queremos) utilizamos el m√©todo `copy()`.

In [74]:
arr2_nuevo = arr2[:2,:2]
arr2_nuevo[:1, :1] = 100  # el 100 se va a reflejar tambi√©n en el array original arr2

In [75]:
# Veamos arr2 (original)
arr2

array([[100.,   2.,   3.,   4.],
       [  3.,  -1.,  -1.,   6.],
       [  5.,   6.,   7.,   8.]])

Y ahora veamos `arr2_nuevo`

In [76]:
arr2_nuevo

array([[100.,   2.],
       [  3.,  -1.]])

In [77]:
#Para evitar esto vamos a usar copy
arr2_nuevo_2 = arr2[:2, :2].copy()
arr2_nuevo_2[0, 0] = 102  # 102 no saldr√° en arr2
arr2

array([[100.,   2.,   3.,   4.],
       [  3.,  -1.,  -1.,   6.],
       [  5.,   6.,   7.,   8.]])

In [78]:
arr2_nuevo_2

array([[102.,   2.],
       [  3.,  -1.]])

---

## Crear secuencias, repeticiones y n√∫meros aleatorios

`np.arange`

In [14]:
# El l√≠mite inferior es 0 por defecto
print(np.arange(5))
nuevo_arr = np.arange(10)

[0 1 2 3 4]


In [79]:
type(nuevo_arr)

numpy.ndarray

In [11]:
# 0 a 9
print(np.arange(5, 100))

[ 5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76
 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99]


In [15]:
# 0 a 9 de 2 en 2
print(np.arange(0, 100, 3.5))

[ 0.   3.5  7.  10.5 14.  17.5 21.  24.5 28.  31.5 35.  38.5 42.  45.5
 49.  52.5 56.  59.5 63.  66.5 70.  73.5 77.  80.5 84.  87.5 91.  94.5
 98. ]


In [16]:
# 10 a 1, en decrementos de 1
print(np.arange(10, 0, -1))

[10  9  8  7  6  5  4  3  2  1]


Podemos poner l√≠mite inferior y superior con `np.arange`, pero si queremos enfocarnos en el n√∫mero de elmentos que queremos generar, entonces tenemos que concentrarnos en el valor del incremento/decremento (`step`)

Digamos que queremos generar exactamente 10 valores entre 1 y 50.

Podemos usar `np.linspace`

In [17]:
# Empieza en 1, terminar en 50, creando 10 n√∫meros enteros
np.linspace(start=1, stop=50, num=20, dtype=int)

array([ 1,  3,  6,  8, 11, 13, 16, 19, 21, 24, 26, 29, 31, 34, 37, 39, 42,
       44, 47, 50])

Un buen observador se dar√° cuenta que nuestros elementos no est√°n espaciados uniformemente. Esto se debe a que especificamos que el tipo de dato era entero.

---

## Crear arreglos de $1's$ y $0's$

A menudo tendremos la necesidad de crear vectores o matrices que tengan √∫nicamente valores de $1$ o $0$. Numpy hace esto muy f√°cil

In [18]:
np.zeros([2,2])

array([[0., 0.],
       [0., 0.]])

In [19]:
np.ones([2,2])

array([[1., 1.],
       [1., 1.]])

---

## Crear secuencias repetidas

In [20]:
a = [1,2,3]

# Repetir todo el arreglo 'a' dos veces
print('Tile:   ', np.tile(a, 2))

# Repetir cada elemento de 'a' dos veces
print('Repeat: ', np.repeat(a, 4))


Tile:    [1 2 3 1 2 3]
Repeat:  [1 1 1 1 2 2 2 2 3 3 3 3]


In [21]:
import random
random.randint(0,100)

53

---

## Generar n√∫meros aleatorios
Numpy tiene un m√≥dulo `random` con funciones √∫ltiles para generar n√∫meros aleatorios de cualquier `shape`

In [22]:

print("N√∫meros aleatorios entre [0,1) de tama√±o  2,2")
print(np.random.rand(3,5))

N√∫meros aleatorios entre [0,1) de tama√±o  2,2
[[0.92884244 0.05972929 0.8460163  0.47788627 0.93453173]
 [0.61244751 0.5597725  0.31892002 0.74016817 0.45992519]
 [0.0040474  0.98026964 0.86373784 0.82917834 0.25739379]]


In [23]:
print("N√∫meros aleatorios de una distribuci√≥n normal con media=0 y varianza=1 de tama√±o 2,2")
print(np.random.randn(2,2))

N√∫meros aleatorios de una distribuci√≥n normal con media=0 y varianza=1 de tama√±o 2,2
[[-0.8096555   0.89991537]
 [ 1.31960534 -1.70203228]]


In [24]:
print("Enteros aleatorios entre [0,10) de tama√±o 2,2")
print(np.random.randint(0, 100, size=[5,5]))

Enteros aleatorios entre [0,10) de tama√±o 2,2
[[91 83 16 77  5]
 [96 72 57 97 64]
 [18 70 44 15 46]
 [70 21 84 30 21]
 [86 40 32 16 99]]


In [25]:
print("Genera un n√∫mero aleatorio entre [0,1)")
print(np.random.random())

Genera un n√∫mero aleatorio entre [0,1)
0.8040949921660954


In [26]:
print("Elige 10 elementos de una lista (los resultados son equiprobables)")
print(np.random.choice(['Cara', 'Sol'], size=10))

Elige 10 elementos de una lista (los resultados son equiprobables)
['Sol' 'Cara' 'Cara' 'Sol' 'Cara' 'Sol' 'Sol' 'Sol' 'Sol' 'Cara']


In [27]:
print("Elige 10 elementos de una lista. Cada uno con una probablidad p")
print(np.random.choice(['Cara', 'Sol'], size=10, p=[0.2, .8]))

Elige 10 elementos de una lista. Cada uno con una probablidad p
['Sol' 'Sol' 'Cara' 'Cara' 'Sol' 'Sol' 'Sol' 'Cara' 'Sol' 'Sol']


Cada que corramos el c√≥digo anterior, obtendremos valores diferentes ya que estamos generando n√∫meros aleatorios.

Existen casos en los que queremos n√∫meros pseudoaleatorios para poder reproducir nuestros resultados. Para esto utlizamos una semilla

In [28]:
# ponemos una semilla 100 para reproducibilidad
np.random.seed(100)
print(np.random.rand(2,2))

[[0.54340494 0.27836939]
 [0.42451759 0.84477613]]


En todo script de python, si colocamos una semilla de 100 y ejecutamos `np.random.rand(2,2)` deber√≠amos obtener exactamente el mismo resultado. Esto es √∫til porque la reproducibilidad es indispensable en investigaci√≥n. O sea, queremos que otras personas sean capaces de reproducir nuestros resultados.

---
## Obtener valores √∫nicos y frecuencias absolutas

In [29]:
np.random.seed(1)
arr_rand = np.random.randint(0, 10, size=100)
arr_rand

array([5, 8, 9, 5, 0, 0, 1, 7, 6, 9, 2, 4, 5, 2, 4, 2, 4, 7, 7, 9, 1, 7,
       0, 6, 9, 9, 7, 6, 9, 1, 0, 1, 8, 8, 3, 9, 8, 7, 3, 6, 5, 1, 9, 3,
       4, 8, 1, 4, 0, 3, 9, 2, 0, 4, 9, 2, 7, 7, 9, 8, 6, 9, 3, 7, 7, 4,
       5, 9, 3, 6, 8, 0, 2, 7, 7, 9, 7, 3, 0, 8, 7, 7, 1, 1, 3, 0, 8, 6,
       4, 5, 6, 2, 5, 7, 8, 4, 4, 7, 7, 4])

In [30]:
vals_unicos, frecuencias = np.unique(arr_rand, return_counts=True)
print("Elementos √∫nicos: ", vals_unicos)
print("Frecuencias      :", frecuencias)

Elementos √∫nicos:  [0 1 2 3 4 5 6 7 8 9]
Frecuencias      : [ 9  8  7  8 11  7  8 18 10 14]


In [31]:
2**32

4294967296