## Geração de números pseudoaleatórios
O módulo numpy.random complementa o módulo random interno do Python para a
geração eficiente de arrays de inteiros com valores de amostras de muitos
tipos de distribuições de probabilidade. Por exemplo, você pode obter uma
array 4 × 4 de amostras da distribuição normal padrão usando
numpy.random.standard_normal:

In [9]:
import numpy as np

samples = np.random.standard_normal(size=(4, 4))

samples

array([[ 0.2374976 ,  0.87210105,  0.67730884,  1.99592929],
       [ 0.29523851,  0.85616367, -0.73218115, -0.65525216],
       [-0.95732433,  2.44062582,  0.31916503,  0.11645883],
       [ 1.08627088,  1.07738649, -0.19670616,  0.34661079]])

Em contrapartida, o módulo random interno do Python só obtém a amostra de
um valor de cada vez. Como você pode ver nesse benchmark, numpy.random éacima de uma ordem de grandeza mais rápido para a geração de amostras
muito grandes:

In [10]:
from random import normalvariate

N = 1_000_000

t1 = %timeit samples = [normalvariate(0, 1) for _ in range(N)]

t2 = %timeit np.random.standard_normal(N)


1.15 s ± 114 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
42.3 ms ± 792 μs per loop (mean ± std. dev. of 7 runs, 10 loops each)


**Esses números aleatórios não são realmente aleatórios (são pseudoaleatórios);
eles são criados por um gerador de números aleatórios configurável que
define deterministicamente que valores serão criados.** Funções como
numpy.random.standard_normal usam o gerador de números aleatórios padrão do
módulo numpy.random, mas o código pode ser configurado para usar um gerador
explícito:

In [12]:
rng = np.random.default_rng(seed=12345)

data = rng.standard_normal((2, 3))

data

array([[-1.42382504,  1.26372846, -0.87066174],
       [-0.25917323, -0.07534331, -0.74088465]])

O argumento seed é que determina o estado inicial do gerador e o estado muda
sempre que o objeto rng é usado para gerar dados. O objeto gerador rng
também fica isolado de qualquer outro código que possa usar o módulo
numpy.random:

In [13]:
type(rng)

numpy.random._generator.Generator

## Funções universais: funções rápidas de arrays para todos os elementos

Uma **função universal (universal function), ou ufunc, é aquela que executa
operações em todos os elementos dos dados dos ndarrays**. Podemos
considerá-las como encapsuladores (wrappers) vetorizados rápidos para
funções simples que recebem um ou mais valores escalares e produzem um
ou mais resultados escalares.

Muitas ufuncs são transformações simples em todos os elementos, como as
de numpy.sqrt ou numpy.exp:

In [15]:
arr = np.arange(10)
arr

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [16]:
np.sqrt(arr)

array([0.        , 1.        , 1.41421356, 1.73205081, 2.        ,
       2.23606798, 2.44948974, 2.64575131, 2.82842712, 3.        ])

In [17]:
np.exp(arr)

array([1.00000000e+00, 2.71828183e+00, 7.38905610e+00, 2.00855369e+01,
       5.45981500e+01, 1.48413159e+02, 4.03428793e+02, 1.09663316e+03,
       2.98095799e+03, 8.10308393e+03])

**Essas funções são chamadas de ufuncs unárias**. Outras, como **numpy.add ou
numpy.maximum, recebem dois arrays (logo, são ufuncs binárias) e retornam um
único array como resultado**:

In [19]:
x = rng.standard_normal(8)

y = rng.standard_normal(8)

x

array([ 0.90291934, -1.62158273, -0.15818926,  0.44948393, -1.34360107,
       -0.08168759,  1.72473993,  2.61815943])

In [20]:
y

array([ 0.77736134,  0.8286332 , -0.95898831, -1.20938829, -1.41229201,
        0.54154683,  0.7519394 , -0.65876032])

In [21]:
np.maximum(x, y)

array([ 0.90291934,  0.8286332 , -0.15818926,  0.44948393, -1.34360107,
        0.54154683,  1.72473993,  2.61815943])

Embora não seja comum, **uma ufunc pode retornar múltiplos arrays.
numpy.modf é um exemplo: uma versão vetorizada da função math.modf** interna
do Python, ela retorna as partes fracionária e inteira de um array de ponto
flutuante:

In [23]:
arr = rng.standard_normal(7) * 5
arr

array([-5.54107234,  0.67978425,  6.73538882,  0.3057201 ,  0.354573  ,
        2.16827269,  1.3874183 ])

In [24]:
remainder, whole_part = np.modf(arr)
remainder

array([-0.54107234,  0.67978425,  0.73538882,  0.3057201 ,  0.354573  ,
        0.16827269,  0.3874183 ])

In [25]:
whole_part

array([-5.,  0.,  6.,  0.,  0.,  2.,  1.])

As ufuncs aceitam um argumento opcional out que as permite atribuir seus
resultados a um array existente em vez de criarem um novo array:

In [27]:
arr

array([-5.54107234,  0.67978425,  6.73538882,  0.3057201 ,  0.354573  ,
        2.16827269,  1.3874183 ])

In [28]:
out = np.zeros_like(arr)

In [29]:
np.add(arr, 1)

array([-4.54107234,  1.67978425,  7.73538882,  1.3057201 ,  1.354573  ,
        3.16827269,  2.3874183 ])