# Análises estatísticas para gestão de processos

Este notebook foi desenvolvido por [Paulo Araujo](mailto:paulo@visiumlabs.com.br) e tem por objetivo demonstrar a diferença de se trabalhar com diferentes tamanhos de amostra quando estamos modelando digitalmente um sistema a fim de se realizar análises estratégicas do mesmo.

## Pacotes do Python

Neste exemplo utilizaremos a biblioteca [Numpy](https://numpy.org) para geração de números aleatórios e cálculos estatísticos.

In [5]:
import numpy as np

Vamos fixar a semente do algoritmo de geração de números aleatórios para tornar o código reproduzível.

In [6]:
np.random.seed(0)

Definindo algumas variáveis de controle do processo.

In [7]:
HORAS = 24 * 30
AMOSTRAS = [3,20,100,500]
MEDIA = 0.1
DESVP = 0.02
LIM_INF = 0.02
LIM_SUP = 0.18

Vamos considerar os seguintes cenários a respeito da quantidade de dados coletados pelos engenheiros de processo da linha em questão:
+ 3
+ 20
+ 100
+ 200

Vamos supor que o processo se comporta como uma distribuiçâo Normal.

In [8]:
for i,amostra in enumerate(AMOSTRAS):
    s = np.random.normal(MEDIA,DESVP,(amostra,))
    # Procedimento para garantir que apenas tempos
    # dentro de um intervalo pré-definido
    c = np.logical_and(s >= LIM_INF, s <= LIM_SUP)
    while not np.all(c):
        d = c.shape[0] - np.count_nonzero(c)
        s[c == False] = np.random.normal(0.1,0.02,(d,))
    # Calculando o valor médio da amostragem
    media = s.mean()
    # Calculando a produtividade
    prod = HORAS // media
    # Imprimindo o resultado
    print(f'Tamanho da amostra: {amostra} => Tempo médio: {media} => Produtividade: {prod}')

Tamanho da amostra: 3 => Tempo médio: 0.12095298358960417 => Produtividade: 5952.0
Tamanho da amostra: 20 => Tempo médio: 0.10720880929893786 => Produtividade: 6715.0
Tamanho da amostra: 100 => Tempo médio: 0.10102738312217398 => Produtividade: 7126.0
Tamanho da amostra: 500 => Tempo médio: 0.09779203999389989 => Produtividade: 7362.0
