# Comparação de Desempenho: ListaSalario vs. ListaSalarioNumpy

Neste notebook, vamos comparar o desempenho da implementação original usando listas com a implementação usando NumPy, usando a classe ListaSalario como base.

## Implementação Original: ListaSalarioOriginal

Vamos começar apresentando alguns métodos da classe `ListaSalario` original que utiliza listas para armazenar salários e calcular a média.


In [None]:
class ListaSalarioOriginal:

    def __init__(self, nFuncionarios=1000000):
        self.salarios = [0.0] * nFuncionarios

    def calculaMedia(self):
        return sum(self.salarios) / len(self.salarios)

## Implementação com NumPy: ListaSalarioNumpy

Agora, vamos definir a classe ListaSalarioNumpy que utiliza NumPy para armazenar salários e calcular a média.

In [None]:
import numpy as np

class ListaSalarioNumpy:
    def __init__(self, nFuncionarios=1000000):
        self.salarios = np.zeros(nFuncionarios, dtype=float)

    def calculaMedia(self):
        return np.mean(self.salarios)

## Teste de Desempenho

Agora, vamos realizar um teste de desempenho para medir o tempo de execução das duas implementações.

In [None]:
import timeit

def teste_desempenho(lista_salarios):
    for i in range(len(lista_salarios.salarios)):
        lista_salarios.salarios[i] = i + 1

    media = lista_salarios.calculaMedia()
    return media

# Medição do tempo de execução para a implementação original
tempo_original = timeit.timeit(
    lambda: teste_desempenho(ListaSalarioOriginal()),
    number=1
)

# Medição do tempo de execução para a implementação com NumPy
tempo_numpy = timeit.timeit(
    lambda: teste_desempenho(ListaSalarioNumpy()),
    number=1
)

# Resultados
print(f"Tempo Original: {tempo_original} segundos")
print(f"Tempo com Numpy: {tempo_numpy} segundos")


As conclusões podem variar dependendo do ambiente de execução, do hardware e do tamanho dos dados. No entanto, em cenários típicos, pode-se esperar observar benefícios de desempenho ao utilizar o NumPy, especialmente em operações vetorizadas. Aqui estão algumas considerações comuns:

1. Vetorização em NumPy:

NumPy é otimizado para operações vetorizadas, o que significa que muitas operações são executadas de maneira eficiente sem a necessidade de loops explícitos. Isso geralmente resulta em desempenho superior quando comparado a loops tradicionais com listas.

2. Eficiência em Grandes Conjuntos de Dados:

O NumPy é particularmente eficiente ao lidar com grandes conjuntos de dados. À medida que o tamanho dos dados aumenta, a diferença de desempenho entre NumPy e listas pode se tornar mais evidente.

3. Caso Contrário - Overhead de NumPy:

Em operações simples em conjuntos de dados pequenos, o overhead introduzido pelo NumPy pode não ser justificado. Listas podem ser suficientemente eficientes para esses casos.

4. Cuidado com o Overhead Inicial:

NumPy pode ter um pequeno overhead inicial ao criar arrays e realizar algumas operações. Em casos onde as operações são muito simples, esse overhead pode ser perceptível.

5. Facilidade de Uso e Legibilidade:

NumPy oferece uma sintaxe concisa e legível para operações matriciais e estatísticas. Isso pode resultar em código mais claro e fácil de entender, especialmente para quem está familiarizado com operações em arrays.

### Conclusões Empíricas:

Para análises estatísticas, operações numéricas e manipulação eficiente de grandes conjuntos de dados, o NumPy geralmente oferece vantagens de desempenho. No entanto, em cenários mais simples, a escolha entre listas e NumPy pode depender de fatores como facilidade de uso e legibilidade do código.





