## Masked Arrays

Masked arrays são arrays que podem ter valores inválidos ou ausentes, criados com o módulo numpy.ma.

Conjuntos de dados (datasets) podem estar incompletos por conta da presença de dados inválidos ou dados inexistentes. por exemplo, um sensor em uma aplicação IoT pode não ter registrado um dado em um momento especifico, ou o dado registrado pode ter sido corrompido. E isso pode causar problemas caso, por exemplo, seja necessário realizar cálculos com os dados obtidos, como somatório ou cálculo de valores estatísticos.
Para resolver esse problema podemos empregar um masked array (array mascarado).
Um masked array é uma combinação de um ndarray com uma máscara, sendo assim uma subclasse do objeto ndarray.

### Máscara

Uma máscara pode ser:
- nomask - Indica que nenhum valor do array associado é inválido; ou
- Um array de booleanos que determina para cada elemento do array associado se o valor é válido ou não.

Quando um elemento na máscara possui valor False (0), o elemento correspondente no array associado é válido. E quando um elemento da máscara possui valor True (1), o elemento correspondente no array é inválido. (está "mascarado").

Vamos a um exemplo.

In [1]:
# Usando Masked Arrays em NumPy

import numpy as np
import numpy.ma as ma

# Criar um array com um valor considerado inválido (valor 7):
a = np.array([2,4,6,7,8,10])

# Suponha que a leitura do quarto elemento do array esteja incorreta. Podemos marcá-la com
# um masked array usando o método masked_array() como segue (vamos criar o array mascarado a_mask):
a_mask = ma.masked_array(a, mask=[0,0,0,1,0,0])

# Com isso, podemos efetuar operações sobre o array mascarado sem levar em conta o valor inválido.
# Por exemplo, vamos calcular a média aritmética dos valores do array mascarado:
print('Média aritmética do array com máscara:')
print(a_mask.mean())

# Contraste o resultado obtido com o cálculo da média aritmética no array original (não-mascarado),
# que inclui o valor inválido:
print('\nMédia aritmética do array a (sem máscara):')
print(a.mean())

# Opcionalmente, podemos criar diretamente o array já mascarado, usando o
# método array do objeto masked array:
a = ma.array([2,4,6,7,8,10], mask=[0,0,0,1,0,0])
print('\nMédia aritmética do array a com máscara aplicada:')
print(a.mean())



Média aritmética do array com máscara:
6.0

Média aritmética do array a (sem máscara):
6.166666666666667

Média aritmética do array a com máscara aplicada:
6.0


CONTINUA NA PG. 198 do Numpy Reference.