# Análisis estadístico para la banda @555 utilizando una máscara

Esta libreta implementa una máscara sencilla para limpiar matrices y realizar un análisis estadístico sencillo sobre los resultados.

Primero importaremos las librerías necesarias.

In [1]:
import numpy as np
import pandas

Leemos los datos para enero.

In [2]:
# Para el sensor SeaWiFS.
with open('./ENERO_2003/SeaWiFS/Composicion (Lt_555).txt') as archivo_seawifs:
    for _ in range(5):
        # Ignoramos los primeros 5 renglones del archivo.
        archivo_seawifs.readline()
    # Separamos los datos en una matriz.
    datos_seawifs = np.array([archivo_seawifs.readline().split()
                              for _ in range(127)])

# Convertimos a reales.
datos_seawifs = np.array([[float(dat) for dat in row] for row in datos_seawifs])

# Para el sensor MODIS. Es lo mismo pero con otro archivo.
with open('./ENERO_2003/MODIS/Composicion (Band 12).txt') as archivo_modis:
    for _ in range(5):
        # Ignoramos los primeros 5 renglones del archivo.
        archivo_modis.readline()
    # Separamos los datos en una matriz.
    datos_modis = np.array([archivo_modis.readline().split()
                              for _ in range(127)])

# Convertimos a reales.
datos_modis = np.array([[float(dat) for dat in row] for row in datos_modis])

Revisamos datos estadísticos de los datos sucios.

In [3]:
media_seawifs = np.mean(datos_seawifs)
media_modis = np.mean(datos_modis)

var_seawifs = np.var(datos_seawifs)
var_modis = np.var(datos_modis)

print("Promedio de los datos del SeaWiFS: {}.".format(media_seawifs))
print("Promedio de los datos del MODIS: {}.".format(media_modis))

print("Varianza de los datos del SeaWiFS: {}.".format(var_seawifs))
print("Varianza de los datos del MODIS: {}.".format(var_modis))

Promedio de los datos del SeaWiFS: 26.797526653779055.
Promedio de los datos del MODIS: 26.92018436512801.
Varianza de los datos del SeaWiFS: 63.224910538906244.
Varianza de los datos del MODIS: 28.748522280901284.


### Función de la máscara

In [4]:
def filter(img, row, column):
    mean_img = np.mean(img)
    tol = 3 * np.std(img)
    
    for i in range(row):
        row_sum = 0.0
        row_mean = 0.0
        
        for j in range(column):
            if np.abs(img[i][j] - mean_img) >= tol:
                img[i][j] = mean_img

Ahora limpiamos las composiciones.

In [5]:
filter(datos_seawifs, 127, 167)
filter(datos_modis, 127, 167)

Revisamos los datos limpios.

In [6]:
media_seawifs = np.mean(datos_seawifs)
media_modis = np.mean(datos_modis)

var_seawifs = np.var(datos_seawifs)
var_modis = np.var(datos_modis)

print("Promedio de los datos del SeaWiFS: {}.".format(media_seawifs))
print("Promedio de los datos del MODIS: {}.".format(media_modis))

print("Varianza de los datos del SeaWiFS: {}.".format(var_seawifs))
print("Varianza de los datos del MODIS: {}.".format(var_modis))

Promedio de los datos del SeaWiFS: 25.29328108072652.
Promedio de los datos del MODIS: 25.962328187189804.
Varianza de los datos del SeaWiFS: 8.949307253569854.
Varianza de los datos del MODIS: 6.054601327923097.


Comparamos ambas matrices calculando la diferencia absoluta entre ellas.

In [7]:
datos_comb = abs(datos_seawifs - datos_modis)
ma_comb = np.mean(datos_comb)
var_comb = np.var(datos_comb)

print("Media aritmética de las distancias entre pixeles: {}".format(ma_comb))
print("Varianza de las distancias entre pixeles: {}.".format(var_comb))

Media aritmética de las distancias entre pixeles: 1.1556727722888482
Varianza de las distancias entre pixeles: 4.113432548014346.


## Febrero a Junio

El proceso anterior lo aplicaremos para cada mes de los datos disponibles.

In [8]:
seawifs_path = ['./FEBRERO_2003/SeaWiFS/3_Bandas/Composicion (Lt_555).txt', 
               './MARZO_2003/SeaWiFS/Composicion (Lt_555).txt',
               './ABRIL_2003_CORREGIDOS/SeaWiFS/Composicion (B555).txt',
               './MAYO_2003/SeaWiFS/Composicion (Lt_555).txt',
               './JUNIO_2003/SeaWiFS/Composicion (Lt_555).txt']
modis_path = ['./FEBRERO_2003/MODIS/3_Bandas/Composicion (B12).txt',
             './MARZO_2003/MODIS/Composicion (B12).txt',
             './ABRIL_2003_CORREGIDOS/MODIS/Composicion (B12).txt',
             './MAYO_2003/MODIS/Composicion (B12).txt',
             './JUNIO_2003/MODIS/Composicion (B12).txt']

meses = ['Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio']

for loc_seawifs, loc_modis, mes in zip(seawifs_path, modis_path, meses):
    print("Análisis para el mes de {}".format(mes))
    # Para el sensor SeaWiFS.

    with open(loc_seawifs) as archivo_seawifs:
        for _ in range(5):
            # Ignoramos los primeros 5 renglones del archivo.
            archivo_seawifs.readline()
        # Separamos los datos en una matriz.
        datos_seawifs = np.array([archivo_seawifs.readline().split()
                                  for _ in range(127)])

    # Convertimos a reales.
    datos_seawifs = np.array([[float(dat) for dat in row] for row in datos_seawifs])

    # Para el sensor MODIS. Es lo mismo pero con otro archivo.

    with open(loc_modis) as archivo_modis:
        for _ in range(5):
            # Ignoramos los primeros 5 renglones del archivo.
            archivo_modis.readline()
        # Separamos los datos en una matriz.
        datos_modis = np.array([archivo_modis.readline().split()
                                  for _ in range(127)])

    # Convertimos a reales.
    datos_modis = np.array([[float(dat) for dat in row] for row in datos_modis])

    ##-----------------------------------------------

    media_seawifs = np.mean(datos_seawifs)
    media_modis = np.mean(datos_modis)

    var_seawifs = np.var(datos_seawifs)
    var_modis = np.var(datos_modis)

    print("Promedio de los datos del SeaWiFS sin limpiar: {}.".format(media_seawifs))
    print("Promedio de los datos del MODIS sin limpiar: {}.".format(media_modis))

    print("Varianza de los datos del SeaWiFS sin limpiar: {}.".format(var_seawifs))
    print("Varianza de los datos del MODIS sin limpiar: {}.".format(var_modis))

    ##-----------------------------------------------

    filter(datos_seawifs, 127, 167)
    filter(datos_modis, 127, 167)

    ##-----------------------------------------------

    media_seawifs = np.mean(datos_seawifs)
    media_modis = np.mean(datos_modis)

    var_seawifs = np.var(datos_seawifs)
    var_modis = np.var(datos_modis)

    print("Promedio de los datos del SeaWiFS limpios: {}.".format(media_seawifs))
    print("Promedio de los datos del MODIS limpios: {}.".format(media_modis))

    print("Varianza de los datos del SeaWiFS limpios: {}.".format(var_seawifs))
    print("Varianza de los datos del MODIS limpios: {}.".format(var_modis))

    ##-----------------------------------------------

    datos_comb = abs(datos_seawifs - datos_modis)
    ma_comb = np.mean(datos_comb)
    var_comb = np.var(datos_comb)

    print("Media aritmética de las distancias entre pixeles: {}".format(ma_comb))
    print("Varianza de las distancias entre pixeles: {}.\n".format(var_comb))

Análisis para el mes de Febrero
Promedio de los datos del SeaWiFS sin limpiar: 31.519342232071295.
Promedio de los datos del MODIS sin limpiar: 28.102216973926165.
Varianza de los datos del SeaWiFS sin limpiar: 144.5797617945364.
Varianza de los datos del MODIS sin limpiar: 33.49479096316608.
Promedio de los datos del SeaWiFS limpios: 29.50822424054011.
Promedio de los datos del MODIS limpios: 27.1166504804914.
Varianza de los datos del SeaWiFS limpios: 39.574324115132235.
Varianza de los datos del MODIS limpios: 8.34458338520682.
Media aritmética de las distancias entre pixeles: 2.9307343902153975
Varianza de las distancias entre pixeles: 30.03897346034906.

Análisis para el mes de Marzo
Promedio de los datos del SeaWiFS sin limpiar: 33.66331414493847.
Promedio de los datos del MODIS sin limpiar: 35.639694639068324.
Varianza de los datos del SeaWiFS sin limpiar: 156.73346272014223.
Varianza de los datos del MODIS sin limpiar: 15.190722190206069.
Promedio de los datos del SeaWiFS limpi