# Análisis estadístico para la banda @490 utilizando una máscara

Esta libreta implementa una máscara sencilla para limpiar matrices y realizar un análisis estadístico sencillo sobre los resultados.

Primero importaremos las librerías necesarias.

In [1]:
import numpy as np
import pandas

Leemos los datos para enero.

In [2]:
# Para el sensor SeaWiFS.
with open('./ENERO_2003/SeaWiFS/Composicion (Lt_490).txt') as archivo_seawifs:
    for _ in range(5):
        # Ignoramos los primeros 5 renglones del archivo.
        archivo_seawifs.readline()
    # Separamos los datos en una matriz.
    datos_seawifs = np.array([archivo_seawifs.readline().split()
                              for _ in range(127)])

# Convertimos a reales.
datos_seawifs = np.array([[float(dat) for dat in row] for row in datos_seawifs])

# Para el sensor MODIS. Es lo mismo pero con otro archivo.
with open('./ENERO_2003/MODIS/Composicion (Band 10).txt') as archivo_modis:
    for _ in range(5):
        # Ignoramos los primeros 5 renglones del archivo.
        archivo_modis.readline()
    # Separamos los datos en una matriz.
    datos_modis = np.array([archivo_modis.readline().split()
                              for _ in range(127)])

# Convertimos a reales.
datos_modis = np.array([[float(dat) for dat in row] for row in datos_modis])

Revisamos datos estadísticos de los datos sucios.

In [3]:
media_seawifs = np.mean(datos_seawifs)
media_modis = np.mean(datos_modis)

var_seawifs = np.var(datos_seawifs)
var_modis = np.var(datos_modis)

print("Promedio de los datos del SeaWiFS: {}.".format(media_seawifs))
print("Promedio de los datos del MODIS: {}.".format(media_modis))

print("Varianza de los datos del SeaWiFS: {}.".format(var_seawifs))
print("Varianza de los datos del MODIS: {}.".format(var_modis))

Promedio de los datos del SeaWiFS: 44.80587750011788.
Promedio de los datos del MODIS: 42.81177717478429.
Varianza de los datos del SeaWiFS: 34.116755167250844.
Varianza de los datos del MODIS: 15.516441651737484.


### Función de la máscara

In [4]:
def filter(img, row, column):
    mean_img = np.mean(img)
    tol = 3 * np.std(img)
    
    for i in range(row):
        row_sum = 0.0
        row_mean = 0.0
        
        for j in range(column):
            if np.abs(img[i][j] - mean_img) >= tol:
                img[i][j] = mean_img

Ahora limpiamos las composiciones.

In [5]:
filter(datos_seawifs, 127, 167)
filter(datos_modis, 127, 167)

Revisamos los datos limpios.

In [6]:
media_seawifs = np.mean(datos_seawifs)
media_modis = np.mean(datos_modis)

var_seawifs = np.var(datos_seawifs)
var_modis = np.var(datos_modis)

print("Promedio de los datos del SeaWiFS: {}.".format(media_seawifs))
print("Promedio de los datos del MODIS: {}.".format(media_modis))

print("Varianza de los datos del SeaWiFS: {}.".format(var_seawifs))
print("Varianza de los datos del MODIS: {}.".format(var_modis))

Promedio de los datos del SeaWiFS: 43.71391638491253.
Promedio de los datos del MODIS: 42.18228854985871.
Varianza de los datos del SeaWiFS: 4.959781832275386.
Varianza de los datos del MODIS: 3.8079368398081495.


Comparamos ambas matrices calculando la diferencia absoluta entre ellas.

In [7]:
datos_comb = abs(datos_seawifs - datos_modis)
ma_comb = np.mean(datos_comb)
var_comb = np.var(datos_comb)

print("Media aritmética de las distancias entre pixeles: {}".format(ma_comb))
print("Varianza de las distancias entre pixeles: {}.".format(var_comb))

Media aritmética de las distancias entre pixeles: 1.736816359498021
Varianza de las distancias entre pixeles: 2.5862544501914653.


## Febrero a Junio

El proceso anterior lo aplicaremos para cada mes de los datos disponibles.

In [8]:
seawifs_path = ['./FEBRERO_2003/SeaWiFS/3_Bandas/Composicion (Lt_490).txt', 
               './MARZO_2003/SeaWiFS/Composicion (Lt_490).txt',
               './ABRIL_2003_CORREGIDOS/SeaWiFS/Composicion (B490).txt',
               './MAYO_2003/SeaWiFS/Composicion (Lt_490).txt',
               './JUNIO_2003/SeaWiFS/Composicion (Lt_490).txt']
modis_path = ['./FEBRERO_2003/MODIS/3_Bandas/Composicion (B10).txt',
             './MARZO_2003/MODIS/Composicion (B10).txt',
             './ABRIL_2003_CORREGIDOS/MODIS/Composicion (B10).txt',
             './MAYO_2003/MODIS/Composicion (B10).txt',
             './JUNIO_2003/MODIS/Composicion (B10).txt']

meses = ['Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio']

for loc_seawifs, loc_modis, mes in zip(seawifs_path, modis_path, meses):
    print("Análisis para el mes de {}".format(mes))
    # Para el sensor SeaWiFS.

    with open(loc_seawifs) as archivo_seawifs:
        for _ in range(5):
            # Ignoramos los primeros 5 renglones del archivo.
            archivo_seawifs.readline()
        # Separamos los datos en una matriz.
        datos_seawifs = np.array([archivo_seawifs.readline().split()
                                  for _ in range(127)])

    # Convertimos a reales.
    datos_seawifs = np.array([[float(dat) for dat in row] for row in datos_seawifs])

    # Para el sensor MODIS. Es lo mismo pero con otro archivo.

    with open(loc_modis) as archivo_modis:
        for _ in range(5):
            # Ignoramos los primeros 5 renglones del archivo.
            archivo_modis.readline()
        # Separamos los datos en una matriz.
        datos_modis = np.array([archivo_modis.readline().split()
                                  for _ in range(127)])

    # Convertimos a reales.
    datos_modis = np.array([[float(dat) for dat in row] for row in datos_modis])

    ##-----------------------------------------------

    media_seawifs = np.mean(datos_seawifs)
    media_modis = np.mean(datos_modis)

    var_seawifs = np.var(datos_seawifs)
    var_modis = np.var(datos_modis)

    print("Promedio de los datos del SeaWiFS sin limpiar: {}.".format(media_seawifs))
    print("Promedio de los datos del MODIS sin limpiar: {}.".format(media_modis))

    print("Varianza de los datos del SeaWiFS sin limpiar: {}.".format(var_seawifs))
    print("Varianza de los datos del MODIS sin limpiar: {}.".format(var_modis))

    ##-----------------------------------------------

    filter(datos_seawifs, 127, 167)
    filter(datos_modis, 127, 167)

    ##-----------------------------------------------

    media_seawifs = np.mean(datos_seawifs)
    media_modis = np.mean(datos_modis)

    var_seawifs = np.var(datos_seawifs)
    var_modis = np.var(datos_modis)

    print("Promedio de los datos del SeaWiFS limpios: {}.".format(media_seawifs))
    print("Promedio de los datos del MODIS limpios: {}.".format(media_modis))

    print("Varianza de los datos del SeaWiFS limpios: {}.".format(var_seawifs))
    print("Varianza de los datos del MODIS limpios: {}.".format(var_modis))

    ##-----------------------------------------------

    datos_comb = abs(datos_seawifs - datos_modis)
    ma_comb = np.mean(datos_comb)
    var_comb = np.var(datos_comb)

    print("Media aritmética de las distancias entre pixeles: {}".format(ma_comb))
    print("Varianza de las distancias entre pixeles: {}.\n".format(var_comb))

Análisis para el mes de Febrero
Promedio de los datos del SeaWiFS sin limpiar: 50.37943367909849.
Promedio de los datos del MODIS sin limpiar: 43.087711377245505.
Varianza de los datos del SeaWiFS sin limpiar: 107.25804162019581.
Varianza de los datos del MODIS sin limpiar: 20.39668228312531.
Promedio de los datos del SeaWiFS limpios: 48.75700040037154.
Promedio de los datos del MODIS limpios: 42.393132918236326.
Varianza de los datos del SeaWiFS limpios: 34.4880739742457.
Varianza de los datos del MODIS limpios: 5.993207478240061.
Media aritmética de las distancias entre pixeles: 6.509689854485027
Varianza de las distancias entre pixeles: 27.402702166275965.

Análisis para el mes de Marzo
Promedio de los datos del SeaWiFS sin limpiar: 53.67939175821586.
Promedio de los datos del MODIS sin limpiar: 52.79657578858032.
Varianza de los datos del SeaWiFS sin limpiar: 103.00748182330138.
Varianza de los datos del MODIS sin limpiar: 22.182261898164807.
Promedio de los datos del SeaWiFS limpi