In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import os
import gc # Liberar memoria ram

# Carga datos y filtrado de nan 

In [None]:
Carga_Datos = pd.read_csv(r"C:\Users\dfgom\OneDrive\Escritorio\USRP\RFI_Captura\Salida\CSV_Salida.csv")

In [None]:
Carga_Datos= Carga_Datos.dropna(subset=['Frecuencia (Hz)'])

In [None]:
Carga_Datos = Carga_Datos.replace(-379.29779052734375, np.nan) # error al tomar las muestras

## Cantidad total de datos por cada frecuencia     

In [None]:
conteo_frecuencia = Carga_Datos['Frecuencia (Hz)'].value_counts()
print(conteo_frecuencia)

### Separación de muestras por cada frecuencia (Visualización)

In [None]:
recuentos_por_muestra = {}

# Convertir la columna 'Frecuencia (Hz)' en un arreglo NumPy
frecuencias = Carga_Datos['Frecuencia (Hz)'].values

# Inicializar variables para llevar el seguimiento de la muestra actual y el conteo actual
muestra_actual = None
conteo_actual = 0

for frecuencia in frecuencias:
    if muestra_actual is None:
        muestra_actual = frecuencia
        conteo_actual = 1
    elif muestra_actual == frecuencia:
        conteo_actual += 1
    else:
        if muestra_actual not in recuentos_por_muestra:
            recuentos_por_muestra[muestra_actual] = []
        recuentos_por_muestra[muestra_actual].append(conteo_actual)
        
        muestra_actual = frecuencia
        conteo_actual = 1

# Agregar el último conjunto de conteos a la salida
if muestra_actual is not None:
    if muestra_actual not in recuentos_por_muestra:
        recuentos_por_muestra[muestra_actual] = []
    recuentos_por_muestra[muestra_actual].append(conteo_actual)

for muestra, conteos in recuentos_por_muestra.items():
    print(f'Frecuencia: {muestra} - Conteos: {", ".join(map(str, conteos))}')

# Tratado de datos

Para poder tratar los datos se dividen por grupos de frecuencias y de muestras esos hacen referencia a las muestras que se toman, para posteriormente sacar el promedio de estos y el los máximos 


In [None]:
def dividir_y_guardar_grupos(Carga_Datos, carpeta_salida):
    if not os.path.exists(carpeta_salida):
        os.makedirs(carpeta_salida)

    cambios = np.where(Carga_Datos['Frecuencia (Hz)'].values[:-1] > Carga_Datos['Frecuencia (Hz)'].values[1:])[0]
    cambios = np.concatenate(([0], cambios, [len(Carga_Datos)]))  # Agregar el inicio y final del DataFrame

    for i in range(len(cambios) - 1):
        inicio, fin = cambios[i], cambios[i + 1]
        grupo = Carga_Datos.iloc[inicio:fin]

        grupos_frecuencia = grupo.groupby('Frecuencia (Hz)').apply(lambda x: x.to_dict(orient='records')).tolist()

        for j, subgrupo in enumerate(grupos_frecuencia):
            if subgrupo:  # Verificar si la lista no está vacía
                # Convertir a DataFrame solo si subgrupo[0] es un diccionario y no un escalar
                if isinstance(subgrupo[0], dict):
                    nombre_archivo = os.path.join(carpeta_salida, f'Muestra_{i + 1}_Grupo_{j + 1}.csv')
                    pd.DataFrame(subgrupo).to_csv(nombre_archivo, index=False)
                    print(f"Grupo {i + 1}, Subgrupo {j + 1} guardado en '{nombre_archivo}'")

carpeta_muestras = 'Muestras'
dividir_y_guardar_grupos(Carga_Datos, carpeta_muestras)



In [None]:
#del Carga_Datos

def limpiar_ram(variables_locales):
    # Lista de variables locales a eliminar
    variables_a_eliminar = ['inicio', 'fin', 'grupo', 'grupos_frecuencia', 'subgrupo', 'nombre_archivo', 'Carga_Datos','nombre_muestra','archivo']

    gc.collect()

    # Eliminar las variables locales
    for variable in variables_a_eliminar:
        if variable in variables_locales:
            del variables_locales[variable]

In [None]:
limpiar_ram(locals())

# Variables 

In [None]:
carpeta_entrada = r'C:\Users\dfgom\OneDrive\Escritorio\USRP\RFI_Captura\Salida\Muestras'

archivos = os.listdir(carpeta_entrada)

archivos_csv = [archivo for archivo in os.listdir(carpeta_entrada) if archivo.endswith('.csv')]

filas_por_grupo = 1024

# Transpone los datos cada 1024 datos, crea columna adicional con promedio de todas estas 

In [None]:
# transpone los datos cada 1024 datos y saca el promedio de este en la ultima columna 

for archivo in archivos:
    if archivo.endswith('.csv'):  
        
        data = pd.read_csv(os.path.join(carpeta_entrada, archivo))

        cantidad_grupos = len(data['Frecuencia (Hz)']) // filas_por_grupo
        columna_frecuencia = pd.Series(data['Frecuencia (Hz)'][:cantidad_grupos]).repeat(filas_por_grupo).reset_index(drop=True)
        data['Grupo'] = (data.index // filas_por_grupo) + 1
        data['Nuevo_Indice'] = data.groupby('Grupo').cumcount()
        df_pivot = data.pivot(index='Nuevo_Indice', columns='Grupo', values='dB')
        df_pivot.columns = [f'dB{col}' for col in df_pivot.columns]
        df_pivot.reset_index(drop=True, inplace=True)
        df_pivot.index.name = 'Indice'
        df_pivot['Frecuencia (Hz)'] = columna_frecuencia
        df_pivot = df_pivot[['Frecuencia (Hz)'] + [col for col in df_pivot.columns if col != 'Frecuencia (Hz)']]
        df_promedio = df_pivot.copy()
        df_promedio['Promedio_dB'] = df_pivot.iloc[:, 1:].mean(axis=1)

        df_promedio.to_csv(os.path.join(carpeta_entrada, archivo), index=False)

        print(f"Archivo '{archivo}' procesado y sobrescrito.")

print("Proceso de procesamiento y sobrescrita de grupos completado.")


# Filtrado (Elimina columnas intermedias, conserva primera columna(Frecuencia) y ultima columna (dB))

In [None]:
# elimina los datos restantes, conserva primera columna (Frecuencia) y ultima columna, promedio de frecuencias por muestra 

for archivo in archivos_csv:
    ruta_completa = os.path.join(carpeta_entrada, archivo)

    df = pd.read_csv(ruta_completa)

    df = df.iloc[:, [0, -1]]

    df = df.rename(columns={df.columns[-1]: 'dB'})
    df.to_csv(ruta_completa, index=False)


# Concatena los datos que pertenecen a la misma muestra

In [None]:
dataframes_por_muestra = {}

for archivo in os.listdir(carpeta_entrada):
    if archivo.endswith(".csv"):
        nombre_muestra = archivo.split("_")[1]
        df = pd.read_csv(os.path.join(carpeta_entrada, archivo))

        if nombre_muestra in dataframes_por_muestra:
            dataframes_por_muestra[nombre_muestra] = pd.concat([dataframes_por_muestra[nombre_muestra], df], ignore_index=True)
        else:
            dataframes_por_muestra[nombre_muestra] = df

# Elimina los archivos originales
for archivo in os.listdir(carpeta_entrada):
    if archivo.endswith(".csv"):
        os.remove(os.path.join(carpeta_entrada, archivo))

for nombre_muestra, df in dataframes_por_muestra.items():
    archivo_salida = os.path.join(carpeta_entrada, f"Muestra_{nombre_muestra}.csv")
    df.to_csv(archivo_salida, index=False, mode='w')  #


# Asignación de frecuencias para cada muestra  

In [None]:
carpeta = r'C:\Users\dfgom\OneDrive\Escritorio\USRP\RFI_Captura\Salida\Muestras'  
archivos_csv = [archivo for archivo in os.listdir(carpeta) if archivo.endswith('.csv')]

BW_TEMP = 0
MST_ANT = False

# Procesar cada archivo CSV en la carpetax
for archivo_csv in archivos_csv:
    archivo_path = os.path.join(carpeta, archivo_csv)
    data = pd.read_csv(archivo_path)

    # Identificar las secuencias de frecuencias iguales
    secuencias = data['Frecuencia (Hz)'].unique()
    secuencias.sort() # organiza variable secuencias de menor a mayor

    # Calcular el valor de BW
    if len(secuencias) >= 2: # REVISA SI HAY OTRA FRECUENCIA 
        BW = (secuencias[1] - secuencias[0])
        BW_TEMP = BW
        MST_ANT = True
        
    elif (MST_ANT == True):
        BW = BW_TEMP

    else:               # si no no hubo una muestra anterior y no tiene un valor de BW lo tomara por defecto como 20M.
        BW = 10000000

    # Crear un nuevo DataFrame para los resultados
    nuevo_df = pd.DataFrame(columns=['Frecuencia (Hz)', 'dB'])

    # Calcular y agregar los nuevos valores de frecuencia 
    for secuencia in secuencias:
        num_samples = (data['Frecuencia (Hz)'] == secuencia).sum()
        
        min_value = secuencia - (BW / 2)
        max_value = secuencia + (BW / 2)

        # Asegurar que num_samples sea al menos 2
        if num_samples == 1:
            num_samples = 2

        incremento_frec = BW / (num_samples - 1)
        nuevos_valores_frecuencia = min_value + np.arange(num_samples) * incremento_frec
        nuevos_valores_frecuencia = pd.Series(nuevos_valores_frecuencia)
        nuevos_valores_frecuencia.name = 'Frecuencia (Hz)'
        nuevo_df = pd.concat([nuevo_df, pd.concat([nuevos_valores_frecuencia, data[data['Frecuencia (Hz)'] == secuencia]['dB'].reset_index(drop=True)], axis=1)], ignore_index=True)

    # Ordenar el nuevo DataFrame por frecuencia
    nuevo_df.sort_values(by=['Frecuencia (Hz)'], inplace=True)

    # Reiniciar los índices del nuevo DataFrame
    nuevo_df.reset_index(drop=True, inplace=True)

    # Sobreescribir el archivo CSV original con los nuevos datos
    nuevo_df.to_csv(archivo_path, index=False)

    print(f'Archivo procesado y sobrescrito: {archivo_path}')
    print (f"BW: {BW} ")


In [None]:
carpeta_entrada = r'C:\Users\dfgom\OneDrive\Escritorio\USRP\RFI_Captura\Salida\Muestras'

archivos = os.listdir(carpeta_entrada)

for archivo in archivos:
    if archivo.endswith('.csv'):
        
        archivo_completo = os.path.join(carpeta_entrada, archivo)
        
        df = pd.read_csv(archivo_completo)

        result_data = []
        
        for freq in df['Frecuencia (Hz)'].unique():
            # Filtra las filas que tienen el mismo valor en 'Frecuencia (Hz)'
            filtered_rows = df[df['Frecuencia (Hz)'] == freq]
            
            avg_db = filtered_rows['dB'].mean()
      
            # Agrega una tupla con el valor de 'Frecuencia (Hz)' y el promedio 'dB' a la lista de resultados
            result_data.append((freq, avg_db))
        
        result_df = pd.DataFrame(result_data, columns=['Frecuencia (Hz)', 'dB'])
        
        result_df.to_csv(archivo_completo, index=False)


# Promedio 

In [None]:
ruta_resultados = 'Resultados'

# Obtener la lista de archivos CSV en el directorio
archivos_csv = [archivo for archivo in os.listdir(carpeta_entrada) if archivo.endswith('.csv')]

# Ordenar los archivos alfabéticamente
archivos_csv.sort()

# Verificar si hay al menos dos archivos CSV
if len(archivos_csv) < 2:
    print("Deben existir al menos dos archivos CSV en la carpeta para calcular promedios y máximos.")
else:
    # Leer el primer archivo CSV para obtener el encabezado y comprobar si los archivos tienen el mismo tamaño
    primer_archivo = pd.read_csv(os.path.join(carpeta_entrada, archivos_csv[0]))
    num_filas = len(primer_archivo)

    # Crear DataFrames para los promedios y máximos
    promedios = primer_archivo.copy()
    maximos = primer_archivo.copy()

    for archivo_csv in archivos_csv[1:-1]:
        ruta_archivo = os.path.join(carpeta_entrada, archivo_csv)
        df = pd.read_csv(ruta_archivo)

        # Comprobar si el DataFrame tiene el mismo tamaño que el primero
        if len(df) != num_filas:
            print(f"El archivo {archivo_csv} no tiene el mismo tamaño que los archivos anteriores. Se omitirá.")
        else:
            # Calcular el promedio y el máximo y agregarlos a los DataFrames de promedios y máximos
            promedios['dB'] = promedios['dB'] + df['dB']
            maximos['dB'] = maximos['dB'].combine_first(df['dB'])

    # Calcular el promedio dividiendo la suma de dB por el número de archivos válidos
    promedios['dB'] = promedios['dB'] / (len(archivos_csv) - 1)

    # Comprobar si la carpeta de resultados existe, si no, crearla
    if not os.path.exists(ruta_resultados):
        os.makedirs(ruta_resultados)

    # Guardar los DataFrames de promedios y máximos como archivos CSV
    promedios.to_csv(os.path.join(ruta_resultados, 'promedios.csv'), index=False)
    maximos.to_csv(os.path.join(ruta_resultados, 'maximos.csv'), index=False)

    print("Los resultados se han guardado en la carpeta 'Resultados'.")