In [1]:
import requests

# Ruta base de la API de Geonity
base_url = "https://geonity.ibercivis.es/api/project/"

# ID del proyecto (según la información que proporcionaste)
project_id = 13

# URL completa para descargar las observaciones usando el ID del proyecto
download_url = f"{base_url}{project_id}/download_observations/"

# Realizar la solicitud GET a la API
response = requests.get(download_url)

# Verificar si la solicitud fue exitosa
if response.status_code == 200:
    # Obtener el contenido del archivo CSV
    csv_content = response.content

    # Escribir el contenido en un archivo CSV local
    with open(f"observations_{project_id}.csv", "wb") as csv_file:
        csv_file.write(csv_content)

    print(f"Archivo CSV descargado con éxito para el proyecto {project_id}.")
else:
    print(f"Error al descargar el archivo CSV. Código de estado: {response.status_code}")


Archivo CSV descargado con éxito para el proyecto 13.


In [2]:
import requests
import pandas as pd

# Ruta base de la API de Geonity
base_url = "https://geonity.ibercivis.es/api/project/"
project_id = 13

# URL completa para descargar las observaciones usando el ID del proyecto
download_url = f"{base_url}{project_id}/download_observations/"

# Autenticación - Reemplaza '<your_access_token>' con tu token de acceso
headers = {
    'Authorization': 'Bearer <your_access_token>'
}

# Realizar la solicitud GET a la API
response = requests.get(download_url, headers=headers)

# Verificar si la solicitud fue exitosa
if response.status_code == 200:
    # Obtener el contenido del archivo CSV
    csv_content = response.content

    # Leer el CSV en un DataFrame de pandas
    from io import BytesIO
    df = pd.read_csv(BytesIO(csv_content))

    # Mostrar las primeras filas del DataFrame
    print(df.head())
else:
    print(f"Error al descargar el archivo CSV. Código de estado: {response.status_code}")

    ID                  Timestamp  Latitude  Longitude  \
0  360  2024-04-19 12:24:39+00:00 -0.932642  41.615961   
1  374  2024-04-25 17:31:37+00:00 -3.625667  37.161216   
2    4  2023-12-19 09:51:48+00:00 -0.885918  41.680452   
3   28  2024-02-07 13:48:28+00:00 -3.743405  40.410973   
4   16  2024-01-25 19:09:37+00:00 -0.849943  40.815211   

  Breve descripción del punto donde se toma la muestra (campo de cultivo, parque, jardín, bosque, etc.)  \
0                                  Zona verde urbana                                                      
1     Parcela de huerta en cultivo. Riego habitual.                                                       
2                                                NaN                                                      
3                                           Frutales                                                      
4                                                NaN                                                      

        

In [3]:
df.head()

Unnamed: 0,ID,Timestamp,Latitude,Longitude,"Breve descripción del punto donde se toma la muestra (campo de cultivo, parque, jardín, bosque, etc.)",Ubicación,Foto del entorno de la toma de muestras,Fecha de la toma de muestras (dd/mm/aaaa),Resultado del indicador 1: Cobertura del suelo,Fotos de ejemplos de macrofauna y/o lombrices,Puntuación promedio del indicador 2: Infiltración,Puntuación promedio del indicador 3: Compactación,Puntuación promedio del indicador 4: Diversidad de macrofauna,Puntuación promedio del indicador 5: N° de lombrices,Puntuación promedio del indicador 6: pH,Puntuación promedio del indicador 7: Materia orgánica
0,360,2024-04-19 12:24:39+00:00,-0.932642,41.615961,Zona verde urbana,Valdespartera. Plantación zona A,https://geonity.ibercivis.es/media/images/2024...,02/03/2024,1.0,,7.3,3.0,0.0,0.0,5.0,1.0
1,374,2024-04-25 17:31:37+00:00,-3.625667,37.161216,Parcela de huerta en cultivo. Riego habitual.,"37,1611840 -3,6255470",,08/04/2024,100.0,,10.0,10.0,6.0,7.0,7.0,10.0
2,4,2023-12-19 09:51:48+00:00,-0.885918,41.680452,,Fundación Ibercivis,,19/12/2023,100.0,,100.0,100.0,100.0,100.0,100.0,100.0
3,28,2024-02-07 13:48:28+00:00,-3.743405,40.410973,Frutales,Escuela de la vid,,07/02/2024,0.0,,0.0,3.0,6.0,3.0,6.0,6.0
4,16,2024-01-25 19:09:37+00:00,-0.849943,40.815211,,40.815119 -0.849962,https://geonity.ibercivis.es/media/images/2024...,24/01/2024,10.0,https://geonity.ibercivis.es/media/images/2024...,3.33,3.0,1.3,1.0,1.0,8.6


VALIDATION MODULE

In [4]:
import pandas as pd
from datetime import datetime

# Suponiendo que ya existe un DataFrame df con datos anteriores
# Definimos el módulo de validación

def validar_datos(df, nuevos_datos):
    """
    Función para validar nuevos datos y generar alertas en caso de incumplimiento.
    
    Parámetros:
    df: DataFrame existente con datos previos.
    nuevos_datos: DataFrame con nuevas entradas para validar.
    
    Retorna:
    DataFrame consolidado y lista de alertas generadas.
    """
    
    alertas = []
    muestras_unicas = set(df.apply(tuple, axis=1))  # Crear un conjunto de muestras únicas existentes
    
    # Recorrer los nuevos datos para validación
    for index, row in nuevos_datos.iterrows():
        usuario, ph, compactacion, hora = row['usuario'], row['pH'], row['Compactación'], row['hora']
        
        # Convertir la hora a un objeto de tiempo
        try:
            hora_objeto = datetime.strptime(hora, "%H:%M").time()
        except ValueError:
            alertas.append(f"Fila {index + 1}: Formato de hora no válido.")
            continue
        
        # Inicializar contador de variables erróneas
        variables_erroneas = 0

        # Validación de pH (ejemplo de rango de pH para suelos saludables)
        if not (5.5 <= ph <= 7.5):
            variables_erroneas += 1
            alertas.append(f"Fila {index + 1}: pH ({ph}) no está entre 5.5 y 7.5.")
        
        # Validación de Compactación (ejemplo de valor aceptable para compactación)
        if not (0 <= compactacion <= 1):  # Supongamos que 0-1 es un rango de compactación aceptable
            variables_erroneas += 1
            alertas.append(f"Fila {index + 1}: Compactación ({compactacion}) no está entre 0 y 1.")
        
        # Validación de hora
        hora_inicio = datetime.strptime("06:00", "%H:%M").time()
        hora_fin = datetime.strptime("22:00", "%H:%M").time()
        
        if not (hora_inicio <= hora_objeto <= hora_fin):
            variables_erroneas += 1
            alertas.append(f"Fila {index + 1}: Hora ({hora}) fuera del rango de 6 am a 10 pm.")
        
        # Verificación de duplicados
        muestra = (usuario, ph, compactacion, hora)
        if muestra in muestras_unicas:
            alertas.append(f"Fila {index + 1}: Muestra duplicada.")
        else:
            muestras_unicas.add(muestra)

        # Alerta si todas las variables (excluyendo el nombre) están fuera de rango
        if variables_erroneas == 3:
            alertas.append(f"Fila {index + 1}: Todas las variables introducidas están fuera de rango.")
    
    # Concatenar nuevos datos con el DataFrame existente si no hay errores críticos
    df = pd.concat([df, nuevos_datos], ignore_index=True)
    
    return df, alertas

# Ejemplo de uso del módulo de validación
# Nuevos datos simulados
nuevos_datos = pd.DataFrame({
    'usuario': ['Usuario1', 'Usuario2', 'Usuario3'],
    'pH': [6.0, 4.0, 8.0],
    'Compactación': [0.3, 1.2, -0.5],
    'hora': ['07:30', '23:00', '12:00']
})

# Validar los nuevos datos
df, alertas = validar_datos(df, nuevos_datos)

# Mostrar alertas generadas
for alerta in alertas:
    print(alerta)


Fila 2: pH (4.0) no está entre 5.5 y 7.5.
Fila 2: Compactación (1.2) no está entre 0 y 1.
Fila 2: Hora (23:00) fuera del rango de 6 am a 10 pm.
Fila 2: Todas las variables introducidas están fuera de rango.
Fila 3: pH (8.0) no está entre 5.5 y 7.5.
Fila 3: Compactación (-0.5) no está entre 0 y 1.
