# Machine Learning & Deep Learning para Ingeniería Pesquera
## Marco Teórico y Aplicaciones Prácticas

### Introducción

Este compendio representa una colección estructurada de técnicas de Ciencia de Datos, Inteligencia Artificial y Analítica Avanzada aplicadas específicamente al sector pesquero y acuícola argentino. El objetivo es proporcionar a ingenieros pesqueros, biólogos marinos, gestores de recursos y otros profesionales del sector, herramientas computacionales modernas que permitan optimizar procesos, predecir comportamientos y tomar decisiones basadas en datos.

La pesca y la acuicultura en Argentina enfrentan desafíos únicos debido a la extensión de su plataforma continental, la diversidad de especies comerciales y las complejas dinámicas oceanográficas. Las técnicas de Machine Learning y Deep Learning ofrecen soluciones innovadoras para abordar estos desafíos, desde la predicción de zonas de pesca hasta la optimización de cadenas de suministro y el monitoreo de la sostenibilidad de los recursos.

### Objetivos Generales:
1. Proporcionar herramientas de IA para optimización de procesos pesqueros
2. Modelado predictivo para gestión sostenible de recursos
3. Automatización de análisis mediante visión computacional y sensores
4. Facilitar la toma de decisiones basada en datos en el sector pesquero
5. Promover prácticas sostenibles mediante el análisis avanzado de datos

### Estructura del Compendio

Este manual está organizado en secciones temáticas que abarcan desde técnicas básicas de Machine Learning hasta métodos avanzados de Deep Learning. Cada sección incluye:

- **Fundamento teórico**: Explicación de los conceptos matemáticos y estadísticos subyacentes
- **Aplicación práctica**: Casos de uso específicos para el sector pesquero argentino
- **Implementación en código**: Ejemplos ejecutables en Python con bibliotecas estándar
- **Vinculación con fuentes de datos reales**: Referencias a repositorios oficiales (INIDEP, MAGYP)
- **Consideraciones éticas y limitaciones**: Discusión sobre el alcance y restricciones de cada técnica

Cada notebook está diseñado para ser autocontenido, pero se recomienda seguir el orden propuesto para una comprensión progresiva de las técnicas.

## Sección 1: Aprendizaje Supervisado para Clasificación en Pesquerías

### 1.1 Fundamentos Teóricos

El aprendizaje supervisado es una rama del Machine Learning donde el algoritmo aprende a partir de datos etiquetados. En el contexto pesquero, esto puede aplicarse a problemas como la clasificación de especies, la determinación de la viabilidad de proyectos acuícolas, o la identificación de buques eficientes.

Los algoritmos de clasificación más relevantes para el sector incluyen:

- **Regresión Logística**: Modelo probabilístico lineal para clasificación binaria
- **Random Forest**: Conjunto de árboles de decisión para problemas complejos
- **Support Vector Machines (SVM)**: Clasificador de margen máximo
- **K-Nearest Neighbors (KNN)**: Clasificación basada en similitud
- **Naive Bayes**: Clasificador probabilístico basado en el teorema de Bayes

### 1.2 Aplicaciones en Ingeniería Pesquera

#### Notebooks vinculados:
- **Regresión Logística**: Viabilidad de proyectos de acuicultura
- **Random Forest**: Procesamiento de productos pesqueros
- **SVM**: Clasificación de capturas
- **KNN**: Identificación de buques eficientes
- **Naive Bayes**: Identificación de especies

### 1.3 Caso de Estudio: Viabilidad de Proyectos Acuícolas

La acuicultura marina en Argentina presenta un gran potencial, especialmente en regiones como Tierra del Fuego. La regresión logística permite modelar la probabilidad de éxito de un proyecto acuícola basándose en variables ambientales críticas como temperatura, salinidad y oxígeno disuelto.

El notebook `Regresion_Log_Viabilidad_Proyecto_Acuicultura.ipynb` implementa un modelo que clasifica sitios potenciales como "viables" o "no viables" basándose en parámetros ambientales y operativos.

## Sección 2: Aprendizaje Supervisado para Regresión en Pesquerías

### 2.1 Fundamentos Teóricos

Los algoritmos de regresión permiten predecir valores continuos, lo que resulta fundamental para estimar parámetros como biomasa, rendimiento productivo o crecimiento de especies cultivadas. A diferencia de la clasificación, la regresión proporciona estimaciones numéricas precisas.

Técnicas principales:
- **Regresión Lineal y Polinomial**: Para relaciones simples entre variables
- **Random Forest Regressor**: Para capturar relaciones no lineales complejas
- **Support Vector Regression (SVR)**: Para problemas con alta dimensionalidad

### 2.2 Aplicaciones en Ingeniería Pesquera

#### Notebooks vinculados:
- **Random Forest Regressor**: Predicción de estadios larvales en crustáceos
- **SVR**: Modelado del crecimiento en salmones

### 2.3 Caso de Estudio: Predicción de Desarrollo Larval

El desarrollo larval de crustáceos decápodos es un proceso crítico en acuicultura que depende de múltiples variables ambientales. El notebook `RandomForest_Reg_estadio_larval.ipynb` implementa un modelo que predice el estadio de desarrollo larval basándose en parámetros como temperatura, salinidad, pH y alimentación.

## Sección 3: Aprendizaje No Supervisado para Análisis de Patrones

### 3.1 Fundamentos Teóricos

El aprendizaje no supervisado trabaja con datos no etiquetados para descubrir patrones, agrupaciones o relaciones ocultas. En el sector pesquero, estas técnicas son valiosas para segmentar flotas, identificar patrones de co-captura o reducir la dimensionalidad de datos complejos.

Técnicas principales:
- **Análisis de Componentes Principales (PCA)**: Reducción de dimensionalidad
- **Algoritmos de Clustering (K-means, DBSCAN)**: Agrupación de datos similares
- **Reglas de Asociación (Apriori)**: Descubrimiento de patrones frecuentes

### 3.2 Aplicaciones en Ingeniería Pesquera

#### Notebooks vinculados:
- **PCA**: Análisis de características de flota pesquera
- **Apriori**: Patrones de co-captura en desembarques

### 3.3 Caso de Estudio: Segmentación de Flota Pesquera

La heterogeneidad de la flota pesquera argentina requiere un análisis multivariado para su caracterización. El notebook `PrincipalComponentAnalysis_Flota.ipynb` implementa PCA para reducir la dimensionalidad de variables como eslora, potencia, capacidad de bodega y antigüedad, permitiendo identificar segmentos homogéneos de embarcaciones.

## Sección 4: Deep Learning para Análisis de Imágenes y Sensores

### 4.1 Fundamentos Teóricos

Las redes neuronales profundas han revolucionado el procesamiento de imágenes y datos de sensores. En el sector pesquero, estas técnicas permiten automatizar tareas como la detección de embarcaciones en imágenes satelitales, el conteo de larvas o el monitoreo de parámetros ambientales.

Arquitecturas relevantes:
- **Redes Neuronales Convolucionales (CNN)**: Para procesamiento de imágenes
- **Redes Neuronales Recurrentes (RNN/LSTM)**: Para series temporales

### 4.2 Aplicaciones en Ingeniería Pesquera

#### Notebooks vinculados:
- **CNN**: Predicción de distribución de flotas pesqueras mediante imágenes satelitales
- **OpenCV**: Contador automático de larvas

### 4.3 Caso de Estudio: Monitoreo Satelital de Flotas

El seguimiento de flotas pesqueras mediante imágenes satelitales es fundamental para la gestión y control de la actividad pesquera. El notebook `CNNs_PrediccionSatelitalDistFlotaPesquera.ipynb` implementa una CNN para detectar embarcaciones en imágenes satelitales y predecir su distribución espacial futura.

In [None]:
# Ejemplo simplificado de CNN para imágenes satelitales
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

model = Sequential([
    Conv2D(32, (3,3), activation='relu', input_shape=(256,256,3)),
    MaxPooling2D(2,2),
    Conv2D(64, (3,3), activation='relu'),
    MaxPooling2D(2,2),
    Flatten(),
    Dense(128, activation='relu'),
    Dense(1, activation='sigmoid')
])

## Sección 5: Modelado Causal y Redes Bayesianas

### 5.1 Fundamentos Teóricos

Las redes bayesianas permiten modelar relaciones causales entre variables, lo que resulta especialmente valioso para comprender sistemas complejos como los ecosistemas marinos o las pesquerías. Estas redes representan dependencias probabilísticas mediante grafos dirigidos acíclicos.

Conceptos clave:
- **Probabilidad condicional**: P(A|B)
- **Teorema de Bayes**: P(A|B) = P(B|A)P(A)/P(B)
- **Independencia condicional**: Variables que son independientes dado un conjunto de otras variables

### 5.2 Aplicaciones en Ingeniería Pesquera

#### Notebooks vinculados:
- **Redes Bayesianas**: Modelado causal para sostenibilidad pesquera

### 5.3 Caso de Estudio: Sostenibilidad de Pesquerías Marinas

La sostenibilidad de las pesquerías depende de múltiples factores interrelacionados. El notebook `BayesianNetworks_SostenibilidadPesquera.ipynb` implementa una red bayesiana que modela las relaciones causales entre variables ambientales, operativas y económicas para identificar los factores críticos que afectan la sostenibilidad.

In [None]:
# Ejemplo de Red Bayesiana para sostenibilidad pesquera
from pgmpy.models import BayesianModel

modelo = BayesianModel([
    ('Temperatura', 'Biomasa'),
    ('Presion_Pesquera', 'Biomasa'),
    ('Biomasa', 'Sostenibilidad'),
    ('Regulacion', 'Presion_Pesquera'),
    ('Costos_Operativos', 'Presion_Pesquera')
])

## Sección 6: Graph Neural Networks para Cadenas de Suministro

### 6.1 Fundamentos Teóricos

Las Graph Neural Networks (GNNs) extienden las capacidades del deep learning a datos estructurados como grafos. En el sector pesquero, estas técnicas son ideales para modelar redes logísticas, cadenas de suministro o relaciones entre puertos y centros de procesamiento.

Conceptos clave:
- **Representación de grafos**: Nodos, aristas y sus atributos
- **Propagación de mensajes**: Cómo la información fluye entre nodos conectados
- **Embeddings de nodos**: Representaciones vectoriales de nodos que capturan su posición en el grafo

### 6.2 Aplicaciones en Ingeniería Pesquera

#### Notebooks vinculados:
- **GNN**: Modelado y análisis de la cadena de suministro pesquero

### 6.3 Caso de Estudio: Optimización de Cadena de Suministro

La cadena de suministro pesquero en Argentina involucra múltiples puertos, rutas de transporte y centros de procesamiento. El notebook `GNNs_CadenaSuministro_Pesca.ipynb` implementa una GNN para modelar esta red compleja, identificar cuellos de botella y optimizar la distribución de recursos.

## Sección 7: Aprendizaje por Refuerzo para Gestión Pesquera

### 7.1 Fundamentos Teóricos

El aprendizaje por refuerzo permite a los agentes aprender a tomar decisiones secuenciales mediante la interacción con un entorno. En la gestión pesquera, estas técnicas pueden modelar estrategias óptimas de captura, políticas de cuotas o planes de manejo adaptativo.

Enfoques principales:
- **Model-Free RL**: Aprende directamente de la experiencia sin modelar el entorno
- **Model-Based RL**: Aprende un modelo del entorno para planificar acciones

### 7.2 Aplicaciones en Ingeniería Pesquera

#### Notebooks vinculados:
- **Model-Based RL**: Aprendizaje del modelo para cuotas de captura sostenible

### 7.3 Caso de Estudio: Determinación de Cuotas Sostenibles

La determinación de cuotas de captura que maximicen el rendimiento económico mientras garantizan la sostenibilidad del recurso es un problema complejo. El notebook `Learn_the_Model_CuotaCapturaSostenible.ipynb` implementa un enfoque de RL basado en modelo para aprender políticas óptimas de captura.

## Cuadro Integrador de Técnicas y Aplicaciones

| Problema Pesquero | Técnica ML/DL | Caso de Estudio Argentino | Notebook |
|-------------------|---------------|---------------------------|----------|
| Viabilidad Acuícola | Regresión Logística | Proyectos en Tierra del Fuego | `Regresion_Log_Viabilidad_Proyecto_Acuicultura.ipynb` |
| Procesamiento de Productos | Random Forest | Calidad de productos pesqueros | `Random_Forest_ProcesamientoProdPesq.ipynb` |
| Clasificación de Capturas | SVM | Muestreo y clasificación | `SVM_Clas_captura.ipynb` |
| Eficiencia de Buques | KNN | Flota argentina | `KNN_buque_eficiente.ipynb` |
| Identificación de Especies | Naive Bayes | Especies comerciales argentinas | `Naive_Bayes_Identi_Especie.ipynb` |
| Desarrollo Larval | Random Forest Regressor | Crustáceos decápodos | `RandomForest_Reg_estadio_larval.ipynb` |
| Crecimiento en Cultivo | SVR | Salmónidos en sistemas RAS | `SVM_Salmones.ipynb` |
| Segmentación de Flota | PCA | Flota argentina | `PrincipalComponentAnalysis_Flota.ipynb` |
| Patrones de Co-captura | Apriori | Desembarques en puertos argentinos | `AprioriAlgorithm_Co-captura.ipynb` |
| Monitoreo de Flotas | CNN | ZEE Argentina - Imágenes satelitales | `CNNs_PrediccionSatelitalDistFlotaPesquera.ipynb` |
| Conteo de Larvas | OpenCV | Laboratorios de acuicultura | `Contador.ipynb` |
| Sostenibilidad Pesquera | Redes Bayesianas | Pesquerías marinas argentinas | `BayesianNetworks_SostenibilidadPesquera.ipynb` |
| Cadena de Suministro | GNN | Logística pesquera patagónica | `GNNs_CadenaSuministro_Pesca.ipynb` |
| Cuotas de Captura | Model-Based RL | Manejo adaptativo de recursos | `Learn_the_Model_CuotaCapturaSostenible.ipynb` |

## Fuentes de Datos y Referencias

### Fuentes Institucionales

- **INIDEP (Instituto Nacional de Investigación y Desarrollo Pesquero)**
  - Informes técnicos y científicos
  - Estadísticas pesqueras
  - Estudios biológicos de especies comerciales
  - [https://www.argentina.gob.ar/inidep](https://www.argentina.gob.ar/inidep)

- **Ministerio de Agricultura, Ganadería y Pesca**
  - Estadísticas de desembarques
  - Informes sobre la evolución de la pesca marina
  - [https://www.magyp.gob.ar/sitio/areas/pesca_maritima/](https://www.magyp.gob.ar/sitio/areas/pesca_maritima/)

### Publicaciones Científicas

- **Revistas especializadas**
  - Fisheries Research
  - Aquaculture
  - Revista de Biología Marina
  - Latin American Journal of Aquatic Research

- **Estudios de referencia**
  - "Estadísticas de la pesca marina en la Argentina: Evolución de los desembarques 2012–2016"
  - "Acuicultura en Argentina: red de actores, procesos de producción y espacios para el agregado de valor"
  - "Aspectos del desove y fecundidad del langostino Pleoticus muelleri" (Macchi et al., 1992)

### Repositorios de Datos

- **Datos satelitales**
  - Copernicus Marine Service
  - NASA Earth Data
  - NOAA Fisheries

- **Datos oceanográficos**
  - Sistema Nacional de Datos del Mar (SNDM)
  - World Ocean Database

## Consideraciones Éticas y Limitaciones

### Ética en el Uso de Datos Pesqueros

- **Privacidad**: Los datos de operaciones pesqueras pueden contener información sensible sobre rutas comerciales o zonas de pesca. Es fundamental anonimizar adecuadamente estos datos.

- **Transparencia**: Los modelos predictivos deben ser transparentes en cuanto a sus limitaciones y márgenes de error, especialmente cuando se utilizan para la toma de decisiones que afectan a comunidades pesqueras.

- **Equidad**: Los beneficios de la aplicación de estas tecnologías deben distribuirse equitativamente entre los diferentes actores del sector pesquero, desde grandes empresas hasta pescadores artesanales.

### Limitaciones Técnicas

- **Calidad de datos**: Muchos datasets pesqueros presentan problemas de completitud, consistencia o sesgo que pueden afectar el rendimiento de los modelos.

- **Complejidad de los ecosistemas**: Los sistemas marinos son altamente complejos y dinámicos, lo que dificulta su modelado preciso mediante técnicas de ML/DL.

- **Validación**: La validación de modelos predictivos en contextos pesqueros puede requerir largos períodos de tiempo debido a la estacionalidad y variabilidad natural de los recursos.

- **Interpretabilidad**: Algunos modelos avanzados (como deep learning) funcionan como "cajas negras", lo que puede limitar su aceptación en contextos donde la interpretabilidad es crucial para la toma de decisiones.

## Conclusiones y Perspectivas Futuras

### Síntesis

Este compendio presenta un panorama integral de las aplicaciones de Machine Learning y Deep Learning en el sector pesquero y acuícola argentino. Desde técnicas básicas de clasificación hasta métodos avanzados como redes bayesianas y GNNs, estas herramientas ofrecen soluciones innovadoras para los desafíos que enfrenta el sector.

La integración de datos provenientes de diversas fuentes (satelitales, oceanográficos, biológicos, económicos) permite un enfoque holístico para la gestión de recursos pesqueros, promoviendo prácticas más sostenibles y eficientes.

### Tendencias Emergentes

- **Integración de múltiples fuentes de datos**: Combinación de datos satelitales, sensores in-situ, información biológica y económica.

- **Modelos híbridos**: Fusión de conocimiento experto con técnicas de ML/DL para mejorar la interpretabilidad y precisión.

- **Sistemas de alerta temprana**: Desarrollo de sistemas predictivos para fenómenos como floraciones algales nocivas o cambios en la distribución de especies.

- **Democratización de herramientas**: Creación de interfaces y aplicaciones que permitan a usuarios no técnicos beneficiarse de estas tecnologías.

### Próximos Pasos

Este compendio es un proyecto en evolución que se enriquecerá con:

- Incorporación de nuevos casos de estudio basados en datos reales
- Desarrollo de interfaces interactivas para visualización de resultados
- Colaboraciones con instituciones del sector para validación de modelos
- Extensión a nuevas técnicas emergentes como federated learning o neuro-symbolic AI

El objetivo final es crear un ecosistema de herramientas computacionales que contribuyan a la sostenibilidad y eficiencia del sector pesquero argentino, promoviendo una gestión basada en datos y evidencia científica.