# Tesauros y su Uso en la Investigación

Los tesauros son vocabularios controlados y estructurados que ayudan a organizar y estandarizar términos en un campo específico. Son fundamentales para realizar búsquedas sistemáticas de literatura.

## Tesauros estandarizados:

### 1. AGROVOC (FAO)
- **Descripción**: Tesauro multilingüe de la FAO que cubre agricultura, silvicultura, pesca y alimentación
- **Utilidad**: Excelente para términos relacionados con cultivos y agricultura
- **Acceso**: [AGROVOC](http://aims.fao.org/vest-registry/vocabularies/agrovoc)

### 2. CAB Thesaurus
- **Descripción**: Especializado en ciencias de la vida, incluyendo agricultura y ciencias vegetales
- **Utilidad**: Muy útil para términos sobre enfermedades de plantas y cultivos
- **Acceso**: [CAB Thesaurus](https://www.cabi.org/cabthesaurus/)

### 3. IEEE Thesaurus
- **Descripción**: Vocabulario controlado para términos técnicos y de ingeniería
- **Utilidad**: Perfecto para términos de IA y procesamiento de datos
- **Acceso**: Disponible a través de IEEE Xplore
- [IEEE Thesaurus](https://ieee-org.widen.net/s/ljqzpfxm5g/ieee-thesaurus)

### 4. NAL Agricultural Thesaurus
- **Descripción**: Tesauro de la Biblioteca Nacional de Agricultura de EE.UU.
- **Utilidad**: Específico para términos agrícolas y de cultivos
- **Acceso**: [NAL Thesaurus](https://agclass.nal.usda.gov/)

### Beneficios de Usar Tesauros en la Búsqueda:
1. **Exhaustividad**: Asegura que no se pierdan documentos relevantes
2. **Precisión**: Reduce el ruido en los resultados
3. **Consistencia**: Mantiene coherencia en la terminología
4. **Jerarquía**: Permite expandir o reducir el alcance de la búsqueda

## Uso de los tesauros

### Pasos para una Búsqueda Efectiva:

1. **Identificar Conceptos Clave o Macro**

2. **Consultar Tesauros Específicos**
   - AGROVOC: Para términos agrícolas
   - CAB Thesaurus: Para enfermedades de plantas
   - IEEE Thesaurus: Para términos de IA y asociados a ingenieria
   
3. **Construir Jerarquías de Términos**
   - Identificar términos más específicos
   - Identificar términos relacionados
   - Identificar términos más amplios

4. **Combinar Términos**
   - Usar operadores booleanos (AND, OR)
   - Incluir variaciones de términos
   - Considerar sinónimos y términos relacionados

# Resumen de Tesauros: ScienceDirect

## Definición y Evolución
Los tesauros han evolucionado desde su concepción original como "tesoro de palabras" hasta convertirse en herramientas sofisticadas para la organización y recuperación de información. Según las definiciones modernas, un tesauro es:

- Un vocabulario controlado y dinámico
- Una herramienta que establece relaciones semánticas y sintácticas entre términos
- Un instrumento para el control terminológico en sistemas de información

## Características Principales
1. **Estructura Formal**
   - Relaciones jerárquicas entre conceptos
   - Relaciones semánticas entre términos
   - Control de vocabulario
   - Organización sistemática

2. **Funcionalidades**
   - Control terminológico
   - Ayuda en la recuperación de información
   - Expansión de consultas
   - Normalización de vocabulario

## Tipos de Tesauros
1. **Por Alcance**
   - Generales
   - Especializados
   - Multidisciplinarios
   - Monodisciplinarios

2. **Por Estructura**
   - Alfabéticos
   - Sistemáticos (temáticos)
   - Gráficos

3. **Por Tamaño**
   - Macrotesauros
   - Microtesauros

4. **Por Idioma**
   - Monolingües
   - Bilingües
   - Plurilingües

## Control Terminológico
Los tesauros pueden ser:
1. **Controlados**
   - Un solo término por concepto
   - Relaciones estandarizadas
   - Significados delimitados

2. **De lenguaje libre**
   - Múltiples términos por concepto
   - Mayor flexibilidad
   - Basados en literatura relevante

## Usos Modernos
1. Indexación de documentos
2. Búsqueda y recuperación de información
3. Apoyo en sistemas de IA y procesamiento de lenguaje natural
4. Organización del conocimiento
5. Desarrollo de ontologías y taxonomías

Referencia: [https://www.sciencedirect.com/topics/social-sciences/thesauri](https://www.sciencedirect.com/topics/social-sciences/thesauri)

# Identificacion de Conceptos Macro para la Ecuación de Búsqueda

## Facetas Principales

### Faceta 1: TECNOLOGÍA (Herramientas y Métodos)
```
("artificial intelligence" OR "machine learning" OR "deep learning" OR 
 "neural network*" OR "computer vision" OR "image processing" OR 
 "pattern recognition")
```

### Faceta 2: ENFERMEDADES (Contexto/Problema)
```
("plant disease*" OR "crop disease*" OR "pathogen*" OR 
 "disease detection" OR "disease assessment" OR "pest*" OR
 "plant health" OR "crop infection*")
```

### Faceta 3: PREDICCIÓN Y MODELADO (Acción/Propósito)
```
("predict*" OR "forecast*" OR "model*" OR "estimation" OR 
 "early detection" OR "assessment" OR "monitoring" OR
 "analysis" OR "evaluation")
```

### Faceta 4: OBJETO DE ESTUDIO (Objetivo Final)
```
("crop yield" OR "fruit quality" OR "harvest quality" OR 
 "production quality" OR "crop performance")
```

## Justificacion del orden de las facetas

1. **Tecnología** (¿Con qué herramientas?)
   - Define las herramientas y métodos disponibles
   - Base tecnológica para la solución

2. **Enfermedades** (¿Cuál es el problema?)
   - Define el contexto del problema
   - Establece el ámbito de aplicación
   - Identifica la variable independiente principal

3. **Predicción** (¿Qué queremos hacer?)
   - Define la acción sobre el problema
   - Establece el tipo de análisis
   - Conecta el problema con el objetivo

4. **Objeto de Estudio** (¿Qué queremos impactar?)
   - Define el objetivo final
   - Establece las variables dependientes
   - Determina los resultados esperados

## Ejemplo de Construcción Progresiva Refinada

1. **Base Tecnológica**:
   ```
   ("artificial intelligence" OR "machine learning" OR "computer vision")
   ```

2. **+ Contexto del Problema**:
   ```
   [Nivel 1] AND ("plant disease*" OR "crop disease*" OR "pathogen*")
   ```

3. **+ Propósito de Análisis**:
   ```
   [Nivel 2] AND ("predict*" OR "forecast*" OR "model*")
   ```

4. **+ Objetivo Final**:
   ```
   [Nivel 3] AND ("crop yield" OR "fruit quality")
   ```

## ¿Como afecta el orden logico al analisis?

1. **Flujo Lógico**:
   - De herramientas → problema → acción → objetivo
   - Sigue un proceso de pensamiento natural
   - Facilita la comprensión del alcance

2. **Claridad en las relaciones**:
   - Vincula directamente el problema con su solución
   - Establece clara relación causa-efecto
   - Mejora la identificación de variables

3. **Mayor Precisión**:
   - Enfoca primero el contexto del problema
   - Clarifica el tipo de análisis necesario
   - Define mejor el impacto esperado
```

Este orden refleja mejor la secuencia lógica de:
1. Con qué herramientas contamos
2. Qué problema enfrentamos
3. Qué queremos hacer al respecto
4. Qué resultados esperamos obtener

# Justificación Lógica del Orden de Facetas

## Ejemplo de Aplicación

Si tomamos un caso específico orientado a calidad nutricional:

1. **Tecnología**: Deep Learning y Computer Vision
   - NT: Hyperspectral Imaging
   - NT: NIR Spectroscopy
   - RT: Pattern Recognition

2. **Enfermedad/Estrés**: Manchas foliares en hojas
   - BT: Plant Diseases
   - NT: Fungal Diseases
   - RT: Nutrient Deficiencies

3. **Predicción**: Estimación temprana
   - BT: Predictive Analysis
   - RT: Real-time Monitoring
   - RT: Early Detection

4. **Objeto**: Calidad Nutricional
   - NT: Macronutrients
      - NT: Protein Content
      - NT: Carbohydrate Content
   - NT: Micronutrients
      - NT: Vitamin Content
      - NT: Mineral Content
   - RT: Organoleptic Properties
      - NT: Texture
      - NT: Color
   - RT: Functional Properties
      - NT: Bioactive Compounds
      - NT: Antioxidant Activity

Esta secuencia nos permite entender claramente:
- **Herramientas**: Tecnologías de imagen hiperespectral y espectroscopía NIR para análisis no destructivo
- **Problema**: Impacto de enfermedades foliares en la composición nutricional
- **Predicción**: Detección temprana de cambios en el perfil nutricional
- **Impacto**: Evaluación de múltiples aspectos de la calidad nutricional:
  * Contenido de macro y micronutrientes
  * Propiedades organolépticas asociadas
  * Compuestos bioactivos y capacidad antioxidante

### Ecuación de búsqueda resultante:
```
(
    ("deep learning" OR "computer vision" OR "hyperspectral imaging" OR "NIR spectroscopy")
    AND
    ("foliar spot*" OR "leaf spot*" OR "fungal disease*" OR "nutrient deficienc*")
    AND
    ("early prediction" OR "early detection" OR "real-time monitoring")
    AND
    (
        ("nutrient* content" OR "nutritional quality")
        OR
        ("macronutrient*" OR "protein content" OR "carbohydrate content")
        OR
        ("micronutrient*" OR "vitamin*" OR "mineral*")
        OR
        ("bioactive compound*" OR "antioxidant activity")
    )
)
```

Esta estructura jerárquica, basada en tesauros especializados (AGROVOC, NAL, IEEE), permite:
1. Capturar la complejidad multidimensional de la calidad nutricional
2. Incluir términos relacionados relevantes
3. Mantener la coherencia con vocabularios controlados
4. Facilitar la expansión o restricción de la búsqueda según necesidades

# Adaptación para Predicción de Calidad Nutricional

## Facetas Refinadas para Calidad Nutricional

### 1. TECNOLOGÍA (Herramientas y Métodos)
```
(
    "artificial intelligence" OR "machine learning" OR "deep learning"
    OR "neural network*" OR "computer vision" OR "spectral analysis"
    OR "near infrared spectroscopy" OR "NIR" OR "hyperspectral imaging"
    OR "chemical analysis" OR "compositional analysis"
)
```

### 2. ENFERMEDADES Y FACTORES DE ESTRÉS (Contexto/Problema)
```
(
    "plant disease*" OR "crop disease*" OR "pathogen*" 
    OR "environmental stress" OR "nutrient deficienc*"
    OR "physiological disorder*" OR "abiotic stress"
    OR "water stress" OR "nutritional stress"
)
```

### 3. PREDICCIÓN Y EVALUACIÓN (Acción/Propósito)
```
(
    "predict*" OR "forecast*" OR "model*" OR "estimation"
    OR "assessment" OR "monitoring" OR "analysis"
    OR "quantification" OR "determination" OR "evaluation"
    OR "characterization" OR "profiling"
)
```

### 4. CALIDAD NUTRICIONAL (Objetivo Específico)
```
(
    ("nutrient* content" OR "nutritional quality" OR "nutritional value")
    OR
    ("macronutrient*" OR "protein content" OR "carbohydrate content" OR "lipid content")
    OR
    ("micronutrient*" OR "vitamin*" OR "mineral*" OR "trace element*")
    OR
    ("organoleptic propert*" OR "sensory quality" OR "food quality")
    OR
    ("functional propert*" OR "bioactive compound*" OR "antioxidant*")
    OR
    ("moisture content" OR "water activity" OR "dry matter")
)
```

## Ejemplo de Ecuación Completa (Scopus)

```
TITLE-ABS-KEY(
    (
        ("artificial intelligence" OR "machine learning" OR "spectral analysis" OR "NIR")
        AND
        ("plant disease*" OR "nutrient deficienc*" OR "environmental stress")
        AND
        ("predict*" OR "assessment" OR "quantification")
        AND
        (
            ("nutrient* content" OR "nutritional quality")
            OR
            ("macronutrient*" OR "micronutrient*")
            OR
            ("organoleptic propert*" OR "sensory quality")
        )
    )
)
```

## Aspectos Específicos por Categoría

### Macronutrientes
- Proteínas
- Carbohidratos
- Lípidos
- Fibra

### Micronutrientes
- Vitaminas
- Minerales
- Oligoelementos
- Antioxidantes

### Propiedades Organolépticas
- Textura
- Sabor
- Aroma
- Color
- Apariencia

### Propiedades Físico-químicas
- Contenido de agua
- Actividad de agua
- Materia seca
- pH
- Acidez

## Estrategia de Búsqueda Específica

1. **Por Tipo de Análisis**:
```
("spectral analysis" OR "NIR" OR "chemical analysis")
AND
("nutrient* content" OR "nutritional quality")
```

2. **Por Componente Específico**:
```
("machine learning" OR "deep learning")
AND
("predict*" OR "quantification")
AND
("protein content" OR "mineral content" OR "vitamin content")
```

3. **Por Propiedades Organolépticas**:
```
("computer vision" OR "image analysis" OR "spectral imaging")
AND
("quality assessment" OR "characterization")
AND
("texture" OR "color" OR "appearance")
```

## Consideraciones Importantes

1. **Métodos de Análisis**:
   - Técnicas no destructivas (NIR, espectroscopía)
   - Análisis de imagen (computer vision)
   - Análisis químicos tradicionales

2. **Variables de Impacto**:
   - Enfermedades y patógenos
   - Estrés ambiental
   - Deficiencias nutricionales
   - Condiciones de cultivo

3. **Aspectos de Calidad**:
   - Composición nutricional
   - Propiedades organolépticas
   - Calidad funcional
   - Seguridad alimentaria

4. **Aplicaciones Específicas**:
   - Monitoreo en tiempo real
   - Predicción temprana
   - Evaluación de calidad
   - Control de procesos

# Jerarquización de Conceptos según Tesauros

## 1. TECNOLOGÍA (IEEE/ACM)
```
➤ Artificial Intelligence
   ├─ Machine Learning
   │  ├─ Deep Learning
   │  │  ├─ Convolutional Neural Networks
   │  │  ├─ Recurrent Neural Networks
   │  │  └─ Transfer Learning
   │  ├─ Supervised Learning
   │  │  ├─ Classification
   │  │  └─ Regression
   │  └─ Unsupervised Learning
   │     ├─ Clustering
   │     └─ Dimensionality Reduction
   │
   ├─ Computer Vision
   │  ├─ Image Processing
   │  │  ├─ Feature Extraction
   │  │  ├─ Segmentation
   │  │  └─ Pattern Recognition
   │  └─ Spectral Analysis
   │     ├─ Hyperspectral Imaging
   │     ├─ NIR Spectroscopy
   │     └─ Multispectral Analysis
   │
   └─ Data Analytics
      ├─ Predictive Analytics
      ├─ Statistical Analysis
      └─ Time Series Analysis
```

## 2. ENFERMEDADES Y ESTRÉS (NAL/AGROVOC)
```
➤ Plant Health Issues
   ├─ Plant Diseases
   │  ├─ Fungal Diseases
   │  ├─ Bacterial Diseases
   │  ├─ Viral Diseases
   │  └─ Disease Progression
   │
   ├─ Physiological Disorders
   │  ├─ Nutrient Deficiencies
   │  │  ├─ Macronutrient Deficiencies
   │  │  └─ Micronutrient Deficiencies
   │  └─ Environmental Stress
   │
   └─ Stress Factors
      ├─ Abiotic Stress
      │  ├─ Water Stress
      │  ├─ Temperature Stress
      │  └─ Light Stress
      └─ Biotic Stress
         ├─ Pest Damage
         └─ Pathogen Infection
```

## 3. PREDICCIÓN Y EVALUACIÓN (IEEE/NAL)
```
➤ Predictive Analysis
   ├─ Modeling Methods
   │  ├─ Mathematical Models
   │  ├─ Statistical Models
   │  └─ Machine Learning Models
   │
   ├─ Prediction Types
   │  ├─ Early Detection
   │  ├─ Real-time Monitoring
   │  └─ Forecasting
   │
   └─ Assessment Methods
      ├─ Quantitative Analysis
      │  ├─ Chemical Analysis
      │  └─ Physical Analysis
      └─ Qualitative Analysis
         ├─ Visual Assessment
         └─ Sensory Evaluation
```

## 4. CALIDAD NUTRICIONAL (NAL/AGROVOC)
```
➤ Nutritional Quality
   ├─ Macronutrients
   │  ├─ Proteins
   │  │  ├─ Amino Acids
   │  │  └─ Protein Content
   │  ├─ Carbohydrates
   │  │  ├─ Simple Sugars
   │  │  └─ Complex Carbohydrates
   │  └─ Lipids
   │     ├─ Fatty Acids
   │     └─ Fat Content
   │
   ├─ Micronutrients
   │  ├─ Vitamins
   │  │  ├─ Water-soluble
   │  │  └─ Fat-soluble
   │  └─ Minerals
   │     ├─ Major Minerals
   │     └─ Trace Elements
   │
   ├─ Organoleptic Properties
   │  ├─ Physical Properties
   │  │  ├─ Texture
   │  │  ├─ Color
   │  │  └─ Appearance
   │  └─ Chemical Properties
   │     ├─ Flavor
   │     ├─ Aroma
   │     └─ Taste
   │
   └─ Functional Properties
      ├─ Bioactive Compounds
      │  ├─ Antioxidants
      │  └─ Phytochemicals
      └─ Physical Characteristics
         ├─ Water Activity
         └─ Moisture Content
```

## Relaciones entre Niveles (Basado en Tesauros)

### Relaciones Verticales (BT/NT)
- BT (Broader Term): Término más amplio
- NT (Narrower Term): Término más específico

### Relaciones Horizontales (RT)
- RT (Related Term): Términos relacionados
- UF (Used For): Términos alternativos

## Códigos de Búsqueda por Nivel

### Nivel 1 (Términos más Amplios)
```
("artificial intelligence" OR "plant health" OR "prediction" OR "nutritional quality")
```

### Nivel 2 (Términos Específicos)
```
("machine learning" OR "plant disease*" OR "predictive model*" OR "nutrient* content")
```

### Nivel 3 (Términos muy Específicos)
```
("deep learning" OR "nutrient deficienc*" OR "early detection" OR "protein content")
```

## Notas sobre Fuentes de Tesauros

1. **IEEE Thesaurus**
   - Términos técnicos y de IA
   - Métodos computacionales
   - Técnicas de análisis

2. **NAL Thesaurus**
   - Términos agrícolas
   - Enfermedades de plantas
   - Aspectos nutricionales

3. **AGROVOC**
   - Términos agrícolas multilingües
   - Aspectos de calidad
   - Propiedades nutricionales

4. **ACM Computing Classification**
   - Métodos de IA
   - Técnicas de análisis
   - Procesamiento de datos

# Construcción de Ecuaciones de Búsqueda usando Tesauros Estandarizados

Este notebook demuestra cómo usar la clase `ThesaurusBuilder` para construir ecuaciones de búsqueda que cumplan con los estándares de tesauros.

## Relaciones Básicas en un Tesauro

Las relaciones fundamentales en un tesauro estandarizado son:

1. **BT (Broader Term / Término Más Amplio)**
   - Indica una relación jerárquica hacia arriba
   - El término BT es más general que el término actual
   - Ejemplo: "machine learning" BT "artificial intelligence"

2. **NT (Narrower Term / Término Más Específico)**
   - Indica una relación jerárquica hacia abajo
   - El término NT es más específico que el término actual
   - Ejemplo: "deep learning" NT "machine learning"

3. **RT (Related Term / Término Relacionado)**
   - Indica una asociación entre términos que no es jerárquica
   - Los términos RT tienen una relación semántica o conceptual
   - Ejemplo: "supervised learning" RT "unsupervised learning"

4. **UF (Used For / Usado Por)**
   - Indica que el término actual es el preferido
   - Los términos UF son sinónimos o variantes no preferidas
   - Ejemplo: "artificial intelligence" UF "AI"

5. **USE (Usar)**
   - Indica que existe un término preferido
   - Dirige desde un término no preferido al término autorizado
   - Ejemplo: "AI" USE "artificial intelligence"

6. **SN (Scope Note / Nota de Alcance)**
   - No es una relación, sino una nota explicativa
   - Define el significado y uso del término en el tesauro
   - Ejemplo: SN "Systems that can learn from data" para "machine learning"

Estas relaciones son bidireccionales:
- Si A es BT de B, entonces B es NT de A
- Si A tiene UF B, entonces B tiene USE A
- Si A es RT de B, entonces B es RT de A

### Fuentes y Estándares

Esta estructura de relaciones está basada en estándares internacionales y documentación especializada:

1. **ISO 25964-1:2011** - "Information and documentation — Thesauri and interoperability with other vocabularies — Part 1: Thesauri for information retrieval"
   - Principal estándar internacional para la construcción de tesauros
   - Define la estructura y relaciones básicas
   - Establece las buenas prácticas para el control de vocabulario

2. **ANSI/NISO Z39.19-2005 (R2010)** - "Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies"
   - Guía americana para la construcción de vocabularios controlados
   - Define las relaciones semánticas y su uso
   - Establece principios para la gestión de tesauros

3. **UNESCO Thesaurus Guidelines** (2005)
   - Guía práctica para la construcción de tesauros multilingües
   - Define la implementación de relaciones jerárquicas y asociativas
   - Proporciona ejemplos de uso en contextos internacionales

4. **ASIS&T Thesaurus Construction Guidelines** - American Society for Information Science and Technology
   - Directrices para la construcción y mantenimiento de tesauros
   - Define las mejores prácticas para establecer relaciones
   - Proporciona ejemplos prácticos de implementación

5. **The Thesaurus: Review, Renaissance, and Revision** (2004)
   - Autores: Sandra K. Roe y Alan R. Thomas
   - Analiza la evolución y modernización de los tesauros
   - Discute la implementación práctica de las relaciones

Estas fuentes establecen los estándares internacionales que aseguran:
- Consistencia en la estructura del tesauro
- Interoperabilidad entre diferentes sistemas
- Calidad en el control del vocabulario
- Correcta gestión de las relaciones semánticas

In [None]:
from thesaurus_builder import ThesaurusBuilder, RelationType

## 1. Creación de un Tesauro Simple

Vamos a crear un tesauro simple que demuestre las relaciones básicas (BT, NT, RT, USE, UF)

In [3]:
# Crear el constructor
builder = ThesaurusBuilder()

# Crear términos principales con notas de alcance
ai = builder.add_term(
    "artificial intelligence",
    scope_note="Use for AI and artificial intelligence systems"
)

# Crear término no preferido
ai_alt = builder.add_term("AI", is_preferred=False)
ai_alt.add_relation(RelationType.USE, ai)

# Crear términos más específicos
ml = builder.add_term(
    "machine learning",
    scope_note="Systems that can learn from data"
)
ml.add_relation(RelationType.BT, ai)  # ML es más específico que AI

# Añadir como faceta y construir ecuación
builder.add_facet(ai)
print("Ecuación de búsqueda simple:")
print(builder.build_search_equation())

Ecuación de búsqueda simple:
(("AI" OR "artificial intelligence" OR "machine learning"))


In [6]:
# Crear el constructor para nuestro tesauro específico
builder = ThesaurusBuilder()

# 1. TECNOLOGÍA (IEEE Thesaurus)
tech = builder.add_term(
    "artificial intelligence",
    scope_note="Systems that simulate human intelligence and decision making"
)

# 1.1 Machine Learning branch
ml = builder.add_term("machine learning", scope_note="Systems that improve through experience")
ml.add_relation(RelationType.BT, tech)

dl = builder.add_term("deep learning", scope_note="Neural network-based learning methods")
dl.add_relation(RelationType.BT, ml)

cv = builder.add_term("computer vision", scope_note="Systems for analyzing visual information")
cv.add_relation(RelationType.BT, tech)


# 2. ENFERMEDADES Y ESTRÉS (AGROVOC/CAB)
stress = builder.add_term(
    "plant stress",
    scope_note="Adverse conditions affecting plant growth and development"
)

# 2.1 Disease branch
diseases = builder.add_term("plant diseases")
diseases.add_relation(RelationType.BT, stress)

fungal = builder.add_term("fungal diseases")
fungal.add_relation(RelationType.BT, diseases)

# 2.2 Nutrient stress branch
nutrient_stress = builder.add_term("nutrient stress")
nutrient_stress.add_relation(RelationType.BT, stress)

deficiencies = builder.add_term("nutrient deficiencies")
deficiencies.add_relation(RelationType.BT, nutrient_stress)

# 3. PREDICCIÓN (IEEE/NAL)
prediction = builder.add_term(
    "prediction",
    scope_note="Forecasting or estimating future conditions"
)

early_detection = builder.add_term("early detection")
early_detection.add_relation(RelationType.BT, prediction)

monitoring = builder.add_term("real-time monitoring")
monitoring.add_relation(RelationType.RT, early_detection)

# 4. CALIDAD NUTRICIONAL (AGROVOC/NAL)
quality = builder.add_term(
    "nutritional quality",
    scope_note="Nutritional value and composition of food products"
)

# 4.1 Macronutrients
macro = builder.add_term("macronutrients")
macro.add_relation(RelationType.BT, quality)

proteins = builder.add_term("protein content")
proteins.add_relation(RelationType.BT, macro)

carbs = builder.add_term("carbohydrate content")
carbs.add_relation(RelationType.BT, macro)

# 4.2 Micronutrients
micro = builder.add_term("micronutrients")
micro.add_relation(RelationType.BT, quality)

vitamins = builder.add_term("vitamin content")
vitamins.add_relation(RelationType.BT, micro)

minerals = builder.add_term("mineral content")
minerals.add_relation(RelationType.BT, micro)

# 4.3 Functional Properties
functional = builder.add_term("functional properties")
functional.add_relation(RelationType.RT, quality)

bioactive = builder.add_term("bioactive compounds")
bioactive.add_relation(RelationType.BT, functional)

antioxidants = builder.add_term("antioxidant activity")
antioxidants.add_relation(RelationType.BT, functional)

# 4.4 Organoleptic Properties
organoleptic = builder.add_term("organoleptic properties")
organoleptic.add_relation(RelationType.RT, quality)

texture = builder.add_term("texture")
texture.add_relation(RelationType.BT, organoleptic)

# Añadir las facetas principales
builder.add_facet(tech)      # Tecnología
builder.add_facet(stress)    # Enfermedades y Estrés
builder.add_facet(prediction)  # Predicción
builder.add_facet(quality)   # Calidad Nutricional

# Construir las ecuaciones
print("Ecuación de búsqueda básica:")
print(builder.build_search_equation())
print("\nEcuación incluyendo términos relacionados:")
print(builder.build_search_equation(include_related=True))

# Visualizar la estructura completa
print("\nEstructura jerárquica completa:")
def print_thesaurus_structure(term, level=0, visited=None):
    if visited is None:
        visited = set()
    
    if term.term in visited:
        return
    visited.add(term.term)
    
    indent = "  " * level
    print(f"{indent}└── {term.term}")
    
    if term.scope_note:
        print(f"{indent}    SN: {term.scope_note}")
    
    if not term.is_preferred:
        print(f"{indent}    USE: {term.use_term.term}")
    
    if term.used_for_terms:
        print(f"{indent}    UF: {', '.join(t.term for t in term.used_for_terms)}")
    
    if term.related_terms:
        print(f"{indent}    RT: {', '.join(t.term for t in term.related_terms)}")
    
    for nt in term.narrower_terms:
        print_thesaurus_structure(nt, level + 1, visited)

print("\nEstructura completa del tesauro por facetas:")
for facet in builder.facets:
    print(f"\nFaceta: {facet.term}")
    print_thesaurus_structure(facet)

Ecuación de búsqueda básica:
(("artificial intelligence" OR "computer vision" OR "machine learning") OR ("deep learning")) AND (("nutrient stress") OR "plant diseases") OR "plant stress" OR ("fungal diseases" OR ("nutrient deficiencies")) AND (("early detection" OR "prediction")) AND (("macronutrients" OR "mineral content" OR "nutritional quality" OR "protein content") OR "vitamin content") OR ("carbohydrate content" OR ("micronutrients"))

Ecuación incluyendo términos relacionados:
(("artificial intelligence" OR "computer vision" OR "machine learning") OR ("deep learning")) AND (("nutrient stress") OR "plant diseases") OR "plant stress" OR ("fungal diseases" OR ("nutrient deficiencies")) AND (("early detection" OR "prediction")) AND (("functional properties" OR "macronutrients" OR "mineral content" OR "nutritional quality" OR "organoleptic properties" OR "protein content") OR "vitamin content") OR ("carbohydrate content" OR ("micronutrients"))

Estructura jerárquica completa:

Estruct

In [8]:
# Crear el constructor de tesauros con estructura expandida
builder = ThesaurusBuilder()

# 1. TECNOLOGÍA (IEEE/ACM)
tech = builder.add_term(
    "artificial intelligence",
    scope_note="Systems that simulate human intelligence and decision making"
)

# 1.1 Machine Learning y sus términos relacionados
ml = builder.add_term(
    "machine learning",
    scope_note="Systems that improve through experience"
)
ml.add_relation(RelationType.BT, tech)

# Deep Learning branch
dl = builder.add_term(
    "deep learning",
    scope_note="Neural network-based learning methods"
)
dl.add_relation(RelationType.BT, ml)

# Neural Networks específicos
cnn = builder.add_term("convolutional neural networks")
cnn.add_relation(RelationType.BT, dl)
rnn = builder.add_term("recurrent neural networks")
rnn.add_relation(RelationType.BT, dl)
transformer = builder.add_term("transformers")
transformer.add_relation(RelationType.BT, dl)

# Computer Vision branch
cv = builder.add_term(
    "computer vision",
    scope_note="Systems for analyzing visual information"
)
cv.add_relation(RelationType.BT, tech)

# Image Processing sub-branch
img_proc = builder.add_term("image processing")
img_proc.add_relation(RelationType.BT, cv)
feature_extract = builder.add_term("feature extraction")
feature_extract.add_relation(RelationType.BT, img_proc)
segmentation = builder.add_term("image segmentation")
segmentation.add_relation(RelationType.BT, img_proc)


# 2. ENFERMEDADES Y ESTRÉS (AGROVOC/CAB)
plant_health = builder.add_term(
    "plant health",
    scope_note="Overall plant condition and wellness"
)

# Diseases branch
diseases = builder.add_term(
    "plant diseases",
    scope_note="Pathological conditions in plants"
)
diseases.add_relation(RelationType.BT, plant_health)

# Fungal Diseases
fungal = builder.add_term("fungal diseases")
fungal.add_relation(RelationType.BT, diseases)
leaf_spots = builder.add_term("leaf spots")
leaf_spots.add_relation(RelationType.BT, fungal)
root_rots = builder.add_term("root rots")
root_rots.add_relation(RelationType.BT, fungal)

# Physiological Disorders branch
physio = builder.add_term("physiological disorders")
physio.add_relation(RelationType.BT, plant_health)

# Nutrient Deficiencies
nutrient_def = builder.add_term("nutrient deficiencies")
nutrient_def.add_relation(RelationType.BT, physio)

# Macro deficiencies
macro_def = builder.add_term("macronutrient deficiencies")
macro_def.add_relation(RelationType.BT, nutrient_def)
n_def = builder.add_term("nitrogen deficiency")
n_def.add_relation(RelationType.BT, macro_def)
p_def = builder.add_term("phosphorus deficiency")
p_def.add_relation(RelationType.BT, macro_def)

# Micro deficiencies
micro_def = builder.add_term("micronutrient deficiencies")
micro_def.add_relation(RelationType.BT, nutrient_def)
fe_def = builder.add_term("iron chlorosis")
fe_def.add_relation(RelationType.BT, micro_def)
zn_def = builder.add_term("zinc deficiency")
zn_def.add_relation(RelationType.BT, micro_def)

# 3. PREDICCIÓN (IEEE/NAL)
prediction = builder.add_term(
    "prediction",
    scope_note="Forecasting or estimating future conditions"
)

# Early Detection branch
early_detection = builder.add_term("early detection")
early_detection.add_relation(RelationType.BT, prediction)
disease_detect = builder.add_term("disease detection")
disease_detect.add_relation(RelationType.BT, early_detection)
stress_detect = builder.add_term("stress detection")
stress_detect.add_relation(RelationType.BT, early_detection)

# Monitoring branch
monitoring = builder.add_term("real-time monitoring")
monitoring.add_relation(RelationType.RT, early_detection)
continuous = builder.add_term("continuous assessment")
continuous.add_relation(RelationType.BT, monitoring)

# 4. CALIDAD NUTRICIONAL (AGROVOC/NAL)
quality = builder.add_term(
    "nutritional quality",
    scope_note="Nutritional value and composition of food products"
)

# Macronutrients branch
macro = builder.add_term("macronutrients")
macro.add_relation(RelationType.BT, quality)

# Proteins
proteins = builder.add_term("proteins")
proteins.add_relation(RelationType.BT, macro)
amino_acids = builder.add_term("amino acids")
amino_acids.add_relation(RelationType.BT, proteins)
protein_content = builder.add_term("protein content")
protein_content.add_relation(RelationType.BT, proteins)

# Carbohydrates
carbs = builder.add_term("carbohydrates")
carbs.add_relation(RelationType.BT, macro)
simple_carbs = builder.add_term("simple carbohydrates")
simple_carbs.add_relation(RelationType.BT, carbs)
complex_carbs = builder.add_term("complex carbohydrates")
complex_carbs.add_relation(RelationType.BT, carbs)

# Micronutrients branch
micro = builder.add_term("micronutrients")
micro.add_relation(RelationType.BT, quality)

# Vitamins
vitamins = builder.add_term("vitamins")
vitamins.add_relation(RelationType.BT, micro)
water_sol = builder.add_term("water-soluble vitamins")
water_sol.add_relation(RelationType.BT, vitamins)
fat_sol = builder.add_term("fat-soluble vitamins")
fat_sol.add_relation(RelationType.BT, vitamins)

# Minerals
minerals = builder.add_term("minerals")
minerals.add_relation(RelationType.BT, micro)
major_min = builder.add_term("major minerals")
major_min.add_relation(RelationType.BT, minerals)
trace_elem = builder.add_term("trace elements")
trace_elem.add_relation(RelationType.BT, minerals)

# Functional Properties
functional = builder.add_term("functional properties")
functional.add_relation(RelationType.RT, quality)

# Bioactive compounds
bioactive = builder.add_term("bioactive compounds")
bioactive.add_relation(RelationType.BT, functional)
antioxidants = builder.add_term("antioxidants")
antioxidants.add_relation(RelationType.BT, bioactive)
phenolics = builder.add_term("phenolic compounds")
phenolics.add_relation(RelationType.BT, bioactive)

# Organoleptic Properties
organoleptic = builder.add_term("organoleptic properties")
organoleptic.add_relation(RelationType.RT, quality)

# Physical Properties
physical = builder.add_term("physical properties")
physical.add_relation(RelationType.BT, organoleptic)
texture = builder.add_term("texture")
texture.add_relation(RelationType.BT, physical)
color = builder.add_term("color")
color.add_relation(RelationType.BT, physical)

# Chemical Properties
chemical = builder.add_term("chemical properties")
chemical.add_relation(RelationType.BT, organoleptic)
flavor = builder.add_term("flavor")
flavor.add_relation(RelationType.BT, chemical)
aroma = builder.add_term("aroma")
aroma.add_relation(RelationType.BT, chemical)

# Añadir las facetas principales
builder.add_facet(tech)         # Tecnología
builder.add_facet(plant_health) # Salud de la Planta
builder.add_facet(prediction)   # Predicción
builder.add_facet(quality)      # Calidad Nutricional

# Construir y mostrar las ecuaciones
print("Ecuación de búsqueda básica:")
print(builder.build_search_equation())
print("\nEcuación incluyendo términos relacionados:")
print(builder.build_search_equation(include_related=True))

# Visualizar la estructura completa
print("\nEstructura jerárquica completa:")
for facet in builder.facets:
    print(f"\nFaceta: {facet.term}")
    print_thesaurus_structure(facet)

Ecuación de búsqueda básica:
(("artificial intelligence" OR "image processing" OR "image segmentation") OR "machine learning" OR "recurrent neural networks" OR "transformers") OR ("computer vision" OR ("convolutional neural networks") OR ("deep learning" OR ("feature extraction"))) AND (("nutrient deficiencies" OR "phosphorus deficiency") OR "physiological disorders" OR "plant diseases" OR "plant health" OR "root rots") OR "zinc deficiency") OR ("fungal diseases") OR ("iron chlorosis" OR ("leaf spots" OR ("macronutrient deficiencies") OR ("micronutrient deficiencies") OR ("nitrogen deficiency")) AND (("early detection" OR "prediction" OR "stress detection") OR ("disease detection")) AND (("macronutrients" OR "minerals" OR "nutritional quality" OR "protein content" OR "proteins") OR "simple carbohydrates") OR "trace elements") OR "vitamins" OR "water-soluble vitamins") OR ("amino acids" OR ("carbohydrates") OR ("complex carbohydrates" OR ("fat-soluble vitamins" OR ("major minerals") OR 

# Ecuacion para scopus

TITLE-ABS-KEY((("artificial intelligence" OR "machine learning" OR "deep learning" OR "computer vision" OR "image processing" OR "image segmentation" OR "feature extraction" OR "convolutional neural networks" OR "recurrent neural networks" OR "transformers") AND ("plant health" OR "plant diseases" OR "fungal diseases" OR "physiological disorders" OR ("nutrient deficiencies" OR "macronutrient deficiencies" OR "micronutrient deficiencies" OR "nitrogen deficiency" OR "phosphorus deficiency" OR "iron chlorosis" OR "zinc deficiency") OR "leaf spots" OR "root rots") AND ("prediction" OR "early detection" OR "disease detection" OR "stress detection") AND ("nutritional quality" OR ("macronutrients" OR "proteins" OR "protein content" OR "amino acids" OR "carbohydrates" OR "simple carbohydrates" OR "complex carbohydrates") OR ("micronutrients" OR "minerals" OR "major minerals" OR "trace elements" OR "vitamins" OR "water-soluble vitamins" OR "fat-soluble vitamins") OR "functional properties" OR "organoleptic properties")))