# ML models 
---- 

# Performance Evaluation methods
----

# Feature Selection Methods

## 1. Filter Methods

### 1.1 Parametric Methods (Univariants)

#### Discrete Predictors
- Mutual information  
- Gain ratio  
- Symmetrical uncertainty  
- Chi-squared  
- Odds ratio  
- Bi-normal separation  

#### Continuous Predictors
- t-test family  
- ANOVA  

### 1.2 Model-Free Methods (Univariants)
- Threshold number of misclassification (TNoM)  
- P-metric  
- Mann-Whitney test  
- Kruskal-Wallis test  
- Between-groups to within-groups sum of squares  
- Scores based on estimating density functions  


### 1.3 Multivariant

- RELIEF algorithm
- Correlation-based feature selection
- Conditional mutual information

---

## 2. Wrapper Methods

### 2.1 Deterministic Heuristics

#### Sequential Methods
- Sequential feature selection  
- Sequential forward feature selection  
- Sequential backward elimination  

#### Greedy and Best-First Approaches
- Greedy hill climbing  
- Best first  

#### Hybrid and Adaptive Methods
- Plus-L-Minus-r algorithm  
- Floating search selection  

#### Advanced Deterministic Search
- Tabu search  
- Branch and bound  

### 2.2 Non-Deterministic Heuristics

#### Single-Solution Metaheuristics
- Simulated annealing  
- Las Vegas algorithm  
- Greedy randomized adaptive search procedure (GRASP)  
- Variable neighborhood search  

#### Population-Based Metaheuristics
- Scatter search  
- Ant colony optimization  
- Particle swarm optimization  

#### Evolutionary Algorithms
- Genetic algorithms  
- Estimation of distribution algorithms  
- Differential evolution  
- Genetic programming  
- Evolution strategies

----



Tipo	Evaluadores

-Filtro univariante: 	InfoGainAttributeEval, GainRatioAttributeEval, SymmetricalUncertAttributeEval, OneRAttributeEval, CorrelationAttributeEval, ReliefFAttributeEval

-Filtro multivariante:     CfsSubsetEval, PrincipalComponents

-Wrapper:   	WrapperSubsetEval, ClassifierSubsetEval, ClassifierAttributeEval

# WEKA ‚Äî Classification Models (Supervised Learning)

Gu√≠a completa de clasificadores de **WEKA** organizada por tipo de modelo y naturaleza estad√≠stica.  
Incluye las rutas de clase (`weka.classifiers...`) para su uso en **Experimenter** o **CLI**.

---

## ‚öôÔ∏è Non-Probabilistic Models

### üîπ KNN (K-Nearest Neighbors)
| Tipo general | Nombre en WEKA | Ruta / Clase | Tipo | Naturaleza del modelo |
|---------------|----------------|---------------|-------|------------------------|
| KNN cl√°sico | **IBk** | `weka.classifiers.lazy.IBk` | No param√©trico | Basado en distancias (vecindad) |
| K* (versi√≥n basada en entrop√≠a) | **KStar** | `weka.classifiers.lazy.KStar` | No param√©trico | Basado en entrop√≠a y similitud probabil√≠stica |
| LWL (Locally Weighted Learning, variante ponderada) | **LWL** | `weka.classifiers.lazy.LWL` | No param√©trico | Basado en distancias ponderadas localmente |

---

### üîπ Rule Induction (Inducci√≥n de Reglas)
| Tipo general | Nombre en WEKA | Ruta / Clase | Tipo | Naturaleza del modelo |
|---------------|----------------|---------------|-------|------------------------|
| Reglas tipo RIPPER | **JRip** | `weka.classifiers.rules.JRip` | No param√©trico | Basado en reglas l√≥gicas (IF-THEN) |
| Reglas OneR (una regla por atributo) | **OneR** | `weka.classifiers.rules.OneR` | No param√©trico | Basado en reglas simples por atributo |
| Reglas PART (a partir de √°rboles) | **PART** | `weka.classifiers.rules.PART` | No param√©trico | Basado en reglas derivadas de √°rboles |
| Decision Table | **DecisionTable** | `weka.classifiers.rules.DecisionTable` | No param√©trico | Basado en tabla de decisiones (combinaciones de atributos) |

---

### üîπ ANN (Artificial Neural Networks)
| Tipo general | Nombre en WEKA | Ruta / Clase | Tipo | Naturaleza del modelo |
|---------------|----------------|---------------|-------|------------------------|
| Multilayer Perceptron (MLP cl√°sico, backpropagation) | **MultilayerPerceptron** | `weka.classifiers.functions.MultilayerPerceptron` | Param√©trico | No lineal, basado en capas neuronales |
| Red de base radial | **RBFNetwork** | `weka.classifiers.functions.RBFNetwork` | Param√©trico | No lineal, funciones de base radial |
| Variante moderna de RBF | **RBFClassifier** | `weka.classifiers.functions.RBFClassifier` | Param√©trico | No lineal, funciones de base radial |
| Simple Logistic (una capa log√≠stica, con boosting) | **SimpleLogistic** | `weka.classifiers.functions.SimpleLogistic` | Param√©trico | Lineal (regresi√≥n log√≠stica con boosting) |

---

### üîπ SVM (Support Vector Machines)
| Tipo general | Nombre en WEKA | Ruta / Clase | Tipo | Naturaleza del modelo |
|---------------|----------------|---------------|-------|------------------------|
| SVM cl√°sico (SMO = Sequential Minimal Optimization) | **SMO** | `weka.classifiers.functions.SMO` | Param√©trico | Lineal o no lineal (seg√∫n kernel) |
| SVM con regresi√≥n (para tareas de regresi√≥n) | **SMOreg** | `weka.classifiers.functions.SMOreg` | Param√©trico | Lineal o no lineal (seg√∫n kernel) |

---

### üîπ √Årboles de Decisi√≥n
| Tipo general | Nombre en WEKA | Ruta / Clase | Tipo | Naturaleza del modelo |
|---------------|----------------|---------------|-------|------------------------|
| ID3 (b√°sico, sin pruning) | **Id3** | `weka.classifiers.trees.Id3` | No param√©trico | Basado en particiones de entrop√≠a (no lineal) |
| C4.5 (implementaci√≥n mejorada: J48) | **J48** | `weka.classifiers.trees.J48` | No param√©trico | Basado en ganancia de informaci√≥n (no lineal) |
| Random Tree | **RandomTree** | `weka.classifiers.trees.RandomTree` | No param√©trico | Basado en √°rboles aleatorios (no lineal) |
| Random Forest | **RandomForest** | `weka.classifiers.trees.RandomForest` | No param√©trico | Ensamble de √°rboles, no lineal |
| REPTree (similar a CART) | **REPTree** | `weka.classifiers.trees.REPTree` | No param√©trico | Basado en reducci√≥n de error, no lineal |
| Decision Stump (un solo nodo, √∫til para boosting) | **DecisionStump** | `weka.classifiers.trees.DecisionStump` | No param√©trico | Lineal por tramos (una divisi√≥n) |
| Logistic Model Tree | **LMT** | `weka.classifiers.trees.LMT` | H√≠brido | No lineal (√°rbol con regresi√≥n log√≠stica en hojas) |

---

## üé≤ Probabilistic Models

### üîπ Bayesian ‚Äî Discrete
| Tipo general | Nombre en WEKA | Ruta / Clase | Tipo | Naturaleza del modelo |
|---------------|----------------|---------------|-------|------------------------|
| Naive Bayes cl√°sico (atributos discretos) | **NaiveBayes** | `weka.classifiers.bayes.NaiveBayes` | Param√©trico | Probabil√≠stico cl√°sico basado en independencia condicional |
| Naive Bayes Multinomial | **NaiveBayesMultinomial** | `weka.classifiers.bayes.NaiveBayesMultinomial` | Param√©trico | Para datos de texto o conteo (multinomial) |
| Complement Naive Bayes | **ComplementNB** | `weka.classifiers.bayes.ComplementNB` | Param√©trico | Variante robusta para clases desbalanceadas |
| Hidden Naive Bayes | **HNB** | `weka.classifiers.bayes.HNB` | Param√©trico | Extiende NB considerando dependencias entre atributos |
| Bayesian Network | **BayesNet** | `weka.classifiers.bayes.BayesNet` | Param√©trico | Modela relaciones de dependencia entre variables (grafo ac√≠clico) |

---

### üîπ Bayesian ‚Äî Continuous
| Tipo general | Nombre en WEKA | Ruta / Clase | Tipo | Naturaleza del modelo |
|---------------|----------------|---------------|-------|------------------------|
| Naive Bayes para atributos continuos (asume normalidad) | **NaiveBayesSimple** | `weka.classifiers.bayes.NaiveBayesSimple` | Param√©trico | Supone distribuci√≥n gaussiana de los atributos |
| Naive Bayes con estimaci√≥n Kernel | **NaiveBayesKDE** | `weka.classifiers.bayes.NaiveBayesKDE` | Param√©trico | Estima densidades continuas mediante kernel |
| Naive Bayes KNN (versi√≥n mixta) | **NaiveBayesKNN** | `weka.classifiers.bayes.NaiveBayesKNN` | Param√©trico | Estima densidad con vecinos m√°s cercanos |

---

### üîπ Logistic / Probabilistic Regression
| Tipo general | Nombre en WEKA | Ruta / Clase | Tipo | Naturaleza del modelo |
|---------------|----------------|---------------|-------|------------------------|
| Regresi√≥n log√≠stica | **Logistic** | `weka.classifiers.functions.Logistic` | Param√©trico | Estima probabilidad con funci√≥n log√≠stica (sigmoide) |
| Simple Logistic (con boosting) | **SimpleLogistic** | `weka.classifiers.functions.SimpleLogistic` | Param√©trico | Ensamble de regresiones log√≠sticas simples |
| Linear Regression (para clasificaci√≥n softmax) | **LinearRegression** | `weka.classifiers.functions.LinearRegression` | Param√©trico | Lineal, adaptable a clasificaci√≥n binaria probabil√≠stica |

---

### üîπ Discriminant Analysis
| Tipo general | Nombre en WEKA | Ruta / Clase | Tipo | Naturaleza del modelo |
|---------------|----------------|---------------|-------|------------------------|
| Linear Discriminant Analysis | **LinearDiscriminantAnalysis (LDA)** | `weka.classifiers.functions.LinearDiscriminantAnalysis` *(paquete externo)* | Param√©trico | Probabil√≠stico lineal, asume covarianza igual entre clases |
| Quadratic Discriminant Analysis | **QuadraticDiscriminantAnalysis (QDA)** | `weka.classifiers.functions.QuadraticDiscriminantAnalysis` *(paquete externo)* | Param√©trico | Probabil√≠stico cuadr√°tico, covarianzas distintas por clase |

---



# Gu√≠a de Par√°metros de Modelos para WEKA Experimenter

Esta es una gu√≠a de los hiperpar√°metros m√°s importantes que puedes probar para los modelos listados en tu plan de an√°lisis.

**Metodolog√≠a:** Para probar diferentes par√°metros de un mismo modelo (ej. RandomForest con 100 √°rboles y con 200 √°rboles), simplemente a√±ade RandomForest dos veces a la lista de "Algorithms" en el Experimenter y configura cada instancia con los par√°metros deseados.

---

## Experimento 1: Modelos Robustos (Grupo 1)

**Dataset:** `datos_train_grupo1.arff`

### √Årboles de Decisi√≥n

**1. J48 (C4.5)**  
- **confidenceFactor (-C):** Umbral para la poda.  
  - Valores a probar: 0.1, 0.25 (default), 0.5  
- **minNumObj (-M):** N√∫mero m√≠nimo de instancias por hoja.  
  - Valores a probar: 2 (default), 5, 10  

**2. Id3**  
- No tiene par√°metros relevantes para tuning. Nota: tiende a sobreajustar.

**3. RandomTree**  
- **K (numFeatures):** N√∫mero de atributos a considerar aleatoriamente en cada divisi√≥n.  
  - Valores a probar: 0 (default, usa log2(N)+1), 3, 5  
- **maxDepth:** Profundidad m√°xima del √°rbol. 0 = sin l√≠mite.  
  - Valores a probar: 0 (default), 5, 10  

**4. RandomForest**  
- **numIterations (-I):** N√∫mero de √°rboles en el bosque.  
  - Valores a probar: 100 (default), 200, 500  
- **maxDepth:** Profundidad m√°xima de cada √°rbol.  
  - Valores a probar: 0 (default), 5, 10, 20  

**5. REPTree**  
- **minNum (-M):** M√≠nimo de instancias por hoja.  
  - Valores a probar: 2.0 (default), 5.0, 10.0  
- **maxDepth:** Profundidad m√°xima del √°rbol.  
  - Valores a probar: -1 (default, sin l√≠mite), 3, 5  

**6. DecisionStump**  
- No tiene par√°metros. Nota: toma una sola decisi√≥n.

**7. LMT (Logistic Model Tree)**  
- **numBoostingIterations (-I):** Iteraciones de LogitBoost.  
  - Valores a probar: -1 (default, auto), 10, 30  

---

### Inducci√≥n de Reglas

**1. JRip (RIPPER)**  
- **minNo (-N):** N√∫mero m√≠nimo de instancias que debe cubrir una regla.  
  - Valores a probar: 2.0 (default), 3.0, 5.0  
- **folds (-F):** N√∫mero de folds en la poda interna.  
  - Valores a probar: 3 (default), 5  

**2. OneR**  
- **minBucketSize (-B):** M√≠nimo de instancias por cubeta.  
  - Valores a probar: 6 (default), 10, 20  

**3. PART**  
- **confidenceFactor (-C):** Umbral de poda (igual que J48).  
  - Valores a probar: 0.1, 0.25 (default), 0.5  
- **minNumObj (-M):** M√≠nimo de instancias por hoja.  
  - Valores a probar: 2 (default), 5, 10  

**4. DecisionTable**  
- **search:** Algoritmo para buscar el mejor subconjunto de atributos.  
  - Valores a probar: BestFirst (default), GreedyStepwise  

---

## Experimento 2: Modelos Sensibles (Grupo 2)

**Dataset:** `datos_train_grupo2.arff`  

**Nota:** Aqu√≠ se usa `FilteredClassifier`. Hay dos niveles de par√°metros: del filtro (SMOTE) y del clasificador (SMO, IBk, etc.).

### A. Par√°metros del Filtro (weka.filters.supervised.instance.SMOTE)

- **percentage (-P):** Porcentaje de sobremuestreo.  
  - Valores a probar: 100.0 (default), 300.0, 500.0  
- **nearestNeighbors (-K):** Vecinos para generar instancias sint√©ticas.  
  - Valores a probar: 5 (default), 3  

---

### B. Par√°metros de los Clasificadores

**1. IBk (KNN)**  
- **KNN (-K):** N√∫mero de vecinos.  
  - Valores a probar: 1, 3, 5, 7, 11  

**2. KStar**  
- **globalBlend (-B):** Controla la esfera de influencia.  
  - Valores a probar: 20 (default), 10, 40  

**3. LWL (Locally Weighted Learning)**  
- **KNN (-K):** Vecinos para ponderaci√≥n local.  
  - Valores a probar: -1 (default, todos), 5, 10, 20  

**4. MultilayerPerceptron (ANN)**  
- **hiddenLayers (-H):** Arquitectura de la red.  
  - Valores a probar: `'a'` (default), `'5'`, `'10,5'`  
- **learningRate (-L):** Tasa de aprendizaje.  
  - Valores a probar: 0.3 (default), 0.1, 0.01  
- **trainingTime (-N):** √âpocas de entrenamiento.  
  - Valores a probar: 500 (default), 1000, 2000  

**5. RBFClassifier**  
- **numClusters (-N):** N√∫mero de funciones de base radial.  
  - Valores a probar: 2 (default), 5, 10, 20  

**6. SimpleLogistic**  
- **numBoostingIterations (-I):** Iteraciones de LogitBoost.  
  - Valores a probar: 500 (default), 100, 1000  

**7. SMO (SVM)**  
- **C:** Regularizaci√≥n.  
  - Valores a probar: 0.1, 1.0 (default), 10.0  
- **kernel:** Funci√≥n de kernel.  
  - Valores a probar:  
    - `weka.classifiers.functions.supportVector.PolyKernel` (default)  
    - `weka.classifiers.functions.supportVector.RBFKernel` (radial)  
- **gamma (-G) (solo RBFKernel):** Influencia de un ejemplo.  
  - Valores a probar: 0.01 (default), 0.1, 1.0  


# Gu√≠a de Par√°metros de Modelos Probabil√≠sticos para WEKA

Esta es una gu√≠a de los hiperpar√°metros m√°s importantes que puedes probar para los modelos listados en tu plan de an√°lisis probabil√≠stico.

---

## Metodolog√≠a

Para probar diferentes par√°metros de un mismo modelo (por ejemplo, BayesNet con TAN y BayesNet con K2), simplemente a√±ade BayesNet dos veces a la lista de *Algorithms* en el Experimenter y configura cada instancia con el `searchAlgorithm` deseado.

---

## Experimento 1: Modelos Robustos (Grupo 1)

**Dataset:** `datos_train_grupo1.arff`  
(Datos crudos, mixtos, sin anomal√≠as)

### Modelos Bayesianos (Manejo Mixto)

#### 1. NaiveBayes ‚Äî Tus modelos ‚ÄúMixtos‚Äù

Aqu√≠ comparas c√≥mo tratar los predictores continuos.  
A√±ade **NaiveBayes** dos veces:

##### Prueba A: ‚ÄúKernel-Based‚Äù

- **Par√°metro:** `useKernelEstimator (-K)` = `True`  
- **Par√°metro:** `useSupervisedDiscretization (-D)` = `False`

##### Prueba B: ‚ÄúDiscretized‚Äù

- **Par√°metro:** `useKernelEstimator (-K)` = `False`  
- **Par√°metro:** `useSupervisedDiscretization (-D)` = `True`

---

#### 2. SelectiveNaiveBayes

- **Par√°metro:** `search`  
  - **Qu√© es:** M√©todo de b√∫squeda para seleccionar los atributos.  
  - **Valores a probar:** `BestFirst (Default)`, `GreedyStepwise`

---

#### 3. AODE (Averaged One-Dependence Estimators, relacionado con SP-ODE)

- **Par√°metro:** `frequencyLimit (-f)`  
  - **Qu√© es:** Frecuencia m√≠nima de un ‚Äúsuper-padre‚Äù para ser incluido.  
  - **Valores a probar:** `1 (Default)`, `5`, `10`

---

#### 4. KDB (k-dependence Bayesian Classifier)

- **Par√°metro:** `k`  
  - **Qu√© es:** Nivel de dependencia (el ‚Äúk‚Äù).  
  - **Valores a probar:** `2`, `3`  
  (Nota: `k=1` es equivalente a NaiveBayes).

---

#### 5. MarkovBlanketClassifier

- **Par√°metro:** `search`  
  - **Qu√© es:** Algoritmo para encontrar la ‚Äúmanta de Markov‚Äù de la clase.  
  - **Valores a probar:** `BestFirst (Default)`, `GreedyStepwise`

---

#### 6. BayesNet ‚Äî Red Bayesiana General y TAN

- **Par√°metro:** `searchAlgorithm`  
  - **Qu√© es:** Algoritmo para aprender la estructura de la red.

**Valores a probar** (a√±ade BayesNet 4 veces al experimento):

| Variante | searchAlgorithm | Descripci√≥n |
|-----------|----------------|--------------|
| TAN | `weka.classifiers.bayes.net.search.local.TAN` | Tree Augmented Naive Bayes |
| K2 | `weka.classifiers.bayes.net.search.local.K2` | R√°pido, requiere orden de atributos |
| HillClimber | `weka.classifiers.bayes.net.search.local.HillClimber` | Clasificador no restringido |
| TabuSearch | `weka.classifiers.bayes.net.search.local.TabuSearch` | Clasificador no restringido, m√°s lento y potente |

---

## Experimento 2: Modelos Sensibles (Grupo 2)

**Dataset:** `datos_train_grupo2.arff`  
(Datos 100% num√©ricos y normalizados)

Nota: Aqu√≠ se usa **FilteredClassifier**.  
Hay dos niveles de par√°metros: del filtro (**SMOTE**) y del clasificador (**Logistic**, **LDA**, etc.).

---

### A. Par√°metros del Filtro ‚Äî `weka.filters.supervised.instance.SMOTE`

- **Par√°metro:** `percentage (-P)`  
  - **Qu√© es:** Porcentaje de sobremuestreo.  
  - **Valores a probar:** `100.0 (Default)`, `300.0`, `500.0` (depende del desbalanceo)

- **Par√°metro:** `nearestNeighbors (-K)`  
  - **Qu√© es:** N√∫mero de vecinos usados para generar instancias sint√©ticas.  
  - **Valores a probar:** `5 (Default)`, `3`

---

### B. Par√°metros de los Clasificadores

#### 1. Logistic ‚Äî Regresi√≥n Log√≠stica

- **Par√°metro:** `ridge (-R)`  
  - **Qu√© es:** Regularizaci√≥n L2 para prevenir sobreajuste.  
  - **Valores a probar:** `1.0E-8 (Default)`, `0.01`, `0.1`, `1.0`

---

#### 2. LinearDiscriminantAnalysis (LDA)

- **Par√°metros:** (Pocos par√°metros relevantes para tuning)  
  - **Nota:** El rendimiento de LDA depende casi exclusivamente del preprocesamiento  
    (normalizaci√≥n, log-transformaciones, etc.) para cumplir el supuesto de normalidad.

---

#### 3. QuadraticDiscriminantAnalysis (QDA)

- **Par√°metros:** (Ninguno relevante para tuning)  
  - **Nota:** Al igual que LDA, depende cr√≠ticamente de que los datos sigan una distribuci√≥n gaussiana.  
    M√°s flexible que LDA al no asumir covarianza compartida.

---

## Resumen

| Categor√≠a | Modelo | Par√°metro principal | Valores sugeridos |
|------------|---------|--------------------|------------------|
| Bayesianos mixtos | NaiveBayes | `-K`, `-D` | Kernel vs Discretization |
| Selecci√≥n de atributos | SelectiveNaiveBayes | `search` | BestFirst / GreedyStepwise |
| Dependencia promedio | AODE | `-f` | 1 / 5 / 10 |
| Dependencia K | KDB | `k` | 2 / 3 |
| Manta de Markov | MarkovBlanketClassifier | `search` | BestFirst / GreedyStepwise |
| Redes Bayesianas | BayesNet | `searchAlgorithm` | TAN / K2 / HillClimber / TabuSearch |
| Sobremuestreo | SMOTE | `-P`, `-K` | 100‚Äì500 / 3‚Äì5 |
| Regresi√≥n log√≠stica | Logistic | `-R` | 1e-8 / 0.01 / 0.1 / 1.0 |
| Discriminante | LDA / QDA | ‚Äî | Depende del preprocesamiento |
