# ‚õèÔ∏è Miner√≠a de Datos
## Descubrimiento de Patrones en Grandes Vol√∫menes

<a href="https://colab.research.google.com/github/Jomucon21muri/Aprendizaje_automatico/blob/main/02_Big_data/04_Mineria_datos/mineria_datos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---

## üìã Resumen

Miner√≠a de Datos aplica algoritmos para descubrir patrones, asociaciones y conocimiento oculto en grandes conjuntos de datos.

### üéØ Objetivos
- **Association Rules**: Descubrir relaciones (Market Basket Analysis)
- **Sequential Patterns**: Patrones temporales
- **Clustering**: Agrupamiento de datos similares
- **Classification**: Modelos predictivos
- **Anomaly Detection**: Identificar outliers

### üõí Algoritmos Cl√°sicos

**Apriori**: Reglas de asociaci√≥n
- Support: frecuencia de itemset
- Confidence: probabilidad condicional
- Lift: correlaci√≥n entre items

**FP-Growth**: Alternativa eficiente a Apriori

**ECLAT**: Equivalence Class Transformation

### üìä M√©tricas

**Support**: $\text{supp}(X) = \frac{|T \text{ containing } X|}{|T|}$

**Confidence**: $\text{conf}(X \Rightarrow Y) = \frac{\text{supp}(X \cup Y)}{\text{supp}(X)}$

**Lift**: $\text{lift}(X \Rightarrow Y) = \frac{\text{conf}(X \Rightarrow Y)}{\text{supp}(Y)}$

### üéØ Aplicaciones
- Market Basket Analysis (e-commerce)
- Web Usage Mining
- Fraud Detection
- Customer Segmentation
- Recommendation Systems

---

In [None]:
# Setup - Market Basket Analysis simple
import pandas as pd
import numpy as np
from itertools import combinations
from collections import Counter

# Dataset de transacciones simulado
transactions = [
    ['leche', 'pan', 'huevos'],
    ['pan', 'mantequilla'],
    ['leche', 'pan', 'mantequilla', 'huevos'],
    ['leche', 'pan'],
    ['pan', 'huevos'],
    ['leche', 'mantequilla'],
    ['leche', 'pan', 'huevos'],
    ['pan', 'mantequilla', 'huevos']
]

n_transactions = len(transactions)

# Calcular support para itemsets de tama√±o 2
itemsets_2 = []
for trans in transactions:
    for combo in combinations(trans, 2):
        itemsets_2.append(frozenset(combo))

support_counts = Counter(itemsets_2)
frequent_itemsets = {k: v/n_transactions for k, v in support_counts.items() if v/n_transactions >= 0.3}

print("üõí Market Basket Analysis")
print("="*50)
print(f"\nTransacciones: {n_transactions}")
print(f"\nItemsets frecuentes (support ‚â• 0.3):")
for itemset, support in sorted(frequent_itemsets.items(), key=lambda x: x[1], reverse=True):
    print(f"  {set(itemset)}: support={support:.2f}")

print("\nüìä Interpretaci√≥n:")
print("  ‚Ä¢ Support alto: Items frecuentemente comprados juntos")
print("  ‚Ä¢ Confidence: P(Y|X) - probabilidad de Y dado X")
print("  ‚Ä¢ Lift > 1: Correlaci√≥n positiva entre items")
print("\nüîë Aplicaciones:")
print("  ‚Ä¢ Product placement en tiendas")
print("  ‚Ä¢ Recomendaciones de productos")
print("  ‚Ä¢ Promociones cruzadas")
print("  ‚Ä¢ Optimizaci√≥n de inventario")