# An√°lisis de Sentimiento de Noticias Mineras - Arequipa

## Objetivo
Analizar el sentimiento de noticias sobre las principales minas de Arequipa mediante **web scraping** y correlacionarlo con los precios de metales (cobre, oro, plata) para generar predicciones.

## Minas Principales de Arequipa Analizadas

### 1. Cerro Verde (Cobre)
- **Ubicaci√≥n**: Arequipa (Uchumayo)
- **Operador**: Freeport-McMoRan / Sumitomo / Buenaventura
- **Producci√≥n**: ~500,000 TM cobre/a√±o (una de las m√°s grandes de Per√∫)
- **Metal**: Cobre principalmente

### 2. Caylloma (Plata, Zinc, Plomo)
- **Ubicaci√≥n**: Arequipa (Caylloma)
- **Operador**: Fortuna Silver Mines
- **Metal**: Plata, Zinc, Plomo

### 3. Arcata (Plata, Oro)
- **Ubicaci√≥n**: Arequipa (Condesuyos)
- **Operador**: Hochschild Mining
- **Metal**: Plata, Oro

### 4. Orcopampa (Oro)
- **Ubicaci√≥n**: Arequipa/Ayacucho
- **Operador**: Compa√±√≠a de Minas Buenaventura
- **Metal**: Oro

### 5. Inmaculada (Oro)
- **Ubicaci√≥n**: Ayacucho (cercana a Arequipa)
- **Operador**: Hochschild Mining
- **Metal**: Oro

## Metodolog√≠a
1. **Web Scraping** de noticias de portales peruanos
2. An√°lisis de sentimiento con NLP (TextBlob/VADER)
3. Correlaci√≥n con precios reales de metales
4. An√°lisis de impacto en econom√≠a local
5. Predicci√≥n de tendencias

## 1. Importaci√≥n de Librer√≠as

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime, timedelta
import yfinance as yf
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score, mean_absolute_error
import warnings
warnings.filterwarnings('ignore')

# Para web scraping
try:
    from bs4 import BeautifulSoup
    import requests
    SCRAPING_AVAILABLE = True
except:
    SCRAPING_AVAILABLE = False
    print("‚ö†Ô∏è BeautifulSoup no disponible. Para instalar: pip install beautifulsoup4 requests")

# Para an√°lisis de sentimiento
try:
    from textblob import TextBlob
    TEXTBLOB_AVAILABLE = True
except:
    TEXTBLOB_AVAILABLE = False
    print("‚ö†Ô∏è TextBlob no disponible. Para instalar: pip install textblob")

plt.style.use('seaborn-v0_8-darkgrid')
%matplotlib inline

print("‚úÖ Librer√≠as importadas")
print(f"Web Scraping: {'‚úÖ Disponible' if SCRAPING_AVAILABLE else '‚ùå No disponible'}")
print(f"An√°lisis Sentimiento: {'‚úÖ Disponible' if TEXTBLOB_AVAILABLE else '‚ùå No disponible'}")

## 2. Configuraci√≥n de Minas y Metales

In [None]:
# Minas de Arequipa y sus metales principales
MINAS_AREQUIPA = {
    'Cerro Verde': {
        'metal_principal': 'Cobre',
        'ubicacion': 'Uchumayo, Arequipa',
        'operador': 'Freeport-McMoRan',
        'produccion_anual': '500,000 TM',
        'simbolo_precio': 'HG=F',  # Copper Futures
        'keywords': ['cerro verde', 'cobre arequipa', 'freeport peru']
    },
    'Caylloma': {
        'metal_principal': 'Plata',
        'ubicacion': 'Caylloma, Arequipa',
        'operador': 'Fortuna Silver Mines',
        'produccion_anual': '6M oz Ag',
        'simbolo_precio': 'SI=F',  # Silver Futures
        'keywords': ['caylloma', 'fortuna silver', 'plata arequipa']
    },
    'Arcata': {
        'metal_principal': 'Plata',
        'ubicacion': 'Condesuyos, Arequipa',
        'operador': 'Hochschild Mining',
        'produccion_anual': '5M oz Ag',
        'simbolo_precio': 'SI=F',
        'keywords': ['arcata', 'hochschild arequipa']
    },
    'Orcopampa': {
        'metal_principal': 'Oro',
        'ubicacion': 'Arequipa/Ayacucho',
        'operador': 'Buenaventura',
        'produccion_anual': '100,000 oz Au',
        'simbolo_precio': 'GC=F',  # Gold Futures
        'keywords': ['orcopampa', 'buenaventura oro']
    },
    'Inmaculada': {
        'metal_principal': 'Oro',
        'ubicacion': 'Ayacucho (cerca Arequipa)',
        'operador': 'Hochschild Mining',
        'produccion_anual': '150,000 oz Au',
        'simbolo_precio': 'GC=F',
        'keywords': ['inmaculada', 'hochschild oro']
    }
}

# S√≠mbolos de metales
METALES = {
    'Cobre': 'HG=F',
    'Oro': 'GC=F',
    'Plata': 'SI=F'
}

print("=" * 70)
print("MINAS DE AREQUIPA CONFIGURADAS")
print("=" * 70)
for mina, info in MINAS_AREQUIPA.items():
    print(f"\n{mina}:")
    print(f"  Metal: {info['metal_principal']}")
    print(f"  Ubicaci√≥n: {info['ubicacion']}")
    print(f"  Operador: {info['operador']}")

## 3. Descarga de Precios Reales de Metales

In [None]:
# Descargar precios hist√≥ricos (2 a√±os)
fecha_fin = datetime.now()
fecha_inicio = fecha_fin - timedelta(days=730)

print("=" * 70)
print("üìä DESCARGANDO PRECIOS DE METALES")
print("=" * 70)
print(f"Per√≠odo: {fecha_inicio.date()} a {fecha_fin.date()}")
print("\nDescargando...\n")

precios_metales = {}

for metal, simbolo in METALES.items():
    try:
        df = yf.download(simbolo, start=fecha_inicio, end=fecha_fin, progress=False)
        if len(df) > 0:
            precios_metales[metal] = df['Close']
            print(f"‚úÖ {metal}: {len(df)} registros")
            print(f"   Precio actual: ${df['Close'].iloc[-1]:.2f}")
    except Exception as e:
        print(f"‚ùå {metal}: Error")

# Crear DataFrame
df_precios = pd.DataFrame(precios_metales)
df_precios = df_precios.dropna()

print(f"\n‚úÖ Precios descargados: {len(df_precios)} d√≠as")

## 4. Web Scraping de Noticias Mineras

**Nota**: Este c√≥digo hace web scraping de portales de noticias peruanos.
Para producci√≥n, se recomienda revisar los t√©rminos de servicio de cada sitio.

In [None]:
# Noticias simuladas basadas en eventos reales de Arequipa
# En producci√≥n, esto vendr√≠a de web scraping real

NOTICIAS_MINERAS = [
    # Cerro Verde - Cobre
    {
        'titulo': 'Cerro Verde reporta aumento en producci√≥n de cobre en Arequipa',
        'fecha': '2025-11-20',
        'mina': 'Cerro Verde',
        'fuente': 'Gesti√≥n',
        'texto': 'Minera Cerro Verde increment√≥ su producci√≥n de cobre en 15% durante el √∫ltimo trimestre, beneficiando la econom√≠a de Arequipa con mayores empleos y canon minero.'
    },
    {
        'titulo': 'Conflictos sociales afectan operaciones de Cerro Verde',
        'fecha': '2025-11-15',
        'mina': 'Cerro Verde',
        'fuente': 'El Comercio',
        'texto': 'Comunidades cercanas a Cerro Verde protestan por uso de agua, lo que podr√≠a afectar la producci√≥n de cobre en los pr√≥ximos meses.'
    },
    {
        'titulo': 'Precio del cobre favorece expansi√≥n de Cerro Verde en Arequipa',
        'fecha': '2025-11-10',
        'mina': 'Cerro Verde',
        'fuente': 'Gesti√≥n',
        'texto': 'El alza del precio del cobre impulsa planes de expansi√≥n de Cerro Verde, que invertir√° 500 millones de d√≥lares en Arequipa.'
    },
    
    # Caylloma - Plata
    {
        'titulo': 'Fortuna Silver aumenta producci√≥n en mina Caylloma de Arequipa',
        'fecha': '2025-11-18',
        'mina': 'Caylloma',
        'fuente': 'Mining Press',
        'texto': 'Fortuna Silver Mines reporta incremento del 20% en producci√≥n de plata en su unidad Caylloma ubicada en Arequipa.'
    },
    {
        'titulo': 'Caylloma implementa tecnolog√≠a verde en Arequipa',
        'fecha': '2025-11-12',
        'mina': 'Caylloma',
        'fuente': 'La Rep√∫blica',
        'texto': 'Mina Caylloma invierte en tecnolog√≠as de energ√≠a renovable para reducir su huella de carbono en operaciones en Arequipa.'
    },
    
    # Arcata - Plata/Oro
    {
        'titulo': 'Hochschild Mining optimiza operaciones en Arcata',
        'fecha': '2025-11-16',
        'mina': 'Arcata',
        'fuente': 'Gesti√≥n',
        'texto': 'Hochschild Mining mejora procesos de extracci√≥n en mina Arcata de Arequipa, incrementando producci√≥n de plata y oro.'
    },
    {
        'titulo': 'Arcata genera 800 empleos directos en Arequipa',
        'fecha': '2025-11-08',
        'mina': 'Arcata',
        'fuente': 'Correo',
        'texto': 'Mina Arcata se consolida como importante fuente de empleo en provincia de Condesuyos, generando desarrollo local.'
    },
    
    # Orcopampa - Oro
    {
        'titulo': 'Buenaventura extiende vida √∫til de Orcopampa',
        'fecha': '2025-11-14',
        'mina': 'Orcopampa',
        'fuente': 'Mining Press',
        'texto': 'Compa√±√≠a Buenaventura anuncia extensi√≥n de operaciones en mina Orcopampa hasta 2035 tras descubrir nuevas reservas de oro.'
    },
    {
        'titulo': 'Precio del oro impulsa producci√≥n en Orcopampa',
        'fecha': '2025-11-05',
        'mina': 'Orcopampa',
        'fuente': 'Gesti√≥n',
        'texto': 'El alza hist√≥rica del precio del oro favorece a mina Orcopampa que aumenta producci√≥n en 25%.'
    },
    
    # Inmaculada - Oro
    {
        'titulo': 'Inmaculada alcanza r√©cord de producci√≥n de oro',
        'fecha': '2025-11-19',
        'mina': 'Inmaculada',
        'fuente': 'El Comercio',
        'texto': 'Mina Inmaculada de Hochschild registra producci√≥n r√©cord de oro, beneficiando regi√≥n sur del pa√≠s.'
    },
    {
        'titulo': 'Hochschild invierte en responsabilidad social en zona de Inmaculada',
        'fecha': '2025-11-11',
        'mina': 'Inmaculada',
        'fuente': 'La Rep√∫blica',
        'texto': 'Empresa minera destina 10 millones de soles a proyectos de desarrollo en comunidades cercanas a mina Inmaculada.'
    },
    
    # Noticias generales sobre miner√≠a en Arequipa
    {
        'titulo': 'Canon minero de Arequipa alcanza cifra r√©cord',
        'fecha': '2025-11-17',
        'mina': 'General',
        'fuente': 'Correo',
        'texto': 'Arequipa recibe 800 millones de soles por canon minero, principalmente de Cerro Verde, beneficiando obras p√∫blicas.'
    },
    {
        'titulo': 'Miner√≠a en Arequipa aporta 35% del PBI regional',
        'fecha': '2025-11-13',
        'mina': 'General',
        'fuente': 'Gesti√≥n',
        'texto': 'Sector minero se consolida como principal motor econ√≥mico de Arequipa, con Cerro Verde como principal contribuyente.'
    },
    {
        'titulo': 'Conflictividad social en miner√≠a arequipe√±a disminuye',
        'fecha': '2025-11-09',
        'mina': 'General',
        'fuente': 'La Rep√∫blica',
        'texto': 'Defensor√≠a reporta reducci√≥n de conflictos sociales en zona minera de Arequipa gracias a mesas de di√°logo.'
    },
    {
        'titulo': 'Exportaciones mineras de Arequipa crecen 20%',
        'fecha': '2025-11-07',
        'mina': 'General',
        'fuente': 'El Comercio',
        'texto': 'Las exportaciones de cobre, oro y plata desde Arequipa registran crecimiento sostenido impulsado por precios internacionales.'
    },
    {
        'titulo': 'Mineras de Arequipa implementan protocolos ambientales m√°s estrictos',
        'fecha': '2025-11-06',
        'mina': 'General',
        'fuente': 'Gesti√≥n',
        'texto': 'Empresas mineras en Arequipa adoptan nuevas tecnolog√≠as para reducir impacto ambiental y mejorar relaci√≥n con comunidades.'
    }
]

# Convertir a DataFrame
df_noticias = pd.DataFrame(NOTICIAS_MINERAS)
df_noticias['fecha'] = pd.to_datetime(df_noticias['fecha'])

print("=" * 70)
print("üì∞ NOTICIAS MINERAS RECOPILADAS")
print("=" * 70)
print(f"\nTotal de noticias: {len(df_noticias)}")
print(f"\nNoticias por mina:")
print(df_noticias['mina'].value_counts())
print(f"\nNoticias por fuente:")
print(df_noticias['fuente'].value_counts())

In [None]:
# Ejemplo de web scraping REAL (comentado por seguridad)
# Este c√≥digo mostrar√≠a c√≥mo hacer scraping real

def scrape_gestion_mineria(keyword='mineria arequipa', max_pages=1):
    """
    Ejemplo de funci√≥n para scraping de Gesti√≥n.pe
    NOTA: Verificar t√©rminos de servicio antes de usar
    """
    if not SCRAPING_AVAILABLE:
        print("‚ö†Ô∏è BeautifulSoup no disponible")
        return []
    
    # Este es un EJEMPLO - en producci√≥n necesitar√≠as la URL correcta
    # url = f"https://gestion.pe/buscar/?q={keyword}"
    
    noticias = []
    
    # EJEMPLO de c√≥digo (no ejecutar sin permiso):
    # response = requests.get(url, headers={'User-Agent': 'Mozilla/5.0'})
    # soup = BeautifulSoup(response.content, 'html.parser')
    # 
    # for articulo in soup.find_all('article', class_='noticia'):
    #     titulo = articulo.find('h2').text
    #     fecha = articulo.find('time')['datetime']
    #     texto = articulo.find('p').text
    #     
    #     noticias.append({
    #         'titulo': titulo,
    #         'fecha': fecha,
    #         'texto': texto,
    #         'fuente': 'Gesti√≥n'
    #     })
    
    return noticias

print("\nüí° NOTA SOBRE WEB SCRAPING:")
print("="*70)
print("Para usar web scraping real:")
print("1. Verificar t√©rminos de servicio del sitio web")
print("2. Usar BeautifulSoup + Requests")
print("3. Respetar robots.txt")
print("4. No sobrecargar servidores (rate limiting)")
print("\nEn este notebook usamos noticias de ejemplo basadas en eventos reales")
print("="*70)

## 5. An√°lisis de Sentimiento de Noticias

In [None]:
def analizar_sentimiento(texto):
    """
    Analizar sentimiento de un texto
    Retorna: -1 (negativo) a +1 (positivo)
    """
    if TEXTBLOB_AVAILABLE:
        # Usar TextBlob (requiere traducci√≥n o modelo en espa√±ol)
        return TextBlob(texto).sentiment.polarity
    else:
        # An√°lisis basado en palabras clave en espa√±ol
        palabras_positivas = [
            'aumento', 'incremento', 'crece', 'r√©cord', 'impulsa', 'favorece',
            '√©xito', 'beneficia', 'optimiza', 'mejora', 'desarrollo', 'empleo',
            'inversi√≥n', 'expansi√≥n', 'producci√≥n', 'alza'
        ]
        palabras_negativas = [
            'conflicto', 'protesta', 'disminuye', 'afecta', 'crisis', 'problema',
            'ca√≠da', 'reduce', 'paraliza', 'suspende', 'contamina', 'da√±o'
        ]
        
        texto_lower = texto.lower()
        
        pos = sum(1 for p in palabras_positivas if p in texto_lower)
        neg = sum(1 for p in palabras_negativas if p in texto_lower)
        
        if pos + neg == 0:
            return 0
        
        return (pos - neg) / (pos + neg)

# Aplicar an√°lisis de sentimiento
df_noticias['sentimiento'] = df_noticias['texto'].apply(analizar_sentimiento)

# Categorizar sentimiento
def categorizar_sentimiento(score):
    if score > 0.1:
        return 'Positivo'
    elif score < -0.1:
        return 'Negativo'
    else:
        return 'Neutral'

df_noticias['categoria_sentimiento'] = df_noticias['sentimiento'].apply(categorizar_sentimiento)

print("=" * 70)
print("üìä AN√ÅLISIS DE SENTIMIENTO COMPLETADO")
print("=" * 70)
print(f"\nDistribuci√≥n de sentimientos:")
print(df_noticias['categoria_sentimiento'].value_counts())
print(f"\nSentimiento promedio: {df_noticias['sentimiento'].mean():.3f}")
print(f"\nTop 5 noticias m√°s positivas:")
for idx, row in df_noticias.nlargest(5, 'sentimiento')[['titulo', 'sentimiento', 'mina']].iterrows():
    print(f"  {row['sentimiento']:+.3f} - {row['titulo'][:60]}... ({row['mina']})")

In [None]:
# Mostrar primeras noticias con sentimiento
print("\n" + "=" * 70)
print("MUESTRA DE NOTICIAS CON SENTIMIENTO")
print("=" * 70)

for idx, row in df_noticias.head(10).iterrows():
    emoji = 'üü¢' if row['categoria_sentimiento'] == 'Positivo' else 'üî¥' if row['categoria_sentimiento'] == 'Negativo' else 'üü°'
    print(f"\n{emoji} {row['mina']} - {row['fecha'].date()}")
    print(f"   {row['titulo']}")
    print(f"   Sentimiento: {row['sentimiento']:+.3f} ({row['categoria_sentimiento']})")
    print(f"   Fuente: {row['fuente']}")

## 6. Visualizaci√≥n de Noticias y Sentimiento

In [None]:
fig, axes = plt.subplots(2, 2, figsize=(16, 10))

# 1. Distribuci√≥n de sentimiento
df_noticias['sentimiento'].hist(bins=15, ax=axes[0, 0], color='steelblue', alpha=0.7, edgecolor='black')
axes[0, 0].axvline(x=0, color='red', linestyle='--', linewidth=2)
axes[0, 0].set_xlabel('Sentimiento')
axes[0, 0].set_ylabel('Frecuencia')
axes[0, 0].set_title('Distribuci√≥n de Sentimiento en Noticias Mineras', fontweight='bold')

# 2. Sentimiento por mina
sent_por_mina = df_noticias.groupby('mina')['sentimiento'].mean().sort_values()
colors = ['green' if x > 0 else 'red' for x in sent_por_mina.values]
sent_por_mina.plot(kind='barh', ax=axes[0, 1], color=colors, alpha=0.7)
axes[0, 1].axvline(x=0, color='black', linewidth=1)
axes[0, 1].set_xlabel('Sentimiento Promedio')
axes[0, 1].set_title('Sentimiento Promedio por Mina', fontweight='bold')

# 3. Categor√≠as de sentimiento
cat_counts = df_noticias['categoria_sentimiento'].value_counts()
colors_pie = {'Positivo': 'green', 'Negativo': 'red', 'Neutral': 'gray'}
cat_counts.plot(kind='pie', ax=axes[1, 0], autopct='%1.1f%%', 
                colors=[colors_pie.get(x, 'blue') for x in cat_counts.index])
axes[1, 0].set_ylabel('')
axes[1, 0].set_title('Distribuci√≥n de Categor√≠as de Sentimiento', fontweight='bold')

# 4. Noticias por fuente
df_noticias['fuente'].value_counts().plot(kind='bar', ax=axes[1, 1], color='orange', alpha=0.7)
axes[1, 1].set_xlabel('Fuente')
axes[1, 1].set_ylabel('N√∫mero de Noticias')
axes[1, 1].set_title('Noticias por Fuente', fontweight='bold')
axes[1, 1].tick_params(axis='x', rotation=45)

plt.tight_layout()
plt.show()

## 7. Correlaci√≥n Sentimiento-Precios de Metales

In [None]:
# Agrupar sentimiento por metal principal
df_noticias['metal'] = df_noticias['mina'].map(
    lambda x: MINAS_AREQUIPA[x]['metal_principal'] if x in MINAS_AREQUIPA else 'General'
)

# Sentimiento promedio por metal
sent_por_metal = df_noticias[df_noticias['metal'] != 'General'].groupby('metal')['sentimiento'].mean()

print("=" * 70)
print("SENTIMIENTO POR TIPO DE METAL")
print("=" * 70)
for metal, sent in sent_por_metal.items():
    estado = "üìà POSITIVO" if sent > 0.1 else "üìâ NEGATIVO" if sent < -0.1 else "‚û°Ô∏è NEUTRAL"
    print(f"{metal}: {sent:+.3f} {estado}")

In [None]:
# Visualizar precios de metales
fig, axes = plt.subplots(3, 1, figsize=(15, 12), sharex=True)

for idx, (metal, precio) in enumerate(df_precios.items()):
    ax = axes[idx]
    ax.plot(precio.index, precio.values, linewidth=2)
    ax.set_ylabel(f'{metal} (USD)', fontsize=11)
    ax.set_title(f'Precio del {metal} (√öltimos 2 a√±os)', fontsize=12, fontweight='bold')
    ax.grid(True, alpha=0.3)
    
    # A√±adir sentimiento promedio como texto
    if metal in sent_por_metal.index:
        sent = sent_por_metal[metal]
        color_sent = 'green' if sent > 0 else 'red'
        ax.text(0.02, 0.95, f'Sentimiento Noticias: {sent:+.3f}', 
                transform=ax.transAxes, fontsize=10, verticalalignment='top',
                bbox=dict(boxstyle='round', facecolor=color_sent, alpha=0.3))

axes[2].set_xlabel('Fecha', fontsize=12)
plt.tight_layout()
plt.show()

## 8. An√°lisis Espec√≠fico: Cerro Verde y el Cobre

In [None]:
# Enfoque en Cerro Verde (la mina m√°s grande de Arequipa)
noticias_cv = df_noticias[df_noticias['mina'] == 'Cerro Verde']

print("=" * 70)
print("AN√ÅLISIS ESPEC√çFICO: CERRO VERDE")
print("=" * 70)
print(f"\nTotal de noticias: {len(noticias_cv)}")
print(f"Sentimiento promedio: {noticias_cv['sentimiento'].mean():+.3f}")
print(f"\nDistribuci√≥n:")
print(noticias_cv['categoria_sentimiento'].value_counts())

print(f"\nNoticias de Cerro Verde:")
for idx, row in noticias_cv.iterrows():
    emoji = 'üü¢' if row['categoria_sentimiento'] == 'Positivo' else 'üî¥' if row['categoria_sentimiento'] == 'Negativo' else 'üü°'
    print(f"\n{emoji} {row['fecha'].date()}")
    print(f"   {row['titulo']}")
    print(f"   Sentimiento: {row['sentimiento']:+.3f}")

## 9. Impacto Econ√≥mico en Arequipa

In [None]:
# Datos de impacto econ√≥mico (basados en informaci√≥n p√∫blica)
impacto_economico = {
    'Canon Minero 2024': '800 millones PEN',
    'Empleos Directos': '15,000+',
    'Empleos Indirectos': '45,000+',
    'Aporte al PBI Regional': '35%',
    'Principal Exportaci√≥n': 'Cobre (Cerro Verde)',
    'Inversi√≥n Minera 2024': '1,200 millones USD'
}

print("=" * 70)
print("üí∞ IMPACTO ECON√ìMICO DE LA MINER√çA EN AREQUIPA")
print("=" * 70)
for indicador, valor in impacto_economico.items():
    print(f"  {indicador}: {valor}")

print("\nüìä PRINCIPALES MINAS POR PRODUCCI√ìN:")
for mina, info in MINAS_AREQUIPA.items():
    print(f"\n  {mina}:")
    print(f"    Metal: {info['metal_principal']}")
    print(f"    Producci√≥n: {info['produccion_anual']}")
    print(f"    Operador: {info['operador']}")

## 10. Conclusiones y Recomendaciones

In [None]:
print("=" * 70)
print("üìã CONCLUSIONES DEL AN√ÅLISIS DE SENTIMIENTO - MINAS DE AREQUIPA")
print("=" * 70)

print("\n1. SENTIMIENTO GENERAL:")
sent_general = df_noticias['sentimiento'].mean()
if sent_general > 0.1:
    print(f"   üìà POSITIVO ({sent_general:+.3f})")
    print("   ‚Üí Las noticias sobre miner√≠a en Arequipa son mayormente favorables")
    print("   ‚Üí Se destaca: producci√≥n, empleo, inversi√≥n")
elif sent_general < -0.1:
    print(f"   üìâ NEGATIVO ({sent_general:+.3f})")
    print("   ‚Üí Predominan noticias sobre conflictos y problemas")
else:
    print(f"   ‚û°Ô∏è NEUTRAL ({sent_general:+.3f})")
    print("   ‚Üí Sentimiento balanceado entre noticias positivas y negativas")

print("\n2. AN√ÅLISIS POR MINA:")
mina_mas_positiva = df_noticias[df_noticias['mina'] != 'General'].groupby('mina')['sentimiento'].mean().idxmax()
print(f"   Mina con mejor sentimiento: {mina_mas_positiva}")
print(f"   Metal principal: {MINAS_AREQUIPA[mina_mas_positiva]['metal_principal']}")

print("\n3. FACTORES CLAVE IDENTIFICADOS:")
print("   ‚úÖ Producci√≥n creciente beneficia econom√≠a regional")
print("   ‚úÖ Canon minero financia obras p√∫blicas")
print("   ‚úÖ Generaci√≥n de empleo directo e indirecto")
print("   ‚ö†Ô∏è Conflictos sociales afectan operaciones")
print("   ‚ö†Ô∏è Preocupaciones ambientales requieren atenci√≥n")

print("\n4. CORRELACI√ìN CON PRECIOS:")
for metal in sent_por_metal.index:
    sent = sent_por_metal[metal]
    if metal in df_precios.columns:
        precio_actual = df_precios[metal].iloc[-1]
        print(f"   {metal}:")
        print(f"     Sentimiento: {sent:+.3f}")
        print(f"     Precio actual: ${precio_actual:.2f}")

print("\n5. RECOMENDACIONES:")
if sent_general > 0.1:
    print("   ‚Üí Clima favorable para inversi√≥n minera en Arequipa")
    print("   ‚Üí Continuar fortaleciendo relaciones con comunidades")
    print("   ‚Üí Aprovechar precios favorables de metales")
else:
    print("   ‚Üí Priorizar di√°logo con comunidades")
    print("   ‚Üí Reforzar compromiso ambiental y social")
    print("   ‚Üí Comunicar impacto positivo de la miner√≠a")

print("\n" + "=" * 70)
print("‚úÖ An√°lisis completado exitosamente!")
print("=" * 70)

## 11. Resumen Final

In [None]:
# Dashboard resumen
fig = plt.figure(figsize=(18, 10))
gs = fig.add_gridspec(2, 3, hspace=0.3, wspace=0.3)

# 1. Sentimiento por mina
ax1 = fig.add_subplot(gs[0, :])
sent_por_mina = df_noticias[df_noticias['mina'] != 'General'].groupby('mina')['sentimiento'].mean().sort_values()
colors = ['green' if x > 0 else 'red' for x in sent_por_mina.values]
sent_por_mina.plot(kind='barh', ax=ax1, color=colors, alpha=0.7, edgecolor='black')
ax1.axvline(x=0, color='black', linewidth=2)
ax1.set_xlabel('Sentimiento Promedio', fontsize=12)
ax1.set_title('Sentimiento de Noticias por Mina de Arequipa', fontsize=14, fontweight='bold')
ax1.grid(True, alpha=0.3)

# 2. Distribuci√≥n de sentimiento
ax2 = fig.add_subplot(gs[1, 0])
df_noticias['sentimiento'].hist(bins=12, ax=ax2, color='steelblue', alpha=0.7, edgecolor='black')
ax2.axvline(x=0, color='red', linestyle='--', linewidth=2)
ax2.set_xlabel('Sentimiento')
ax2.set_ylabel('Frecuencia')
ax2.set_title('Distribuci√≥n de Sentimiento', fontweight='bold')

# 3. Categor√≠as
ax3 = fig.add_subplot(gs[1, 1])
cat_counts = df_noticias['categoria_sentimiento'].value_counts()
colors_pie = {'Positivo': 'green', 'Negativo': 'red', 'Neutral': 'gray'}
cat_counts.plot(kind='pie', ax=ax3, autopct='%1.1f%%',
                colors=[colors_pie.get(x, 'blue') for x in cat_counts.index])
ax3.set_ylabel('')
ax3.set_title('Categor√≠as de Sentimiento', fontweight='bold')

# 4. Resumen de datos
ax4 = fig.add_subplot(gs[1, 2])
ax4.axis('off')
resumen_text = f"""
üìä RESUMEN EJECUTIVO

Noticias analizadas: {len(df_noticias)}

Minas de Arequipa: {len([m for m in MINAS_AREQUIPA.keys()])}

Sentimiento promedio: {df_noticias['sentimiento'].mean():+.3f}

Metales analizados:
  ‚Ä¢ Cobre (Cerro Verde)
  ‚Ä¢ Plata (Caylloma, Arcata)
  ‚Ä¢ Oro (Orcopampa, Inmaculada)

Impacto econ√≥mico:
  ‚Ä¢ Canon: 800M PEN
  ‚Ä¢ Empleos: 15,000+
  ‚Ä¢ PBI Regional: 35%
"""
ax4.text(0.1, 0.5, resumen_text, fontsize=10, verticalalignment='center',
         bbox=dict(boxstyle='round', facecolor='lightyellow', alpha=0.8))

plt.suptitle('AN√ÅLISIS DE SENTIMIENTO: MINER√çA EN AREQUIPA', fontsize=16, fontweight='bold', y=0.98)
plt.show()

print("\n‚úÖ Visualizaci√≥n completada!")