<a href="https://colab.research.google.com/github/financieras/big_data/blob/main/leccion_1_2_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Lección 1.2.1: Los datos en sectores clave: finanzas, retail, salud y otros

## 1. Introducción
Los datos son el motor de la toma de decisiones en sectores que impactan nuestra vida diaria. En **finanzas**, **retail** y **salud**, los datos ayudan a optimizar procesos, personalizar servicios y salvar vidas.

> **Clave:** Los datos no solo informan, sino que transforman negocios y mejoran experiencias.

---

## 2. Aplicaciones en sectores clave

### 2.1 Finanzas: Predicción y prevención
**Objetivo principal:** Minimizar riesgos y maximizar retornos

En el sector financiero, los datos impulsan decisiones rápidas y seguras. Desde detectar fraudes hasta personalizar productos, el análisis de datos es esencial.

- **Caso real: Detección de fraudes en tiempo real**
  - **Problema:** Un banco pierde millones por transacciones fraudulentas.
  - **Solución:** Un modelo de machine learning analiza patrones de transacciones (ubicación, monto, frecuencia) y marca anomalías en milisegundos.
  - **Herramienta:** Python (scikit-learn) Random Forest + Apache Kafka para procesamiento en streaming.
  - **Resultado:** JPMorgan Chase redujo fraudes en un 30% usando modelos predictivos.

- **Otro caso:** Scoring crediticio. Los bancos usan datos de historial crediticio, ingresos y comportamiento digital para predecir si un cliente pagará un préstamo.

> **Dato curioso:** Los algoritmos de detección de fraude procesan millones de transacciones por segundo.

### 2.2 Retail: Conociendo al Cliente
**Objetivo principal:** Personalización a escala

En retail, los datos ayudan a conocer al cliente, optimizar inventarios y aumentar ventas. La clave está en entender patrones de consumo.

- **Caso real: Motor de recomendaciones de Amazon**
  - **Problema:** Cómo aumentar el valor de vida del cliente
  - **Solución:** Algoritmos de recomendación analizan historiales de compra, búsquedas y clics para sugerir productos relevantes.  Comportamiento de usuarios similares
  - **Herramienta:** Motores de recomendación con Python (TensorFlow) y bases de datos NoSQL como MongoDB.
  - **Resultado:** Amazon reporta que el 35% de sus ventas vienen de recomendaciones.

- **Otro caso:** Optimización de inventarios. Walmart usa datos de ventas y clima para predecir demanda (ej. más paraguas en días lluviosos).

> **Tip:** Un buen dashboard en Power BI puede mostrar en tiempo real qué productos se venden más.

### 2.3 Salud: Predecir para Prevenir
**Objetivo principal:** Diagnóstico preciso y medicina preventiva

**Caso real: Detección temprana de cáncer**
  - **Problema:** Cáncer de pulmón detectado tardíamente en 70% de casos
  - **Solución:** Redes neuronales convolucionales que analizan tomografías
  - **Herramienta:** Python (PyTorch) + bases de datos de imágenes médicas.
  - **Precisión:** 94% vs 65% de radiólogos humanos
  - **Beneficio:** Detección 6-12 meses más temprana

- **Otro caso:** Monitoreo de pacientes. Wearables como Fitbit recogen datos de ritmo cardíaco y predicen riesgos de arritmias.

---

## 3. Impacto comparativo

| Sector | Problema resuelto | Técnica principal | Impacto medible |
|--------|-------------------|-------------------|-----------------|
| **Finanzas** | Fraude en transacciones | ML supervisado | -30% pérdidas por fraude |
| **Retail** | Baja conversión | Sistemas recomendación | +35% ventas cruzadas |
| **Salud** | Diagnóstico tardío | Deep Learning | +29% precisión diagnóstica |
| **Transporte** | Rutas ineficientes | Optimización en tiempo real | -18% tiempo de viaje |
| **Educación** | Abandono estudiantil | Análisis predictivo | -25% deserción |

> **Ejemplo:** Duolingo adaptan lecciones según el progreso del usuario.

---


## 4. Herramientas por sector
```python
# Ejemplo simplificado: Detección de anomalías en finanzas
from sklearn.ensemble import IsolationForest
import pandas as pd

# Datos de transacciones
transacciones = pd.read_csv('transacciones.csv')
modelo = IsolationForest(contamination=0.01)
transacciones['fraude'] = modelo.fit_predict(transacciones[['monto', 'hora', 'ubicacion']])
```

---

## 5. Retos actuales
- **Ética:** Sesgos en algoritmos de scoring crediticio
- **Privacidad:** Balance entre personalización e intrusión
- **Talento:** Escasez de profesionales con dominio técnico + sectorial

**Solución emergente:** Equipos multidisciplinarios con expertos de dominio + científicos de datos

---

## 6. Resumen
Los datos son la clave para transformar sectores cotidianos:
- **Finanzas:** Detectan fraudes y personalizan productos.
- **Retail:** Aumentan ventas con recomendaciones personalizadas e inventarios optimizados.
- **Salud:** Mejoran diagnósticos y previenen enfermedades.
- **Otros sectores:** Desde transporte hasta entretenimiento, los datos generan valor.

**Tu próximo paso:** Identifica un caso de uso en tu entorno. ¿Cómo podrían los datos mejorar tu día a día?

---

## 7. Referencias
### Vídeos
- [5 Ways Data Science Changed Finance](https://youtu.be/l_FGeEvqYyM?si=f6PgmLNaoG8LwtVT)
- [Want to be a Data Scientist? This is the First Thing You Need to Do](https://youtu.be/Jwc2SPl7v3Y?si=BwGKyQMfQ7ZCJg3S)
- [Data Engineer vs. Data Scientist](https://youtu.be/jZGWOUNeiFY?si=JByrA19_Ska-3k6R)
- [How much a Data Analyst makes in ](https://youtube.com/shorts/yvDdj1ulkNk?si=org0xWqtujENDZpi)
- [¿Por qué ser Analista de Datos?](https://youtu.be/6CFAdU5amUg?si=GlyEbWDWQb4wPUPC)
- [Top 5 Razones para No Ser Data Analyst](https://youtu.be/ktEiy6kFmpc?si=ynwpFtU_CLNBOxUL)
- [5 Razones para NO ser un Data Scientist](https://youtu.be/SqCN8Etc-RA?si=XFiNAzpCi83S7ljk)
- [6 COSAS que ME HUBIESE GUSTADO SABER ANTES de INICIAR en CIENCIA DE DATOS](https://youtu.be/aJaDmDt1aMo?si=HjBI9xfAeZ6aWTlr)
- [Que necesitas saber de Data Science](https://youtu.be/Lt2P88q0Y68?si=M9fLShXnk2cMpCN9)
