<a href="https://colab.research.google.com/github/financieras/big_data/blob/main/leccion_1_3_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Lección 1.3.1: Lenguaje Python

## 1. ¿Por qué Python es el lenguaje del dato?

Python se ha convertido en el **idioma universal del ecosistema de datos**. Es simple, potente y cuenta con una comunidad inmensa que crea librerías para todo: desde análisis estadístico hasta inteligencia artificial.

> **Idea clave:** Python no es solo para programadores; es una herramienta para **pensar con datos**.

**Ventajas principales:**

* Sintaxis clara y legible
* Miles de librerías open source
* Integración con bases de datos, APIs y herramientas de visualización
* Ideal para análisis, automatización y machine learning

**Ejemplo simple:**

```python
ventas = [120, 130, 150, 170]
promedio = sum(ventas) / len(ventas)
print(f"Promedio de ventas: {promedio}")
```

Salida 👉 `Promedio de ventas: 142.5`

---

## 2. Python en el ecosistema de datos

| Rol                           | Uso de Python                  | Librerías clave                       |
| ----------------------------- | ------------------------------ | ------------------------------------- |
| **Data Engineer**             | Automatiza pipelines y ETL     | `pandas`, `airflow`, `sqlalchemy`     |
| **Data Analyst**              | Limpia y analiza datos         | `pandas`, `numpy`, `matplotlib`       |
| **Data Scientist**            | Modela y predice               | `scikit-learn`, `tensorflow`, `keras` |
| **Machine Learning Engineer** | Despliega modelos a producción | `fastapi`, `flask`, `mlflow`          |

> 💡 **Tip:** Aprende primero a **leer y manipular datos** antes de lanzarte al machine learning.

---

## 3. Sintaxis básica: simple, pero poderosa

| Concepto      | Ejemplo                          | Explicación                               |
| ------------- | -------------------------------- | ----------------------------------------- |
| Variables     | `x = 10`                         | No se declara el tipo, Python lo infiere. |
| Listas        | `numeros = [1,2,3]`              | Estructura flexible y ordenada.           |
| Condicionales | `if x > 5: print("Mayor que 5")` | Bloques definidos por indentación.        |
| Bucles        | `for n in numeros: print(n)`     | Itera sobre listas o secuencias.          |
| Funciones     | `def cuadrado(n): return n**2`   | Reutiliza código fácilmente.              |

**Ejemplo:**

```python
def promedio(lista):
    return sum(lista) / len(lista)

print(promedio([4, 6, 8]))
```

👉 Salida: `6.0`

---

## 4. Librerías esenciales para análisis de datos

| Librería                 | Uso principal                   | Ejemplo básico      |
| ------------------------ | ------------------------------- | ------------------- |
| **pandas**               | Manipulación de datos tabulares | `df.describe()`     |
| **numpy**                | Cálculo numérico eficiente      | `np.mean([1,2,3])`  |
| **matplotlib / seaborn** | Visualización de datos          | `plt.plot(x, y)`    |
| **scikit-learn**         | Machine Learning clásico        | `model.fit(X, y)`   |
| **tensorflow / keras**   | Deep Learning                   | Redes neuronales    |
| **requests**             | Consumo de APIs                 | `requests.get(url)` |

> 📊 Con estas librerías, Python pasa de ser un lenguaje a una **plataforma analítica completa**.

---

## 5. Ejemplo práctico: análisis simple con pandas

```python
import pandas as pd

# Cargar un pequeño dataset
datos = {'Producto': ['A', 'B', 'C'],
         'Ventas': [120, 90, 150]}

df = pd.DataFrame(datos)

# Calcular estadísticas
print(df.describe())

# Filtrar productos con ventas > 100
print(df[df['Ventas'] > 100])
```

Salida:

```
        Ventas
count     3.0
mean    120.0
min      90.0
max     150.0
```

👉 Productos con ventas > 100: A y C

---

## 6. Aplicaciones reales

| Sector          | Caso de uso              | Ejemplo con Python                             |
| --------------- | ------------------------ | ---------------------------------------------- |
| **Finanzas**    | Detección de fraudes     | Modelos predictivos con `scikit-learn`         |
| **Retail**      | Predicción de demanda    | Series temporales con `pandas` y `statsmodels` |
| **Salud**       | Diagnóstico asistido     | Deep Learning con `keras`                      |
| **Manufactura** | Mantenimiento predictivo | Análisis IoT con `numpy` y `spark`             |

> 🧠 Python es el “pegamento” entre los datos, la lógica de negocio y la inteligencia artificial.

---

## 7. Buenas prácticas para trabajar con Python

* [ ] Usa **entornos virtuales** (`venv`, `conda`) para aislar proyectos
* [ ] Documenta tu código y usa **nombres claros**
* [ ] Versiona tu trabajo con **Git y GitHub**
* [ ] Estructura carpetas (`data/`, `notebooks/`, `scripts/`)
* [ ] Automatiza tareas repetitivas con scripts o notebooks

> ⚙️ “No repitas código, repite conocimiento”: automatiza lo rutinario y enfócate en analizar.

---

## 8. Resumen

* Python es el **lenguaje central del análisis de datos**.
* Su ecosistema de librerías lo hace ideal para cualquier etapa del ciclo de datos.
* Es fácil de aprender, pero increíblemente potente cuando se domina.
* Aprender Python es el **primer paso para convertirte en profesional del dato.**

---

## 9. Referencias

## Vídeos
* [Python for Data Analysis (Corey Schafer)](https://youtu.be/r-uOLxNrNk8)
* [Python Crash Course in 1 Hour](https://youtu.be/kqtD5dpn9C8)
* [Why Data Scientists Love Python](https://youtu.be/yP5DKzriqXA)

## Lecturas
* [Python.org – Getting Started](https://www.python.org/about/gettingstarted/)
* [W3Schools – Python Tutorial](https://www.w3schools.com/python/)
* [Real Python – Data Science Tutorials](https://realpython.com/)
