<a href="https://colab.research.google.com/github/financieras/big_data/blob/main/leccion_1_3_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Lecci√≥n 1.3.1: Lenguaje Python

## 1. ¬øPor qu√© Python es el lenguaje del dato?

Python se ha convertido en el **idioma universal del ecosistema de datos**. Es simple, potente y cuenta con una comunidad inmensa que crea librer√≠as para todo: desde an√°lisis estad√≠stico hasta inteligencia artificial.

> **Idea clave:** Python no es solo para programadores; es una herramienta para **pensar con datos**.

**Ventajas principales:**

* Sintaxis clara y legible
* Miles de librer√≠as open source
* Integraci√≥n con bases de datos, APIs y herramientas de visualizaci√≥n
* Ideal para an√°lisis, automatizaci√≥n y machine learning

**Ejemplo simple:**

```python
ventas = [120, 130, 150, 170]
promedio = sum(ventas) / len(ventas)
print(f"Promedio de ventas: {promedio}")
```

Salida üëâ `Promedio de ventas: 142.5`

---

## 2. Python en el ecosistema de datos

| Rol                           | Uso de Python                  | Librer√≠as clave                       |
| ----------------------------- | ------------------------------ | ------------------------------------- |
| **Data Engineer**             | Automatiza pipelines y ETL     | `pandas`, `airflow`, `sqlalchemy`     |
| **Data Analyst**              | Limpia y analiza datos         | `pandas`, `numpy`, `matplotlib`       |
| **Data Scientist**            | Modela y predice               | `scikit-learn`, `tensorflow`, `keras` |
| **Machine Learning Engineer** | Despliega modelos a producci√≥n | `fastapi`, `flask`, `mlflow`          |

> üí° **Tip:** Aprende primero a **leer y manipular datos** antes de lanzarte al machine learning.

---

## 3. Sintaxis b√°sica: simple, pero poderosa

| Concepto      | Ejemplo                          | Explicaci√≥n                               |
| ------------- | -------------------------------- | ----------------------------------------- |
| Variables     | `x = 10`                         | No se declara el tipo, Python lo infiere. |
| Listas        | `numeros = [1,2,3]`              | Estructura flexible y ordenada.           |
| Condicionales | `if x > 5: print("Mayor que 5")` | Bloques definidos por indentaci√≥n.        |
| Bucles        | `for n in numeros: print(n)`     | Itera sobre listas o secuencias.          |
| Funciones     | `def cuadrado(n): return n**2`   | Reutiliza c√≥digo f√°cilmente.              |

**Ejemplo:**

```python
def promedio(lista):
    return sum(lista) / len(lista)

print(promedio([4, 6, 8]))
```

üëâ Salida: `6.0`

---

## 4. Librer√≠as esenciales para an√°lisis de datos

| Librer√≠a                 | Uso principal                   | Ejemplo b√°sico      |
| ------------------------ | ------------------------------- | ------------------- |
| **pandas**               | Manipulaci√≥n de datos tabulares | `df.describe()`     |
| **numpy**                | C√°lculo num√©rico eficiente      | `np.mean([1,2,3])`  |
| **matplotlib / seaborn** | Visualizaci√≥n de datos          | `plt.plot(x, y)`    |
| **scikit-learn**         | Machine Learning cl√°sico        | `model.fit(X, y)`   |
| **tensorflow / keras**   | Deep Learning                   | Redes neuronales    |
| **requests**             | Consumo de APIs                 | `requests.get(url)` |

> üìä Con estas librer√≠as, Python pasa de ser un lenguaje a una **plataforma anal√≠tica completa**.

---

## 5. Ejemplo pr√°ctico: an√°lisis simple con pandas

```python
import pandas as pd

# Cargar un peque√±o dataset
datos = {'Producto': ['A', 'B', 'C'],
         'Ventas': [120, 90, 150]}

df = pd.DataFrame(datos)

# Calcular estad√≠sticas
print(df.describe())

# Filtrar productos con ventas > 100
print(df[df['Ventas'] > 100])
```

Salida:

```
        Ventas
count     3.0
mean    120.0
min      90.0
max     150.0
```

üëâ Productos con ventas > 100: A y C

---

## 6. Aplicaciones reales

| Sector          | Caso de uso              | Ejemplo con Python                             |
| --------------- | ------------------------ | ---------------------------------------------- |
| **Finanzas**    | Detecci√≥n de fraudes     | Modelos predictivos con `scikit-learn`         |
| **Retail**      | Predicci√≥n de demanda    | Series temporales con `pandas` y `statsmodels` |
| **Salud**       | Diagn√≥stico asistido     | Deep Learning con `keras`                      |
| **Manufactura** | Mantenimiento predictivo | An√°lisis IoT con `numpy` y `spark`             |

> üß† Python es el ‚Äúpegamento‚Äù entre los datos, la l√≥gica de negocio y la inteligencia artificial.

---

## 7. Buenas pr√°cticas para trabajar con Python

* [ ] Usa **entornos virtuales** (`venv`, `conda`) para aislar proyectos
* [ ] Documenta tu c√≥digo y usa **nombres claros**
* [ ] Versiona tu trabajo con **Git y GitHub**
* [ ] Estructura carpetas (`data/`, `notebooks/`, `scripts/`)
* [ ] Automatiza tareas repetitivas con scripts o notebooks

> ‚öôÔ∏è ‚ÄúNo repitas c√≥digo, repite conocimiento‚Äù: automatiza lo rutinario y enf√≥cate en analizar.

---

## 8. Resumen

* Python es el **lenguaje central del an√°lisis de datos**.
* Su ecosistema de librer√≠as lo hace ideal para cualquier etapa del ciclo de datos.
* Es f√°cil de aprender, pero incre√≠blemente potente cuando se domina.
* Aprender Python es el **primer paso para convertirte en profesional del dato.**

---

## 9. Referencias

## V√≠deos
* [Python for Data Analysis (Corey Schafer)](https://youtu.be/r-uOLxNrNk8)
* [Python Crash Course in 1 Hour](https://youtu.be/kqtD5dpn9C8)
* [Why Data Scientists Love Python](https://youtu.be/yP5DKzriqXA)

## Lecturas
* [Python.org ‚Äì Getting Started](https://www.python.org/about/gettingstarted/)
* [W3Schools ‚Äì Python Tutorial](https://www.w3schools.com/python/)
* [Real Python ‚Äì Data Science Tutorials](https://realpython.com/)
