# 01 - Introducción a Python para Data Science

Este notebook cubre los conceptos básicos de Python enfocados en Data Science.

**Para usar en Google Colab:**
1. Abre [Google Colab](https://colab.research.google.com)
2. File > Upload notebook > Selecciona este archivo

---

## 1. Variables y Tipos de Datos

En Python, a diferencia de TypeScript, no necesitas declarar tipos explícitamente.

In [None]:
# Variables básicas (sin necesidad de let/const como en JS/TS)
nombre = "Omar"  # string
edad = 25        # int
altura = 1.75    # float
es_estudiante = True  # bool (nota: True/False con mayúscula)

print(f"Hola {nombre}, tienes {edad} años")  # f-strings (como template literals)

## 2. Listas y Diccionarios

Similares a Arrays y Objects en JavaScript.

In [None]:
# Lista (como Array en JS)
numeros = [1, 2, 3, 4, 5]
print(f"Primer elemento: {numeros[0]}")
print(f"Último elemento: {numeros[-1]}")  # índices negativos!

# Diccionario (como Object en JS)
persona = {
    "nombre": "Omar",
    "edad": 25,
    "skills": ["Angular", "Python", "Node"]
}
print(f"Skills: {persona['skills']}")

## 3. Funciones

Similar a funciones en JavaScript pero con `def` en lugar de `function`.

In [None]:
# Función básica
def saludar(nombre: str) -> str:
    """Saluda a una persona (docstring = documentación)"""
    return f"Hola, {nombre}!"

# Función con valores por defecto
def calcular_precio(precio: float, descuento: float = 0.0) -> float:
    return precio * (1 - descuento)

print(saludar("Omar"))
print(f"Precio final: ${calcular_precio(100, 0.15)}")

## 4. Importando Librerías de Data Science

In [None]:
# Importaciones estándar en Data Science
import numpy as np          # Operaciones numéricas
import pandas as pd         # Manipulación de datos
import matplotlib.pyplot as plt  # Visualización

# Verificar versiones
print(f"NumPy: {np.__version__}")
print(f"Pandas: {pd.__version__}")

## 5. Tu Primer DataFrame (Pandas)

Un DataFrame es como una tabla de Excel o una colección de MongoDB.

In [None]:
# Crear un DataFrame desde un diccionario
datos = {
    "nombre": ["Ana", "Carlos", "María", "Pedro"],
    "edad": [28, 34, 29, 42],
    "ciudad": ["CDMX", "GDL", "MTY", "CDMX"],
    "salario": [45000, 52000, 48000, 65000]
}

df = pd.DataFrame(datos)
df

In [None]:
# Operaciones básicas
print("Información del DataFrame:")
print(df.info())

print("\nEstadísticas descriptivas:")
df.describe()

In [None]:
# Filtrar datos (como .filter() en JS pero más potente)
mayores_30 = df[df["edad"] > 30]
print("Personas mayores de 30:")
mayores_30

## 6. Visualización Básica

In [None]:
# Gráfica de barras
plt.figure(figsize=(10, 6))
plt.bar(df["nombre"], df["salario"], color="steelblue")
plt.xlabel("Nombre")
plt.ylabel("Salario")
plt.title("Salarios por Persona")
plt.show()

## Próximos Pasos

1. Practica con más DataFrames
2. Explora datasets reales (Kaggle)
3. Aprende sobre limpieza de datos
4. Introduce Machine Learning con scikit-learn