# Introducción a la Programación en Python para el Análisis de Datos

![Python Logo](https://www.python.org/static/community_logos/python-logo.png)

## ¿Por qué Python para el Análisis de Datos?

Python es uno de los lenguajes de programación más utilizados en el análisis de datos debido a su simplicidad, versatilidad y la gran cantidad de bibliotecas especializadas disponibles. Su sintaxis clara y su comunidad activa hacen que sea una excelente opción tanto para principiantes como para expertos.

## Instalación de Python y JupyterLab

Antes de empezar a programar, necesitas instalar Python y JupyterLab, que es una herramienta popular para trabajar con notebooks.

### Instalación de Python

1. Visita la [página oficial de Python](https://www.python.org/downloads/) y descarga la última versión de Python.
2. Sigue las instrucciones de instalación específicas para tu sistema operativo.

## Bibliotecas Esenciales para el Análisis de Datos

Python cuenta con varias bibliotecas que son fundamentales para el análisis de datos. A continuación, se presentan algunas de las más utilizadas y cómo instalarlas:

### 1. NumPy

NumPy es la biblioteca fundamental para la computación científica en Python. Proporciona soporte para arreglos y matrices de grandes dimensiones, junto con una colección de funciones matemáticas para operar con estos objetos.

- Instalación:

    ```bash
    pip install numpy
    ```

### 2. Pandas

Pandas es una biblioteca esencial para el análisis de datos, que proporciona estructuras de datos y herramientas para manejar datos etiquetados y tabulares.

- Instalación:

    ```bash
    pip install pandas
    ```

### 3. Matplotlib

Matplotlib es una biblioteca de trazado 2D que permite generar gráficos y visualizaciones de datos en una amplia variedad de formatos.

- Instalación:

    ```bash
    pip install matplotlib
    ```

### 4. Seaborn

Seaborn es una biblioteca basada en Matplotlib que facilita la creación de gráficos estadísticos atractivos y con estilo.

- Instalación:

    ```bash
    pip install seaborn
    ```

### 5. SciPy

SciPy es una biblioteca que extiende las capacidades de NumPy con funciones adicionales para la optimización, la integración, la interpolación, la álgebra lineal y otras tareas científicas.

- Instalación:

    ```bash
    pip install scipy
    ```

### 6. Scikit-learn

Scikit-learn es una biblioteca para el aprendizaje automático en Python, que proporciona herramientas simples y eficientes para la minería de datos y el análisis de datos.

- Instalación:

    ```bash
    pip install scikit-learn
    ```

## Variables y Tipos de Datos

En Python, las **variables** son contenedores que se utilizan para almacenar datos que pueden cambiar a lo largo de la ejecución de un programa. Python es un lenguaje de tipado dinámico, lo que significa que no necesitas declarar el tipo de variable antes de asignarle un valor; Python lo determina automáticamente.

### Asignación de Variables

Puedes asignar un valor a una variable utilizando el operador `=`. A continuación se muestra un ejemplo:

In [None]:
nombre = "Juan"
edad = 30
altura = 1.75

En este ejemplo:

- `nombre` es una variable que almacena una cadena de texto (o string).
- `edad` es una variable que almacena un número entero (o integer).
- `altura` es una variable que almacena un número de punto flotante (o float).

## Tipos de Datos Comunes

Python admite varios tipos de datos, los más comunes son:

- **Cadenas de texto (Strings)**: Se utilizan para almacenar texto. Se declaran usando comillas simples (`'`) o dobles (`"`).
    - Ejemplo: `nombre = "Juan"`

- **Números enteros (Integers)**: Se utilizan para almacenar números enteros, sin decimales.
    - Ejemplo: `edad = 30`

- **Números de punto flotante (Floats)**: Se utilizan para almacenar números que tienen una parte decimal.
    - Ejemplo: `altura = 1.75`

- **Listas (Lists)**: Se utilizan para almacenar varios elementos en una sola variable. Los elementos de una lista están separados por comas y se encierran entre corchetes (`[]`).
    - Ejemplo: `frutas = ["manzana", "banana", "cereza"]`

- **Diccionarios (Dictionaries)**: Se utilizan para almacenar pares de clave-valor. Se declaran usando llaves (`{}`), y cada par de clave-valor está separado por dos puntos (`:`).
    - Ejemplo: `estudiante = {"nombre": "Juan", "edad": 30, "ciudad": "Bogotá"}`

## Imprimir Variables

Puedes mostrar el valor de una variable utilizando la función `print()`:


In [None]:
print("Nombre:", nombre)
print("Edad:", edad)
print("Altura:", altura)

Este código imprimirá:

- Nombre: Juan
- Edad: 30
- Altura: 1.75

## Cambiar el Valor de una Variable

Puedes cambiar el valor de una variable en cualquier momento durante la ejecución de un programa:

In [None]:
edad = 31  # Ahora la variable edad tiene un nuevo valor
print("Edad actualizada:", edad)

## Comprobando el Tipo de Dato
Puedes comprobar el tipo de dato de una variable utilizando la función type():

In [None]:
print(type(nombre))  # Esto devolverá <class 'str'>
print(type(edad))    # Esto devolverá <class 'int'>
print(type(altura))  # Esto devolverá <class 'float'>

# Estructuras de Control

Las **estructuras de control** en Python permiten controlar el flujo de ejecución de un programa, es decir, determinar qué bloques de código se ejecutan y cuándo. Las principales estructuras de control son los **condicionales** y los **bucles**.

### Condicionales

Los condicionales permiten ejecutar código basado en si una condición es verdadera o falsa. La estructura básica de un condicional en Python es el `if`, que se puede complementar con `elif` (else if) y `else`.

#### Estructura básica de un condicional

```python
if condición:
    # Código a ejecutar si la condición es verdadera
elif otra_condición:
    # Código a ejecutar si la otra_condición es verdadera
else:
    # Código a ejecutar si ninguna de las condiciones anteriores es verdadera


Ejemplo de Condicional Simple

Vamos a crear un ejemplo en el que determinamos si una persona es mayor de edad o menor de edad:

In [None]:
sexo = input("Introduce tu sexo (H/M): ")
pam = input("Introduce tu pam: ")

if sexo == "H":
    if pam < 100:
        print("Este hombre tiene hipotensión")
    elif pam < 140:
        print("Este hombre tiene tensión normal")
    else:
        print("Este hombre tiene hipertensión")
else:
    if pam < 90:
        print("Esta mujer tiene hipotensión")
    elif pam < 120:
        print("Esta mujer tiene tensión normal")
    else:
        print("Esta mujer tiene hipertensión")



### Paso a paso:

1. **Definir la variable `edad`**: Se asigna el valor 20 a la variable `edad`.
2. **Condición `if`**: La condición `edad >= 18` verifica si la persona tiene 18 años o más.
    - Si esta condición es verdadera (en este caso, lo es), se ejecuta el bloque de código dentro del `if`, que imprime "Es mayor de edad".
3. **Bloque `else`**: Si la condición no es verdadera (es decir, si `edad` es menor que 18), se ejecutaría el bloque de código dentro del `else`, que imprimiría "Es menor de edad".

### Uso de `elif` para múltiples condiciones

Supongamos que queremos clasificar a las personas en diferentes grupos de edad:


In [None]:
edad = 45

if edad < 18:
    print("Es menor de edad")
elif 18 <= edad < 65:
    print("Es un adulto")
else:
    print("Es un adulto mayor")

### Paso a paso:

1. **Definir la variable `edad`**: Se asigna el valor 45 a la variable `edad`.
2. **Primera condición `if`**: La condición `edad < 18` se evalúa.
    - Si es verdadera, se ejecuta el bloque de código que imprime "Es menor de edad".
    - En este caso, la condición es falsa, así que Python pasa a la siguiente condición.
3. **Condición `elif`**: La condición `18 <= edad < 65` se evalúa.
    - Si es verdadera (en este caso, lo es), se ejecuta el bloque de código que imprime "Es un adulto".
4. **Bloque `else`**: Si ninguna de las condiciones anteriores es verdadera, se ejecuta el código en el bloque `else`, que imprimiría "Es un adulto mayor".

### Bucles

Los bucles permiten repetir una sección de código varias veces. Python tiene dos tipos principales de bucles: `for` y `while`.

#### Bucle `for`

El bucle `for` se utiliza para iterar sobre una secuencia (como una lista, una cadena o un rango de números). Es útil cuando conoces de antemano cuántas veces necesitas repetir una acción.

**Estructura básica de un bucle `for`:**


In [None]:
secuencia = [4, 2, 3, 4, 5]
for variable in secuencia:
    print(variable) # Código a ejecutar en cada iteración

Ejemplo de Bucle for

Vamos a crear un bucle que imprima los números del 0 al 4:

In [None]:
for i in range(5):
    print("Número:", i)

### Paso a paso:

1. **Definir el bucle `for`**: El bucle se configura para iterar sobre un rango de números del 0 al 4 (`range(5)`).
    - `range(5)` genera una secuencia de números que va desde 0 hasta 4.
2. **Variable `i`**: En cada iteración del bucle, la variable `i` toma el siguiente valor de la secuencia.
    - En la primera iteración, `i` es 0; en la segunda iteración, `i` es 1, y así sucesivamente.
3. **Imprimir `i`**: En cada iteración, el valor actual de `i` se imprime junto con el texto "Número:".
    - El resultado será:


### Bucle `while`

El bucle `while` repite una sección de código mientras una condición sea verdadera. Es útil cuando no sabes cuántas veces se necesita repetir una acción, pero sí sabes la condición que debe cumplirse para que continúe.

**Estructura básica de un bucle `while`:**

```Python
while condición:
    # Código a ejecutar mientras la condición sea verdadera


Ejemplo de Bucle while

Vamos a crear un bucle que imprima un contador del 0 al 4:

In [None]:
contador = 0

while contador < 5:
    print("Contador:", contador)
    contador += 1

### Paso a paso:

1. **Inicializar la variable `contador`**: Se asigna el valor 0 a la variable `contador`.
2. **Condición `while`**: La condición `contador < 5` se evalúa al inicio de cada iteración.
    - Si la condición es verdadera (como lo es inicialmente), se ejecuta el bloque de código dentro del `while`.
3. **Imprimir `contador`**: En cada iteración, se imprime el valor actual de `contador`.
4. **Incrementar `contador`**: Se aumenta el valor de `contador` en 1 (`contador += 1`).
    - Este paso es crucial para evitar un bucle infinito. Sin este incremento, `contador` siempre sería 0, y el bucle se repetiría indefinidamente.
5. **Salir del bucle**: Cuando `contador` alcanza el valor 5, la condición `contador < 5` se vuelve falsa, y el bucle termina.

El resultado será:

```Python
Contador: 0
Contador: 1
Contador: 2
Contador: 3
Contador: 4