# 1. INTRODUCCIÓN
En esta unidad didáctica, se explorará el ecosistema Python, proporcionando una comprensión de sus componentes más relevantes y su aplicación en el análisis de datos. Python es un lenguaje de programación versátil y ampliamente utilizado en diversas áreas, incluyendo la ciencia de datos, el aprendizaje automático y el desarrollo web.
A continuación, se presentarán los fundamentos del lenguaje Python, abordando su sintaxis básica y sus estructuras de datos principales. También se discutirá la instalación y el mantenimiento de librerías en Python, enfatizando su importancia en la expansión de sus capacidades y en la realización de tareas específicas. Además, introduciremos los formatos de datos más comunes, como CSV, JSON, Parquet y Avro, que son fundamentales para el manejo de datos.
Finalmente, exploraremos cómo utilizar la librería Pandas para la manipulación y análisis de datos, herramientas esenciales en la ciencia de datos que permiten realizar operaciones complejas de manera eficiente y efectiva.

# 2. EL LENGUAJE PYTHON: SINTAXIS Y ESTRUCTURAS BÁSICAS
## 2.1 Introducción
La programación básica en Python es fundamental para desarrollar aplicaciones en diversos campos como la ciencia de datos, el aprendizaje automático y el desarrollo web. En este apartado, introduciremos los elementos esenciales del lenguaje Python, incluyendo su sintaxis básica, tipos de datos fundamentales y estructuras de control de flujo. Aprenderemos a escribir y ejecutar scripts simples, realizar operaciones aritméticas y lógicas, y manipular datos utilizando listas, tuplas, diccionarios y estructuras similares.

## 2.2 Sintaxis Básica en Python
La sintaxis básica en Python es sencilla y legible, lo que facilita su aprendizaje y uso. Las instrucciones fundamentales incluyen la asignación de variables, las operaciones aritméticas básicas y la capacidad de imprimir resultados en la consola.
Otro recurso muy útil es la capacidad de comentar código, que se realiza con el símbolo `#`.
Un ejemplo de estas tareas es el siguiente:

In [None]:
# Asignación de variables
x = 10
y = 5

# Operaciones aritméticas básicas
suma = x + y
resta = x - y
producto = x * y
cociente = x / y

# Imprimir resultados
print(suma)       # Output: 15
print(resta)      # Output: 5
print(producto)   # Output: 50
print(cociente)   # Output: 2.0

## 2.3 Tipos de datos en Python
Los tipos de datos básicos en Python son similares a los de otros lenguajes de programación y son fundamentales para manejar información. Estos incluyen:
1. Datos de tipo numéricos.
    - Enteros (int): números sin parte decimal, por ejemplo, 42.
    - Flotantes (float): números con parte decimal, por ejemplo, 3.14.
2. Datos de tipo cadena de texto (str): representan secuencias de caracteres, por ejemplo, "Hola, mundo".
3. Datos de tipo lógico (bool): representan valores de verdad, True o False.
Un ejemplo de cuál es la nomenclatura que estos siguen en Python es el siguiente:

In [None]:
# Números
numero_entero = 42
numero_flotante = 3.14

# Cadenas de texto
texto = "Hola, mundo"

# Valores lógicos
logico = True

# Imprimir valores
print(numero_entero)    # Output: 42
print(numero_flotante)  # Output: 3.14
print(texto)            # Output: Hola, mundo
print(logico)           # Output: True

## 2.4 Estructuras de datos habituales en Python
Python ofrece diversas estructuras de datos que permiten almacenar y manipular colecciones de elementos de manera eficiente. Las más habituales son: Listas (List), Tuplas (Tuple), Conjuntos (Set) y Diccionarios (Dictionary).

### 2.4.1 Listas (List)
Una lista (list) es una colección que se caracteriza por ser ordenada y mutable, que puede contener elementos de diferentes tipos, tales como strings, números e incluso objetos o estructuras de datos como diccionarios. Se puede acceder a un elemento de la lista indicándolo entre corchetes. Es importante recordar que la numeración de las listas comienzan en 0, es decir, el primer elemento se accedería con: `mi_lista[0]`.
Un ejemplo básico de esta estructura es el siguiente.

In [None]:
# Definición de una lista
lista = [1, 2, 3, 4, 5]

# Acceso a elementos
print(lista[0])    # Output: 1

# Modificación de elementos
lista[1] = 10

# Añadir elementos
lista.append(6)

# Recorrer una lista
for elemento in lista:
    print(elemento)

### 2.4.2 Tuplas (Tuple)
Las tuplas (tuple) se diferencian de las listas en que son inmutables, es decir, una vez creadas no se pueden modificar. 
Mientras que las listas las definimos mediante corchetes `[]`, las tuplas las definimos entre paréntesis `()`.

In [None]:
# Definición de una tupla
tupla = (1, 2, 3)

# Acceso a elementos
print(tupla[0])    # Output: 1

# Las siguientes operaciones no son válidas y generarían un error
# tupla[1] = 10
# tupla.append(4)

### 2.4.3 Conjuntos (Set)
Un conjunto o set, es una colección desordenada (a diferencia de las listas, las cuales eran ordenadas) de elementos únicos, útiles para operaciones de conjunto como unión e intersección. 
La forma de definir un conjunto es entre llaves `{}`.

In [None]:
# Definición de un conjunto
conjunto_1 = {1, 2, 3, 3}

# Los elementos duplicados se eliminan
print(conjunto_1)    # Output: {1, 2, 3}

# Añadir elementos
conjunto_1.add(4)

# Operaciones de conjunto
conjunto_2 = {3, 4, 5}
union = conjunto_1.union(conjunto_2)
print(union)
interseccion = conjunto_1.intersection(conjunto_2)
print(interseccion)

### 2.4.4 Diccionarios
A una colección donde existen pares de clave-valor y siendo las claves únicas, se le conoce como diccionario. Los diccionarios son mutables, es decir, se pueden añadir o eliminar claves, valores e incluso modificarlos. Como valores de las claves, también podemos encontrar otros objetos.
Su sintaxis es la siguiente, `{'key':'value'}`

In [None]:
# Definición de un diccionario
diccionario = {'nombre': 'Ana', 'edad': 28}

# Acceso a valores
print(diccionario['nombre'])    # Output: Ana

# Modificación de valores
diccionario['edad'] = 29

# Añadir nuevos pares clave-valor
diccionario['ciudad'] = 'Madrid'

# Recorrer un diccionario
for clave, valor in diccionario.items():
    print(f"{clave}: {valor}")

## 2.5 Estructuras de control del flujo de ejecución
Para controlar el flujo, encontramos estructuras similares a las presentes en otros lenguajes. Concretamente, podemos encontrar las siguientes implementadas de forma nativa:
- Estructuras condicionales
- Estructuras de tipo bucle

### 2.5.1 Estructuras condicionales
La sintaxis de las estructuras condicionales en Python utiliza la palabra clave `if`, seguida opcionalmente por `elif` (else if) y `else`.

In [None]:
# Estructuras condicionales
x = 7

if x > 5:
    print("x es mayor que 5")
else:
    print("x es menor o igual a 5")

### 2.5.2 Estructuras de tipo bucle
Las estructuras de tipo bucle se dividen en dos tipos: los bucles `for` y los `while`.
En el caso de `for` se utiliza para iterar sobre una secuencia, como por ejemplo una lista o tupla. La sintaxis de los bucles `for` es la siguiente.

In [None]:
# Bucle For
for i in [1, 2, 3, 4, 5]:
    print(i)

# Utilizar la función range()
for i in range(1, 6):
    print(i)

En el caso de un bucle `while`, el bloque de código se repite mientras la condición sea verdadera. La sintaxis de los bucles `while` es la siguiente.

In [None]:
# Bucle While
contador = 1

while contador <= 5:
    print(contador)
    contador += 1

## 2.6 Funciones
Una función de Python es un bloque de código reutilizable que permite realizar tareas específicas. Su sintaxis es similar a otros lenguajes de programación. Al igual que en estos lenguajes, las funciones en Python pueden aceptar argumentos, ejecutar operaciones y devolver resultados. Para definirlas se utiliza la palabra `def`, seguidas del nombre de la función y paréntesis que pueden contener parámetros.
Por ejemplo, una función que suma dos números se define de la siguiente manera:

In [None]:
# Definición de una función
def sumar(a, b):
    resultado = a + b
    return resultado

# Llamada a la función
print(sumar(5, 10))    # Output: 15

Las funciones pueden tener parámetros opcionales, valores por defecto y pueden devolver múltiples valores.

In [None]:
# Función con parámetros por defecto
def saludar(nombre, mensaje="Hola"):
    return f"{mensaje}, {nombre}!"

print(saludar("Carlos"))                # Output: Hola, Carlos!
print(saludar("Ana", "Buenos días"))    # Output: Buenos días, Ana!

## 2.7 Programación orientada a objetos
La programación orientada a objetos (POO) es un paradigma que organiza el diseño de software alrededor de objetos, que pueden contener datos y código para manipular esos datos. Python soporta plenamente la POO, permitiendo crear clases, instanciar objetos.
Una clase se entiende como una plantilla donde se definen las propiedades y comportamientos (atributos y métodos) que tendrán los objetos creados a partir de ella.
Por otro lado, un objeto sería una instancia de la clase creada, es decir, una entidad que posee los atributos y métodos definidos en la clase.

In [None]:
# Definición de una clase
class Persona:
    def __init__(self, nombre, edad):
        self.nombre = nombre  # Atributo de instancia
        self.edad = edad      # Atributo de instancia

    def saludar(self):
        print(f"Hola, me llamo {self.nombre} y tengo {self.edad} años.")

# Crear instancias de la clase Persona (objeto)
persona1 = Persona("Ana", 30)
persona2 = Persona("Luis", 25)

# Acceder a atributos y métodos
print(persona1.nombre)  # Output: Ana
persona2.saludar()      # Output: Hola, me llamo Luis y tengo 25 años.

## 2.8 Manejo de excepciones
El manejo de excepciones es esencial para crear programas robustos que puedan manejar errores y situaciones inesperadas sin interrumpir la ejecución del programa.
En Python existen múltiples tipos de excepciones tales como `ValueError`, `ZeroDivisionError` entre otras. Sin embargo, la manera más genérica de definir excepciones es la siguiente:

In [None]:
# Código que puede generar una excepción
try:
    numero = int(input("Introduce un número entero: "))
    resultado = 10 / numero
except Exception as e:
    print("Ha ocurrido un error:", e)
finally:
    print("Fin del programa.")