# 1. Introducción a Google Colab

## ¿Qué es Google Colab?

Google Colab (Colaboratory) es un entorno de Jupyter Notebook gratuito que se ejecuta en la nube y no requiere configuración. Permite escribir y ejecutar código Python directamente en el navegador.

## Ventajas de Google Colab

  - Sin configuración: No es necesario instalar nada localmente
  - Recursos en la nube: Acceso a GPUs y TPUs gratuito
  - Colaboración: Fácil de compartir y trabajar en equipo
  - Integración con Google Drive: Almacenamiento persistente de notebooks

## Primeros pasos en Colab

  - 1.- Accede a colab.research.google.com
  - 2.- Inicia sesión con tu cuenta de Google
  - 3.- Crea un nuevo notebook o abre uno existente

## Interfaz básica

  - Celdas de código: Para escribir y ejecutar código Python (Ctrl+Enter para ejecutar)
  - Celdas de texto: Para documentar usando Markdown
  - Barra de herramientas: Opciones para ejecutar, añadir celdas, etc.

## Ejemplo: Tu primera celda en Colab

In [None]:
print("¡Hola, bienvenidos a Python!")

# 2. Fundamentos básicos de Python

## Sintaxis básica

Python se caracteriza por su simplicidad y legibilidad:

In [None]:
# Variables y tipos de datos
nombre = "Python"     # String
generaciones = 100    # Integer
amplitud = 0.85       # Float
valor_optimo = True   # Boolean

In [None]:
# Operadores comunes
numero1 = 5
numero2 = 3
suma = numero1 + numero2
resta = numero1 - numero2
multiplicacion = numero1 * numero2
division = numero1 / numero2

print('suma:', suma)
print('resta:', resta)
print('multiplicacion:', multiplicacion)
print('division:', division)

In [None]:
# Otros operadores
potencia = numero1 ** numero2
modulo = numero1 % numero2
division_entera = numero1 // numero2

print('potencia:', potencia)
print('modulo:', modulo)
print('division_entera:', division_entera)

In [None]:
# Listas
poblacion = [1, 2, 3, 4, 5]
print('poblacion:', poblacion)  # Imprime la lista
print('poblacion[0]:', poblacion[0])  # Imprime el primer elemento de la lista
print('poblacion[1:3]:', poblacion[1:3])  # Imprime los elementos 1 y 2 de la lista

In [None]:
poblacion.append(6) # Agrega un elemento al final de la lista
print('poblacion.append(6):', poblacion)

poblacion.remove(3) # Remueve el primer elemento que coincida con el elemento dado
print('poblacion.remove(3):', poblacion)

poblacion.pop(0)  # Elimmina el elemento en la posición proporcionada
print('poblacion.pop(0):', poblacion)

poblacion.insert(0, 1)  # Inserta el elemento dado en la posición proporcionada
print('poblacion.insert(0, 1):', poblacion)

poblacion.reverse() # Ordena la lista de forma inversa
print('poblacion.reverse():', poblacion)

poblacion.sort()  # Ordena la lista de menor a mayor
print('poblacion.sort():', poblacion)

poblacion.clear()  # Elimina todos los elementos de la lista
print('poblacion.clear():', poblacion)

poblacion.extend([1, 2, 3, 4, 5])  # Agrega los elementos de una lista al final de la lista
print('poblacion.extend([1, 2, 3, 4, 5]):', poblacion)

In [None]:
print('poblacion.count(2):', poblacion.count(2))  # Cuenta el número de veces que el elemento dado aparece en la lista
print('poblacion.index(3):', poblacion.index(3))  # Devuelve el índice del primer elemento que coincida con el elemento dado
print('len(poblacion):', len(poblacion))  # Devuelve el número de elementos en la lista
print('max(poblacion):', max(poblacion))  # Devuelve el elemento máximo en la lista
print('min(poblacion):', min(poblacion))  # Devuelve el elemento mínimo en la lista
print('sum(poblacion):', sum(poblacion))  # Devuelve la suma de todos los elementos en la lista

In [None]:
# Diccionarios
individuo = {'fitness': 0.75, 'genes': [0, 1, 0, 1, 1]}  # Crea un diccionario con dos pares clave-valor
print('individuo:', individuo) # Imprime el diccionario
print('individuo["fitness"]:', individuo["fitness"]) # Imprime el valor que se encuentra a traves de la clave 'fitness'
print('individuo["genes"]:', individuo["genes"])  # Imprime el valor que se encuentra a traves de la clave 'genes'

In [None]:
print('individuo.keys():', individuo.keys())  # Devuelve una lista de todas las claves en el diccionario
print('individuo.values():', individuo.values())  # Devuelve una lista de todos los valores en el diccionario
print('individuo.items():', individuo.items())  # Devuelve una lista de tuplas (clave, valor) en el diccionario

In [None]:
# Control de flujo
if amplitud > 0.5:
  print('amplitud es mayor que 0.5')
elif amplitud < 0.5:
  print('amplitud es menor que 0.5')
else:
  print('amplitud es igual a 0.5')

In [None]:
if valor_optimo:  # Uso de variables booleanas
  print('valor_optimo es verdadero')
else:
  print('valor_optimo es falso')

In [None]:
# Bucle for
for i in range(5):
  print(i)

In [None]:
valores = [4, 8, 5, 3, 6]
for valor in valores:
  print(valor)

In [None]:
for llave, valor in individuo.items():
  print(llave, valor)

In [None]:
# Bucle while
generaciones = 10
while generaciones > 0:
  print(generaciones)
  generaciones -= 1 # Equivalente a: generaciones = generaciones - 1

In [None]:
# Funciones
def saludar(nombre):
  print('¡Hola, ' + nombre + '!')

saludar('Python')

Estructura de una [neurona](https://ve.scielo.org/img/revistas/uct/v27n118//2542-3401-uct-27-118-51-gf1.jpg).

In [None]:
# Clases u objetos
class Neurona:
  def __init__(self, pesos, sesgo):
    self.pesos = pesos
    self.sesgo = sesgo

  def activar(self, entradas):
    if len(entradas) != len(self.pesos):
      raise ValueError("El número de entradas debe coincidir con el número de pesos.")

    ponderacion = sum(entrada * peso for entrada, peso in zip(entradas, self.pesos))
    y = ponderacion - self.sesgo
    return self.relu(y)

  def relu(self, x):
    return max([0, x])

In [None]:
neurona = Neurona(pesos=[0.5, -0.2, 0.1], sesgo=0.3)  # Creamos una neurona

entradas = [1.0, 0.5, -1.0] # Definimos las entradas

salida = neurona.activar(entradas)  # Activamos la neurona con las entradas

print(f"La salida de la neurona con entradas {entradas} es: {salida}")

# Math

La librería [math](https://docs.python.org/es/3.10/library/math.html) en Python es un módulo que te brinda acceso a funciones matemáticas estándar. Permite realizar cálculos comunes como logaritmos, exponenciales y funciones trigonométricas, facilitando la implementación de fórmulas matemáticas complejas en tu código.

Además de las funciones, la librería math también incluye constantes matemáticas importantes como el valor de pi y el número de Euler (e), que son útiles para diversas operaciones y cálculos científicos o de ingeniería.

In [None]:
# Importar libreria
import math

In [None]:
# Constantes en math
print('math.pi:', math.pi)
print('math.e:', math.e)
print('math.tau:', math.tau)
print('math.inf:', math.inf)
print('math.nan:', math.nan)

In [None]:
# Funciones trigonometricas comunes
print('math.sin(math.pi):', math.sin(math.pi))
print('math.cos(math.pi):', math.cos(math.pi))
print('math.tan(math.pi):', math.tan(math.pi))

In [None]:
# Pueba otras funciones en math

# Libreria Random

La librería [random](https://docs.python.org/es/3.10/library/random.html#) en Python es un módulo fundamental que proporciona herramientas para generar números pseudoaleatorios. Es muy útil en una amplia gama de aplicaciones, desde simulaciones y juegos hasta algoritmos que requieren aleatoriedad, como los algoritmos genéticos. Permite obtener valores aleatorios de diferentes tipos de distribuciones, tanto para números enteros dentro de un rango específico como para números decimales.

Esta librería ofrece diversas funciones para trabajar con la aleatoriedad. Por ejemplo, se pueden generar números enteros aleatorios dentro de un intervalo definido, seleccionar un elemento aleatorio de una secuencia (como una lista o una tupla), o incluso reordenar aleatoriamente los elementos de una lista. La capacidad de generar aleatoriedad controlada es clave para muchos procesos computacionales, y la librería random simplifica enormemente esta tarea en Python.

In [None]:
# Importar libreria con abreviación
import random as rd

In [None]:
# rd.seed(10) # Definir una semilla filla

# Generar numeros aleatorios enteros
for _ in range(5):
  print(rd.randint(1, 10))

In [None]:
# Numero aleatorios reales
for _ in range(5):
  print(rd.random())

In [None]:
for _ in range(5):
  print(rd.uniform(1, 10))

In [None]:
for _ in range(5):
  print(rd.normalvariate(0, 1))

In [None]:
# Selección aleatoria
valores = ['random', 'choice', 'python']
for _ in range(5):
  print(rd.choice(valores))

In [None]:
# Selección muestral
for _ in range(5):
  print(rd.choices(valores, weights=[0.1,0.3,0.6], k=2))

In [None]:
# Prueba otras funciones en random

# NumPy
[Numpy](https://numpy.org/doc/stable/user/index.html) es una librería fundamental en Python para la computación numérica. Proporciona un objeto de array multidimensional de alto rendimiento, llamado ndarray, junto con una vasta colección de funciones para operar con estos arrays. A diferencia de las listas de Python, los arrays de NumPy son homogéneos (contienen elementos del mismo tipo de dato) y están optimizados para operaciones matemáticas y lógicas en grandes conjuntos de datos, lo que los hace significativamente más rápidos y eficientes en memoria. NumPy es la base para muchas otras librerías de ciencia de datos en Python, como Pandas y Matplotlib.

La fuerza de NumPy radica en su capacidad para realizar operaciones vectorizadas, lo que significa que las operaciones se aplican a todos los elementos del array simultáneamente, sin necesidad de bucles explícitos de Python. Esto no solo mejora el rendimiento, sino que también simplifica el código. NumPy incluye funciones para manipulación de arrays (reshape, slicing, indexing), álgebra lineal, transformadas de Fourier, generación de números aleatorios y mucho más. Es una herramienta esencial para cualquier tarea que involucre el trabajo con datos numéricos en Python, desde el análisis de datos hasta el aprendizaje automático.

In [None]:
# Importar libreria
import numpy as np

In [None]:
# ndarrays de multiples dimensiones
a1D = np.array([1, 2, 3])
a2D = np.array([[1, 2, 3], [4, 5, 6]])
a3D = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])

In [None]:
a1D

In [None]:
# Crear array con incrementos regulares de un valor
np.arange(1, 10, 2)

In [None]:
# Crear array con una cantidad de elementos igualmente espaciados
np.linspace(0, 1, 5)

In [None]:
# Crear una matriz identidad
np.eye(3)

In [None]:
# Crear una matriz diagonal
np.diag([1, 2, 3])

In [None]:
# Obtener la diagonal de una matriz
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
np.diag(a)

# Pandas

[Pandas](https://pandas.pydata.org/docs/user_guide/index.html) es una biblioteca de código abierto fundamental en Python, diseñada para el análisis y la manipulación de datos de manera rápida y eficiente. Se basa en dos estructuras de datos principales: las Series, que son arrays unidimensionales, y los DataFrames, que son tablas bidimensionales similares a hojas de cálculo. Estas estructuras facilitan enormemente el trabajo con datos estructurados, permitiendo realizar operaciones como filtrado, selección, agregación y transformación de datos de forma intuitiva.

La versatilidad de pandas la convierte en una herramienta indispensable para científicos de datos y analistas. Permite cargar datos desde diversas fuentes como archivos CSV, Excel, bases de datos, entre otros. Además, ofrece una amplia gama de funcionalidades para limpiar y preparar los datos, manejar valores faltantes y combinar conjuntos de datos. Su integración con otras bibliotecas como NumPy y Matplotlib amplía aún más sus capacidades para el análisis numérico y la visualización de datos.


In [None]:
# Importar libreria
import pandas as pd

In [None]:
# Crear un DataFrame a partir de una lista
valores = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
df = pd.DataFrame(valores, columns=['A', 'B', 'C'])
print(df)

In [None]:
# Crear un DataFrame a partir de un diccionario
datos = {'A': [1, 4, 7], 'B': [2, 5, 8], 'C': [3, 6, 9]}
df = pd.DataFrame(datos)
print(df)

Ahora utilizaremos el dataset [Medical Cost Personal Dtasets](https://www.kaggle.com/datasets/mirichoi0218/insurance).

In [None]:
# Cargar un DataFrame a partir de un archivo csv
df = pd.read_csv('insurance.csv')
print(df.head())

In [None]:
# Obtener lista de columnas
print(df.columns)

In [None]:
# Realizar una descripción de los datos
print(df.describe().T)

In [None]:
# Crear un grafico de dispersión de los datos
df.plot(kind='scatter', x='age', y='charges')
plt.show()

In [None]:
# Crear un histograma
df['bmi'].plot(kind='hist', bins=10)
plt.show()

In [None]:
# Explora más funciones de pandas

# Matplotlib

[Matplotlib](https://matplotlib.org/stable/users/index.html) es una biblioteca de visualización de datos en Python que te permite crear una amplia variedad de gráficos estáticos, interactivos y animados de manera sencilla. Es muy utilizada en ciencia de datos, análisis numérico y publicaciones científicas debido a su flexibilidad y capacidad para generar visualizaciones de alta calidad. Permite controlar casi todos los aspectos de un gráfico, desde los colores y estilos de línea hasta las etiquetas y títulos, lo que la hace ideal para crear representaciones personalizadas de tus datos.

La biblioteca Matplotlib se estructura en torno a una jerarquía de objetos, donde el objeto principal es la figura, que contiene uno o varios ejes (plots). Puedes crear diferentes tipos de gráficos como líneas, barras, histogramas, gráficos de dispersión, gráficos de pastel, entre muchos otros. Además, se integra bien con otras bibliotecas populares de Python como NumPy y pandas, facilitando la visualización de datos contenidos en arrays y DataFrames. Con Matplotlib, puedes exportar tus gráficos a diversos formatos de archivo, como PNG, JPG, PDF, entre otros.

In [None]:
# Ejemplo de la guia de usuario de matplotlib
import matplotlib.pyplot as plt
import numpy as np

np.random.seed(19680801)  # seed the random number generator.
data = {'a': np.arange(50),
        'c': np.random.randint(0, 50, 50),
        'd': np.random.randn(50)}
data['b'] = data['a'] + 10 * np.random.randn(50)
data['d'] = np.abs(data['d']) * 100

fig, ax = plt.subplots(figsize=(5, 2.7), layout='constrained')
ax.scatter('a', 'b', c='c', s='d', data=data)
ax.set_xlabel('entry a')
ax.set_ylabel('entry b')
plt.show()

In [None]:
# Ejemplo de la guia de usuario de matplotlib
x = np.linspace(0, 2, 100)  # Sample data.

# Note that even in the OO-style, we use `.pyplot.figure` to create the Figure.
fig, ax = plt.subplots(figsize=(5, 2.7), layout='constrained')
ax.plot(x, x, label='linear')  # Plot some data on the Axes.
ax.plot(x, x**2, label='quadratic')  # Plot more data on the Axes...
ax.plot(x, x**3, label='cubic')  # ... and some more.
ax.set_xlabel('x label')  # Add an x-label to the Axes.
ax.set_ylabel('y label')  # Add a y-label to the Axes.
ax.set_title("Simple Plot")  # Add a title to the Axes.
ax.legend()  # Add a legend.
plt.show()

In [None]:
# Ejemplo de la guia de usuario de matplotlib
mu, sigma = 115, 15
x = mu + sigma * np.random.randn(10000)
fig, ax = plt.subplots(figsize=(5, 2.7), layout='constrained')
# the histogram of the data
n, bins, patches = ax.hist(x, 50, density=True, facecolor='C0', alpha=0.75)

ax.set_xlabel('Length [cm]')
ax.set_ylabel('Probability')
ax.set_title('Aardvark lengths\n (not really)')
ax.text(75, .025, r'$\mu=115,\ \sigma=15$')
ax.axis([55, 175, 0, 0.03])
ax.grid(True)

In [None]:
# Ejemplo de la guia de usuario de matplotlib
from matplotlib.colors import LogNorm
data1, data2, data3, data4 = np.random.randn(4, 100)  # make 4 random data sets

X, Y = np.meshgrid(np.linspace(-3, 3, 128), np.linspace(-3, 3, 128))
Z = (1 - X/2 + X**5 + Y**3) * np.exp(-X**2 - Y**2)

fig, axs = plt.subplots(2, 2, layout='constrained')
pc = axs[0, 0].pcolormesh(X, Y, Z, vmin=-1, vmax=1, cmap='RdBu_r')
fig.colorbar(pc, ax=axs[0, 0])
axs[0, 0].set_title('pcolormesh()')

co = axs[0, 1].contourf(X, Y, Z, levels=np.linspace(-1.25, 1.25, 11))
fig.colorbar(co, ax=axs[0, 1])
axs[0, 1].set_title('contourf()')

pc = axs[1, 0].imshow(Z**2 * 100, cmap='plasma', norm=LogNorm(vmin=0.01, vmax=100))
fig.colorbar(pc, ax=axs[1, 0], extend='both')
axs[1, 0].set_title('imshow() with LogNorm()')

pc = axs[1, 1].scatter(data1, data2, c=data3, cmap='RdBu_r')
fig.colorbar(pc, ax=axs[1, 1], extend='both')
axs[1, 1].set_title('scatter()')
plt.show()

# Scikit-learn

[Scikit-learn](https://scikit-learn.org/stable/user_guide.html) es una biblioteca de Python ampliamente utilizada y muy popular para el aprendizaje automático. Proporciona herramientas sencillas y eficientes para una variedad de tareas comunes en el aprendizaje automático, como clasificación, regresión, agrupamiento, reducción de dimensionalidad, selección de modelos y preprocesamiento de datos. Está construida sobre otras bibliotecas científicas de Python como NumPy, SciPy y Matplotlib.

La facilidad de uso y la documentación completa hacen de scikit-learn una excelente opción tanto para principiantes como para expertos en aprendizaje automático. Su diseño consistente y bien estructurado permite a los usuarios experimentar con diferentes algoritmos y técnicas rápidamente. Además, scikit-learn se integra perfectamente con el ecosistema de ciencia de datos de Python, facilitando la construcción de flujos de trabajo completos para el análisis y modelado de datos.

In [None]:
from sklearn.metrics import root_mean_squared_error

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
root_mean_squared_error(y_true, y_pred)

In [None]:
y_true = [[0.5, 1],[-1, 1],[7, -6]]
y_pred = [[0, 2],[-1, 2],[8, -5]]
root_mean_squared_error(y_true, y_pred)

# Material extra

- [Curso de Introducción a Python (217-A).](https://github.com/jramon0624/curso_python_217a)
- [Libros gratuitos de programación en Python.](https://github.com/pamoroso/free-Python-books)
- [Redes Neuronales y Aprendizaje Profundo](http://neuralnetworksanddeeplearning.com/index.html) (WebBook).
- [Exportar graficos Matplotlib a LaTex.](https://blog.timodenk.com/exporting-matplotlib-plots-to-latex/)
- [Guia de graficos TikZ](https://tikz.jp) (WebBook).
