# Introducción a Python y Google Colab

Esta notebook proporciona una introducción detallada a Python y Google Colab, abarcando desde variables básicas y estructuras de control, hasta funciones avanzadas, manejo de excepciones, y visualización de datos.

## ¿Qué es Python?

Python es un lenguaje de programación versátil, interpretado y de alto nivel, que se ha popularizado enormemente por su legibilidad y sintaxis clara. Es ampliamente utilizado en diversas áreas como desarrollo web, ciencia de datos, inteligencia artificial, automatización, y mucho más.

## ¿Qué es Google Colab?

Google Colab es una plataforma de notebooks que permite ejecutar código Python directamente en el navegador, con la ventaja de utilizar la infraestructura de Google. Esto incluye no solo la ejecución del código, sino también el acceso gratuito a GPUs y TPUs para procesar cálculos de mayor complejidad.



## Elmentos y operaciones básicas en Python

**Variables y Tipos de Datos**

Python es un lenguaje de tipado dinámico, lo que significa que no necesitas declarar el tipo de una variable al crearla.

In [None]:
# Tipos de datos básicos: Declaración de variables con asignación

entero = 10
flotante = 10.5
texto = "Hola, mundo"
booleano = True

In [None]:
# Impresión por pantalla de valores almacenados en variables

print(entero)

In [None]:
# Modificación de valores almacenados en variables

entero = 7
print(entero)

In [None]:
# Actualización de valor a partir de valor almacenado previamente

flotante = flotante * 2
print(flotante)

21.0


## Estructuras condicionales

In [None]:
# Condición if simple

numero = 10
if (numero > 0):
    print("El número es positivo.")

In [None]:
# Condición if con AND

edad = 25
if edad >= 18 and edad <= 65:
    print("Estás en el rango de edad laboral.")

In [None]:
# Condición if con OR

llueve = False
soleado = True
if llueve or soleado:
    print("Podrías necesitar un paraguas o protector solar hoy.")

Podrías necesitar un paraguas o protector solar hoy.


In [None]:
# Condición if con elif y else

edad = 13
if edad < 13:
    print("Puedes ver películas PG.")
elif edad >= 13 and edad < 18:
    print("Puedes ver películas PG-13.")
else:
    print("Puedes ver películas R.")

Puedes ver películas PG-13.


In [None]:
# Condición if verificar elementos en lista

ingredientes = ['tomate', 'queso', 'jamon']
if 'tomate' in ingredientes:
    print("No olvides poner tomate en la pizza.")

No olvides poner tomate en la pizza.


In [None]:
# Condición if lista vacía

lista = [] # Lista vacía equivale a un valor falso
if not lista:
    print("La lista está vacía.")

La lista está vacía.


In [None]:
# Condición if con variables booleanas

usuario_logueado = True
if usuario_logueado:
    print("Usuario está logueado.")

Usuario está logueado.


In [None]:
# Condición if con múltiples condiciones combinadas
# % representa el resto de la divisón entre dos números

year = 2020
if year % 4 == 0 and (year % 100 != 0 or year % 400 == 0):
    print(f"{year} es un año bisiesto.")
else:
    print(f"{year} no es un año bisiesto.")

## Estadística básica con Python


Para realizar cálculos estadísticos básicos, podemos utilizar la biblioteca `statistics`, que proporciona funciones para calcular la media, mediana, moda, varianza, y más.

In [None]:
# Importación de dependencias para cálculos estadísticos

import statistics

In [None]:
# Generar algunos datos

datos = [1, 2, 2, 3, 4, 5, 5, 5, 6, 7, 3, 5, 8, 9, 10, 10, 4, 5, 6, 6, 8, 10, 12]

In [None]:
# Cálculo de Media

media = statistics.mean(datos)
print("Media:", media)

Media: 5.913043478260869


In [None]:
# Cálculo de Mediana

mediana = statistics.median(datos)
print("Mediana:", mediana)

Mediana: 5


In [None]:
# Cálculo de Moda

moda = statistics.mode(datos)
print("Moda:", moda)

Moda: 5


In [None]:
# Cálculo de Desvío estándar

desvio = statistics.stdev(datos)
print("Desvío estándar:", desvio)

Desvío estándar: 2.937423785908958


In [None]:
# Cálculo de Varianza

varianza = statistics.variance(datos)
print("Varianza:", varianza)

Varianza: 8.628458498023715


## Estructuras en Python: Listas

In [None]:
# Definimos algunas listas

lista_1 = [1, 2, 3, 4, 5]
lista_2 = ["Hola", "Mundo", "IA", "Mujeres"]
lista_3 = [1.45 , "Hola", 'C', -4, 1.45]

In [None]:
# Acceder a un elemento de la lista a partir del índice (empieza contando en 0)

print(f"Elemento en la posición 0 de la lista_1: {lista_1[0]}")
print(f"Elemento en la posición 1 de la lista_2: {lista_2[1]}")
print(f"Elemento en la posición 3 de la lista_3: {lista_3[3]}")

Elemento en la posición 0 de la lista_1: 1
Elemento en la posición 1 de la lista_2: Mundo
Elemento en la posición 3 de la lista_3: -4


In [None]:
# Anadir un elemento a la lista con append

lista_1.append(6)  # Añade al final
print(lista_1)

[1, 2, 3, 4, 5, 6]


In [None]:
# Añadir un elemento a la lista en una posición específica

lista_2.insert(0, 0)  # Añadir en una posición específica
print(lista_2)

[0, 'Hola', 'Mundo', 'IA', 'Mujeres']


In [None]:
# Remover un elemento de la lista con remove

lista_3.remove(1.45)  # Elimina la primera aparición del valor 1.45
print(lista_3)

['Hola', 'C', -4, 1.45]


In [None]:
# Unir dos listas

lista_4 = lista_2 + lista_3
print(lista_4)

[0, 'Hola', 'Mundo', 'IA', 'Mujeres', 'Hola', 'C', -4, 1.45]


In [None]:
# Recorrer todos los elementos de una lista

for elemento in lista_2:
    print(elemento)

0
Hola
Mundo
IA
Mujeres


In [None]:
# Eliminar todas las instancias de un valor (ejemplo: 3)

lista = [1, 2, 3, 4, 5, 3, 3]
valor_a_eliminar = 3

while valor_a_eliminar in lista:
    lista.remove(valor_a_eliminar)

print(lista)

In [None]:
# Mostrar los primeros 4 elementos

lista = [1, 1, 2, 7, 8, 3, 4, 12, 6, 7]
print(lista[:4])

[1, 1, 2, 7]


In [None]:
# Mostrar del cuarto elemento en adelante

lista = [1, 1, 2, 7, 8, 3, 4, 12, 6, 7]
print(lista[3:])

# Recordar que el índice comienza contando en 0

[7, 8, 3, 4, 12, 6, 7]


In [None]:
# Mostrar un rango de elementos

lista = [1, 1, 2, 7, 8, 3, 4, 12, 6, 7]
print(lista[3:6])

[7, 8, 3]


## Estructuras de en Python: Diccionarios

In [None]:
# Craer un diccionario

diccionario = {'nombre': 'Alice', 'edad': 25, 'profesion': 'Data Scientist', 'hobbie': 'Ajedrez', 'años experiencia': 7}
print(diccionario)

{'nombre': 'Alice', 'edad': 25, 'profesion': 'Data Scientist', 'hobbie': 'Ajedrez', 'años experiencia': 7}


In [None]:
# Añadir una nueva clave valor

diccionario['ciudad'] = 'Madrid'  # Añadir nuevo par clave-valor
print(diccionario)

{'nombre': 'Alice', 'edad': 25, 'profesion': 'Data Scientist', 'hobbie': 'Ajedrez', 'años experiencia': 7, 'ciudad': 'Madrid'}


In [None]:
# Actualizar una clave-valor (key-value) existent

diccionario['edad'] = 26  # Actualizar un valor existente
print(diccionario)

{'nombre': 'Alice', 'edad': 26, 'profesion': 'Data Scientist', 'hobbie': 'Ajedrez', 'años experiencia': 7, 'ciudad': 'Madrid'}


In [None]:
# Acceder al valor de una key en el diccionario

print(diccionario['nombre'])

In [None]:
# Acceso seguro a elementos con get para evitar error si no encuentra key

edad = diccionario.get('edad', 'Edad no especificada')
print(edad)

26


In [None]:
# Recorrer/Iterar sobre claves y valores

for clave, valor in diccionario.items():
    print(f"{clave}: {valor}")

nombre: Alice
edad: 26
profesion: Data Scientist
hobbie: Ajedrez
años experiencia: 7
ciudad: Madrid


In [None]:
# Eliminar una entrada del diccionario mediante del

del diccionario['edad']  # Eliminar por clave
print(diccionario)

In [None]:
# Eliminar una entrada mediante pop

diccionario.pop('ciudad', None)  # Eliminar con pop, devuelve None si no se encuentra
diccionario.pop('pais', None)
print(diccionario)

## Operaciones con Listas y Diccionarios

In [None]:
# Recorrer una lista usando bucle

numeros = [1, 2, 3, 4, 5]
for numero in numeros:
    print(f"Número: {numero}")

In [None]:
# Listas por compresión

cuadrados = [x**2 for x in numeros]
print("Cuadrados:", cuadrados)

Cuadrados: [1, 4, 9, 16, 25]


In [None]:
# Recorrer un diccionario

persona = {"nombre": "Carlos", "edad": 28, "ciudad": "Madrid"}
for clave, valor in persona.items():
    print(f"{clave}: {valor}")

nombre: Carlos
edad: 28
ciudad: Madrid


In [None]:
# Diccionarios por compresión

cubos = {x: x**3 for x in range(6)}
print("Cubos:", cubos)

# Operador ** es la potencia

In [None]:
# Lista de diccionarios, cada diccionario representa un libro y sus detalles

biblioteca = [
    {'titulo': 'Cien Años de Soledad', 'autor': 'Gabriel García Márquez', 'año': 1967},
    {'titulo': '1984', 'autor': 'George Orwell', 'año': 1949},
    {'titulo': 'Don Quijote', 'autor': 'Miguel de Cervantes', 'año': 1605}
]

In [None]:
# Acceder a cada libro y sus propiedades

for libro in biblioteca:
    print(f"Libro: {libro['titulo']}, Escrito por: {libro['autor']}, Año: {libro['año']}")

In [None]:
# Diccionario con listas como valores. Cada clave es una categoría de libros y cada valor es una lista de títulos.

libros_por_categoria = {
    'Novela': ['Cien Años de Soledad', '1984', 'El Quijote'],
    'Ciencia Ficción': ['Fundación', 'Dune', 'Neuromante'],
    'Historia': ['Los caudillos', 'La guerra civil española', 'Postguerra']
}

In [None]:
# Acceder a los títulos de cada categoría

for categoria, titulos in libros_por_categoria.items():
    print(f"Categoría: {categoria}")
    for titulo in titulos:
        print(f"- {titulo}")

## Manipulación de cadenas

In [None]:
# Manipulación de cadenas
mensaje = "Hola Mundo"
mensaje_modificado = mensaje.replace("Mundo", "Python")
print(mensaje_modificado)

Hola Python


In [None]:
# Formateo de cadenas con función format

nombre = "Juan"
producto = "libro de Python"
precio = 39.95

mensaje = "Hola, {0}, gracias por comprar el {1}. El total es ${2}.".format(nombre, producto, precio)
print(mensaje)

In [None]:
# Formateo de cadena con placeholder

temperatura = 20.5
clima = "soleado"

reporte_clima = f"La temperatura actual es {temperatura} grados y el día está {clima}."
print(reporte_clima)

In [None]:
# Concatenación de cadenas con operador de suma +

primer_nombre = "María"
apellido = "González"

nombre_completo = primer_nombre + " " + apellido
#print(nombre_completo)

In [None]:
# Concatenación de cadenas con .join utilizando caracter separador

items = ["manzana", "banana", "cereza"]
lista_compra = "\n".join(items)
print(f"Lista de Compra:\n{lista_compra}")

In [None]:
# Spliteo de cadenas con .split utilizando caracter

email = "usuario@ejemplo.com"
usuario, dominio = email.split('@')
print(f"Usuario: {usuario}, Dominio: {dominio}")

Usuario: usuario, Dominio: ejemplo.com


In [None]:
# Eliminar espacios no deseados con strip

usuario_input = "   usuario123   "
usuario_limpio = usuario_input.strip()
print(f"Nombre de usuario: '{usuario_limpio}'")

In [None]:
# Reemplazar secuencias de caracteres por otras

texto = "Bienvenido al curzo de Python."
texto_corregido = texto.replace("curzo", "curso")
print(texto_corregido)

In [None]:
# Búsqueda de subcadenas en una cadena

frase = "El aprendizaje de máquinas es fascinante."
buscar_palabra = "máquinas"

if buscar_palabra in frase:
    print("La palabra fue encontrada.")
else:
    print("La palabra no fue encontrada.")

In [None]:
# Manipulación de minúsculas, mayúsculas

titulo_libro = "Cien Años de Soledad"
print(titulo_libro.lower())  # Para comparaciones
print(titulo_libro.upper())  # Para énfasis
print(titulo_libro.title())  # Para presentación estética

cien años de soledad
CIEN AÑOS DE SOLEDAD
Cien Años De Soledad


In [None]:
# Formateo de números al convertirse en cadena especificando precisión

temperatura = 21.45789
mensaje_temperatura = f"Temperatura actual: {temperatura:.3f}°C"
print(mensaje_temperatura)

## Manejo de datos tabulares (dataframes) con Pandas

**Manipulación de Datos con Pandas**

Pandas es una biblioteca de Python extremadamente útil en la ciencia de datos para la manipulación y el análisis de datos estructurados. Permite realizar operaciones de manejo de datos como cargar, filtrar, transformar y analizar de manera eficiente y con menos código.

**Cargar Datos desde un Archivo CSV**

Para este ejemplo, utilizaremos un dataset público que está disponible en línea. Utilizaremos datos de vinos disponibles públicamente.

In [None]:
# Importanción de dependencia Pandas para manejo de dataframes

import pandas as pd

In [None]:
# Cargar datos desde un CSV

url = "https://raw.githubusercontent.com/jennybc/gapminder/master/inst/extdata/gapminder.tsv"
datos_df = pd.read_csv(url, delimiter='\t')

In [None]:
# Mostrar las primeras filas del DataFrame

print("Primeras filas del DataFrame: \n")
datos_df.head()

Primeras filas del DataFrame: 



Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap
0,Afghanistan,Asia,1952,28.801,8425333,779.445314
1,Afghanistan,Asia,1957,30.332,9240934,820.85303
2,Afghanistan,Asia,1962,31.997,10267083,853.10071
3,Afghanistan,Asia,1967,34.02,11537966,836.197138
4,Afghanistan,Asia,1972,36.088,13079460,739.981106


In [None]:
# Mostrar las columnas del DataFrame

print("\nColumnas del DataFrame: \n")
datos_df.columns


Columnas del DataFrame: 



Index(['country', 'continent', 'year', 'lifeExp', 'pop', 'gdpPercap'], dtype='object')

In [None]:
# Información general del DataFrame

print("\nInformación del DataFrame: \n")
datos_df.info()


Información del DataFrame: 

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1704 entries, 0 to 1703
Data columns (total 6 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   country    1704 non-null   object 
 1   continent  1704 non-null   object 
 2   year       1704 non-null   int64  
 3   lifeExp    1704 non-null   float64
 4   pop        1704 non-null   int64  
 5   gdpPercap  1704 non-null   float64
dtypes: float64(2), int64(2), object(2)
memory usage: 80.0+ KB


In [None]:
# Descripción estadística de los datos

print("\nDescripción estadística del DataFrame: \n")
datos_df.describe()


Descripción estadística del DataFrame: 



Unnamed: 0,year,lifeExp,pop,gdpPercap
count,1704.0,1704.0,1704.0,1704.0
mean,1979.5,59.474439,29601210.0,7215.327081
std,17.26533,12.917107,106157900.0,9857.454543
min,1952.0,23.599,60011.0,241.165876
25%,1965.75,48.198,2793664.0,1202.060309
50%,1979.5,60.7125,7023596.0,3531.846988
75%,1993.25,70.8455,19585220.0,9325.462346
max,2007.0,82.603,1318683000.0,113523.1329


In [None]:
# Filtrar países con una población mayor a 100 millones en el año 2007

paises_grandes = datos_df[(datos_df['year'] == 2007) & (datos_df['pop'] > 100000000)]
print("Países con población mayor a 100 millones en 2007: \n")
paises_grandes[['country', 'pop']]

Países con población mayor a 100 millones en 2007: 



Unnamed: 0,country,pop
107,Bangladesh,150448339
179,Brazil,190010647
299,China,1318683096
707,India,1110396331
719,Indonesia,223547000
803,Japan,127467972
995,Mexico,108700891
1139,Nigeria,135031164
1175,Pakistan,169270617
1619,United States,301139947


In [None]:
# Agregar una nueva columna 'pop_in_millions' que contiene la población en millones

datos_df['pop_in_millions'] = datos_df['pop'] / 1e6
print("DataFrame con nueva columna 'pop_in_millions':\n")
datos_df[['country', 'year', 'pop_in_millions']].sample(10)

DataFrame con nueva columna 'pop_in_millions':



Unnamed: 0,country,year,pop_in_millions
1305,Sao Tome and Principe,1997,0.145608
396,Czech Republic,1952,9.125183
119,Belgium,2007,10.392226
617,Guinea,1977,4.227026
834,"Korea, Dem. Rep.",1982,17.647518
438,Dominican Republic,1982,5.968349
1556,Trinidad and Tobago,1992,1.183669
1313,Saudi Arabia,1977,8.128505
300,Colombia,1952,12.350771
1414,South Africa,2002,44.433622


## Gráficas a partir de datos

In [None]:
# Importar dependencias para hacer gráficas

import plotly.express as px

In [None]:
# Filtrar datos para el año 2007

datos_2007 = datos_df[datos_df['year'] == 2007]

In [None]:
# Excluir países con una población mayor a 100 millones

datos_2007_filtrados = datos_2007[datos_2007['pop'] <= 100000000]

# Crear histograma de la población con datos filtrados

fig = px.histogram(datos_2007_filtrados, x='pop', nbins=30, title='Distribución de la Población Mundial en 2007 (Excluyendo países > 100M de habitantes)')
fig.update_xaxes(title_text='Población')
fig.update_yaxes(title_text='Número de Países')
fig.show()

In [None]:
# Gráfico de dispersión de PIB per cápita vs. Población

fig = px.scatter(datos_2007, x='gdpPercap', y='pop', size='pop', color='continent',
                 hover_name='country', log_x=True, size_max=60,
                 title='PIB per cápita vs. Población en 2007')
fig.update_xaxes(title_text='PIB per cápita (log scale)')
fig.update_yaxes(title_text='Población')
fig.show()

In [None]:
# Filtrar datos para algunos países específicos
paises_seleccionados = datos_df[datos_df['country'].isin(['China', 'India', 'United States', 'Brazil'])]

# Gráfico de líneas para ver la evolución de la población
fig = px.line(paises_seleccionados, x='year', y='pop', color='country', markers=True,
              title='Evolución de la Población en China, India, Estados Unidos y Brasil')
fig.update_xaxes(title_text='Año')
fig.update_yaxes(title_text='Población')
fig.show()