# Aprendiendo Pandas

## Importar dependencias

In [None]:
import pandas as pd

## Series de Pandas

a. Crear una Serie llamada 'height' con datos de altura de personas en centímetros

In [None]:
height_cm = [165, 180, 171, 155, 170, 167, 188, 201]
height = pd.Series(height_cm)

In [None]:
height

b. Mostrar los primeros 5 elementos de la Serie 'height'

In [None]:
height.head()

c. Mostrar los primeros 2 elementos de la Serie 'height'

In [None]:
height.head(2)

d. Ordenar la Serie 'height' en orden ascendente

In [None]:
height.sort_values()

e. Obtener el valor máximo, mínimo, promedio y suma de la Serie `height`

In [None]:
height.max()

In [None]:
height.min()

In [None]:
height.mean()

In [None]:
height.sum()

f. Obtener estadísticas descriptivas de la Serie `height`

In [None]:
height.describe()

g. Contar el número de elementos en la Serie `height`

In [None]:
height.count()

h. Filtrar la Serie `height` para obtener las alturas mayores que 170 cm

In [None]:
height > 170

In [None]:
height[height > 170]

In [None]:
height[height > 170].count()

## Dataframes de Pandas

a. Crear un DataFrame llamado `people` con datos de personas

In [None]:
data = {
    "name": ["Stephanie", "Karen", "Brian", "Travis", "Evan"],
    "birth_date": ["1994-09-25", "2002-05-01", "1992-03-12", "1995-07-11", "1992-09-29"],
    "height_cm": [153.20, 172.34, 187.57, 196.06, 163.61],
    "weight_kg": [110.11, 96.80, 86.28, 67.14, 55.26]
}

In [None]:
people = pd.DataFrame(data)

In [None]:
people.head(2)

b. Obtener estadísticas descriptivas del DataFrame `people`

In [None]:
people.describe()

c. Filtrar las personas con peso menor a 80 kg

In [None]:
people.weight_kg < 80.0

In [None]:
people[people.weight_kg < 80]

d. Mostrar solo la columna `birth_date` de las personas con peso menor a 80 kg

In [None]:
people[people.weight_kg < 80].birth_date

e. Obtener estadísticas descriptivas de las personas con peso menor a 80 kg

In [None]:
people[people.weight_kg < 80].describe()

f. Leer datos desde el archivo CSV `workers.csv` en un DataFrame

In [None]:
people = pd.read_csv("workers.csv", index_col="id")

g. Mostrar los primeros elementos del DataFrame 'people'

In [None]:
people.head()

h. Contar el número de elementos en el DataFrame 'people'

In [None]:
people.count()

i. Filtrar las personas con peso menor a 80 kg en el DataFrame 'people'

In [None]:
people.weight_kg < 80

In [None]:
people[people.weight_kg < 80].head()

j. Guardar el resultado en un nuevo DataFrame `people_under_80kg`

In [None]:
people_under_80kg = people[people.weight_kg < 80]

In [None]:
people_under_80kg.head()

In [None]:
people_under_80kg.count()

k. Leer datos desde el archivo CSV: `workers_info.csv` en un nuevo DataFrame `company`

In [None]:
company = pd.read_csv("workers_info.csv")

In [None]:
company.head()

l. Unir los DataFrames `people` y `company` usando la columna `id`

In [None]:
workers = people.merge(company, left_on="id", right_on="id")

In [None]:
workers.head()

m. Convertir las letras en la columna `worker_id` a mayúsculas

In [None]:
workers.loc[:, "worker_id"].str.upper()

In [None]:
workers.loc[:, "worker_id"] = workers.loc[:, "worker_id"].str.upper()

In [None]:
workers.head()

n. Cambiar la primera letra a mayúscula en la columna `job`

In [None]:
workers.loc[:, "job"] = workers.loc[:, "job"].str.title()

In [None]:
workers.head()

ñ. Agregar una columna `registration-year` que contenga el año en que el trabajador empezó

In [None]:
# Convertir la columna registration_date a tipo Date
workers["registration_date"] = pd.to_datetime(workers["registration_date"], format="%Y-%m-%d")

In [None]:
workers.dtypes

In [None]:
workers["registration-year"] = workers.registration_date.dt.year

In [None]:
workers.head()

o. Agregar una columna `registration-year-month` que contiene el año y mes de inicio

In [None]:
workers["registration-year-month"] = workers.registration_date.dt.strftime("%Y-%m")

In [None]:
workers.head()

p. Filtrar trabajadores en compañía tipo `LLC`

In [None]:
workers[workers["company"].str.contains("LLC")]