## 📘 Domina tus datos con Pandas: Fundamentos esenciales para todo Analista 🐼

---

👨‍💻 Autor: Brayan Neciosup  
📍 Portafolio: [brayanneciosup](https://bryanneciosup626.wixsite.com/brayandataanalitics)  
🔗 LinkedIn: [linkedin.com/brayanneciosup](https://www.linkedin.com/in/brayan-rafael-neciosup-bola%C3%B1os-407a59246/)  
💻 GitHub: [github.com/BrayanR03](https://github.com/BrayanR03)  
📚 Serie: Fundamentos de Pandas y Polars


In [5]:
# Instalar librería: pip install pandas
# Importamos la librería
import pandas as pd

### 📌 Dataframes en Pandas: ...

#### ✅ OPERACIONES CON DATAFRAMES EN PANDAS 🐼

In [11]:
df_example = pd.DataFrame(data=[["BRAYAN",15,13],["RAFAEL",25,19],["PEPITO",20,10]],
                          columns=["Nombre","Edad","Nota"])
df_example.head()

Unnamed: 0,Nombre,Edad,Nota
0,BRAYAN,15,13
1,RAFAEL,25,19
2,PEPITO,20,10


In [12]:
# A). OBTENER EL VALOR O VALORES DE LA COLUMNA DE UN DATAFRAME MEDIANTE SU NOMBRE.

"""
    📝 SINTAXIS: 
    
        dataframe_nombre[NombreColumna] ⬅️ Llamamos al dataframe directamente o
        print(dataframe_nombre[NombreColumna]) ⬅️ Usamos print()
        
        **Importante: Cuando llamamos con solo un par de corchetes "[]", muestra los resultados,
                      pero, si llamamos con dos pares de corchetes "[[]]" traerá el nombre de la columna.
                      
        ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables. 
"""
# 💡 EJEMPLO 1: Usando un par de corchetes "[]"
# df_example["Nota"]
# print(df_example[["Nota"]])

# 💡 EJEMPLO 2: Usando dos pares de corchetes "[[]]"
# print(df_example[["Nota"]])
# df_example[["Nota"]]

# 💡 EJEMPLO 3: Obtener valores de varias columnas
df_example[["Nota","Nombre"]]

Unnamed: 0,Nota,Nombre
0,13,BRAYAN
1,19,RAFAEL
2,10,PEPITO


In [14]:
# B). OBTENER UNA FILA DE VALORES ESPECÍFICAS DEL DATAFRAME

"""
    📝 SINTAXIS:
    
        dataframe_nombre.iloc[NumeroIndice] ⬅️ Recordemos que el indice empieza en 0.
        
        ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables.
"""

# 💡 EJEMPLO 1: NÚMERO DE ÍNDICE CORRECTO ✅ 
# df_example.iloc[2] # ⬅️ Número de indice: 2.
print(df_example.iloc[2]) # ⬅️ Número de indice: 2.

## 💡 EJEMPLO 2: NÚMERO DE ÍNDICE INCORRECTO ❌ 

## df_example.iloc[3] # ⬅️ Número de indice: 3.
## print(df_example.iloc[3]) # ⬅️ Número de indice: 3.  
## ❌ Error: Índice fuera de los límites

Nombre    PEPITO
Edad          20
Nota          10
Name: 2, dtype: object


In [15]:
# C). OBTENER UN VALOR ESPECÍFICO DE UN REGISTRO, BASADO EN SU NÚMERO DE ÍNDICE
#     Y EL NOMBRE DE UNA COLUMNA.
"""
    📝 SINTAXIS: 
    
        dataframe_nombre.loc[NumeroIndice,NombreColumna] ⬅️ Establecemos 2 parámetros en .loc[]
        
        ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables.
"""
# 💡 EJEMPLO: 
# df_example.loc[1,"Nota"] # ⬅️ Accedemos a la fila con índice 1 y la columna de nombre Nota.
print(df_example.loc[1,"Nota"]) # ⬅️ Accedemos a la fila con índice 1 y la columna de nombre Nota.

19


In [16]:
# D). FILTRAR VALORES EN UN DATAFRAME:

""" 
    Para realizar el filtro de valores debemos de llamar al Dataframe 
    y luego entre corchetes volver a llamar al Dataframe y una
    columna específica con una condición a evaluar.
    
     📝 SINTAXIS:
     
        dataframe_nombre[dataframe_nombre[NombreColumna] + condición] ⬅️ La condición pueden ser mediante operadores lógicos
                                                                         pero, respetando el requerimiento a filtrar.
                                                                         
        condiciones = ( > || < || >= || <= || != ) ⬅️ Operadores lógicos 
        
        ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables.
"""
# 💡 EJEMPLO 1: USANDO OPERADORES LÓGICOS (EN UNA COLUMNA)

# df_example[df_example["Nota"]>15] # ⬅️ Notas mayores a 15
# df_example[df_example["Nombre"]!='RAFAEL'] # ⬅️ Todos los nombre diferentes a RAFAEL


# 💡 EJEMPLO 2: USANDO OPERADORES LÓGICOS (EN MÁS DE UNA COLUMNA)

# df_example[(df_example["Edad"]==20) & (df_example["Nota"]==10)] # ⬅️ Edad igual a 20 y Nota 10. (2 columnas)
### ➡️ Cada condición de filtro, la debemos separar mediante paréntesis ().


""" 
    También podemos usar el método .query() para realizar filtrados en una sola linea,
    llamando directamente a las columnas dentro de las comillas simples ''. Sin embargo,
    si requerimos filtrar en columnas tipo String, el valor debe estar dentro de comillas dobles "".
    
    ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables.
    
    📝 SINTAXIS:
    
        dataframe_filtrado = dataframe_nombre.query('NombreColumna1 + condición1 and|or NombreColumna2 + condición2 ') ⬅️ Utilizamos and y or
"""

# 💡 EJEMPLO 3:

# df_filtrado = df_example.query('Nombre=="RAFAEL" and Nota==19') # Filtrando por dos columnas (Usamos and)
# df_filtrado.head()

# 💡 EJEMPLO 4:

df_filtrado = df_example.query('Edad==20 or Nota==19') # Filtrando por dos columnas (Usamos or)
df_filtrado.head()

Unnamed: 0,Nombre,Edad,Nota
1,RAFAEL,25,19
2,PEPITO,20,10


In [17]:
# E). AGREGAR UNA O VARIAS COLUMNAS AL DATAFRAME:

"""
    La o las columnas agregadas al dataframe son el resultado de nueva información
    o de cálculos realizados entre las columnas existentes del dataframe.
    
    📝 SINTAXIS:

        dataframe_nombre["NuevaColumna"] = [NuevaInformacion] || dataframe_nombre["NombreColumna1"] + 10
        
    ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables.
"""

# 💡 EJERCICIO 1: NUEVA COLUMNA CON INFORMACIÓN

df_example["Puntaje"] = [1,2,3] # ⬅️ Recodemos que para esta forma de agregar información
                                #    debe contener la misma cantidad de datos que 
                                #    el total de registros.
# df_example.head()

# 💡 EJERCICIO 2: NUEVA COLUMNA CALCULADA

df_example["Ranking"] = df_example["Nota"] * df_example["Puntaje"] # ⬅️ Recordemos que debemos acceder 
                                                                   #    a las columnas a través de los corchetes [].
df_example.head()

Unnamed: 0,Nombre,Edad,Nota,Puntaje,Ranking
0,BRAYAN,15,13,1,13
1,RAFAEL,25,19,2,38
2,PEPITO,20,10,3,30


In [18]:
# F). ELIMINAR COLUMNAS DEL DATAFRAME:

"""
    📝 SINTAXIS:
    
        dataframe_nombre.drop(columns=["NombreDeColumnaEliminar"], inplace=True | False)
        
    💡 Importante: Al llamar a la propiedad inplace y establecer el valor en True, eliminamos
                   la columna del dataframe original. Sin embargo, al no llamar al parámetros
                   inplace o llamarlo pero estableciendo un valor false, Pandas devuelve una
                   copia del Dataframe sin las columnas eliminadas.

    ### 🧠 En este caso, si eliminamos directamente en el dataframe, no hay necesidad
    ###     de almacenarlo en una variable, pero, si en caso requeramos, realizaremos una copia
    ###     del dataframe original y eliminamos la columna.
"""

# 💡 EJEMPLO 1:
# df_example.drop(columns="Ranking",inplace=True) # ⬅️ Establecemos True en inplace ✅
# df_example.head() # ⬅️ Verificamos que si se elimino correctamente la columna

### 💡 EJEMPLO 2:
### df_example.drop(columns="Ranking",inplace=False) # ⬅️ Establecemos False en inplace ❌
### df_example.head() # ⬅️ Verificamos que NO SE ELIMINÓ correctamente la columna ❌

# 💡 EJEMPLO 3:
df_copia = df_example.copy() # ⬅️ Método .copy() que permite copiar el dataframe a otra variable.
df_copia.drop(columns="Ranking",inplace=True) # ⬅️ Establecemos True en inplace ✅
df_copia.head() # ⬅️ Verificamos que si se elimino correctamente la columna


Unnamed: 0,Nombre,Edad,Nota,Puntaje
0,BRAYAN,15,13,1
1,RAFAEL,25,19,2
2,PEPITO,20,10,3


In [19]:
# G). ORDERNAR LOS DATOS DEL DATAFRAME POR UNA O VARIAS COLUMNAS

"""
    📝 SINTAXIS: 

        dataframe_nombre.sort_values(by='ColumnaAOrdenar',ascending= True | False) ⬅️ Ordenamos por los nombres de columnas
        
    💡 Importante: Al establecer el valor de ascending en True, los datos se ordenan
                   de menor a mayor por la columna que especifiquemos. Sin embargo, sino 
                   llamamos a la propiedad ascending o por el contrario, se establece el valor en False,
                   los datos se ordenan de mayor a menor.
                   
        ### 🧠 Tengamos en cuenta que podemos almacenar el resultado de estas operaciones en variables.
"""
# 💡 EJEMPLO 1: ➡️ Ordenamos Alfabéticamente (A-Z)

# df_example.sort_values(by="Nombre",ascending=True).head()

# 💡 EJEMPLO 2: ➡️ Ordenamos Alfabéticamente (Z-A)

# df_example.sort_values(by="Nombre",ascending=False).head()

# 💡 EJEMPLO 3: ➡️ Ordenamos por columna Numérica (De mayor a menor)

# df_example.sort_values(by="Edad",ascending=False).head()

# 💡 EJEMPLO 4: ➡️ Ordenamos por columna Numérica (De menor a mayor)

df_example.sort_values(by="Edad",ascending=True).head()


Unnamed: 0,Nombre,Edad,Nota,Puntaje,Ranking
0,BRAYAN,15,13,1,13
2,PEPITO,20,10,3,30
1,RAFAEL,25,19,2,38
