# Ejemplo Practico para Pandas con DataFrames

## 1. Inspeccion Incial del DataFrame

In [51]:
# Importacion de Librerias
import pandas as pd

In [52]:
# Crear un DataFrame a partir de un diccionario
data = {
    'Nombre' :['Ana','Luis' ,'Carlos','Lucia' ,'Martha' ,'Jorge','Sofia'],
    'Edad'   :[23,35,45,25,30,28,32],
    'Ciudad' :['CDMX','Guadalajara','Monterrey','CDMX','Puebla','CDMX','Guadalajara'],
    'Salario':[12000,15000,18000,12500,14000,13000,15500],
    'Departamento':['Ventas','Marketing','Ventas','TI','TI','Marketing','Ventas']
}

In [53]:
df = pd.DataFrame(data)
df

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
1,Luis,35,Guadalajara,15000,Marketing
2,Carlos,45,Monterrey,18000,Ventas
3,Lucia,25,CDMX,12500,TI
4,Martha,30,Puebla,14000,TI
5,Jorge,28,CDMX,13000,Marketing
6,Sofia,32,Guadalajara,15500,Ventas


## 2. Estructura y resumen del DataFrame 

In [54]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 5 columns):
 #   Column        Non-Null Count  Dtype 
---  ------        --------------  ----- 
 0   Nombre        7 non-null      object
 1   Edad          7 non-null      int64 
 2   Ciudad        7 non-null      object
 3   Salario       7 non-null      int64 
 4   Departamento  7 non-null      object
dtypes: int64(2), object(3)
memory usage: 412.0+ bytes


In [55]:
df.describe()

Unnamed: 0,Edad,Salario
count,7.0,7.0
mean,31.142857,14285.714286
std,7.335498,2078.804602
min,23.0,12000.0
25%,26.5,12750.0
50%,30.0,14000.0
75%,33.5,15250.0
max,45.0,18000.0


In [56]:
# Muestra el tamaño del DataFrame
df.shape

(7, 5)

In [57]:
# Muestra cuantas filas
df.shape[0]

7

In [58]:
# Numero del columnas
df.shape[1]

5

In [59]:
# Muestras los tipos de datos de las columnas
df.dtypes

Nombre          object
Edad             int64
Ciudad          object
Salario          int64
Departamento    object
dtype: object

In [60]:
# Muestra el nombre de las columnas
df.columns

Index(['Nombre', 'Edad', 'Ciudad', 'Salario', 'Departamento'], dtype='object')

In [61]:
# Los indices
df.index

RangeIndex(start=0, stop=7, step=1)

# 3. Seleccion de columnas y filas

In [62]:
df['Edad']

0    23
1    35
2    45
3    25
4    30
5    28
6    32
Name: Edad, dtype: int64

In [63]:
type(df['Edad'])

pandas.core.series.Series

In [64]:
df[['Edad']]

Unnamed: 0,Edad
0,23
1,35
2,45
3,25
4,30
5,28
6,32


In [65]:
type(df[['Edad']])

pandas.core.frame.DataFrame

In [66]:
df[['Nombre','Salario','Departamento']]

Unnamed: 0,Nombre,Salario,Departamento
0,Ana,12000,Ventas
1,Luis,15000,Marketing
2,Carlos,18000,Ventas
3,Lucia,12500,TI
4,Martha,14000,TI
5,Jorge,13000,Marketing
6,Sofia,15500,Ventas


## 4. Filtrado de Filas

In [67]:
#Filtrar todas las filas de los que son de CDMX
df['Ciudad']=='CDMX'

0     True
1    False
2    False
3     True
4    False
5     True
6    False
Name: Ciudad, dtype: bool

In [68]:
df[df['Ciudad']=='CDMX']

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing


In [69]:
df[df['Ciudad']=='CDMX'][['Nombre','Ciudad','Salario']]

Unnamed: 0,Nombre,Ciudad,Salario
0,Ana,CDMX,12000
3,Lucia,CDMX,12500
5,Jorge,CDMX,13000


In [70]:
df_CDMX = df[df['Ciudad']=='CDMX']

In [71]:
df_CDMX

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing


In [72]:
df_CDMX[['Nombre','Ciudad','Salario']]

Unnamed: 0,Nombre,Ciudad,Salario
0,Ana,CDMX,12000
3,Lucia,CDMX,12500
5,Jorge,CDMX,13000


In [73]:
#Mostrar todas las filas de la ciudad de mexico y del departamento de TI
df[(df['Ciudad']=='CDMX')&(df['Departamento']=='TI')]

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
3,Lucia,25,CDMX,12500,TI


In [74]:
#Mostrar todas las filas de la ciudad de mexico o del departamento de TI
df[(df['Ciudad']=='CDMX')|(df['Departamento']=='TI')]

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
4,Martha,30,Puebla,14000,TI
5,Jorge,28,CDMX,13000,Marketing


## 5. Ordenar Filas

In [82]:
df.sort_values(by='Salario')

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing
4,Martha,30,Puebla,14000,TI
1,Luis,35,Guadalajara,15000,Marketing
6,Sofia,32,Guadalajara,15500,Ventas
2,Carlos,45,Monterrey,18000,Ventas


In [79]:
#Ordena por salario de Forma Acendente (A-Z,0-9)
df.sort_values(by='Salario',ascending=True)

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing
4,Martha,30,Puebla,14000,TI
1,Luis,35,Guadalajara,15000,Marketing
6,Sofia,32,Guadalajara,15500,Ventas
2,Carlos,45,Monterrey,18000,Ventas


In [81]:
#Ordena por salario de Forma Acendente (Z-A,9-0)
df.sort_values(by='Salario',ascending=False)

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
2,Carlos,45,Monterrey,18000,Ventas
6,Sofia,32,Guadalajara,15500,Ventas
1,Luis,35,Guadalajara,15000,Marketing
4,Martha,30,Puebla,14000,TI
5,Jorge,28,CDMX,13000,Marketing
3,Lucia,25,CDMX,12500,TI
0,Ana,23,CDMX,12000,Ventas


In [83]:
# Ordenar por el salario y la ciudad
df.sort_values(by=['Ciudad','Salario'])

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing
1,Luis,35,Guadalajara,15000,Marketing
6,Sofia,32,Guadalajara,15500,Ventas
2,Carlos,45,Monterrey,18000,Ventas
4,Martha,30,Puebla,14000,TI


In [84]:
# Ordena primero la ciudad de forma acendente y el salario de forma decendente
df.sort_values(by=['Ciudad','Salario'], ascending=[True,False])

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
5,Jorge,28,CDMX,13000,Marketing
3,Lucia,25,CDMX,12500,TI
0,Ana,23,CDMX,12000,Ventas
6,Sofia,32,Guadalajara,15500,Ventas
1,Luis,35,Guadalajara,15000,Marketing
2,Carlos,45,Monterrey,18000,Ventas
4,Martha,30,Puebla,14000,TI


In [85]:
# Ordename de forma decendente la ciudad y de forma acendende el Salario
df.sort_values(by=['Ciudad','Salario'], ascending=[False,True])

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
4,Martha,30,Puebla,14000,TI
2,Carlos,45,Monterrey,18000,Ventas
1,Luis,35,Guadalajara,15000,Marketing
6,Sofia,32,Guadalajara,15500,Ventas
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing


In [88]:
df[(df['Ciudad']=='CDMX')|(df['Departamento']=='TI')].sort_values(by=['Edad','Departamento'],ascending=[True,False])

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing
4,Martha,30,Puebla,14000,TI


## 6. Crear Nuevas Columnas

In [89]:
df['SalarioAnual']=df['Salario']*12

In [90]:
df

Unnamed: 0,Nombre,Edad,Ciudad,Salario,Departamento,SalarioAnual
0,Ana,23,CDMX,12000,Ventas,144000
1,Luis,35,Guadalajara,15000,Marketing,180000
2,Carlos,45,Monterrey,18000,Ventas,216000
3,Lucia,25,CDMX,12500,TI,150000
4,Martha,30,Puebla,14000,TI,168000
5,Jorge,28,CDMX,13000,Marketing,156000
6,Sofia,32,Guadalajara,15500,Ventas,186000
