### Ejemplo practico para pandas con DataFames 

## Inspeccion Inicial del Dataframe 

In [3]:
# importacion de librerias 
import pandas as pd


In [4]:
# crear un data frame a partir de un diccionario 
data = {
    'nombre' : ['Ana','Luis','Carlos','Lucia','Martha','Jorge','Sofia'],
    'edad' : [23,35,45,25,30,28,32],
    'ciudad' : ['CDMX','Guadalajara','Monterrey','CDMX','Puebla','CDMX','Guadalajara'],
    'Salario' : [12000,15000,18000,12500,14000,13000,15500],
    'Departamento' : ['Ventas','Marketing','Ventas','TI','TI','Marketing','Ventas']
}

In [5]:
df = pd.DataFrame(data)
df

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
1,Luis,35,Guadalajara,15000,Marketing
2,Carlos,45,Monterrey,18000,Ventas
3,Lucia,25,CDMX,12500,TI
4,Martha,30,Puebla,14000,TI
5,Jorge,28,CDMX,13000,Marketing
6,Sofia,32,Guadalajara,15500,Ventas


## 2. Estructura y resumen del DataFrame

In [6]:
df.describe()

Unnamed: 0,edad,Salario
count,7.0,7.0
mean,31.142857,14285.714286
std,7.335498,2078.804602
min,23.0,12000.0
25%,26.5,12750.0
50%,30.0,14000.0
75%,33.5,15250.0
max,45.0,18000.0


In [7]:
# muestra el tamano del data
df.shape

(7, 5)

In [8]:
# numero de filas
df.shape[0]

7

In [9]:
# el numero de columnas 
df.shape[1]

5

In [10]:
# tipos de datos columnas 
df.dtypes

nombre          object
edad             int64
ciudad          object
Salario          int64
Departamento    object
dtype: object

In [11]:
#columnas 
df.columns

Index(['nombre', 'edad', 'ciudad', 'Salario', 'Departamento'], dtype='object')

In [12]:
#indices 
df.index

RangeIndex(start=0, stop=7, step=1)

## 3. Selección de columnas y filas 

In [13]:
# selecciona una sola columna de df como una serie 
df['edad']

0    23
1    35
2    45
3    25
4    30
5    28
6    32
Name: edad, dtype: int64

In [14]:
type(df['edad'])

pandas.core.series.Series

In [15]:
df[['edad']]

Unnamed: 0,edad
0,23
1,35
2,45
3,25
4,30
5,28
6,32


In [16]:
df[['nombre','Salario','Departamento']]

Unnamed: 0,nombre,Salario,Departamento
0,Ana,12000,Ventas
1,Luis,15000,Marketing
2,Carlos,18000,Ventas
3,Lucia,12500,TI
4,Martha,14000,TI
5,Jorge,13000,Marketing
6,Sofia,15500,Ventas


## 4.Filtrado de filas 

In [17]:
# Faltar todas la filas de la ciudad CDMX

df[df['ciudad'] == 'CDMX']

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing


In [18]:
df[df['ciudad'] == 'CDMX'][['nombre','ciudad','Salario']]

Unnamed: 0,nombre,ciudad,Salario
0,Ana,CDMX,12000
3,Lucia,CDMX,12500
5,Jorge,CDMX,13000


In [19]:
df_cdmx = df[df['ciudad'] == 'CDMX']

In [20]:
df_cdmx [['nombre','ciudad','Salario']]

Unnamed: 0,nombre,ciudad,Salario
0,Ana,CDMX,12000
3,Lucia,CDMX,12500
5,Jorge,CDMX,13000


In [21]:
# Mostar todas las filas de CDMX y del departamento de Ti
df[(df['ciudad'] == 'CDMX') & (df['Departamento'] == 'TI')]

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento
3,Lucia,25,CDMX,12500,TI


In [22]:
# Mostar todas las filas de CDMX o del departamento de Ti
df[(df['ciudad'] == 'CDMX') | (df['Departamento'] == 'TI')]

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
4,Martha,30,Puebla,14000,TI
5,Jorge,28,CDMX,13000,Marketing


## Ordenar filas 

In [25]:
# ordena de forma ascendente A-Z o  0-9
df.sort_values(by='Salario', ascending=True)

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing
4,Martha,30,Puebla,14000,TI
1,Luis,35,Guadalajara,15000,Marketing
6,Sofia,32,Guadalajara,15500,Ventas
2,Carlos,45,Monterrey,18000,Ventas


In [26]:
# ordena de forma desendente Z-A o  9-0
df.sort_values(by='Salario', ascending=False)

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento
2,Carlos,45,Monterrey,18000,Ventas
6,Sofia,32,Guadalajara,15500,Ventas
1,Luis,35,Guadalajara,15000,Marketing
4,Martha,30,Puebla,14000,TI
5,Jorge,28,CDMX,13000,Marketing
3,Lucia,25,CDMX,12500,TI
0,Ana,23,CDMX,12000,Ventas


In [27]:
# Ordenar por el salario y la ciudad 
df.sort_values(by=['ciudad','Salario'])

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing
1,Luis,35,Guadalajara,15000,Marketing
6,Sofia,32,Guadalajara,15500,Ventas
2,Carlos,45,Monterrey,18000,Ventas
4,Martha,30,Puebla,14000,TI


In [29]:
# Ordenar por el salario y la ciudad 
df.sort_values(by=['ciudad','Salario'], ascending=[True,True])

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing
1,Luis,35,Guadalajara,15000,Marketing
6,Sofia,32,Guadalajara,15500,Ventas
2,Carlos,45,Monterrey,18000,Ventas
4,Martha,30,Puebla,14000,TI


In [30]:
# Ordenar por el salario y la ciudad 
df.sort_values(by=['ciudad','Salario'], ascending=[True,False])

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento
5,Jorge,28,CDMX,13000,Marketing
3,Lucia,25,CDMX,12500,TI
0,Ana,23,CDMX,12000,Ventas
6,Sofia,32,Guadalajara,15500,Ventas
1,Luis,35,Guadalajara,15000,Marketing
2,Carlos,45,Monterrey,18000,Ventas
4,Martha,30,Puebla,14000,TI


In [31]:
# Ordenar por el salario y la ciudad 
df.sort_values(by=['ciudad','Salario'], ascending=[False,True])

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento
4,Martha,30,Puebla,14000,TI
2,Carlos,45,Monterrey,18000,Ventas
1,Luis,35,Guadalajara,15000,Marketing
6,Sofia,32,Guadalajara,15500,Ventas
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing


In [33]:
df[(df['ciudad'] == 'CDMX') | (df['Departamento'] == 'TI')].sort_values(by=['edad','Departamento'],ascending=[True,False])

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento
0,Ana,23,CDMX,12000,Ventas
3,Lucia,25,CDMX,12500,TI
5,Jorge,28,CDMX,13000,Marketing
4,Martha,30,Puebla,14000,TI


## 6. Crear nuevas columnas 

In [34]:
df['salarioAnual'] = df['Salario'] * 12

In [35]:
df

Unnamed: 0,nombre,edad,ciudad,Salario,Departamento,salarioAnual
0,Ana,23,CDMX,12000,Ventas,144000
1,Luis,35,Guadalajara,15000,Marketing,180000
2,Carlos,45,Monterrey,18000,Ventas,216000
3,Lucia,25,CDMX,12500,TI,150000
4,Martha,30,Puebla,14000,TI,168000
5,Jorge,28,CDMX,13000,Marketing,156000
6,Sofia,32,Guadalajara,15500,Ventas,186000
