<center><img src="img/pandas.png"></center>


<h1>PanDas (PANel DAta)</h1>
<p><em><b>Documentación pandas:</b> <a href="https://pandas.pydata.org/docs/">https://pandas.pydata.org/docs/</a></em></p>
<p>Es una librería de Python que proporciona herramientas de análisis y manipulación de datos de alto rendimiento, utilizando potentes estructuras de datos.</p>
<p>Esta librería permite trabajar las 5 etapas del procesamiento y análisis de datos, independientemente de su origen: cargar, preparar, manipular, modelar y analizar.</p>
<center><img src="img/procesos.png"></center>
<p>PanDas nos permite crear distintos dataframes.</p>

<h2>Dataframes</h2>
<p>Un dataframe es una estructura bi-dimensional de datos etiquetados, con columnas de tipos potencialmente diferentes. En palabras simples: una tabla.</p>

<p>Los PanDas dataframes constan de tres componentes principales:</p>
<ul>
<li>los datos</li>
<li>el índice</li>
<li>las columnas</li>
</ul>
<p>Cuando un dataframe es de una sola dimensión, se lo llama <b>serie</b>.<p>
<p>A los nombres de filas y columnas también se los llama <b>labels</b>.</p>

<center><img src="img/df1.png"></center>

<h4>Comparación entre serie de PanDas y array de 1 dimensión de NumPy</h4>
<center><img src="img/df2.png"></center>
<h4>Comparación entre dataframe de PanDas y array de 2 dimensiones de NumPy</h4>
<center><img src="img/df3.png"></center>


<h2>Instalación</h2>
<p>Al igual que NumPy, necesitamos instalar PanDas para trabajar fuera de notebooks, para después poder importarlo a nuestros proyectos.</p>
<p>Recordá trabajar dentro de un entorno virtual antes de instalar nuevos paquetes.</p>
<p>Desde la terminal del SO ejecutamos:</p>
<center><img src="img/instalar.png"></center>

In [1]:
# NO SE OLVIDEN DE EJECUTAR ESTE CUADRO!!!
# IMPORTAMOS LA LIBRERÍA PARA NUESTRO PRIMER PROYECTO
import pandas as pd
# ES USUAL TRABAJAR CON LAS LIBRERÍAS PANDAS Y NUMPY EN SIMULTÁNEO
import numpy as np

# Series

Las series pueden almacenar CUALQUIER tipo de dato.

In [2]:
# Creando series
# se puede crear una serie utilizando una lista, numpy array o diccionario

labels = ["a", "b", "c"]
mi_lista = [10, 20, 30]
arr = np.array(mi_lista)

In [3]:
# creando una serie a partir de una lista :

pd.Series(data=mi_lista)

# Es un RETORNO, no estamos guardando la serie en ningun lado.

0    10
1    20
2    30
dtype: int64

In [4]:
# creamos una serie a partir de una lista (mi_lista)
# pero utilizamos como indices 'labels' , creado anteriormente
# por lo tanto nuestros indices ya no son 0, 1 ,2 sino que a, b, c

pd.Series(data=mi_lista, index=labels)

a    10
b    20
c    30
dtype: int64

In [5]:
# Otra manera de crear una serie con indices 'labels'
pd.Series(arr)
pd.Series(arr, labels)

a    10
b    20
c    30
dtype: int64

In [6]:
# Funciones nativas de python en Pandas
#se puede almacenar CUALQUIER tipo de dato.abs
pd.Series( [sum, print, len] )

0      <built-in function sum>
1    <built-in function print>
2      <built-in function len>
dtype: object

In [7]:
serie_uno = pd.Series( data=[1, 2, 3, 4], index=["Argentina", "Brasil", "Chile", "Uruguay"])

serie_uno

# por DEFAULT si no indico 'index'a las series, los crea automaticamente numerico.
# A través de los indices puedo acceder a los valores

Argentina    1
Brasil       2
Chile        3
Uruguay      4
dtype: int64

## Importando sets de datos

In [8]:
# Para importar archivos de extensión .xlsx
# método pd.read_excel('nombre_archivo.xlsx')

# Para importar archivos de extensión .csv
# método pd.read_csv('nombre_archivo.csv')

pd.read_csv("data/ventas.csv")


Unnamed: 0,Fecha,Vendedor,Sede,Rubro,Marca,Importe,Comision_x_venta,Satisfaccion_cliente
0,10/02/2022,Juliet Glynne,Paternal,equipos de video,Wacom,381291,17243,10
1,17/02/2022,Mufi Panchin,Ezeiza,notebook,Samsung,111535,16691,7
2,14/04/2022,Constantine Creeber,Villa Bosch,equipos de video,Kensington,418512,20934,4
3,23/03/2022,Pennie Hess,Palermo,TV,Engel,236222,17952,9
4,28/03/2022,Timmy Ashlin,Villa Crespo,electrodomésticos,Kensington,266683,18070,7
...,...,...,...,...,...,...,...,...
995,30/01/2022,Angelita Lambkin,San Nicolás,equipos de video,Access,163927,20933,4
996,28/05/2022,Em Edmonson,Floresta,equipos de video,Ubiquity,368788,20758,5
997,13/02/2022,Arvin Bernhardi,Boedo,equipos de video,LG,258935,21330,10
998,31/01/2022,Humfried Woodberry,San Martín,TV,Millenium,395583,17743,3


### Usando index

In [9]:
serie_uno = pd.Series( data=[1,2,3,4] , index=["Ar" , "Br" , "Jp" , "Cl"] )

serie_uno

Ar    1
Br    2
Jp    3
Cl    4
dtype: int64

In [10]:
serie_dos = pd.Series( data=[6,3,2,1] , index=["Ar" , "Ur" , "Mx" , "Br"])
serie_dos

Ar    6
Ur    3
Mx    2
Br    1
dtype: int64

In [11]:
serie_uno["Jp"]

3

In [12]:
serie_dos["Ar"]

6

In [13]:
serie_uno + serie_dos

Ar    7.0
Br    3.0
Cl    NaN
Jp    NaN
Mx    NaN
Ur    NaN
dtype: float64

NOTA: 

 Las SERIES son 'dataframes' de una sola dimensión, en cambio llamamos DATAFRAME a los 'dataframes bidimensionales'.

<h2>Creando estructuras de datos</h2>
<p>Vamos a crear la siguiente estructura:
<center><img src="img/df.png"></center>

In [14]:
# CREANDO UN DATAFRAME DESDE CERO

# Paso 1. Creamos un arreglo de Numpy

arreglo = np.array([["", "Col1", "Col2"], ["Fila1", 12, 20], ["Fila1", 32, 43]] )
print(arreglo)


[['' 'Col1' 'Col2']
 ['Fila1' '12' '20']
 ['Fila1' '32' '43']]


In [15]:
# Paso 2. Lo convertimos a dataframe, 
# especificando los tres componentes que nombramos: datos, indices y columnas

mi_df = pd.DataFrame( data=arreglo[1:,1:], index=arreglo[1:,0] , columns=arreglo [0,1:])

# los indices son las filas (los labels del index) - Eje Y
# las columnas son en el eje X

mi_df

Unnamed: 0,Col1,Col2
Fila1,12,20
Fila1,32,43


In [16]:
# Otro ejemplo:
import numpy
from numpy.random import randn

np.random.seed(101)

df= pd.DataFrame( randn(5, 4), index=["A", "B", "C", "D", "E"], columns=["W", "X", "Y", "Z"])

df

Unnamed: 0,W,X,Y,Z
A,2.70685,0.628133,0.907969,0.503826
B,0.651118,-0.319318,-0.848077,0.605965
C,-2.018168,0.740122,0.528813,-0.589001
D,0.188695,-0.758872,-0.933237,0.955057
E,0.190794,1.978757,2.605967,0.683509


In [17]:
#INDEX

df["W"]

A    2.706850
B    0.651118
C   -2.018168
D    0.188695
E    0.190794
Name: W, dtype: float64

In [18]:
df[ ["W" , "Y"] ]

Unnamed: 0,W,Y
A,2.70685,0.907969
B,0.651118,-0.848077
C,-2.018168,0.528813
D,0.188695,-0.933237
E,0.190794,2.605967


In [19]:
# Tipo de datos en las columnas

type(df["W"])

pandas.core.series.Series

In [20]:
# Creando una nueva columna
df["nueva"] = df["W"] + df["Y"]

df

Unnamed: 0,W,X,Y,Z,nueva
A,2.70685,0.628133,0.907969,0.503826,3.614819
B,0.651118,-0.319318,-0.848077,0.605965,-0.196959
C,-2.018168,0.740122,0.528813,-0.589001,-1.489355
D,0.188695,-0.758872,-0.933237,0.955057,-0.744542
E,0.190794,1.978757,2.605967,0.683509,2.796762


In [21]:
#Eliminar columna

df.drop("nueva" ,axis=1)

Unnamed: 0,W,X,Y,Z
A,2.70685,0.628133,0.907969,0.503826
B,0.651118,-0.319318,-0.848077,0.605965
C,-2.018168,0.740122,0.528813,-0.589001
D,0.188695,-0.758872,-0.933237,0.955057
E,0.190794,1.978757,2.605967,0.683509


In [22]:
df


Unnamed: 0,W,X,Y,Z,nueva
A,2.70685,0.628133,0.907969,0.503826,3.614819
B,0.651118,-0.319318,-0.848077,0.605965,-0.196959
C,-2.018168,0.740122,0.528813,-0.589001,-1.489355
D,0.188695,-0.758872,-0.933237,0.955057,-0.744542
E,0.190794,1.978757,2.605967,0.683509,2.796762


In [23]:
#Eliminar columna en el dataframe original
df.drop("nueva" , axis=1 , inplace=True) 

In [24]:
df


Unnamed: 0,W,X,Y,Z
A,2.70685,0.628133,0.907969,0.503826
B,0.651118,-0.319318,-0.848077,0.605965
C,-2.018168,0.740122,0.528813,-0.589001
D,0.188695,-0.758872,-0.933237,0.955057
E,0.190794,1.978757,2.605967,0.683509


In [25]:
#Eliminar fija

df.drop("E" , axis=0)

Unnamed: 0,W,X,Y,Z
A,2.70685,0.628133,0.907969,0.503826
B,0.651118,-0.319318,-0.848077,0.605965
C,-2.018168,0.740122,0.528813,-0.589001
D,0.188695,-0.758872,-0.933237,0.955057


In [26]:
df

Unnamed: 0,W,X,Y,Z
A,2.70685,0.628133,0.907969,0.503826
B,0.651118,-0.319318,-0.848077,0.605965
C,-2.018168,0.740122,0.528813,-0.589001
D,0.188695,-0.758872,-0.933237,0.955057
E,0.190794,1.978757,2.605967,0.683509


In [27]:
df.loc["A"]

W    2.706850
X    0.628133
Y    0.907969
Z    0.503826
Name: A, dtype: float64

In [28]:
df.iloc[2]

W   -2.018168
X    0.740122
Y    0.528813
Z   -0.589001
Name: C, dtype: float64

In [29]:
df.loc["B" , "Y"]

-0.8480769834036315

In [30]:
df.loc[["A" ,"B"] , ["W" , "Y"]  ]

Unnamed: 0,W,Y
A,2.70685,0.907969
B,0.651118,-0.848077


In [31]:
df > 0

Unnamed: 0,W,X,Y,Z
A,True,True,True,True
B,True,False,False,True
C,False,True,True,False
D,True,False,False,True
E,True,True,True,True


In [32]:
df[ df > 0]

Unnamed: 0,W,X,Y,Z
A,2.70685,0.628133,0.907969,0.503826
B,0.651118,,,0.605965
C,,0.740122,0.528813,
D,0.188695,,,0.955057
E,0.190794,1.978757,2.605967,0.683509


In [33]:
df["W"] > 0

A     True
B     True
C    False
D     True
E     True
Name: W, dtype: bool

In [34]:
df.reset_index()

Unnamed: 0,index,W,X,Y,Z
0,A,2.70685,0.628133,0.907969,0.503826
1,B,0.651118,-0.319318,-0.848077,0.605965
2,C,-2.018168,0.740122,0.528813,-0.589001
3,D,0.188695,-0.758872,-0.933237,0.955057
4,E,0.190794,1.978757,2.605967,0.683509


In [35]:
df["Paises"] = ["Argentina" , "Brasil" , "Peru" , "Ecuador" , "Chile"]

df

Unnamed: 0,W,X,Y,Z,Paises
A,2.70685,0.628133,0.907969,0.503826,Argentina
B,0.651118,-0.319318,-0.848077,0.605965,Brasil
C,-2.018168,0.740122,0.528813,-0.589001,Peru
D,0.188695,-0.758872,-0.933237,0.955057,Ecuador
E,0.190794,1.978757,2.605967,0.683509,Chile


In [36]:
df.set_index("Paises")

Unnamed: 0_level_0,W,X,Y,Z
Paises,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Argentina,2.70685,0.628133,0.907969,0.503826
Brasil,0.651118,-0.319318,-0.848077,0.605965
Peru,-2.018168,0.740122,0.528813,-0.589001
Ecuador,0.188695,-0.758872,-0.933237,0.955057
Chile,0.190794,1.978757,2.605967,0.683509


In [37]:
df

Unnamed: 0,W,X,Y,Z,Paises
A,2.70685,0.628133,0.907969,0.503826,Argentina
B,0.651118,-0.319318,-0.848077,0.605965,Brasil
C,-2.018168,0.740122,0.528813,-0.589001,Peru
D,0.188695,-0.758872,-0.933237,0.955057,Ecuador
E,0.190794,1.978757,2.605967,0.683509,Chile


## Extrayendo información de los dataframes

In [38]:
# INFORMACIÓN DE LOS DATAFRAMES

df= pd.DataFrame( randn(5, 4), index=["A", "B", "C", "D", "E"], columns=["W", "X", "Y", "Z"])

df

print("Shape: ", df.shape)  # cantidad de filas y columnas

print()

print("Filas: ", df.index)  # nos devuelve las filas
print("Cantidad de filas: ", len(df.index)) #nos devuelve la CANTIDAD de filas

print()

print("Columnas: ", df.columns)  # nos devuelve las columnas
print("Cantidad de columnas: ", len(df.columns))  # nos devuelve la CANTIDAD de columnas

print()



Shape:  (5, 4)

Filas:  Index(['A', 'B', 'C', 'D', 'E'], dtype='object')
Cantidad de filas:  5

Columnas:  Index(['W', 'X', 'Y', 'Z'], dtype='object')
Cantidad de columnas:  4



In [39]:
# ESTADÍSTICAS

print(df)

print()

print("Describe - informacion estadística")
print(df.describe())  # Nos da la información estadistica de todas las columnas

print()

print("Media: ") # nos devuelve la 'MEDIA' de las columnas (promeido)
print(df.mean())

print()

print("Mediana: ") # nos devuelve la 'MEDIANA' de las columnas (valor medio)
print(df.median())

print()

print("Valores no nulos: ") # nos devuelve los valores NO NULOS
print(df.count())

print()

print("Valores máximos: ") # nos devuelve el valor máximo de c/u de las columnas
print(df.max())

print()

print("Valores mínimos: ") # nos devuelve el valor mínimo de c/u de las columnas
print(df.min())

print()

print("Desvío standar: ") # nos devuelve el promedio de deviacion
print(df.std())


# NOTA : El metodo ' print(df.describe) ' nos devuelve TODOS los datos mencionados anteriormente
# Se presentan estos metodos para poder acceder a cada uno de ellos de manera individual

          W         X         Y         Z
A  0.302665  1.693723 -1.706086 -1.159119
B -0.134841  0.390528  0.166905  0.184502
C  0.807706  0.072960  0.638787  0.329646
D -0.497104 -0.754070 -0.943406  0.484752
E -0.116773  1.901755  0.238127  1.996652

Describe - informacion estadística
              W         X         Y         Z
count  5.000000  5.000000  5.000000  5.000000
mean   0.072331  0.660979 -0.321135  0.367287
std    0.499191  1.121089  0.971818  1.121759
min   -0.497104 -0.754070 -1.706086 -1.159119
25%   -0.134841  0.072960 -0.943406  0.184502
50%   -0.116773  0.390528  0.166905  0.329646
75%    0.302665  1.693723  0.238127  0.484752
max    0.807706  1.901755  0.638787  1.996652

Media: 
W    0.072331
X    0.660979
Y   -0.321135
Z    0.367287
dtype: float64

Mediana: 
W   -0.116773
X    0.390528
Y    0.166905
Z    0.329646
dtype: float64

Valores no nulos: 
W    5
X    5
Y    5
Z    5
dtype: int64

Valores máximos: 
W    0.807706
X    1.901755
Y    0.638787
Z    1.996652


In [40]:
# ACCESANDO FILAS/COLUMNAS


# ACCEDER A COLUMNAS:

# Una sola columna
print("Primera columna ")
print( df["W"]) # accediendo a la columna por NOMBRE
# print(df[0])  accediendo a la columna por INDICE , en caso de no tener nombre

# Si la columna - fila no tuviese nombre, se puede acceder directamente por el índice
# se puede acceder por nombre o por índice con 'df[]' en el caso de COLUMNAS.

print()

# Múltiples columnas
print("Columnas W, Y:  ")
print(df[["W" , "Y"]])  # me devulve las dos columnas: 'W' , 'Y'

print()


# ACCEDER A FILAS

# Una sola fila
print("Primera fila ")  
print(df.loc["A"])  #accediendo a la fila por NOMBRE.
# print(df.iloc[0]) # accediendo a las fila por INDICE.

# En el caso de las filas NO podemos acceder directamente como en las columnas
# Por eso utilizamos el método ' df.loc ' para poder acceder a las columnas
# Accedemos por NOMBRE con metodo 'df.loc' y por INDICE con el método 'df.iloc'

print()

# Múltiples filas
print("Filas A, B: ")
print(df.loc[["A", "B"]])

print()


# ACCEDIENDO A TODOS LOS VALORES

print("Valores: ")
print(df.values) 
# me devuelve la matriz con sus valores, no imprime los labels.

Primera columna 
A    0.302665
B   -0.134841
C    0.807706
D   -0.497104
E   -0.116773
Name: W, dtype: float64

Columnas W, Y:  
          W         Y
A  0.302665 -1.706086
B -0.134841  0.166905
C  0.807706  0.638787
D -0.497104 -0.943406
E -0.116773  0.238127

Primera fila 
W    0.302665
X    1.693723
Y   -1.706086
Z   -1.159119
Name: A, dtype: float64

Filas A, B: 
          W         X         Y         Z
A  0.302665  1.693723 -1.706086 -1.159119
B -0.134841  0.390528  0.166905  0.184502

Valores: 
[[ 0.30266545  1.69372293 -1.70608593 -1.15911942]
 [-0.13484072  0.39052784  0.16690464  0.18450186]
 [ 0.80770591  0.07295968  0.63878701  0.3296463 ]
 [-0.49710402 -0.7540697  -0.9434064   0.48475165]
 [-0.11677332  1.9017548   0.23812696  1.99665229]]


In [41]:
# Cada DataFrame está conformado pro SERIES
# cada una de las columnas del DF es una serie de Pandas, es decir q trabajamos con series

type(df["W"])  # vemos que el tipo de dato de la columna es una seire.

pandas.core.series.Series

In [42]:
# CREAMOS NUEVAS COLUMNAS

df["Nueva"] = df["W"] + df["Y"]  # se pueden realizar operaciones entre columnas

df

# El formato del DataFrame es dinámica
# no es necesario llamar un metodo para crear una nueva columna

Unnamed: 0,W,X,Y,Z,Nueva
A,0.302665,1.693723,-1.706086,-1.159119,-1.40342
B,-0.134841,0.390528,0.166905,0.184502,0.032064
C,0.807706,0.07296,0.638787,0.329646,1.446493
D,-0.497104,-0.75407,-0.943406,0.484752,-1.44051
E,-0.116773,1.901755,0.238127,1.996652,0.121354


### Eliminando columnas

In [43]:
# BORRAR COLUMNAS  (sin modificar original)

df.drop("Nueva", axis=1)  # debemos indicar el eje.

# El metodo DROP remueve la columna pero NO del DataFrame original
# Si imprimimos 'df' en nuevo cod. podemos observar que la colmn 'Nueva' todavía existe.
# Nos devuelve una COPIA del DF original



Unnamed: 0,W,X,Y,Z,Nueva
A,0.302665,1.693723,-1.706086,-1.159119,-1.40342
B,-0.134841,0.390528,0.166905,0.184502,0.032064
C,0.807706,0.07296,0.638787,0.329646,1.446493
D,-0.497104,-0.75407,-0.943406,0.484752,-1.44051
E,-0.116773,1.901755,0.238127,1.996652,0.121354


In [44]:
# BORRAR COLUMNAS (modificando el original)

df.drop("Nueva", axis=1, inplace=True)

df

# El atributo 'inplace' nos elimina DEFINITIVAMENTE la columna
# En este caso NO devuelve una copia


Unnamed: 0,W,X,Y,Z
A,0.302665,1.693723,-1.706086,-1.159119
B,-0.134841,0.390528,0.166905,0.184502
C,0.807706,0.07296,0.638787,0.329646
D,-0.497104,-0.75407,-0.943406,0.484752
E,-0.116773,1.901755,0.238127,1.996652


### Eliminando filas

In [47]:
# BORRAR FILAS (sin modificar el original)

df.drop( "E" , axis=0)

# El metodo DROP remueve la filas pero NO del DataFrame original
# Si imprimimos 'df' en nuevo cod. podemos observar que la Fila 'E' todavía existe.
# Nos devuelve una COPIA del DF original



Unnamed: 0,W,X,Y,Z
A,0.302665,1.693723,-1.706086,-1.159119
B,-0.134841,0.390528,0.166905,0.184502
C,0.807706,0.07296,0.638787,0.329646
D,-0.497104,-0.75407,-0.943406,0.484752


In [None]:
# BORRANDO FILAS (modificando el original )

#  df.drop( "E" , axis=0, inplace=True)

df

# El atributo 'inplace' nos elimina DEFINITIVAMENTE la fila
# En este caso NO devuelve una copia

### Operaciones 

In [48]:
df>0   #nos devuelve los valores booleanos que cumplen la condicion

Unnamed: 0,W,X,Y,Z
A,True,True,False,False
B,False,True,True,True
C,True,True,True,True
D,False,False,False,True
E,False,True,True,True


In [49]:
df[ df > 0 ]  # Nos devuelve los valores (no booleanos) que cumples la condicion

Unnamed: 0,W,X,Y,Z
A,0.302665,1.693723,,
B,,0.390528,0.166905,0.184502
C,0.807706,0.07296,0.638787,0.329646
D,,,,0.484752
E,,1.901755,0.238127,1.996652


In [None]:
df[df["W"] > 0 ]  # Nos devuelve SOLO los valores que SI sumplen con la condicion

### Resetear el index por default

In [53]:
# Resetea el index default

df.reset_index()

df

# Volvemos a obtener TODOS los valores que tenemos por default.

Unnamed: 0,W,X,Y,Z
A,0.302665,1.693723,-1.706086,-1.159119
B,-0.134841,0.390528,0.166905,0.184502
C,0.807706,0.07296,0.638787,0.329646
D,-0.497104,-0.75407,-0.943406,0.484752
E,-0.116773,1.901755,0.238127,1.996652


### Modificamos nuestro índice (index)

In [61]:
# Creamos una nueva columna llamada paises
df["Paises"] = ["Ar" , "Br" , "Ur" , "Cl" , "Co"]

df

# Seteamos a la columna 'Paises' como indice
# NO se modiica el DataFrame original

Unnamed: 0_level_0,W,X,Y,Z,Paises
Paises,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
Ar,0.302665,1.693723,-1.706086,-1.159119,Ar
Br,-0.134841,0.390528,0.166905,0.184502,Br
Ur,0.807706,0.07296,0.638787,0.329646,Ur
Cl,-0.497104,-0.75407,-0.943406,0.484752,Cl
Co,-0.116773,1.901755,0.238127,1.996652,Co


In [55]:
# MOFICICAMOS EL INDICE (sin cambiar el original)

df.set_index("Paises")

# Seteamos la columna paises de manera tal que sea nuestro nuevo indice
# Es una COPIA de nuestro DataFrame, NO se modifica el original


Unnamed: 0_level_0,W,X,Y,Z
Paises,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Ar,0.302665,1.693723,-1.706086,-1.159119
Br,-0.134841,0.390528,0.166905,0.184502
Ur,0.807706,0.07296,0.638787,0.329646
Cl,-0.497104,-0.75407,-0.943406,0.484752
Co,-0.116773,1.901755,0.238127,1.996652


In [57]:
df  #podemos que el DF original no tuvo modificaciones

Unnamed: 0,W,X,Y,Z,Paises
A,0.302665,1.693723,-1.706086,-1.159119,Ar
B,-0.134841,0.390528,0.166905,0.184502,Br
C,0.807706,0.07296,0.638787,0.329646,Ur
D,-0.497104,-0.75407,-0.943406,0.484752,Cl
E,-0.116773,1.901755,0.238127,1.996652,Co


In [62]:
# MODIFICAMOS EL INDICE (cambiando el original)

df.set_index("Paises", inplace=True)
df

# Seteamos la columna paises de manera tal que sea nuestro nuevo indice
# NO es una COPIA de nuestro DataFrame, en este caso SI se modica el original


Unnamed: 0_level_0,W,X,Y,Z
Paises,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Ar,0.302665,1.693723,-1.706086,-1.159119
Br,-0.134841,0.390528,0.166905,0.184502
Ur,0.807706,0.07296,0.638787,0.329646
Cl,-0.497104,-0.75407,-0.943406,0.484752
Co,-0.116773,1.901755,0.238127,1.996652


NOTA:  Podemos observar que el atributo 'inplace=True' aplicado en diferentes situaciones NOS MODIFICA EL DATAFRAME ORIGINAL, realizando los cambios indicados de manera PERMANENTE en nuestro DF.

<a style='text-decoration:none;line-height:16px;display:flex;color:#5B5B62;padding:10px;justify-content:end;' href='https://deepnote.com?utm_source=created-in-deepnote-cell&projectId=e40fd011-c645-4f60-bc8a-96a063044385' target="_blank">
 </img>
Created in <span style='font-weight:600;margin-left:4px;'>Deepnote</span></a>