# index_col
#set_index
# multiIndex

In [1]:
import pandas as pd

## index_col

In [6]:
# Transformamos la columna 0 (name) en el índice
data = pd.read_csv('marks.csv', index_col = [0])
data

Unnamed: 0_level_0,Marks,Grades
Name,Unnamed: 1_level_1,Unnamed: 2_level_1
Priyang,98,AA
Aadhya,89,AB
Krisha,99,AA
Vedant,87,AB
Parshv,90,AC
Mittal,83,BA
Archana,82,BB


In [7]:
# También se pueden escribir los nombres de las columnas
data = pd.read_csv('marks.csv', index_col = ['Grades'])
data

Unnamed: 0_level_0,Name,Marks
Grades,Unnamed: 1_level_1,Unnamed: 2_level_1
AA,Priyang,98
AB,Aadhya,89
AA,Krisha,99
AB,Vedant,87
AC,Parshv,90
BA,Mittal,83
BB,Archana,82


## set_index

In [18]:
# Una vez cargado el dataframe, podemos establecer alguna columna como índice
data = pd.read_csv('marks.csv')
data = data.set_index('Name')
data

Unnamed: 0_level_0,Marks,Grades
Name,Unnamed: 1_level_1,Unnamed: 2_level_1
Priyang,98,AA
Aadhya,89,AB
Krisha,99,AA
Vedant,87,AB
Parshv,90,AC
Mittal,83,BA
Archana,82,BB


## multiIndex

In [23]:
# Podemos crear índices con más de una columna
data = pd.read_csv('marks.csv', index_col = ['Name', 'Marks'])
data

Unnamed: 0_level_0,Unnamed: 1_level_0,Grades
Name,Marks,Unnamed: 2_level_1
Priyang,98,AA
Aadhya,89,AB
Krisha,99,AA
Vedant,87,AB
Parshv,90,AC
Mittal,83,BA
Archana,82,BB


## header

In [26]:
# El data frame no tiene encabezado, toma la primera fila del encabezado
data = pd.read_csv('marks_2.csv')
data

Unnamed: 0.1,Unnamed: 0,data,Unnamed: 2
0,Name,Marks,Grades
1,Priyang,98,AA
2,Aadhya,89,AB
3,Krisha,99,AA
4,Vedant,87,AB
5,Parshv,90,AC
6,Mittal,83,BA
7,Archana,82,BB


In [27]:
# Usando header, convertimos a la fila 1 en el encabezado
data = pd.read_csv('marks_2.csv', header = 1)
data

Unnamed: 0,Name,Marks,Grades
0,Priyang,98,AA
1,Aadhya,89,AB
2,Krisha,99,AA
3,Vedant,87,AB
4,Parshv,90,AC
5,Mittal,83,BA
6,Archana,82,BB


In [29]:
# En este dataframe, toma una fila de información como encabezado
data = pd.read_csv('marks_2nh.csv')
data

Unnamed: 0,Priyang,98,AA
0,Aadhya,89,AB
1,Krisha,99,AA
2,Vedant,87,AB
3,Parshv,90,AC
4,Mittal,83,BA
5,Archana,82,BB


In [31]:
# Indicamos que no hay encabezado
data = pd.read_csv('marks_2nh.csv', header = None)
data

Unnamed: 0,0,1,2
0,Priyang,98,AA
1,Aadhya,89,AB
2,Krisha,99,AA
3,Vedant,87,AB
4,Parshv,90,AC
5,Mittal,83,BA
6,Archana,82,BB


## names

In [35]:
# Con names podemos darle nombre a las columnas
data = pd.read_csv('marks_2nh.csv', names = [1, 2, 3])
data

Unnamed: 0,1,2,3
0,Priyang,98,AA
1,Aadhya,89,AB
2,Krisha,99,AA
3,Vedant,87,AB
4,Parshv,90,AC
5,Mittal,83,BA
6,Archana,82,BB


In [36]:
# También podemos dar valores string
data = pd.read_csv('marks_2nh.csv', names = ['Name', 'Marks', 'Grades'])
data

Unnamed: 0,Name,Marks,Grades
0,Priyang,98,AA
1,Aadhya,89,AB
2,Krisha,99,AA
3,Vedant,87,AB
4,Parshv,90,AC
5,Mittal,83,BA
6,Archana,82,BB


In [40]:
# También podemos dar valores contenidos en una lista
columns_name = ['Name', 'Marks', 'Grades']
data = pd.read_csv('marks_2nh.csv', names = columns_name)
data

Unnamed: 0,Name,Marks,Grades
0,Priyang,98,AA
1,Aadhya,89,AB
2,Krisha,99,AA
3,Vedant,87,AB
4,Parshv,90,AC
5,Mittal,83,BA
6,Archana,82,BB


In [38]:
# Si el archivo ya tiene nombre de columnas y queremos modificarlos
# debemos usar header = 0
data = pd.read_csv('marks.csv', names = ['aa', 'bb', 'cc'], header = 0)
data

# NOTA: nombres de columna repetidos no son permitidos

Unnamed: 0,aa,bb,cc
0,Priyang,98,AA
1,Aadhya,89,AB
2,Krisha,99,AA
3,Vedant,87,AB
4,Parshv,90,AC
5,Mittal,83,BA
6,Archana,82,BB
