<a href="https://colab.research.google.com/github/martinbedia/mineria/blob/main/pandas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Pandas
https://pandas.pydata.org/

In [2]:
import pandas as pd
import numpy as np

## Creacion de objetos
- Series: columnas de un dataframe
- DataFrame: tablas

para crear una series:
pd.Series(datos)

un data frame:
pd.DataFrame(datos)

In [9]:
s = pd.Series([1,20,3])
s

0     1
1    20
2     3
dtype: int64

In [11]:
type(s)

pandas.core.series.Series

In [12]:
s = pd.Series([1.5,20,3,'Hola'])
s


0     1.5
1      20
2       3
3    Hola
dtype: object

In [13]:
s = pd.Series(np.arange(1,5))
s

0    1
1    2
2    3
3    4
dtype: int64

In [14]:
s = pd.Series(np.array([30,20.1,50]))
s

0    30.0
1    20.1
2    50.0
dtype: float64

In [17]:
s = pd.Series([1500.32,2021.54,1890.43],
              index = ['Enero','Febrero','Marzo'],
              name = 'ventas')
s

Enero      1500.32
Febrero    2021.54
Marzo      1890.43
Name: ventas, dtype: float64

## Dataframes

In [19]:
# definicion usando una lista de tuplas

datos = [('Lunes',15),('Martes',22),('Miercoles',23)]
df = pd.DataFrame(datos)
df

Unnamed: 0,0,1
0,Lunes,15
1,Martes,22
2,Miercoles,23


In [20]:
# usando un diccionario
nombres = ['Ana','Juan','Carlos']
apellidos = ['Garcia','Perez','Diaz']

# para cada clave del diccionario me crea una columna distinta
df = pd.DataFrame({
    'nombre': nombres,
    'apellido': apellidos
})
df


Unnamed: 0,nombre,apellido
0,Ana,Garcia
1,Juan,Perez
2,Carlos,Diaz


In [24]:
df = pd.DataFrame({
    'verdadero': [48,2],
    'falso': [2,26]
}, index = ['Pregunta 1', 'Pregunta 2'])
df

Unnamed: 0,verdadero,falso
Pregunta 1,48,2
Pregunta 2,2,26


In [26]:
# usando un array de numpy
arr = np.array([
    [1,'A',10.1],
    [2,'B',20.2],
    [3,'C',30.3]
])
df = pd.DataFrame(arr)
df

Unnamed: 0,0,1,2
0,1,A,10.1
1,2,B,20.2
2,3,C,30.3


In [27]:
# para que no de por defecto los nombres de las columnas
arr = np.array([
    [1,'A',10.1],
    [2,'B',20.2],
    [3,'C',30.3]
])
df = pd.DataFrame(arr, columns= ['Columna 1', 'Columna 2', 'Columna 3'])
df

Unnamed: 0,Columna 1,Columna 2,Columna 3
0,1,A,10.1
1,2,B,20.2
2,3,C,30.3


In [29]:
df.index = ['Fila1','Fila2','Fila3']
df

Unnamed: 0,Columna 1,Columna 2,Columna 3
Fila1,1,A,10.1
Fila2,2,B,20.2
Fila3,3,C,30.3


In [32]:
nuevos_nombres = {'Fila2': 'FilaModificada'}
df.rename(index= nuevos_nombres)    # sobrescribir para que el df salgan esos valores
df = df.rename(index= nuevos_nombres)
df

Unnamed: 0,Columna 1,Columna 2,Columna 3
Fila1,1,A,10.1
FilaModificada,2,B,20.2
Fila3,3,C,30.3


In [34]:
df.set_index('Columna 1')

Unnamed: 0_level_0,Columna 2,Columna 3
Columna 1,Unnamed: 1_level_1,Unnamed: 2_level_1
1,A,10.1
2,B,20.2
3,C,30.3


Los indices pueden estar repetidos. No es como en SQL

# Exploracion

In [40]:
from numpy.random.mtrand import rand
# nombre, edad, altura en cm, puntuacion, aprobado
# ids: uo001, uo002m uo003...

# def nombre_funcion (x):
# return f'uo{x:03d}'
# si no lo tuviera dentro del vectorize
# for i in range(n):
#  nombre_funcion(x)


generar_secuencia = np.vectorize(lambda x: f'uo{x:03d}')   #completa con ceros hasta tres posiciones decimales
ids = generar_secuencia(np.arange(1,16))

datos = {'Nombre': ['Alcia', 'Bruno' ,'Carlos' , 'David', 'Elena', 'Fernando', 'gloria' , 'hector' , 'isabel', 'juan', 'laura', 'Martin', 'nuria', 'oscar', 'patricia'],
         'Edad': [25, 30, 22, 35, 28, 40, 27, 29, 32, 24, 33, 26, 31, 23, 37],
         'Altura (cm)': [165, 180, 175, 160, 170, 160, 180, 172, 165, 187, np.nan, 181, 179, 176, 186],
         'Puntuacion': np.random.randint(0, 11, size = 15)
         }

df_ejemplo = pd.DataFrame(datos,  index= ids)
df_ejemplo

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion
uo001,Alcia,25,165.0,7
uo002,Bruno,30,180.0,8
uo003,Carlos,22,175.0,10
uo004,David,35,160.0,3
uo005,Elena,28,170.0,4
uo006,Fernando,40,160.0,7
uo007,gloria,27,180.0,10
uo008,hector,29,172.0,1
uo009,isabel,32,165.0,2
uo010,juan,24,187.0,1


In [42]:
df_ejemplo.head

<bound method NDFrame.head of          Nombre  Edad  Altura (cm)  Puntuacion
uo001     Alcia    25        165.0           7
uo002     Bruno    30        180.0           8
uo003    Carlos    22        175.0          10
uo004     David    35        160.0           3
uo005     Elena    28        170.0           4
uo006  Fernando    40        160.0           7
uo007    gloria    27        180.0          10
uo008    hector    29        172.0           1
uo009    isabel    32        165.0           2
uo010      juan    24        187.0           1
uo011     laura    33          NaN           3
uo012    Martin    26        181.0           6
uo013     nuria    31        179.0           9
uo014     oscar    23        176.0           1
uo015  patricia    37        186.0           4>

In [44]:
pd.set_option('display.max_rows',5)

In [46]:
pd.reset_option('display.max_rows')
df_ejemplo

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion
uo001,Alcia,25,165.0,7
uo002,Bruno,30,180.0,8
uo003,Carlos,22,175.0,10
uo004,David,35,160.0,3
uo005,Elena,28,170.0,4
uo006,Fernando,40,160.0,7
uo007,gloria,27,180.0,10
uo008,hector,29,172.0,1
uo009,isabel,32,165.0,2
uo010,juan,24,187.0,1


Para acceder a las columnas podemos hacer:

df.nombre_columna

df['nombre_columna']    mejor esta por si hay caracteres especiales

In [51]:
df_ejemplo.Edad

uo001    25
uo002    30
uo003    22
uo004    35
uo005    28
uo006    40
uo007    27
uo008    29
uo009    32
uo010    24
uo011    33
uo012    26
uo013    31
uo014    23
uo015    37
Name: Edad, dtype: int64

In [52]:
df_ejemplo['Edad']     #mejor esta sintaxis

uo001    25
uo002    30
uo003    22
uo004    35
uo005    28
uo006    40
uo007    27
uo008    29
uo009    32
uo010    24
uo011    33
uo012    26
uo013    31
uo014    23
uo015    37
Name: Edad, dtype: int64

In [54]:
df_ejemplo['Altura (cm)'][0]   #primer valor

165.0

In [55]:
df_ejemplo[['Edad', 'Altura (cm)']]

Unnamed: 0,Edad,Altura (cm)
uo001,25,165.0
uo002,30,180.0
uo003,22,175.0
uo004,35,160.0
uo005,28,170.0
uo006,40,160.0
uo007,27,180.0
uo008,29,172.0
uo009,32,165.0
uo010,24,187.0


Para la indexacion de filas existe iloc (por indice) y loc (por etiquetas)

In [56]:
df_ejemplo.iloc[2]    # esto me devuelve una serie tambien

Nombre         Carlos
Edad               22
Altura (cm)     175.0
Puntuacion         10
Name: uo003, dtype: object

In [None]:
df_ejemplo.loc['uo003']
# si no hubieramos definido nombres para las filas podria funcionar solo el numero
# pero tenemos etiquetas (uo001...), necesitamos que en el loc vaya el nombre de la fila

In [57]:
df_ejemplo.iloc[1:4]   #devuelve las de indice 1,2,3 (segunda, tercera y cuarta fila)

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion
uo002,Bruno,30,180.0,8
uo003,Carlos,22,175.0,10
uo004,David,35,160.0,3


In [58]:
df_ejemplo.loc['uo002' : 'uo004']   # ambos limites van incluidos

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion
uo002,Bruno,30,180.0,8
uo003,Carlos,22,175.0,10
uo004,David,35,160.0,3


In [59]:
df = pd.DataFrame({
    'verdadero': [48,2,25,1],
    'falso': [2,26,25,49]
})
df

Unnamed: 0,verdadero,falso
0,48,2
1,2,26
2,25,25
3,1,49


In [61]:
df.loc[0:2]   # con el loc el limite superior se incluye

Unnamed: 0,verdadero,falso
0,48,2
1,2,26
2,25,25


In [63]:
df_ejemplo.loc['uo003','Nombre']

'Carlos'

In [64]:
df_ejemplo.iloc[-2]

Nombre         oscar
Edad              23
Altura (cm)    176.0
Puntuacion         1
Name: uo014, dtype: object

In [65]:
df_ejemplo.iloc[3,0]   #cuarta fila, primera columna

'David'

In [66]:
df_ejemplo.iloc[: , 0]   #todas las filas y la primera columna

uo001       Alcia
uo002       Bruno
uo003      Carlos
uo004       David
uo005       Elena
uo006    Fernando
uo007      gloria
uo008      hector
uo009      isabel
uo010        juan
uo011       laura
uo012      Martin
uo013       nuria
uo014       oscar
uo015    patricia
Name: Nombre, dtype: object

In [67]:
df_ejemplo.iloc[[1,3], -4:2]

Unnamed: 0,Nombre,Edad
uo002,Bruno,30
uo004,David,35


In [68]:
df_ejemplo['Altura (cm)'] > 170  # valores booleanos

uo001    False
uo002     True
uo003     True
uo004    False
uo005    False
uo006    False
uo007     True
uo008     True
uo009    False
uo010     True
uo011    False
uo012     True
uo013     True
uo014     True
uo015     True
Name: Altura (cm), dtype: bool

In [69]:
# el where nos permite filtrar utilizando los valores booleanos
# mantiene los datos que cumplen la condicion y pone NaN
# mantiene la misma shape
df_ejemplo['Altura (cm)'].where(df_ejemplo['Altura (cm)'] > 170)

uo001      NaN
uo002    180.0
uo003    175.0
uo004      NaN
uo005      NaN
uo006      NaN
uo007    180.0
uo008    172.0
uo009      NaN
uo010    187.0
uo011      NaN
uo012    181.0
uo013    179.0
uo014    176.0
uo015    186.0
Name: Altura (cm), dtype: float64

In [71]:
# en este caso no mantiene la shape, porque filtra las filas que no cumplen la condicion
# mantiene aquellas que son true
df_ejemplo.loc[df_ejemplo['Altura (cm)'] > 170]

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion
uo002,Bruno,30,180.0,8
uo003,Carlos,22,175.0,10
uo007,gloria,27,180.0,10
uo008,hector,29,172.0,1
uo010,juan,24,187.0,1
uo012,Martin,26,181.0,6
uo013,nuria,31,179.0,9
uo014,oscar,23,176.0,1
uo015,patricia,37,186.0,4


La estrucutura solo se mantiene con el where

In [72]:
df_ejemplo.loc[(df_ejemplo['Altura (cm)'] > 170) & (df_ejemplo['Edad'] <= 25)]

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion
uo003,Carlos,22,175.0,10
uo010,juan,24,187.0,1
uo014,oscar,23,176.0,1


In [75]:
datos = np.random.randint(0,101, 12*5).reshape(12,5)
df_numeros = pd.DataFrame(datos)
df_numeros

Unnamed: 0,0,1,2,3,4
0,87,33,68,9,89
1,64,26,52,65,4
2,36,66,4,69,42
3,64,99,3,83,37
4,86,76,66,90,84
5,97,3,25,70,69
6,23,98,85,5,89
7,33,56,98,94,51
8,96,100,61,96,27
9,7,98,39,10,53


In [76]:
#como un for para cada uno de los elementos
df_numeros < 50

Unnamed: 0,0,1,2,3,4
0,False,True,False,True,False
1,False,True,False,False,True
2,True,False,True,False,True
3,False,False,True,False,True
4,False,False,False,False,False
5,False,True,True,False,False
6,True,False,False,True,False
7,True,False,False,False,False
8,False,False,False,False,True
9,True,False,True,True,False


In [77]:
#mantener solo aquellos que coumplen la condicion
df_numeros.where(df_numeros < 50, -1)
# el -1 es para el que no cumpla la condicion poner un -1
# es como un for, si se cumple la condicion deja el numero y sino por un -1

Unnamed: 0,0,1,2,3,4
0,-1,33,-1,9,-1
1,-1,26,-1,-1,4
2,36,-1,4,-1,42
3,-1,-1,3,-1,37
4,-1,-1,-1,-1,-1
5,-1,3,25,-1,-1
6,23,-1,-1,5,-1
7,33,-1,-1,-1,-1
8,-1,-1,-1,-1,27
9,7,-1,39,10,-1


Pandas tiene seleccionares condicionales implementados _built-in_ para las columnas, a destacar:

- .isin()
- .notnull()   permite filtar los NaN

In [78]:
df_ejemplo.loc[df_ejemplo['Edad'].isin([23,33])]    # valores unicos, el 23,33 no es un rango

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion
uo011,laura,33,,3
uo014,oscar,23,176.0,1


In [79]:
df_ejemplo['Altura (cm)'].notnull()   #vector de booleanos

uo001     True
uo002     True
uo003     True
uo004     True
uo005     True
uo006     True
uo007     True
uo008     True
uo009     True
uo010     True
uo011    False
uo012     True
uo013     True
uo014     True
uo015     True
Name: Altura (cm), dtype: bool

In [80]:
df_ejemplo.loc[df_ejemplo['Altura (cm)'].notnull()]   #devuelve sin laura que era la que tenia el valor nulo de la altura

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion
uo001,Alcia,25,165.0,7
uo002,Bruno,30,180.0,8
uo003,Carlos,22,175.0,10
uo004,David,35,160.0,3
uo005,Elena,28,170.0,4
uo006,Fernando,40,160.0,7
uo007,gloria,27,180.0,10
uo008,hector,29,172.0,1
uo009,isabel,32,165.0,2
uo010,juan,24,187.0,1


## Para modificar los datos

Usamos:
- df['nombre_nueva_columna'] = valores

Tienen que ser del mismo type

In [83]:
df_ejemplo['curso'] = 'Primer curso'
df_ejemplo

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion,curso
uo001,Alcia,25,165.0,7,Primer curso
uo002,Bruno,30,180.0,8,Primer curso
uo003,Carlos,22,175.0,10,Primer curso
uo004,David,35,160.0,3,Primer curso
uo005,Elena,28,170.0,4,Primer curso
uo006,Fernando,40,160.0,7,Primer curso
uo007,gloria,27,180.0,10,Primer curso
uo008,hector,29,172.0,1,Primer curso
uo009,isabel,32,165.0,2,Primer curso
uo010,juan,24,187.0,1,Primer curso


In [84]:
df_ejemplo['Curso'] = 'Primer curso'   #ahora tengo dos columnas curso
df_ejemplo

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion,curso,Curso
uo001,Alcia,25,165.0,7,Primer curso,Primer curso
uo002,Bruno,30,180.0,8,Primer curso,Primer curso
uo003,Carlos,22,175.0,10,Primer curso,Primer curso
uo004,David,35,160.0,3,Primer curso,Primer curso
uo005,Elena,28,170.0,4,Primer curso,Primer curso
uo006,Fernando,40,160.0,7,Primer curso,Primer curso
uo007,gloria,27,180.0,10,Primer curso,Primer curso
uo008,hector,29,172.0,1,Primer curso,Primer curso
uo009,isabel,32,165.0,2,Primer curso,Primer curso
uo010,juan,24,187.0,1,Primer curso,Primer curso


In [85]:
#para borrar una columna. se elimina sobre el conjunto original (cuidado!!!)
df_ejemplo.drop('curso', axis= 1, inplace= True)  #axis fila es eje 0
df_ejemplo

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion,Curso
uo001,Alcia,25,165.0,7,Primer curso
uo002,Bruno,30,180.0,8,Primer curso
uo003,Carlos,22,175.0,10,Primer curso
uo004,David,35,160.0,3,Primer curso
uo005,Elena,28,170.0,4,Primer curso
uo006,Fernando,40,160.0,7,Primer curso
uo007,gloria,27,180.0,10,Primer curso
uo008,hector,29,172.0,1,Primer curso
uo009,isabel,32,165.0,2,Primer curso
uo010,juan,24,187.0,1,Primer curso


In [86]:
# a los que tienen un 4 ponerles un 5
df_ejemplo['Puntuacion'].replace(4,5)    #valor que buscamos y valor por el que lo sustituimos

uo001     7
uo002     8
uo003    10
uo004     3
uo005     5
uo006     7
uo007    10
uo008     1
uo009     2
uo010     1
uo011     3
uo012     6
uo013     9
uo014     1
uo015     5
Name: Puntuacion, dtype: int64

In [88]:
df_ejemplo['Puntuacion'] = df_ejemplo['Puntuacion'].replace(4,5)   #reemplazar
df_ejemplo

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion,Curso
uo001,Alcia,25,165.0,7,Primer curso
uo002,Bruno,30,180.0,8,Primer curso
uo003,Carlos,22,175.0,10,Primer curso
uo004,David,35,160.0,3,Primer curso
uo005,Elena,28,170.0,5,Primer curso
uo006,Fernando,40,160.0,7,Primer curso
uo007,gloria,27,180.0,10,Primer curso
uo008,hector,29,172.0,1,Primer curso
uo009,isabel,32,165.0,2,Primer curso
uo010,juan,24,187.0,1,Primer curso


In [90]:
df_ejemplo['Turno presentacion'] = range(len(df_ejemplo),0,-1)
df_ejemplo

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion,Curso,Turno presentacion
uo001,Alcia,25,165.0,7,Primer curso,15
uo002,Bruno,30,180.0,8,Primer curso,14
uo003,Carlos,22,175.0,10,Primer curso,13
uo004,David,35,160.0,3,Primer curso,12
uo005,Elena,28,170.0,5,Primer curso,11
uo006,Fernando,40,160.0,7,Primer curso,10
uo007,gloria,27,180.0,10,Primer curso,9
uo008,hector,29,172.0,1,Primer curso,8
uo009,isabel,32,165.0,2,Primer curso,7
uo010,juan,24,187.0,1,Primer curso,6


In [92]:
df_ejemplo['Grupo'] = [1,2,3]*5
df_ejemplo

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion,Curso,Turno presentacion,Grupo
uo001,Alcia,25,165.0,7,Primer curso,15,1
uo002,Bruno,30,180.0,8,Primer curso,14,2
uo003,Carlos,22,175.0,10,Primer curso,13,3
uo004,David,35,160.0,3,Primer curso,12,1
uo005,Elena,28,170.0,5,Primer curso,11,2
uo006,Fernando,40,160.0,7,Primer curso,10,3
uo007,gloria,27,180.0,10,Primer curso,9,1
uo008,hector,29,172.0,1,Primer curso,8,2
uo009,isabel,32,165.0,2,Primer curso,7,3
uo010,juan,24,187.0,1,Primer curso,6,1


Crear columnas a partir de condicionales

In [93]:
df_ejemplo['Aprobado'] = df_ejemplo['Puntuacion'] >= 5
df_ejemplo

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion,Curso,Turno presentacion,Grupo,Aprobado
uo001,Alcia,25,165.0,7,Primer curso,15,1,True
uo002,Bruno,30,180.0,8,Primer curso,14,2,True
uo003,Carlos,22,175.0,10,Primer curso,13,3,True
uo004,David,35,160.0,3,Primer curso,12,1,False
uo005,Elena,28,170.0,5,Primer curso,11,2,True
uo006,Fernando,40,160.0,7,Primer curso,10,3,True
uo007,gloria,27,180.0,10,Primer curso,9,1,True
uo008,hector,29,172.0,1,Primer curso,8,2,False
uo009,isabel,32,165.0,2,Primer curso,7,3,False
uo010,juan,24,187.0,1,Primer curso,6,1,False


Cuando tenemos cosas duplicadas

In [97]:
edades= df_ejemplo['Edad']
edades

uo001    25
uo002    30
uo003    22
uo004    35
uo005    28
uo006    40
uo007    27
uo008    29
uo009    32
uo010    24
uo011    33
uo012    26
uo013    31
uo014    23
uo015    37
Name: Edad, dtype: int64

¿Que ocurre si creamos una variable con una de las columnas y luego hacemos modificaciones sobre el dataframe original? ¿Se modifica la variable?


In [98]:
df_ejemplo.loc['uo001','Edad']

25

In [99]:
df_ejemplo.loc['uo001','Edad'] = 33
df_ejemplo

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion,Curso,Turno presentacion,Grupo,Aprobado
uo001,Alcia,33,165.0,7,Primer curso,15,1,True
uo002,Bruno,30,180.0,8,Primer curso,14,2,True
uo003,Carlos,22,175.0,10,Primer curso,13,3,True
uo004,David,35,160.0,3,Primer curso,12,1,False
uo005,Elena,28,170.0,5,Primer curso,11,2,True
uo006,Fernando,40,160.0,7,Primer curso,10,3,True
uo007,gloria,27,180.0,10,Primer curso,9,1,True
uo008,hector,29,172.0,1,Primer curso,8,2,False
uo009,isabel,32,165.0,2,Primer curso,7,3,False
uo010,juan,24,187.0,1,Primer curso,6,1,False


In [100]:
edades   # tiene la edad modificada

uo001    33
uo002    30
uo003    22
uo004    35
uo005    28
uo006    40
uo007    27
uo008    29
uo009    32
uo010    24
uo011    33
uo012    26
uo013    31
uo014    23
uo015    37
Name: Edad, dtype: int64

¿Y al reves?

In [102]:
edades [0] = 22
edades

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  edades [0] = 22


uo001    22
uo002    30
uo003    22
uo004    35
uo005    28
uo006    40
uo007    27
uo008    29
uo009    32
uo010    24
uo011    33
uo012    26
uo013    31
uo014    23
uo015    37
Name: Edad, dtype: int64

In [103]:
df_ejemplo    #sale modificado

Unnamed: 0,Nombre,Edad,Altura (cm),Puntuacion,Curso,Turno presentacion,Grupo,Aprobado
uo001,Alcia,22,165.0,7,Primer curso,15,1,True
uo002,Bruno,30,180.0,8,Primer curso,14,2,True
uo003,Carlos,22,175.0,10,Primer curso,13,3,True
uo004,David,35,160.0,3,Primer curso,12,1,False
uo005,Elena,28,170.0,5,Primer curso,11,2,True
uo006,Fernando,40,160.0,7,Primer curso,10,3,True
uo007,gloria,27,180.0,10,Primer curso,9,1,True
uo008,hector,29,172.0,1,Primer curso,8,2,False
uo009,isabel,32,165.0,2,Primer curso,7,3,False
uo010,juan,24,187.0,1,Primer curso,6,1,False
