# Introducción al manejo de archivos en Python

Python es una poderosa herramiento que nos puede ayudar a realizar distintos tipos de tareas, como automatización, cálculos ciéntificos, aprendizaje automático, análisis de datos y más. 

Imaginemos que queremos hacer un análisis sobre las notas de los alumnos de alguna universidad con respecto a algunos parámetros como la cantidad de sus horas de sueño, la cantidad de horas diarias dedicadas a estudiar, porcentaje de asistencias a clases. Para este análisis, entonces, vamos a recoger datos de los alumnos mediante entrevistas o formularios. Posteriormente, estos datos se encontrarán almacenados en algún archivo, y el tipo de este archivo puede ser TXT, CSV, Excel, JSON, o algun otro tipo más. Dentro de esta carpeta, encontraremos un archivo llamado `notas.txt`, donde encontraremos el reporte de 1000 alumnos (son datos generados artificialmente). Los primeros diez reportes son:

<img src="images/Notas.jpg" alt="Notas" width="800"/>


Cada reporte consiste en la cantidad de horas de sueño, cantidad de horas de estudio diarias, porcentaje de asistencia a clases, nota obtenida.

Para que Python pueda realizar cálculos sobre este conjuntos de datos, necesitamos *cargar* los datos a Python y almacenarlos en alguna estructura de datos. Podríamos intentar añadir cada reporte manualmente en una lista:

In [3]:
grades = []

grades.append((5, 8, 51, 14))
grades.append((8, 5, 99, 18))
grades.append((5, 10, 67, 14))
# 997 líneas más
# ...
# ...
grades

[(5, 8, 51, 14), (8, 5, 99, 18), (5, 10, 67, 14)]

Añadir manualmente los 1000 reportes es ineficiente y nos tardaríamos mucho. Por suerte, Python cuenta con librerías y métodos que nos va a permitir leer datos de distintos tipos de archivos como los ya mencionados. 

Ejecutemos el siguiente código, que lee el archivo `notas.txt` y carga los 1000 reportes en una lista:

In [None]:
# reserved word
for if in and or
# signals
== = + - % 
# funciones
input() print() enumerate() len() type() dir() ejecutar()
# variables
name = "jean pierre" size = 10

In [9]:
name = "Hola mundo!"
dir(name)
name = name.upper()
#name.size
print(type(name))

<class 'str'>


In [16]:
var = "Hola mundo cruel!\nHola mundo lindo!".splitlines()
var

['Hola mundo cruel!', 'Hola mundo lindo!']

In [25]:
grades_file = open('notas.txt', 'r')

grades = grades_file.read().splitlines()

for i, line in enumerate(grades):
    numbers = line.split()
    grades[i] = tuple(numbers)

grades

<class '_io.TextIOWrapper'>
['_CHUNK_SIZE', '__class__', '__del__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_checkClosed', '_checkReadable', '_checkSeekable', '_checkWritable', '_finalizing', 'buffer', 'close', 'closed', 'detach', 'encoding', 'errors', 'fileno', 'flush', 'isatty', 'line_buffering', 'mode', 'name', 'newlines', 'read', 'readable', 'readline', 'readlines', 'reconfigure', 'seek', 'seekable', 'tell', 'truncate', 'writable', 'write', 'write_through', 'writelines']
<class 'list'>


[('5', '8', '51', '14'),
 ('8', '5', '99', '18'),
 ('5', '10', '67', '14'),
 ('7', '7', '65', '14'),
 ('9', '9', '100', '14'),
 ('7', '7', '62', '13'),
 ('5', '6', '81', '14'),
 ('10', '7', '53', '20'),
 ('10', '9', '88', '17'),
 ('5', '9', '54', '17'),
 ('4', '8', '46', '16'),
 ('7', '9', '78', '15'),
 ('6', '7', '58', '20'),
 ('4', '8', '45', '15'),
 ('8', '9', '70', '18'),
 ('8', '4', '95', '14'),
 ('5', '8', '78', '19'),
 ('6', '5', '54', '14'),
 ('5', '6', '76', '13'),
 ('8', '8', '96', '20'),
 ('10', '6', '85', '18'),
 ('4', '10', '70', '13'),
 ('6', '7', '73', '20'),
 ('4', '9', '92', '14'),
 ('8', '5', '80', '17'),
 ('6', '9', '46', '15'),
 ('10', '6', '87', '13'),
 ('5', '9', '55', '17'),
 ('8', '9', '54', '16'),
 ('9', '10', '96', '20'),
 ('4', '7', '44', '13'),
 ('10', '10', '51', '15'),
 ('8', '6', '54', '19'),
 ('6', '7', '55', '17'),
 ('9', '8', '57', '13'),
 ('4', '5', '47', '19'),
 ('8', '9', '42', '13'),
 ('7', '8', '93', '20'),
 ('6', '4', '53', '15'),
 ('6', '10', '5

In [None]:
# La lista 'grades' contiene los 1000 reportes de los alumnos

len(grades)

Ahora que tenemos cargados los datos, podemos empezar a realizar análisis sobre estos datos. Y además, Python también nos permite guardar los resultados obtenidos en algún archivo, por ejemplo `results.txt`. 

Es importante saber leer y escribir en distintos tipos de archivo con Python, y es lo que aprenderemos en este primer capítulo del curso.