# Lectura de Ficheros

## Generando nuestro primer archivo de texto

In [1]:
with open('datos.txt', 'w') as d:
    d.write('10,20,30')

La instruccion **with** nos asegura que el proceso de crear el objeto con la clase **open**, se cerrara automaticamente. En caso de no usar estas instrucciones, el codigo debe escribirse como sigue:

In [2]:
# instanciamos el objeto con la clase open
d = open('datos2.txt', 'w')

# utilizamos el metodo write para agregar contenido al archivo
d.write('40,50,60')

# cerramos el archivo
d.close()

## Modos de apertura del archivo

Al crear el objeto con la clase __open__ se le pasa como argumento dos datos, el primero es el nombre del archivo y el segundo el modo de apertura.

- __w__: indica al programa que abra el archivo en forma de escritura.

- __r__: indica al programa que abra ela archivo en forma de lectura.

- __a__: permite agregar datos al archivo sin borrar los ya existentes.

## Recuperar el contenido de un archivo en una variable

In [3]:
with open('datos.txt', 'r') as d:
    data = d.read()
    print(data)

10,20,30


- El metodo __read()__ permite cargar en la variable data todos los datos contenidos en un archivo.

- El metodo __readline()__ permite leer varias lineas en un archivo

## Ejercicios

### 1. Crea un archivo con los 20 primeros datos de la expresion matematica y luego recupera los datos en una lista

In [4]:
# Creamos el archivo con los datos de la siguiente expresion
# X**2 + 4X

# creamos una variables con 20 valores a pasar en la ecuacion
n = range(20)

# creamos el archivo en modo w ya que empezamos desde cero el archivo
# recuerda que con w los datos nuevos reemplazan a los datos antiguos
with open('datos.txt', 'w') as d:
    for x in n:
        y = x**2 + 4*x
        # todos los datos deben ser convertidos a String
        d.write(str(y))
        # agregamos un salto de linea por dato agregado
        d.write('\n')

In [5]:
# Recuperamos todos los datos en una lista
lista = []
n = range(20)

# abrimos el archivo en modo lectura (r) para obtener la informacion
with open('datos.txt', 'r') as d:
    for y in n:
        # lee linea por linea
        temp = d.readline()
        # limpia el caracter escape de cada linea
        temp = temp.strip()
        # agrega cada linea a la lista
        lista.append(temp)

print(lista)

['0', '5', '12', '21', '32', '45', '60', '77', '96', '117', '140', '165', '192', '221', '252', '285', '320', '357', '396', '437']


### 2. Crea un archivo con los 30 primeros datos de la expresion matematica x + 10 - 4k, donde k = 10

In [6]:
n = range(30)
k = 10

with open('datos2.txt', 'w') as d:
    for x in n:
        y = x + 10 - 4*k
        d.write(str(y))
        d.write('\n')

# Archivos csv

## **Obtener los datos de una columna de un csv**

In [7]:
import csv
lista = []

with open('notas.csv', encoding='utf8') as notas:
    csv_datos = csv.reader(notas)
    for i in csv_datos:
        fisica = i[1]
        lista.append(fisica)

print(lista)

['Física', '3,5', '4,1', '3,2', '4,5', '3,9']


- el modificador **encoding = 'utf8'** permite que los caracteres especiales sean leidos correctamente.

- Llamamos la clase **csv** para crear un objetoy emplear sus metodos para extraer los datos que necesitamos de dicho archivo.

- Cargamos todos los datos en el nuevo objeto **csv_datos**  mediante el metodo **.reader()**

- Utilizamos el bucle For para obtener todos los valores de la columna Fisica incluso el nombre. Para obtener solo los valores utilizamos el metodo **.DictReader()** que reconoce el primer dato como un encabezado.

## **Obtener solo los datos de la columna Fisica**

In [8]:
import csv
lista = []

with open('notas.csv', encoding='utf8') as notas:
    csv_datos = csv.DictReader(notas)
    for i in csv_datos:
        fisica = i['Física']
        lista.append(fisica)

print(lista)

['3,5', '4,1', '3,2', '4,5', '3,9']


- El metodo **DictReader** crea un diccionario con los datos del archivo csv utlizando como llave los valores de la primera columna que son los titulos. Esto hace que sea mas facil acceder a los datos mediante el nombre de la columna.

## **Convertir los datos a numericos**

In [9]:
import csv
lista = []

with open('notas.csv', encoding='utf8') as notas:
    csv_datos = csv.DictReader(notas)
    for i in csv_datos:
        fisica = i['Física'].replace(',', '.')
        lista.append(float(fisica))

print(lista)

[3.5, 4.1, 3.2, 4.5, 3.9]


- Utilizamos el metodo **replace()** de la clase **str** para sustituir las comas por puntos ya que el separador de decimales en Python son los puntos..

- utilizamos la funcion **float()** para convertir los datos a tipo float.

# Archivo Excel

## **Imprimir los valores del archivo Excel**

In [10]:
import xlrd

with xlrd.open_workbook('notas.xls') as excel:
    for hoja in excel.sheets():
        for fila in range(hoja.nrows):
            print(hoja.row(fila))

[text:'nombre', text:'Física', text:'Química', text:'Artes']
[text:'Francisco Alvarez', number:3.5, number:4.7, number:3.9]
[text:'Juan Gonzalez', number:4.1, number:3.8, number:4.5]
[text:'Mauricio Castro', number:3.2, number:3.4, number:4.7]
[text:'Saray Lozano', number:4.5, number:4.3, number:4.8]
[text:'Viviana Cáceres', number:3.9, number:4.0, number:3.6]


- El metodo **.open_workbook()** permtie acceder a la ruta donde esta el archivo Excel.

- El metodo **.sheets()** devuelve una lista con todos los nombres de las hojas dentro del libro de Excel.

- El atributo **nrows** devuelve el numero de filas que contienen datos

- El metodo **.row()** recupera la informacion de cada fila en una lista

## **Imprimir los datos de la columna Artes**

In [11]:
import xlrd

with xlrd.open_workbook('notas.xls') as excel:
    for hoja in excel.sheets():
        print(hoja.col(3))

[text:'Artes', number:3.9, number:4.5, number:4.7, number:4.8, number:3.6]


## **Obtener solo los datos de la columna Artes**

In [16]:
import xlrd
lista = []

with xlrd.open_workbook('notas.xls') as excel:
    for hoja in excel.sheets():
        for fila in range(1, hoja.nrows):
            dato = hoja.col(3)[fila].value
            lista.append(dato)

print(lista)

[3.9, 4.5, 4.7, 4.8, 3.6]


# Conclusiones

Al manejar archivos de texto o cualquier otro tipo de archivo como CSV o Excel, se 
recomienda hacerlo dentro de un bloque **with** para asegurar el cierre correcto del archivo después de haber leído o escrito datos. 

Los modificadores que contiene un archivo de tipo texto en su apertura son modo de lectura r, modo de sobreescritura w, el cual elimina el contenido anterior y lo reemplaza por el nuevo, y modo de escritura anidada a, el cual no elimina el contenido anterior, sino que anida o suma el nuevo contenido

# Lectura Recomendada

[Formato de Archivo](https://docs.python.org/es/3.8/library/fileformats.html)