# **Manejo e archivos con Python**

## Simón Villanueva & Javier Correa

## **Manejo de archivos con Python**

Python permite leer, modificar, crear y guardar archivos de texto. Estas funcionalidades pueden acoplarse a las demás que Python ofrece.

La [función](https://docs.python.org/3/library/functions.html#open) `open`, permite abrir o crear archivos y recibe dos argumentos:

- La ubicación del archivo [string] (_e.g._ "home/Downloads/foo.txt")
- Los permisos u operaciones que hará con el archivo [string]. Las opciones básicas son:
    + `r` , reading: Abrir el archivo como sólo lectura
    + `w` , writing: Abrir el archivo con permiso de escritura 
    + `x` , exclusive creation: Crea el archivo, aunque este ya exista
    + `a` , appending: Toda lo que se escriba en el archivo será anexado al final del archivo.
- Adicionalmente, podemos agregar un `+` en el segundo argumento para indicar que el archivo se cree en caso de que no exista

### **Creación de archivos y escritura**

In [1]:
#Creando un archivo
file = open('textfile.txt','w') 
 
file.write('Hola Python \n') 
file.write('Este es un texto prueba\n') 
file.write('acá meto otra línea y qué! jajaja.\n') 
 
file.close()

In [2]:
%%bash
cat textfile.txt

Hola Python 
Este es un texto prueba
acá meto otra línea y qué! jajaja.


In [3]:
#Leyendo un archivo de texto en python
file = open('textfile.txt', 'r') 
file.read()

'Hola Python \nEste es un texto prueba\nacá meto otra línea y qué! jajaja.\n'

In [4]:
#Leer linea por linea
file = open('textfile.txt', 'r') 
file.readline()

'Hola Python \n'

In [5]:
#Looping lineas
file = open('textfile.txt', 'r')
for line in file: 
    print (line) 

Hola Python 

Este es un texto prueba

acá meto otra línea y qué! jajaja.



Todo esto queda más claro con otro ejemplo

In [7]:
f = open("foo.txt", "w+")

En este caso, al no existir el archivo, Python lo creó y está habilitado con permisos de escritura. 

**Notese que el archivo fue guardado en la variable f**

Como está recién creado, está vacio. Aprovechemos los permisos de escritura y llenemoslo.

In [8]:
for i in range(10):
    f.write("Esta es la linea %d\n" % (i+1))

El método `.write()` es utilzado para escribir sobre los archivos. 

Ya que escribimos unas cuantas lineas podemos ver cómo quedo el archivo...

¿Pero y dónde está el archivo?

El archivo como tal no existe aún. Python lo tiene guardado en la variable `f`, la cual está en memoria, mas no guardada en disco.

Para guardar el archivo en disco, tenemos que "cerrar" el archivo con el método `.close()`

In [9]:
f.close()

Ahora si podemos ver el archivo (debería estar en la misma carpeta en la que se encuentra este notebook)

### **Lectura de archivos**

Usualmente vamos a trabajar con archivos externos que contienen información que vamos a utilizar.

Examinemos el archivo de datos2.csv . ¿Qué tipo de datos son?

In [6]:
f = open("datos-2.csv", "r")

datos2.csv no es un archivo tan pequeño. Por lo que lo mejor es leerlo linea por linea

In [7]:
f1 = f.readlines()

El método `.readlines()` separa el archivo por saltos de linea (`\n`) y pasa el archivo a una lista. Por lo que el resultado es una lista en la que cada elemento es una linea del archivo original.

Comprobemos eso:

In [8]:
for i in range(5):
    print(f1[i])

Country Name;Region;IncomeGroup;population2009;population2010;populationGrowthPercent

Brunei Darussalam;East Asia & Pacific;High income: nonOECD;394400;400569;1.54%

French Polynesia;East Asia & Pacific;High income: nonOECD;265412;268065;0.99%

Guam;East Asia & Pacific;High income: nonOECD;158621;159440;0.51%

Hong Kong SAR China;East Asia & Pacific;High income: nonOECD;6972800;7024200;0.73%



¡Son datos demográficos de distintos paises categorizados por ingresos y región!

Veamos en que categorias están subdivididos los paises

Regiones:

In [9]:
Regions = []
for line in f1:
    #print(line.split(";")[1])
    if line.split(';')[1] not in Regions:
        aux = line.split(';')[1]
        Regions.append(aux)
        print(aux)

Region
East Asia & Pacific
Europe & Central Asia
Latin America & Caribbean
Middle East & North Africa
North America
South Asia
Sub-Saharan Africa


Ingresos:

In [10]:
Income = []
for line in f1:
    if line.split(';')[2] not in Income:
        aux = line.split(';')[2]
        Income.append(aux)
        print(aux)


IncomeGroup
High income: nonOECD
High income: OECD
Low income
Lower middle income
Upper middle income


### **Ejercicio**

A partir del archivo "datos-2.csv" Crear otro con la misma estructura que sólo contenga los paises que más crecen de cada región.

Resultado:

Country Name;Region;IncomeGroup;population2009;population2010;populationGrowthPercent
Timor-Leste;East Asia & Pacific;Lower middle income;1110071;1142502;2.84%
Uzbekistan;Europe & Central Asia;Lower middle income;27767400;28562400;2.78%
Guatemala;Latin America & Caribbean;Lower middle income;13988988;14341576;2.46%
Qatar;Middle East & North Africa;High income: nonOECD;1564082;1749713;10.61%
Canada;North America;High income: OECD;33726915;34126547;1.17%
Afghanistan;South Asia;Low income;27708187;28397812;2.43%
South Sudan;Sub-Saharan Africa;Low income;9520571;9940929;4.23%