## Archivos en Python

Con el fin de abrir un archivo utilizando Python, usaremos la función **open()**. open() devuelve un objeto file, y comúnmente se utiliza con dos argumentos: open(nombre del archivo, modo)

La función open() cuenta con dos argumentos: el nombre del archivo y el modo. Estos argumentos se parecen a la función de stdio (es decir, de C) fopen(). El nombre del archivo hace referencia al nombre (y la ruta) del archivo que desees abrir. El modo es un valor string que indica cómo se va a abrir el archivo. Aquí puedes ver los distintos modos en los que se puede abrir un archivo:

* r:  Abrir fichero para lectura. El puntero se posiciona al principio del fichero
* r+: Abrir fichero para lectura y escritura. El puntero se posiciona al principio del fichero
* w:  Trunca a cero la longitud o crea un fichero de texto para escritura. El puntero se posiciona al principio del fichero
* w+: Abrir fichero para lectura y escritura. Si el fichero no existe, se crea, de lo contrario se trunca. El puntero se posiciona al principio del fichero
* a: Abrir fichero para lectura. Se creará el fichero si no existe. El puntero se posiciona al final del fichero.
* a+: Abrir fichero para lectura y escritura. Se creará el fichero si no exsite. El puntero se posiciona al final del fichero.

```python
# Abre un archivo para escritura
f = open ("holamundo.txt","w")
# Escribe un mensaje en el archivo
f.write("hola mundo peludo"')
# Cierra el archivo
f.close()
```        


**Abre un archivo para lectura y escritura**
```python
f = open ("holamundo.txt","a+")
# Escribe un mensaje en el archivo
f.write("hola peluchones")
# Cierra el archivo
f.close()
```  

In [3]:
#Ejemplo de creacion de archivo

f = open ("holamundo.txt","a+")
# Escribe un mensaje en el archivo
f.write("hola peluchones")
f.write("Hola mundo peludo desde la angustia de los estudiantes")
f.write("alumnos preocupados por su futuro")

# Abre archivo en modo lectura
archivo = open('holamundo.txt','r')

# Lee los 9 primeros bytes
cadena1 = archivo.read(9)

# Lee la información restaste 
cadena2 = archivo.read()

# Muestra la primera lectura  
print(cadena1)

# Muestra la segunda lectura
print(cadena2)


# Cierra el archivo
f.close()

hola pelu
choneshola peluchonesHola mundo peludo desde la angustia de los estudiantesalumnos preocupados por su futuro


#### Leer archivo: read, readline, readlines, with-as

Con el método read() es posible leer un número de bytes determinados. Si no se indica número se leerá todo lo que reste o si se alcanzó el final del fichero devolverá una cadena vacía.

```python
# Abre archivo en modo lectura
archivo = open('archivo.txt','r')

# Lee los 9 primeros bytes
cadena1 = archivo.read(9)

# Lee la información restaste 
cadena2 = archivo.read()

# Muestra la primera lectura  
print(cadena1)

# Muestra la segunda lectura
print(cadena2)

# Cierra el archivo 
archivo.close  

```




**Abre un archivo e imprime su contenido**
```python
texto  = open("archivo.txt","r")
print(texto.read())
``` 
**Cerrar archivo**
Después de terminar de trabajar con un archivo lo cerraremos con el método close. 

```python
archivo.txt.close
``` 

El método **readline()** lee de un archivo una línea completa

```python

# Abre archivo en modo lectura
archivo = open('archivo.txt','r')  

# inicia bucle infinito para leer línea a línea
while True: 
    linea = archivo.readline()  # lee línea
    if not linea: 
        break  # Si no hay más se rompe bucle
    print(linea)  # Muestra la línea leída
archivo.close  # Cierra archivo

```

El método **readlines()** lee todas las líneas de un archivo como una lista. 
Si se indica el parámetro de tamaño leerá esa cantidad de bytes del archivo y 
lo necesario hasta completar la última linea.

```python
# Abre archivo en modo lectura
archivo = open('archivo.txt','r')

# Lee todas la líneas y asigna a lista
lista = archivo.readlines()  

# Inicializa un contador
numlin = 0  

# Recorre todas los elementos de la lista
for linea in lista:
    # incrementa en 1 el contador  
    numlin += 1
    # muestra contador y elemento (línea)
    print(numlin, linea)
  
archivo.close  # cierra archivo
```

**with-as** permite usar los archivos de forma óptima cerrándolos y liberando la memoria al 
concluir el proceso de lectura.

```python
# abre archivo (y cierra cuando termine lectura)
with open("indice.txt") as fichero:
    # recorre línea a línea el archivo
    for linea in fichero:
        # muestra línea última leída
        print(linea) 
```        
        

In [5]:
# Abre archivo en modo lectura
archivo = open('holamundo.txt','r')

# Lee todas la líneas y asigna a lista
lista = archivo.readlines()  

# Inicializa un contador
numlin = 0  

# Recorre todas los elementos de la lista
for linea in lista:
    # incrementa en 1 el contador  
    numlin += 1
    # muestra contador y elemento (línea)
    print(numlin, linea)
archivo.close()  # cierra archivo

1 hola peluchoneshola peluchones

2 Hola mundo peludo 

3 desde la angustia de los estudiantesalumnos preocupados por su futuro


#### Escribir en archivo: write, writelines

El método write() escribe una cadena y el método writelines() escribe una lista a un archivo. Si en el momento de escribir el archivo no existe se creará uno nuevo.

```python
cadena1 = 'Datos'  # declara cadena1
cadena2 = 'Secretos'  # declara cadena2

# Abre archivo para escribir
archivo = open('datos1.txt','w')

# Escribe cadena1 añadiendo salto de línea 
archivo.write(cadena1 + '\n')

# Escribe cadena2 en archivo
archivo.write(cadena2) 

# cierra archivo
archivo.close


# Declara lista
lista = ['lunes', 'martes', 'miercoles', 'jueves', 'viernes']  

# Abre archivo en modo escritura
archivo = open('datos2.txt','w')

# Escribe toda la lista en el archivo
archivo.writelines(lista)  

# Cierra archivo
archivo.close  
```


In [6]:
cadena1 = 'Datos'  # declara cadena1
cadena2 = 'Secretos'  # declara cadena2

# Abre archivo para escribir
archivo = open('datos1.txt','w')

# Escribe cadena1 añadiendo salto de línea 
archivo.write(cadena1 + '\n')

# Escribe cadena2 en archivo
archivo.write(cadena2) 

# cierra archivo
archivo.close()


# Declara lista
lista = ['lunes', 'martes', 'miercoles', 'jueves', 'viernes']  

# Abre archivo en modo escritura
archivo = open('datos2.txt','w')

# Escribe toda la lista en el archivo
archivo.writelines(lista)  

# Cierra archivo
archivo.close()  

In [8]:
#insertar items de una lista incluyendo salto de linia
#abre archivon para escribir

#abrimos archivos para escritura posicionamos el puntero al final
archivo = open('datos2.txt','a+')

# Declara lista
lista = ['lunes', 'martes', 'miercoles', 'jueves', 'viernes']  

for i in lista:
    archivo.writelines("\n"+i)


# Cierra archivo
archivo.close()  

#### Mover el puntero: seek(), tell()

El método **seek()** desplaza el puntero a una posición del archivo y el método **tell()** devuelve la posición del puntero en un momento dado (en bytes).

```python
# Abre archivo en modo lectura
archivo = open('datos2.txt','r')  

# Mueve puntero al quinto byte
archivo.seek(5)  

# lee los siguientes 5 bytes
cadena1 = archivo.read(5) 

# Muestra cadena
print(cadena1) 

# Muestra posición del puntero 
print(archivo.tell())

# Cierra archivo
archivo.close  
```

In [9]:
# Abre archivo en modo lectura
archivo = open('datos2.txt','r')  

# Mueve puntero al quinto byte
archivo.seek(5)  

# lee los siguientes 5 bytes
cadena1 = archivo.read(4) 

# Muestra cadena
print(cadena1) 

# Muestra posición del puntero 
print(archivo.tell())

# Cierra archivo
archivo.close() 

mart
9


#### Leer y escribir cualquier objeto a un archivo: pickle

Para leer y escribir cualquier tipo de objeto Python podemos importar el modulo **pickle** y usar sus métodos **dump()** y
**load()** para leer y escribir los datos.

```python

# Importa módulo pickle
import pickle

# Declara lista
lista = ['Perl', 'Python', 'Ruby']

# Abre archivo binario para escribir   
archivo = open('lenguajes.dat', 'wb')

# Escribe lista en archivo
pickle.dump(lista, archivo)

# Cierra archivo
archivo.close

# Borra de memoria la lista
del lista  

# Abre archivo binario para leer
archivo = open('lenguajes.dat', 'rb')

# carga lista desde archivo
lista = pickle.load(archivo)

# Muestra lista  
print(lista)

# Cierra archivo
archivo.close  

```

In [11]:
# Importa módulo pickle
import pickle

# Declara lista
lista = ['Perl', 'Python', 'Ruby']

# Abre archivo binario para escribir   
archivo = open('lenguajes.dat', 'wb')

# Escribe lista en archivo
pickle.dump(lista, archivo)

# Cierra archivo
archivo.close()

# Borra de memoria la lista
del lista  

# Abre archivo binario para leer
archivo = open('lenguajes.dat', 'rb')

# carga lista desde archivo
lista = pickle.load(archivo)

# Muestra lista  
print(lista)

# Cierra archivo
archivo.close () 

['Perl', 'Python', 'Ruby']


In [12]:
# Nombre: receivefromArduino.py
# Objetivo: Genera datos aleatorios y los guarda en un archivo
# Autor: alumnos de LA2
# Fecha: 9 de julio de 2019


# importar libreria
from random import randint, uniform, random

#-----------------------------------------
# Método para escribir datos en un archivo
#------------------------------------------
def escribeDatoInFile(data):
    f = open('datos.txt', 'a')
    f.write(str(data)+",")

i=0

while (i<100):
    dato = randint(10,100)
    print(dato) 
    # Invocamos función
    escribeDatoInFile(dato)
    i=i+1
   

68
40
60
61
65
42
31
28
45
89
28
57
81
62
38
28
49
42
42
81
96
20
19
38
58
13
93
74
87
41
40
24
29
54
38
80
12
56
92
26
26
95
70
60
32
47
34
32
56
36
92
47
47
18
78
59
80
87
25
24
65
27
35
74
26
41
62
28
48
15
56
36
86
100
81
61
83
79
74
33
81
94
84
81
72
18
63
82
38
83
85
39
42
97
13
14
42
20
74
72


In [10]:
#Modificar el codigo del ejemplo anterior para escribir un archivo tipo csv

import csv
# importar libreria
from random import randint, uniform, random






 # Invocamos función
for filas in range (1,20):
    for columnas in range (1,5):
        f = open('num.csv', 'a+')
        f.write('"'+ str(randint(10,100))+'",')
    f.write('\n')
   



In [20]:
#leer archivo csv

import csv

archivo = open("ArchivoPrueba.csv")
reader = csv.reader(archivo,delimiter=',')
#print(reader)
for linea in reader:
    print(linea[0]+"\t" +linea[1]+"\t"+linea[2]+"\t" +linea[3]+"\t"+linea[4])

Series_reference	Period	Type	Data_value	Lower_CI
W_A11	2000-02	Moving average	59.6666666666666	50.9258230199682
W_A11	2001-03	Moving average	60	51.2347745942341
W_A11	2002-04	Moving average	59	50.308125050352
W_A11	2003-05	Moving average	59	50.308125050352
W_A11	2004-06	Moving average	61.3333333333333	52.4712516678722
W_A11	2005-07	Moving average	63	54.0183166814579
W_A11	2006-08	Moving average	57.3333333333333	48.7651044410217
W_A11	2007-09	Moving average	63.6666666666666	54.6375862732774
W_A11	2008-10	Moving average	64	54.9473141273906
W_A11	2009-11	Moving average	64.3333333333333	55.2571033744794
W_A11	2010-12	Moving average	55.3333333333333	46.9158768407868
W_A11	2011-13	Moving average	54.3333333333333	45.992284986132
W_A11	2012-14	Moving average	51.3333333333333	43.225828864654
W_A11	2013-15	Moving average	52	43.8400192264096
W_A12	2000-02	Moving average	1.54334312064924	1.31706323799652
W_A12	2001-03	Moving average	1.52551030167286	1.30260589374312
W_A12	2002-04	Moving average	1.

W_I12	2006	Single year	39.9298516560774	38.0291360348359
W_I12	2007	Single year	41.5432569105054	39.6153686927135
W_I12	2008	Single year	42.5939638829999	40.6563574619447
W_I12	2009	Single year	42.3150055546732	40.3909446711225
W_I12	2010	Single year	41.4837496236027	39.6023396822477
W_I12	2011	Single year	42.719847580541	40.8128890533926
W_I12	2012	Single year	39.6869715012161	37.8588338354112
W_I12	2013	Single year	36.231466326717	34.4955017893572
W_I12	2014	Single year	37.0273882464845	35.2946351168198
W_I12	2015	Single year	37.0599752421226	35.3420534068369
W_D11	2000	Single year	111	90.3504980908243
W_D11	2001	Single year	93	74.0987918289715
W_D11	2002	Single year	120	98.5296702753941
W_D11	2003	Single year	108	87.6314567866289
W_D11	2004	Single year	101	81.3026057334959
W_D11	2005	Single year	100	80.4003601545994
W_D11	2006	Single year	76	58.9134301168211
W_D11	2007	Single year	80	62.4695491884683
W_D11	2008	Single year	104	84.0122107937824
W_D11	2009	Single year	105	84.916345547

W_M14	2007	Single year	1.27143726603469	1.15084232485409
W_M14	2008	Single year	1.07498886723858	0.96470661537043
W_M14	2009	Single year	1.16196870529259	1.0472341037625
W_M14	2010	Single year	1.1249480370682	1.01243186693375
W_M14	2011	Single year	0.85382112828794	0.75572124425395
W_M14	2012	Single year	0.92208417616837	0.82089750268872
W_M14	2013	Single year	0.71649200998575	0.6283784832061
W_M14	2014	Single year	0.77842192645818	0.68820663946852
W_M14	2015	Single year	0.84170493233846	0.74962702363266
W_M15	2000	Single year	462	419.872171012967
W_M15	2001	Single year	455	413.192539380921
W_M15	2002	Single year	405	365.556485674053
W_M15	2003	Single year	461	418.917788599694
W_M15	2004	Single year	435	394.121710077329
W_M15	2005	Single year	405	365.556485674053
W_M15	2006	Single year	393	354.145227879541
W_M15	2007	Single year	421	380.784901299235
W_M15	2008	Single year	366	328.503681135689
W_M15	2009	Single year	384	345.592706589157
W_M15	2010	Single year	375	337.04546064355
W_M15	2

W_F01C	2012	Single year	3250	3138.2648615374
W_F01C	2013	Single year	3365	3251.30519391091
W_F01C	2014	Single year	3630	3511.91318651466
W_F01C	2015	Single year	3691	3571.92513066485
W_F01C	2016	Single year	3934	3811.06790898788
W_F01C	2017	Single year	4253	4125.18089202152
W_F02C	2000	Single year	1310.05056937786	1259.93601320064
W_F02C	2001	Single year	1278.84632508955	1230.23081376662
W_F02C	2002	Single year	1253.41522516553	1205.95868844814
W_F02C	2003	Single year	1249.71483323447	1202.91298548058
W_F02C	2004	Single year	1180.35651603269	1135.4044139263
W_F02C	2005	Single year	1152.18905884387	1108.48817095524
W_F02C	2006	Single year	1132.13152867203	1089.5620227378
W_F02C	2007	Single year	1064.08040562163	1023.40154087492
W_F02C	2008	Single year	1078.31667410822	1037.8764815649
W_F02C	2009	Single year	1143.66053847629	1102.44647754584
W_F02C	2010	Single year	1157.83218138291	1116.9667551862
W_F02C	2011	Single year	1165.46357504916	1124.84562091656
W_F02C	2012	Single year	1159.1239

M_I01	2017	Single year	1623	1544.03996158824
M_I02	2000	Single year	190.566572968361	179.258167800851
M_I02	2001	Single year	187.805965463953	176.679568467874
M_I02	2002	Single year	167.905346262237	157.484425857393
M_I02	2003	Single year	179.767827529021	169.066308699275
M_I02	2004	Single year	164.299938485111	154.149756000104
M_I02	2005	Single year	186.266540888037	175.538918947655
M_I02	2006	Single year	188.444447084876	177.723765072585
M_I02	2007	Single year	183.603007615281	173.090324620829
M_I02	2008	Single year	177.501247879825	167.259115436631
M_I02	2009	Single year	178.110809198789	167.908645697996
M_I02	2010	Single year	177.801465292965	167.696480013208
M_I02	2011	Single year	166.515144819821	156.819514892888
M_I02	2012	Single year	174.458125251309	164.602845080575
M_I02	2013	Single year	175.184629044536	165.376748501234
M_I02	2014	Single year	165.634068076657	156.138975991288
M_I02	2015	Single year	180.894973703476	170.997143286353
M_I02	2016	Single year	195.380267208626	185

M_F22A	2003	Single year	37.9767827529021	33.0581033084542
M_F22A	2004	Single year	33.3436459917674	28.8001794073467
M_F22A	2005	Single year	39.950814693601	35.0223998208566
M_F22A	2006	Single year	38.292690984248	33.5338864498131
M_F22A	2007	Single year	37.0432587630948	32.4144824250887
M_F22A	2008	Single year	40.2419760615741	35.4906963024198
M_F22A	2009	Single year	36.5203254901888	32.0618097395247
M_F22A	2010	Single year	39.6825388338588	35.078226842038
M_F22A	2011	Single year	40.1421740514961	35.6005532454761
M_F22A	2012	Single year	43.1934683352184	38.5364241399739
M_F22A	2013	Single year	49.5880877611807	44.604178972431
M_F22A	2014	Single year	44.5256771150737	39.8697523493468
M_F22A	2015	Single year	42.5578004570409	38.0349890208327
M_M21	2000	Single year	496	452.34952949779
M_M21	2001	Single year	471	428.463814174906
M_M21	2002	Single year	400	360.800720309198
M_M21	2003	Single year	505	460.955287440482
M_M21	2004	Single year	453	411.284525104292
M_M21	2005	Single year	556	509.

C_M22	2009	Single year	15.0295170512579	12.4816875406069
C_M22	2010	Single year	14.3354374255395	11.8483153424867
C_M22	2011	Single year	11.598801105251	9.36546990306926
C_M22	2012	Single year	11.0207473477643	8.84539012362162
C_M22	2013	Single year	12.2588630900797	9.95335440843266
C_M22	2014	Single year	13.2470513150698	10.862772834709
C_M22	2015	Single year	12.0213127171099	9.77012377775534
a12	2000	Single year	1.46533128386629	1.08422953235681
a12	2001	Single year	1.35400787940645	0.98571027708594
a12	2002	Single year	1.77664234006226	1.3603606189779
a12	2003	Single year	1.44002780743352	1.0694281847724
a12	2004	Single year	1.19946230360417	0.86358569920782
a12	2005	Single year	1.70424786351863	1.30485315984152
a12	2006	Single year	1.55280085330775	1.17492822851925
a12	2007	Single year	1.26719350844258	0.92885368900107
a12	2008	Single year	1.25761328345717	0.91828682556471
a12	2009	Single year	1.98906937136429	1.56244503588977
a12	2010	Single year	1.25386505834183	0.92082286735864


a22	2002	Single year	6.20870233605566	4.56784180619392
a22	2003	Single year	3.25996537691944	2.07348084795114
a22	2004	Single year	5.14212179552349	3.6561294139076
a22	2005	Single year	5.03643095448297	3.56489286514266
a22	2006	Single year	5.1225301329883	3.64214005098405
a22	2007	Single year	4.95946779017058	3.50993242927347
a22	2008	Single year	3.93980103111714	2.65152281168998
a22	2009	Single year	6.89775895206005	5.2187586152171
a22	2010	Single year	6.02653859509343	4.45870927102801
a22	2011	Single year	4.7733245488802	3.3750546657291
a22	2012	Single year	3.7899682580732	2.54882586748247
a22	2013	Single year	3.26792357126308	2.11518018106456
a22	2014	Single year	5.98986043150921	4.41812089806959
a22	2015	Single year	3.93400258623977	2.66442392364691
a21	2000	Single year	36	24.2402160927596
a21	2001	Single year	58	43.0733589980779
a21	2002	Single year	55	40.464518063092
a21	2003	Single year	29	18.4452709272037
a21	2004	Single year	46	32.7068775018083
a21	2005	Single year	45	31.85216

In [23]:
import pandas as pd
df =pd.read_csv("ArchivoPrueba.csv")
df

Unnamed: 0,Series_reference,Period,Type,Data_value,Lower_CI,Upper_CI,Units,Indicator,Cause,Validation,Population,Age,Severity
0,W_A11,2000-02,Moving average,59.666667,50.925823,68.407510,Injuries,Number,Assault,Validated,Whole pop,All ages,Fatal
1,W_A11,2001-03,Moving average,60.000000,51.234775,68.765225,Injuries,Number,Assault,Validated,Whole pop,All ages,Fatal
2,W_A11,2002-04,Moving average,59.000000,50.308125,67.691875,Injuries,Number,Assault,Validated,Whole pop,All ages,Fatal
3,W_A11,2003-05,Moving average,59.000000,50.308125,67.691875,Injuries,Number,Assault,Validated,Whole pop,All ages,Fatal
4,W_A11,2004-06,Moving average,61.333333,52.471252,70.195415,Injuries,Number,Assault,Validated,Whole pop,All ages,Fatal
5,W_A11,2005-07,Moving average,63.000000,54.018317,71.981683,Injuries,Number,Assault,Validated,Whole pop,All ages,Fatal
6,W_A11,2006-08,Moving average,57.333333,48.765104,65.901562,Injuries,Number,Assault,Validated,Whole pop,All ages,Fatal
7,W_A11,2007-09,Moving average,63.666667,54.637586,72.695747,Injuries,Number,Assault,Validated,Whole pop,All ages,Fatal
8,W_A11,2008-10,Moving average,64.000000,54.947314,73.052686,Injuries,Number,Assault,Validated,Whole pop,All ages,Fatal
9,W_A11,2009-11,Moving average,64.333333,55.257103,73.409563,Injuries,Number,Assault,Validated,Whole pop,All ages,Fatal


In [16]:
#contar las palabras de un archivo pdf

import PyPDF2

def contar(cadena):
    let=0
    for i in cadena:
        let = let +1
    print("Numero de letras", let)
    print("Numero de palabras", len(cadena.split()))
          
with open('historia2.pdf','rb') as f:
    read_pdf = PyPDF2.PdfFileReader(f)
    np= read_pdf.getNumPages()
    print("Número de paginas: ", np)
    page= read_pdf.getPage(0)
    page_content=page.extractText()
    contar(page_content)
f.close()

Número de paginas:  1
Numero de letras 219
Numero de palabras 37


In [24]:
#Hacer un programa que cuente el numero de palabras del libro de don quijote
import PyPDF2

def contar(cadena):
    let=0
    for i in cadena:
        let = let +1
    return let
          
with open('quijote.pdf','rb') as f:
    pal=0
    let=0
    read_pdf = PyPDF2.PdfFileReader(f)
    np= read_pdf.getNumPages()
    print("Número de paginas: ", np)
    for i in range(0,np): 
        page= read_pdf.getPage(i)
        page_content=page.extractText()
        let=let+contar(page_content)
        pal=pal+len(page_content.split())
    print("Numero de letras", let)
    print("Numero de palabras", pal)
f.close()




Número de paginas:  471
Numero de letras 1308888
Numero de palabras 227076
