## Archivos en Python

Con el fin de abrir un archivo utilizando Python, usaremos la función **open()**. open() devuelve un objeto file, y comúnmente se utiliza con dos argumentos: open(nombre del archivo, modo)

La función open() cuenta con dos argumentos: el nombre del archivo y el modo. Estos argumentos se parecen a la función de stdio (es decir, de C) fopen(). El nombre del archivo hace referencia al nombre (y la ruta) del archivo que desees abrir. El modo es un valor string que indica cómo se va a abrir el archivo. Aquí puedes ver los distintos modos en los que se puede abrir un archivo:

* r:  Abrir fichero para lectura. El puntero se posiciona al principio del fichero
* r+: Abrir fichero para lectura y escritura. El puntero se posiciona al principio del fichero
* w:  Trunca a cero la longitud o crea un fichero de texto para escritura. El puntero se posiciona al principio del fichero
* w+: Abrir fichero para lectura y escritura. Si el fichero no existe, se crea, de lo contrario se trunca. El puntero se posiciona al principio del fichero
* a: Abrir fichero para lectura. Se creará el fichero si no existe. El puntero se posiciona al final del fichero.
* a+: Abrir fichero para lectura y escritura. Se creará el fichero si no exsite. El puntero se posiciona al final del fichero.

```python
# Abre un archivo para escritura
f = open ("holamundo.txt","w")
# Escribe un mensaje en el archivo
f.write("hola mundo peludo"')
# Cierra el archivo
f.close()
```        


**Abre un archivo para lectura y escritura**
```python
f = open ("holamundo.txt","a+")
# Escribe un mensaje en el archivo
f.write("hola peluchones")
# Cierra el archivo
f.close()
```  

In [1]:
#Abre un archivo para lectura y escritura

f = open ("holamundo.txt","a+")
# Escribe un mensaje en el archivo
f.write("hola peluchones")
# Cierra el archivo
f.close()

#### Leer archivo: read, readline, readlines, with-as

Con el método read() es posible leer un número de bytes determinados. Si no se indica número se leerá todo lo que reste o si se alcanzó el final del fichero devolverá una cadena vacía.

```python
# Abre archivo en modo lectura
archivo = open('archivo.txt','r')

# Lee los 9 primeros bytes
cadena1 = archivo.read(9)

# Lee la información restaste 
cadena2 = archivo.read()

# Muestra la primera lectura  
print(cadena1)

# Muestra la segunda lectura
print(cadena2)

# Cierra el archivo 
archivo.close()  

```




In [2]:
# Abre archivo en modo lectura
archivo = open('holamundo.txt','r')

# Lee los 9 primeros bytes
cadena1 = archivo.read(9)

# Lee la información restaste 
cadena2 = archivo.read()

# Muestra la primera lectura  
print(cadena1)

# Muestra la segunda lectura
print(cadena2)

# Cierra el archivo 
archivo.close()  

hola pelu
choneshola peluchones


**Abre un archivo e imprime su contenido**
```python
texto  = open("archivo.txt","r")
print(texto.read())
``` 
**Cerrar archivo**
Después de terminar de trabajar con un archivo lo cerraremos con el método close. 

```python
archivo.txt.close()
``` 

El método **readline()** lee de un archivo una línea completa

```python

# Abre archivo en modo lectura
archivo = open('archivo.txt','r')  

# inicia bucle infinito para leer línea a línea
while True: 
    linea = archivo.readline()  # lee línea
    if not linea: 
        break  # Si no hay más se rompe bucle
    print(linea)  # Muestra la línea leída
archivo.close()  # Cierra archivo

```

El método **readlines()** lee todas las líneas de un archivo como una lista. 
Si se indica el parámetro de tamaño leerá esa cantidad de bytes del archivo y 
lo necesario hasta completar la última linea.

```python
# Abre archivo en modo lectura
archivo = open('archivo.txt','r')

# Lee todas la líneas y asigna a lista
lista = archivo.readlines()  

# Inicializa un contador
numlin = 0  

# Recorre todas los elementos de la lista
for linea in lista:
    # incrementa en 1 el contador  
    numlin += 1
    # muestra contador y elemento (línea)
    print(numlin, linea)
  
archivo.close()  # cierra archivo
```

**with-as** permite usar los archivos de forma óptima cerrándolos y liberando la memoria al 
concluir el proceso de lectura.

```python
# abre archivo (y cierra cuando termine lectura)
with open("indice.txt") as fichero:
    # recorre línea a línea el archivo
    for linea in fichero:
        # muestra línea última leída
        print(linea) 
```        
        

#### Escribir en archivo: write, writelines

El método write() escribe una cadena y el método writelines() escribe una lista a un archivo. Si en el momento de escribir el archivo no existe se creará uno nuevo.

```python
cadena1 = 'Datos'  # declara cadena1
cadena2 = 'Secretos'  # declara cadena2

# Abre archivo para escribir
archivo = open('datos1.txt','w')

# Escribe cadena1 añadiendo salto de línea 
archivo.write(cadena1 + '\n')

# Escribe cadena2 en archivo
archivo.write(cadena2) 

# cierra archivo
archivo.close()


# Declara lista
lista = ['lunes', 'martes', 'miercoles', 'jueves', 'viernes']  

# Abre archivo en modo escritura
archivo = open('datos2.txt','w')

# Escribe toda la lista en el archivo
archivo.writelines(lista)  

# Cierra archivo
archivo.close()  
```


In [9]:
# Escribir en archivo: write, writelines

cadena1 = 'Datos'  # declara cadena1
cadena2 = 'Secretos'  # declara cadena2

# Abre archivo para escribir
archivo = open('datos1.txt','w')

# Escribe cadena1 añadiendo salto de línea 
archivo.write(cadena1 + '\n')

# Escribe cadena2 en archivo
archivo.write(cadena2) 

# cierra archivo
archivo.close()


# Declara lista
lista = ['lunes', 'martes', 'miercoles', 'jueves', 'viernes']  

# Abre archivo en modo escritura
archivo = open('datos2.txt','w')

# Escribe toda la lista en el archivo
archivo.writelines(lista)  

# Cierra archivo
archivo.close()  

In [10]:
# Escribir en archivo: write, writelines con SALTO

# Abre archivo para escribir
archivo = open('datos2.txt','w')

# Declara lista
lista = ['lunes', 'martes', 'miercoles', 'jueves', 'viernes']

# Escribe toda la lista en el archivo
archivo.writelines(lista) 

# Escribe toda la lista con salto
for i in lista:
    archivo.writelines('\n'+ i)

# Cierra archivo
archivo.close()  

#### Mover el puntero: seek(), tell()

El método **seek()** desplaza el puntero a una posición del archivo y el método **tell()** devuelve la posición del puntero en un momento dado (en bytes).

```python
# Abre archivo en modo lectura
archivo = open('datos2.txt','r')  

# Mueve puntero al quinto byte
archivo.seek(5)  

# lee los siguientes 5 bytes
cadena1 = archivo.read(5) 

# Muestra cadena
print(cadena1) 

# Muestra posición del puntero 
print(archivo.tell())

# Cierra archivo
archivo.close()  
```

In [11]:
# Mover el puntero seek y tell

# Abre archivo en modo lectura
archivo = open('datos2.txt','r')  

# Mueve puntero al quinto byte
archivo.seek(5)  

# lee los siguientes 5 bytes
cadena1 = archivo.read(5) 

# Muestra cadena
print(cadena1) 

# Muestra posición del puntero 
print(archivo.tell())

# Cierra archivo
archivo.close()


marte
10


In [6]:
# Imprimir el caracter correspondiente a la posición

# Abre archivo en modo lectura
archivo = open('datos2.txt','r')  

# Mueve puntero al quinto byte
archivo.seek(5)  

# lee los siguientes 5 bytes
cadena1 = archivo.read(5) 

pos = archivo.tell()
pos = pos - 1
print(archivo.read(pos))

# Cierra archivo
archivo.close()

smiercole


#### Leer y escribir cualquier objeto a un archivo: pickle

Para leer y escribir cualquier tipo de objeto Python podemos importar el modulo **pickle** y usar sus métodos **dump()** y
**load()** para leer y escribir los datos.

```python

# Importa módulo pickle
import pickle

# Declara lista
lista = ['Perl', 'Python', 'Ruby']

# Abre archivo binario para escribir   
archivo = open('lenguajes.dat', 'wb')

# Escribe lista en archivo
pickle.dump(lista, archivo)

# Cierra archivo
archivo.close()

# Borra de memoria la lista
del lista  

# Abre archivo binario para leer
archivo = open('lenguajes.dat', 'rb')

# carga lista desde archivo
lista = pickle.load(archivo)

# Muestra lista  
print(lista)

# Cierra archivo
archivo.close()  

```

In [7]:
# Leer y escribir cualquier objeto a un archivo: pickle


# Importa módulo pickle
import pickle

# Declara lista
lista = ['Perl', 'Python', 'Ruby']

# Abre archivo binario para escribir   
archivo = open('lenguajes.dat', 'wb')

# Escribe lista en archivo
pickle.dump(lista, archivo)

# Cierra archivo
archivo.close()

# Borra de memoria la lista
del lista  

# Abre archivo binario para leer
archivo = open('lenguajes.dat', 'rb')

# carga lista desde archivo
lista = pickle.load(archivo)

# Muestra lista  
print(lista)

# Cierra archivo
archivo.close() 

['Perl', 'Python', 'Ruby']


In [14]:
# Nombre: receivefromArduino.py
# Objetivo: Genera datos aleatorios y los guarda en un archivo
# Autor: alumnos de LA2
# Fecha: 9 de julio de 2019


# importar libreria
from random import randint, uniform, random

#-----------------------------------------
# Método para escribir datos en un archivo
#------------------------------------------
def escribeDatoInFile(data):
    f = open('datos.txt', 'a')
    f.write(str(data)+",")

c = 0
while c < 100:
    dato = randint(10,100)
    print(dato) 
    # Invocamos función
    escribeDatoInFile(dato)
    c += 1
    
    #escribeDatoInFile(dato.decode().replace("\n", ""))

#puerto.close()


31
69
37
17
93
81
83
15
26
29
44
54
14
85
77
51
22
46
55
42
67
10
64
46
62
59
28
92
60
100
25
18
60
77
68
31
95
97
65
55
31
78
26
59
18
59
64
49
28
43
96
22
64
100
49
45
100
11
15
64
71
89
92
36
88
68
85
79
50
94
54
98
51
89
78
44
15
10
56
59
28
10
72
38
68
68
98
83
30
19
22
38
74
62
98
28
51
30
83
68


In [15]:
# Modificar el código del ejemplo anterior para escribir un archivo tipo CSV en formato renglon columna

import textract, re
text = textract.process("ArchivosCSV.pdf") # http://www.africau.edu/images/default/sample.pdf
words = re.findall(r"[^\W_]+", text, re.MULTILINE) # regex demo and explanation - https://regex101.com/r/U7WMSA/1
print(len(words))
print(words)

ModuleNotFoundError: No module named 'textract'

In [None]:
# Contar palabras del libro el quijote

import PyPDF2

def contar(cadena):
    let=0
    for i in cadena:
        let=let+1
    return let
    
    
with open('quijote.pdf', 'rb') as f:
    pal=0
    let=0
    read_pdf = PyPDF2.PdfFileReader(f)
    np = read_pdf.getNumPages()
    print("Numero de paginas: ",np)
    for i in range(0,np):
        page = read_pdf.getPage(i)
        page_content = page.extractText()
        let = let + contar(page_content)
        pal = pal + len(page_content.split())
        
    print('Numero de letras: ',let)
    print("Numero de palabras: ",pal)

f.close()