Ejemplo de uso: Estamos trabajando para una editorial y tienen muchos ficheros de tipo .txt

Creamos una clase que:

- Recibe dos parámetros en el método constructor: 1. La ruta donde se encuentra el fichero, 2. El nombre y la extensión del fichero que quieren abrir. 

- Tiene un método que nos abre el fichero en python, y obtiene un único *string* con el contenido del archivo. Debemos proporcionarle la ruta en la que está situado el archivo para que podamos abrirlo independientemente de dónde esté situado.

- Tiene un método que nos abre el fichero en python, y obtiene un único *string* con un número de palabras determinado del contenido del archivo. Debemos proporcionarle el número de palabras como parámetro. Si pasamos el número como tipo distinto a *integer*, nos saldrá un mensaje de error

- Tiene un método que nos abre el fichero en python, y obtiene un único *string* con todas o bien con un número determinado de LÍNEAS del contenido del archivo. El número de líneas se nos pide como *input*. Si pasamos el número como tipo distinto a *integer*, nos saldrá un mensaje de error. El método nos devuelve el texto como un único *string*.

- Tiene un método específico que obtiene un *string* con el contenido principal del archivo, sin la introducción inicial ni el epílogo. Debemos proporcionar de qué línea a qué linea se encuentra el texto principal (el texto principal en el archivo *quijote.txt* está a partir de la línea 1780 y hasta la 74276)

- Tiene un método que nos permite extraer cuántas veces aparece un determinado *string* en el contenido del archivo. El *string* se nos pide como *input* y el método nos devuelve el número de coincidencias. No distingue entre mayúsculas y minúsculas

In [10]:
import os
import re

In [11]:

class Libro:
    """
    Representa un archivo.
    Attributes:
    ruta (str): Ruta
    encod (str): Encoding
    """ 
    
    def __init__(self, ruta, encod): 
        """
        Inicializa en objeto de tipo Archivo
        Args:
        ruta (str): Ruta del archivo en nuestro ordenador
        encod (str): Encoding necesario para que el archivo reconozca los caracteres especiales
        """
             
        self.ruta = ruta
        self.encod = encod
        
        
        
    def openfile(self):
        """
        Nos permite abrir un archivo y obetener su contenido
        Args:
        
        Returns: 
        texto_completo (str): Un string con el contenido del archivo
        """
              
        with open (self.ruta, encoding = self.encod) as f:
            texto_completo = f.read()            
            
        return texto_completo
           
        
        
    def getwords(self, palabras):
        self.palabras = palabras
        """
        Nos permite abrir un archivo y obtener un número específico de palabras
        Args:
        num_words(int): número de palabras
        Returns: 
        texto_seleccion (str): Un string con las palabras especificadas
        """
        
        try:            
            texto_completo = self.openfile()
            lista_limpia = re.sub('\n', ' ', texto_completo)
            lista_dividida = re.split(' +', lista_limpia)
            lista_seleccion = lista_dividida[:self.palabras]
            texto_seleccion = ' '.join(lista_seleccion)            
            return texto_seleccion
                           
        except TypeError:
            print('Debes introducir un número entero')
        
            
                    
    def getlines(self): 
        """
        Nos permite abrir un archivo y obtener todas o un número específico de líneas
        Args:
        
        Returns: 
        texto_seleccion (str): Un string con todo el texto o con las líneas especificadas
        """ 
        texto_completo = self.openfile()        
        
        choice = int(input("""Elige una opcion:
                           1. Leer el libro entero
                           2. Leer un numero de lineas"""))
        if choice == 1:            
            return texto_completo                      
                       
        elif choice == 2:
            try:            
                lineas = int(input('¿Cuantas lineas quieres leer?'))                
                lista_dividida = re.split('\n', texto_completo)
                lista_seleccion = lista_dividida[:lineas]
                texto_seleccion = '\n'.join(lista_seleccion)
                return texto_seleccion                                    
            except ValueError:
                        print('Introduce un numero entero')
                        self.getlines()
        else:
            self.getlines()
            
              
            
    def dropintro(self, linea_ini, linea_fin):
        self.linea_ini = linea_ini
        self.linea_fin = linea_fin
        """
        Nos permite abrir un archivo y especificar desde que línea hasta qué línea
        Args:
        linea_ini(int): numero de linea donde se inicia el texto principañ
        linea_fin(int): numero de linea donde finaliza el texto principal
        Returns: 
        texto_seleccion (str): Un string con las líneas especificadas
        """ 
        texto_completo = self.openfile()
        lista_dividida = re.split('\n', texto_completo)
        lista_seleccion = lista_dividida[self.linea_ini:self.linea_fin+1]
        texto_seleccion = '\n'.join(lista_seleccion)
        return texto_seleccion
            
            
            
    def searchwords(self):
        """
        Nos permite saber cuantas veces se repite una frase o una palabra en el contenido de un archivo sin distinguir mayusculas o minusculas
        Args:
         
        Returns: 
        recuento (int): numero de coincidencias
        """ 
        texto_completo = self.openfile().lower()
              
        palabra = input('¿Que palabra quieres buscar?')
        print(palabra)
        busqueda = re.findall(palabra.lower(), texto_completo)
        recuento = len(busqueda)
        
        return recuento         
                         
        

In [12]:
encoding_archivo = 'latin-1'
ruta_archivo = 'data/quijote.txt'

libro1 = Libro(ruta_archivo, encoding_archivo)

In [13]:
lectura1 = libro1.openfile()
print(lectura1)

Project Gutenberg Etext of Don Quijote, by Cervantes, in Spanish

#2 in our series by Cervantes



We will be presenting two versions of this, one in HTML and one

in "Plain Upper ASCII Spanish."



The HTML file will have "h" as the last character in the name...

such as 2donq10h.htm and the plain file will be 2donq10.txt





Also see

Jul 1997 Don Quixote, by Miguel de Cervantes--[1donqxxx.xxx] 996





Copyright laws are changing all over the world, be sure to check

the copyright laws for your country before posting these files!!



Please take a look at the important information in this header.

We encourage you to keep this file on your own disk, keeping an

electronic path open for the next readers.  Do not remove this.





**Welcome To The World of Free Plain Vanilla Electronic Texts**



**Etexts Readable By Both Humans and By Computers, Since 1971**



*These Etexts Prepared By Hundreds of Volunteers and Donations*



Information on contacting Project Gutenberg to get Etext

In [14]:
lectura2 = libro1.getwords(80)
print(lectura2)

Project Gutenberg Etext of Don Quijote, by Cervantes, in Spanish #2 in our series by Cervantes We will be presenting two versions of this, one in HTML and one in "Plain Upper ASCII Spanish." The HTML file will have "h" as the last character in the name... such as 2donq10h.htm and the plain file will be 2donq10.txt Also see Jul 1997 Don Quixote, by Miguel de Cervantes--[1donqxxx.xxx] 996 Copyright laws are changing all over the world, be sure to check


In [15]:
lectura3 = libro1.getlines()
print(lectura3)

Project Gutenberg Etext of Don Quijote, by Cervantes, in Spanish

#2 in our series by Cervantes



We will be presenting two versions of this, one in HTML and one

in "Plain Upper ASCII Spanish."



The HTML file will have "h" as the last character in the name...

such as 2donq10h.htm and the plain file will be 2donq10.txt





Also see

Jul 1997 Don Quixote, by Miguel de Cervantes--[1donqxxx.xxx] 996





Copyright laws are changing all over the world, be sure to check

the copyright laws for your country before posting these files!!



Please take a look at the important information in this header.

We encourage you to keep this file on your own disk, keeping an

electronic path open for the next readers.  Do not remove this.





**Welcome To The World of Free Plain Vanilla Electronic Texts**



**Etexts Readable By Both Humans and By Computers, Since 1971**



*These Etexts Prepared By Hundreds of Volunteers and Donations*



Information on contacting Project Gutenberg to get Etext

In [16]:
lectura4 = libro1.dropintro(1780, 74277)
print(lectura4)

En un lugar de la Mancha, de cuyo nombre no quiero acordarme, no ha mucho

tiempo que vivía un hidalgo de los de lanza en astillero, adarga antigua,

rocín flaco y galgo corredor. Una olla de algo más vaca que carnero,

salpicón las más noches, duelos y quebrantos los sábados, lantejas los

viernes, algún palomino de añadidura los domingos, consumían las tres

partes de su hacienda. El resto della concluían sayo de velarte, calzas de

velludo para las fiestas, con sus pantuflos de lo mesmo, y los días de

entresemana se honraba con su vellorí de lo más fino. Tenía en su casa una

ama que pasaba de los cuarenta, y una sobrina que no llegaba a los veinte,

y un mozo de campo y plaza, que así ensillaba el rocín como tomaba la

podadera. Frisaba la edad de nuestro hidalgo con los cincuenta años; era de

complexión recia, seco de carnes, enjuto de rostro, gran madrugador y amigo

de la caza. Quieren decir que tenía el sobrenombre de Quijada, o Quesada,

que en esto hay alguna diferencia en 

In [17]:
recuento1 = libro1.searchwords()
recuento1

Don Quijote de la Mancha


97