In [0]:
__author__ = 'Ricardo Del Río Guzmán'

'''DEFINICIONES DE FUNCIONES'''

# ---------------------------------- FUNCIONES SOLICITADAS

def leer_diccionario(nom_archivo):
  # Construye y retorna el diccionario
  diccionario = {}

  with open(nom_archivo, 'r', encoding='utf-8') as archivo:
    lineas = archivo.readlines()
  for linea in lineas:
    palabras = linea.strip().split()
    contador = 0
    palabra_base = ''
    for palabra in palabras:
        contador +=1
        if contador == 1:
          palabra_base = palabra
          diccionario[palabra_base] = []
        else: 
          diccionario[palabra_base].append(palabra)
  
  return diccionario



def leer_texto(nom_archivo):
  # Lee el archivo línea por línea y retorna una lista donde cada 
  # elemento corresponde a una línea de texto.
  with open(nom_archivo, 'r', encoding='utf-8') as archivo:
    return archivo.readlines()

def separar_palabras(lista_lineas, separador=' '):
  # Separa las palabras contenidas en las líneas procesadas.
  # Cada línea procesada pasa a ser una nueva lista cuyos
  # elementos son sus palabras.
  matriz_palabras = []
  for linea in lista_lineas:
    matriz_palabras.append(linea.strip().strip('\ufeff').split(separador))
  return matriz_palabras

def cambiar_palabras(matriz_palabras, diccionario):
  # Cambia las palabras de un texto usando el diccionario previamente 
  # leído.
  palabras_vistas = []
  num_linea = 0
  for linea in matriz_palabras:
    num_palabra = 0
    for palabra in linea:
      palabra = palabra.strip('.').strip(',')
      # Si es llave del diccionario y ya fue vista antes:
      if palabra in palabras_vistas:
        matriz_palabras[num_linea][num_palabra] = usar_palabra_dic(palabra, diccionario)
      # Si la palabra es llave del dic. y no ha sido vista antes
      elif palabra in diccionario.keys():
        palabras_vistas.append(palabra)
      num_palabra += 1
    num_linea += 1
  return matriz_palabras

def grabar_archivo(nom_archivo, matriz, largo_linea=60):
  # Graba el archivo línea por línea de forma que cada línea escrita 
  # no supere la cantidad "largo_linea" de caracteres
  with open(nom_archivo, 'w', encoding='utf-8') as archivo:
    archivo.write(preparador_texto(matriz, largo_linea))
    

# ---------------------------------- FUNCIONES ADICIONALES

def usar_palabra_dic(palabra, diccionario):
  # Esta función se encarga de cambiar el orden de las palabras en el
  # diccionario a medida que las palabras son usadas.
  palabra_extraida = diccionario[palabra].pop(0)
  diccionario[palabra].append(palabra_extraida)
  return palabra_extraida

def preparador_texto(matriz, largo_linea):
  # Convierte la matriz de palabras en un texto con un máximo de caracteres por
  # líneas.

  #lista_palabras = []
  #for linea in matriz:
  #  lista_palabras += linea

  nuevo_texto = []
  nueva_linea = ''
  cant_palabras = 0 # Conteo de palabras en la nueva línea

  for linea in matriz:
    for palabra in linea:
      # Se calcula cuánto pasaría a medir la línea:
      carac_parciales = len(palabra) + len(nueva_linea) + 1
      # print(len(palabra), len(nueva_linea), cant_palabras)
      # Si se mantendría bajo el límite:
      if carac_parciales <= largo_linea:
        cant_palabras += 1
        if len(nueva_linea) == 0:
          nueva_linea += palabra
        else:
          nueva_linea += ' '+palabra
      # Si supera el límite:
      else:
        # print('SE SUPERO EL LIMITE CON LA PALABRA {}\nLa linea mediría {}'.format(palabra, carac_parciales))
        nuevo_texto.append(nueva_linea)
        # Se añade la palabra como primera de la siguiente línea:
        cant_palabras = 1
        nueva_linea = palabra
  nuevo_texto.append(nueva_linea)

  print('\nEl texto modificado es: \n\n'+'123456789 '*((largo_linea//10)+1)+'\n\n{}'.format('\n'.join(nuevo_texto)))
  print('\n'+'123456789 '*((largo_linea//10)+1))

  return '\n'.join(nuevo_texto)


In [10]:
'''EJECUCIÓN DE FUNCIONES'''

if __name__ == '__main__':

  archivo_texto = input('Ingresa el nombre del archivo con el texto: ')
  archivo_dic = input('Ingresa el nombre del archivo con el diccionario: ')
  nuevo_archivo = input('¿Cómo quieres que se llame el nuevo archivo? ')
  carac_linea = input('''\nIngresa la cantidad de caracteres por línea del texto final
                      \tDebe ser mínimo el largo de la palabra más extensa +1
                      \tEnter para usar valor por defecto\n''')
  print('Procesando...')
 

  if carac_linea.isnumeric():
    grabar_archivo(nuevo_archivo, 
                   cambiar_palabras(separar_palabras(leer_texto(archivo_texto)), 
                   leer_diccionario(archivo_dic)),
                   int(carac_linea))
  else:
    print('Se ha establecido el largo por defecto.')
    grabar_archivo(nuevo_archivo, 
                     cambiar_palabras(separar_palabras(leer_texto(archivo_texto)), 
                     leer_diccionario(archivo_dic)))
  
  print('\nListo! El archivo {} se ha creado con el texto modificado.'.format(nuevo_archivo))

Ingresa el nombre del archivo con el texto: /content/drive/My Drive/Classroom/Machine Learning C3 - 2 GRU/Ricardo Andres Del Rio Guzman - texto.txt
Ingresa el nombre del archivo con el diccionario: /content/drive/My Drive/Classroom/Machine Learning C3 - 2 GRU/Ricardo Andres Del Rio Guzman - diccionario.txt
¿Cómo quieres que se llame el nuevo archivo? nuevo_texto.txt

Ingresa la cantidad de caracteres por línea del texto final
                      	Debe ser mínimo el largo de la palabra más extensa +1
                      	Enter para usar valor por defecto

Procesando...
Se ha establecido el largo por defecto.

El texto modificado es: 

123456789 123456789 123456789 123456789 123456789 123456789 123456789 

El gato de la Su salió a pasear en el bosque donde encontró
otro felino que jugaba con un mono el primer minino se enojó
con el otro cuchito porque ese felino le estaba pegando al
pobre simio en ese momento vio que venía otro gorila a
defender al primer macaco

123456789 123456789 

In [4]:
from os import getcwd, listdir

''' ESTE CÓDIGO PERMITE GENERAR LOS ARCHIVOS DE PRUEBA CON FACILIDAD '''

with open('diccionario.txt', 'w', encoding='utf-8' ) as archivo:
  archivo.write('''gato felino minino cuchito
mono simio gorila macaco''')
  
with open('texto.txt', 'w', encoding='utf-8' ) as archivo:
  archivo.write('''El gato de la Su salió a pasear en el bosque
donde encontró otro gato que jugaba con un mono
el primer gato se enojó con el otro gato porque ese gato
le estaba pegando al pobre mono
en ese momento vio que venía otro mono a defender al 
primer mono.''')

print(listdir(getcwd()))

['.config', 'diccionario.txt', 'texto.txt', 'sample_data']


In [9]:
from google.colab import drive
drive.mount('/content/drive')

Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3Aietf%3Awg%3Aoauth%3A2.0%3Aoob&scope=email%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdocs.test%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdrive%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdrive.photos.readonly%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fpeopleapi.readonly&response_type=code

Enter your authorization code:
··········
Mounted at /content/drive
