## Reto 01_M2: Data Augmentation

In [1]:
# Importación de librerías
import spacy


# Frases para trabajar:

# Frases para swap posicional (por verbos)
Frases_swap = ["Programar mi alarma a las 8",
               "Poner mi alarma a las 5 AM",
               "Por favor, configura mi alarma a las 6PM",
               "Hola ChatBot, coloca mi alarma para las 2AM"]

# Frases para inserción de errores comunes
Frases_errores = ["quiero hacer un retiro sin tarjeta",
                  "me puedes por favor mostrar mi saldo",
                  "¿cuales fueron mis gastos de este mes?",
                  "necesito hacer una consulta de movimientos"]

# Frases para aplicar diccionarios de campos semánticos
Frases_campos = ["quiero ver mis gastos de agosto",
            "quiero transferir 20 pesos",
            "Dame mis movimientos de septiembre",
            "quiero enviar $40, por favor"]

## Técnica 1.- Swap Posicional

In [3]:
# Método para realizar Swap posicional
# core_es = spacy.load("es_core_news_lg")
core_es = spacy.load("es_core_news_md")

def swap_posicional(Textos):
    # Recuperamos los verbos (Lematizados para homologar)
    verbos = []
    for Texto in Textos:
        for token in core_es(Texto):
            if token.pos_ == "VERB":
                verbos.append(token.lemma_)
    # Generamos los nuevos ejemplos
    frases_nuevas = []
    for Texto in Textos:
        for token in core_es(Texto):
            if token.pos_ == "VERB":
                for verbo in verbos:
                    frases_nuevas.append(Texto.replace(token.text, verbo))
    
    return frases_nuevas

# Implementamos el método programado
frases_totales = swap_posicional(Frases_swap)
print("Frases originales:", len(Frases_swap))
print("Frases nuevas:", len(frases_totales) - len(Frases_swap))
print("\nTodas las frases:")
for f in frases_totales:
    print(f)

Frases originales: 4
Frases nuevas: 12

Todas las frases:
programar mi alarma a las 8
poner mi alarma a las 8
configurar mi alarma a las 8
colocar mi alarma a las 8
programar mi alarma a las 5 AM
poner mi alarma a las 5 AM
configurar mi alarma a las 5 AM
colocar mi alarma a las 5 AM
Por favor, programar mi alarma a las 6PM
Por favor, poner mi alarma a las 6PM
Por favor, configurar mi alarma a las 6PM
Por favor, colocar mi alarma a las 6PM
Hola ChatBot, programar mi alarma para las 2AM
Hola ChatBot, poner mi alarma para las 2AM
Hola ChatBot, configurar mi alarma para las 2AM
Hola ChatBot, colocar mi alarma para las 2AM


## Técnica 2.- Inserción de errores

In [5]:
# Lista con los errores de ortografía comunes
Errores = {'hacer': ['acer', 'aser'],
           'saldo': ['zaldo', 'saldó'],
           'favor': ['fabor'],
           'quiero': ['kiero', 'qiero'],
           'gastos': ['gaztos', 'gastoz'],
           'necesito': ['nesesito', 'nesecito']}

def errores_ortografia(Textos):
    frases_nuevas = []
    for Texto in Textos:
        for clave in Errores.keys():
            # Verificar si las Clave del Diccionario aparecen en el texto
            if clave in Texto:
                # Escribir todas las variantes mal escritas del diccionario
                for error in Errores[clave]:
                    frases_nuevas.append(Texto.replace(clave, error))

    return frases_nuevas

# Implementamos el método programado
frases_nuevas = errores_ortografia(Frases_errores)
print("Frases originales:", len(Frases_errores))
print("Frases nuevas:", len(frases_nuevas))
print("\nTodas las frases:")
for f in Frases_errores:
    print(f)
for f in frases_nuevas:
    print(f)

Frases originales: 4
Frases nuevas: 13

Todas las frases:
quiero hacer un retiro sin tarjeta
me puedes por favor mostrar mi saldo
¿cuales fueron mis gastos de este mes?
necesito hacer una consulta de movimientos
quiero acer un retiro sin tarjeta
quiero aser un retiro sin tarjeta
kiero hacer un retiro sin tarjeta
qiero hacer un retiro sin tarjeta
me puedes por favor mostrar mi zaldo
me puedes por favor mostrar mi saldó
me puedes por fabor mostrar mi saldo
¿cuales fueron mis gaztos de este mes?
¿cuales fueron mis gastoz de este mes?
necesito acer una consulta de movimientos
necesito aser una consulta de movimientos
nesesito hacer una consulta de movimientos
nesecito hacer una consulta de movimientos


## Técnica 3.- Diccionarios de Campos semánticos

In [6]:
# Listas con los campos semánticos
Meses = ['enero', 'febrero', 'marzo', 'abril', 'mayo', 'junio', 'julio', 'agosto', 'septiembre', 'octubre', 'noviembre', 'diciembre']
Verbos = ['transferir', 'enviar', 'mandar', 'pasar']

Campos_Semanticos = [Meses, Verbos]

def campos_semanticos(Textos):
    frases_totales = []
    for Texto in Textos:
        for Campo in Campos_Semanticos:
            for Palabra in Campo:
                if Palabra in Texto:
                    for n_Palabra in Campo:
                        # AGREGAMOS la misma frase REEMPLAZANDO por las opciones de la lista
                        frases_totales.append(Texto.replace(Palabra, n_Palabra))
    return frases_totales

# Implementamos el método programado
frases_totales = campos_semanticos(Frases_campos)
print("Frases originales:", len(Frases_campos))
print("Frases nuevas:", len(frases_totales) - len(Frases_campos))
print("\nTodas las frases:")
for f in frases_totales:
    print(f)

Frases originales: 4
Frases nuevas: 28

Todas las frases:
quiero ver mis gastos de enero
quiero ver mis gastos de febrero
quiero ver mis gastos de marzo
quiero ver mis gastos de abril
quiero ver mis gastos de mayo
quiero ver mis gastos de junio
quiero ver mis gastos de julio
quiero ver mis gastos de agosto
quiero ver mis gastos de septiembre
quiero ver mis gastos de octubre
quiero ver mis gastos de noviembre
quiero ver mis gastos de diciembre
quiero transferir 20 pesos
quiero enviar 20 pesos
quiero mandar 20 pesos
quiero pasar 20 pesos
Dame mis movimientos de enero
Dame mis movimientos de febrero
Dame mis movimientos de marzo
Dame mis movimientos de abril
Dame mis movimientos de mayo
Dame mis movimientos de junio
Dame mis movimientos de julio
Dame mis movimientos de agosto
Dame mis movimientos de septiembre
Dame mis movimientos de octubre
Dame mis movimientos de noviembre
Dame mis movimientos de diciembre
quiero transferir $40, por favor
quiero enviar $40, por favor
quiero mandar $40, 