In [17]:
import nltk
from nltk.chat.util import Chat, reflections
import json
import re
import unicodedata
import random

In [18]:
def normalizar_texto(texto):
    """
    Convierte texto a minúsculas y elimina tildes para mejorar la coincidencia de patrones.
    """
    texto = texto.lower()
    texto = ''.join(c for c in unicodedata.normalize('NFD', texto) if unicodedata.category(c) != 'Mn')  # Elimina tildes
    return texto

In [19]:
def leer_json_y_generar_patrones_respuestas(ruta_archivo):
    with open(ruta_archivo, 'r', encoding='utf-8') as archivo:
        data = json.load(archivo)
    
    patrones_respuestas = []
    patrones_unificados = {}  # Para agrupar patrones similares en una sola expresión

    for intent in data['intents']:
        patterns = intent['patterns']
        responses = intent['responses']
        
        # Normalizamos los patrones para evitar problemas con tildes o mayúsculas
        patterns_normalizados = [normalizar_texto(p) for p in patterns]
        regex_pattern = r'\b(' + '|'.join(map(re.escape, patterns_normalizados)) + r')\b'
        
        # Agrupamos respuestas si ya existe un patrón similar
        if regex_pattern in patrones_unificados:
            patrones_unificados[regex_pattern].extend(responses)
        else:
            patrones_unificados[regex_pattern] = responses

    # Convertimos el diccionario en la lista de tuplas (pattern, responses)
    for pattern, responses in patrones_unificados.items():
        patrones_respuestas.append((pattern, responses))

    return patrones_respuestas

In [20]:
# Ruta del archivo JSON
ruta_archivo = '..\\datos web\\output.json'
patrones_respuestas = leer_json_y_generar_patrones_respuestas(ruta_archivo)

In [21]:
# ruta_archivo = '..\\datos web\\output.json'
# patrones_respuestas = leer_json_y_generar_patrones_respuestas(ruta_archivo)

for item in patrones_respuestas:
    print(item)

('\\b(contacto)\\b', ['Correo: 46019015@edu.gva.es\nFAX : 961206091\nE-mail: 46019015.secretaria@edu.gva.es\nTelefono : 961206090'])
('\\b(correo)\\b', ['Correo: 46019015@edu.gva.es\nE-mail: 46019015.secretaria@edu.gva.es'])
('\\b(fax)\\b', ['FAX : 961206091'])
('\\b(telefono)\\b', ['Telefono : 961206090'])
('\\b(¿que\\ informacion\\ hay\\ sobre\\ paginas\\ web\\?)\\b', ['http://www.dmae.upct.es/~juan/matematicas.htm', 'https://areatablet.wordpress.com/', 'http://www.ceice.gva.es/doc046/gen/es/tasas.asp?idf=TITULOS', 'https://ceice.gva.es/es/web/formacion-profesional/pruebas-de-acceso-a-ciclos-formativos', 'https://media.upv.es/#/catalog/channel/eda03965-19d6-1a4e-abaf-cf5b04ce1a6e', 'http://www.intersindical.org/escola/activitat/9081', 'https://portal.edu.gva.es/46019015/', 'http://cefire.edu.gva.es/sfp/index.php?usuario=formacion', 'http://www.ceice.gva.es/doc046/gen/val/tasas.asp?idf = ADMIN', 'http://www.apuntesmareaverde.org.es/', 'http://www.ceice.gva.es/doc046/gen/val/tasas.asp?

In [22]:
# Crear el chatbot usando `nltk.Chat`
chatbot = Chat(patrones_respuestas, reflections)

print("Chatbot: Hi! Type 'exit' to end the conversation.")
while True:
    user_input = input("You: ").strip()
    user_input_normalizado = normalizar_texto(user_input)

    if user_input_normalizado in ["exit", "quit"]:
        print("Chatbot: Goodbye!")
        break

    response = None
    for pattern, responses in patrones_respuestas:
        if re.search(pattern, user_input_normalizado, re.IGNORECASE):  # Busca sin importar mayúsculas o minúsculas
            response = random.choice(responses)
            break

    if response:
        print(f"Chatbot: {response}")
    else:
        print("Chatbot: I'm not sure how to respond to that.")

Chatbot: Hi! Type 'exit' to end the conversation.
Chatbot: I'm not sure how to respond to that.
Chatbot: PREMIOS De FP
Batxillerat
Grado Superior
Grau Superior Desenvolupament d'Aplicacions Multiplataforma
Intelligncia Artificial i Big data
2 ESO
Grau Superior
3 ESO
4 ESO
Grau Superior Administraci i Finances
Grau Superior Desenvolupament d'Aplicacions Web
Chatbot: Telefono : 961206090
Chatbot: Telefono : 961206090
Chatbot: Goodbye!
