In [62]:
import pandas as pd
import nltk
import random
import datetime
from nltk.tokenize import sent_tokenize, word_tokenize
from nltk.stem import WordNetLemmatizer
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
from nltk.corpus import stopwords
import string # to process standard python strings

nltk.download('punkt')
nltk.download('wordnet')
nltk.download('stopwords')

file_path = '/content/sample_data/chatbot.txt'
with open(file_path, 'r') as file:
    text_chatbot = file.read()

print("Original text:\n", text_chatbot)

# Convert to lowercase
text_chatbot = text_chatbot.lower()
print("Lowercased text:\n", text_chatbot)

# Tokenize into sentences
sent_tokens = sent_tokenize(text_chatbot)
print("Sentences:\n", sent_tokens)

# Tokenize into words
word_tokens = word_tokenize(text_chatbot)
print("Words:\n", word_tokens)

# Lemmatization
lemmatizer = WordNetLemmatizer()
lemmatized_words = [lemmatizer.lemmatize(word) for word in word_tokens]
print("Lemmatized words:\n", lemmatized_words)

# Remove stopwords
stop_words = set(stopwords.words('english'))
filtered_words = [word for word in lemmatized_words if word not in stop_words]
print("Filtered words:\n", filtered_words)

print("Number of sentences:", len(sent_tokens))
print("Number of words:", len(word_tokens))

test_sentence = "This is a test sentence for lemmatization."

lemmer = nltk.stem.WordNetLemmatizer()
#WordNet is a semantically-oriented dictionary of English included in NLTK.
def LemTokens(tokens):
    return [lemmer.lemmatize(token) for token in tokens]
remove_punct_dict = dict((ord(punct), None) for punct in string.punctuation)
def LemNormalize(text):
    return LemTokens(nltk.word_tokenize(text.lower().translate(remove_punct_dict)))

normalized_tokens = LemNormalize(test_sentence)
print(normalized_tokens)

Original text:
 La felicidad es un estado de ánimo deseado y perseguido por muchas personas en todo el mundo. Se trata de una sensación de bienestar y satisfacción interna que puede manifestarse de diversas maneras. La búsqueda de la felicidad es un objetivo común para muchas personas, ya que todos anhelamos experimentar momentos de alegría y plenitud en nuestras vidas.

La felicidad puede encontrarse en las pequeñas cosas de la vida, como disfrutar de una comida deliciosa, compartir momentos especiales con seres queridos, contemplar un hermoso paisaje o simplemente reír a carcajadas. También puede estar vinculada al logro de metas personales, alcanzar el éxito profesional, encontrar el amor verdadero o experimentar un sentido de propósito y significado en la vida.

Es importante destacar que la felicidad no es un estado permanente, sino más bien una emoción fugaz que viene y va. Todos enfrentamos desafíos y adversidades en nuestras vidas que pueden afectar nuestra felicidad en diferen

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package wordnet to /root/nltk_data...
[nltk_data]   Package wordnet is already up-to-date!
[nltk_data] Downloading package stopwords to /root/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


In [63]:
# to lowercase
text_chatbot = text_chatbot.lower()
print(text_chatbot)

la felicidad es un estado de ánimo deseado y perseguido por muchas personas en todo el mundo. se trata de una sensación de bienestar y satisfacción interna que puede manifestarse de diversas maneras. la búsqueda de la felicidad es un objetivo común para muchas personas, ya que todos anhelamos experimentar momentos de alegría y plenitud en nuestras vidas.

la felicidad puede encontrarse en las pequeñas cosas de la vida, como disfrutar de una comida deliciosa, compartir momentos especiales con seres queridos, contemplar un hermoso paisaje o simplemente reír a carcajadas. también puede estar vinculada al logro de metas personales, alcanzar el éxito profesional, encontrar el amor verdadero o experimentar un sentido de propósito y significado en la vida.

es importante destacar que la felicidad no es un estado permanente, sino más bien una emoción fugaz que viene y va. todos enfrentamos desafíos y adversidades en nuestras vidas que pueden afectar nuestra felicidad en diferentes momentos. si

In [64]:
sent_tokens = nltk.sent_tokenize(text_chatbot)# converts documents to list of sentences
print(sent_tokens)


['la felicidad es un estado de ánimo deseado y perseguido por muchas personas en todo el mundo.', 'se trata de una sensación de bienestar y satisfacción interna que puede manifestarse de diversas maneras.', 'la búsqueda de la felicidad es un objetivo común para muchas personas, ya que todos anhelamos experimentar momentos de alegría y plenitud en nuestras vidas.', 'la felicidad puede encontrarse en las pequeñas cosas de la vida, como disfrutar de una comida deliciosa, compartir momentos especiales con seres queridos, contemplar un hermoso paisaje o simplemente reír a carcajadas.', 'también puede estar vinculada al logro de metas personales, alcanzar el éxito profesional, encontrar el amor verdadero o experimentar un sentido de propósito y significado en la vida.', 'es importante destacar que la felicidad no es un estado permanente, sino más bien una emoción fugaz que viene y va. todos enfrentamos desafíos y adversidades en nuestras vidas que pueden afectar nuestra felicidad en diferent

In [66]:
lemmer = nltk.stem.WordNetLemmatizer()
#WordNet is a semantically-oriented dictionary of English included in NLTK.
def LemTokens(tokens):
    return [lemmer.lemmatize(token) for token in tokens]
remove_punct_dict = dict((ord(punct), None) for punct in string.punctuation)
def LemNormalize(text):
    return LemTokens(nltk.word_tokenize(text.lower().translate(remove_punct_dict)))

LemTokens(sent_tokens)


['la felicidad es un estado de ánimo deseado y perseguido por muchas personas en todo el mundo.',
 'se trata de una sensación de bienestar y satisfacción interna que puede manifestarse de diversas maneras.',
 'la búsqueda de la felicidad es un objetivo común para muchas personas, ya que todos anhelamos experimentar momentos de alegría y plenitud en nuestras vidas.',
 'la felicidad puede encontrarse en las pequeñas cosas de la vida, como disfrutar de una comida deliciosa, compartir momentos especiales con seres queridos, contemplar un hermoso paisaje o simplemente reír a carcajadas.',
 'también puede estar vinculada al logro de metas personales, alcanzar el éxito profesional, encontrar el amor verdadero o experimentar un sentido de propósito y significado en la vida.',
 'es importante destacar que la felicidad no es un estado permanente, sino más bien una emoción fugaz que viene y va. todos enfrentamos desafíos y adversidades en nuestras vidas que pueden afectar nuestra felicidad en dif

In [67]:
GREETING_INPUTS = ("hello", "hi", "greetings", "sup", "what's up","hey",)
GREETING_RESPONSES = ["hi", "hey", "*nods*", "hi there", "hello", "I am glad! You are talking to me"]
def greeting(sentence):
 
    for word in sentence.split():
        if word.lower() in GREETING_INPUTS:
            return random.choice(GREETING_RESPONSES)

greeting('hello')

'hi'

In [68]:
def response(user_response):
    robo_response=''
    sent_tokens.append(user_response)
    TfidfVec = TfidfVectorizer(tokenizer=LemNormalize, stop_words='english')
    tfidf = TfidfVec.fit_transform(sent_tokens)
    vals = cosine_similarity(tfidf[-1], tfidf)
    idx=vals.argsort()[0][-2]
    flat = vals.flatten()
    flat.sort()
    req_tfidf = flat[-2]
    if(req_tfidf==0):
        robo_response=robo_response+"I am sorry! I don't understand you"
        return robo_response
    else:
        robo_response = robo_response+sent_tokens[idx]
        return robo_response

In [69]:
def get_current_time():
    current_time = datetime.datetime.now().strftime("%H:%M:%S")  # Get the current time in the format HH:MM:SS
    return current_time

In [61]:
flag=True
print("ROBO: My name is Robo. I will answer your queries about Chatbots. If you want to exit, type Bye!")
while(flag==True):
    user_response = input()
    user_response=user_response.lower()
    if(user_response!='bye'):
        if(user_response=='thanks' or user_response=='thank you' ):
            flag=False
            print("ROBO: You are welcome..")
        else:
            if(user_response =='time'):
                print("The current time is " + get_current_time())
            if(greeting(user_response)!=None):
                print("ROBO: "+greeting(user_response))
            else:
                print("ROBO: ",end="")
                print(response(user_response))
                sent_tokens.remove(user_response)
    else:
        flag=False
        print("ROBO: Bye! take care..")

ROBO: My name is Robo. I will answer your queries about Chatbots. If you want to exit, type Bye!
time




The current time is 18:04:08
ROBO: however, this is changing over time.


KeyboardInterrupt: ignored