# ChatBot

In [None]:
!pip install pystempel



In [None]:
import csv
from pystempel import Stemmer

stemmer = Stemmer.polimorf()

Loading: 100%|██████████| 11368252/11368252 [00:13<00:00, 854277.95bytes/s] 


In [None]:
for word in ['komputer', 'komputery', 'komputerami', 'był', 'jest', 'są', 'były', 'pierzyna', 'pierzyny', 'pierza', 'źółtego', 'brązowym']:
  print(f'{word} --> {stemmer(word)}')

komputer --> komputer
komputery --> komputer
komputerami --> komputer
był --> być
jest --> być
są --> być
były --> były
pierzyna --> pierzyna
pierzyny --> pierzyna
pierza --> pierze
źółtego --> źółty
brązowym --> brązowy


In [None]:
for word in ['...', 'i', 'ujrzał', 'Pan', 'pracę', 'naszą', 'i', 'był', 'zadowolony', ',', 'a', 'potem', 'zapytawszy', 'o', 'zarobki', 'nasze', '-', 'usiadł', 'i', 'zapłakał', '...']:
  print(f'{word} --> {stemmer(word)}')

... --> ...
i --> i
ujrzał --> ujrzeć
Pan --> Pawumeowy
pracę --> praca
naszą --> nasz
i --> i
był --> być
zadowolony --> zadowolony
, --> ,
a --> ativus
potem --> pot
zapytawszy --> zapytać
o --> ojciec
zarobki --> zarobki
nasze --> nasze
- --> -
usiadł --> usiąść
i --> i
zapłakał --> zapłakać
... --> ...


In [None]:
with open('dialogs.csv', 'w') as file:
  csv_writer = csv.writer(file, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)

  csv_writer.writerow(['Cześć', 'Cześć'])
  csv_writer.writerow(['Co u ciebie słychać?', 'Dobrze, dziękuję.'])
  csv_writer.writerow(['Powiedz coś miłego', 'Jesteś najbardziej interesującym człowiekiem jakiego znam!'])
  csv_writer.writerow(['Czy jesteś sztuczną inteligencją?', 'Oczywiście, nie widać?'])
  csv_writer.writerow(['Niezwykłe', 'Tak, wiem. Dziękuję za komplement!'])
  # ...
  csv_writer.writerow(['pa', 'Pa, pa!'])

In [None]:
class Chatbot():

  def __init__(self, csv_dialogs_file):
    self.csv_dialogs_file = csv_dialogs_file


  def create_dialog_tuples(self):
    pairs = []
    with open(self.csv_dialogs_file, newline='') as file:
      csv_reader = csv.reader(file, delimiter=',', quotechar='"')
      for row in csv_reader:
        pairs.append((row[0], row[1]))
    return pairs

  def split_and_clean(self, sentence):
    punkt = ',.?!\'";@#$%&*+-_`<>{}()'
    sentence_tokenized = [word.lower() for word in sentence.split()]
    sentence_tokenized_clean = []
    for word in sentence_tokenized:
      if word[0] in punkt:
        word = word[1:]
      if word[-1] in punkt:
        word = word[:-1]
      sentence_tokenized_clean.append(stemmer(word))
    return sentence_tokenized_clean

  def find_matching(self, user_phrase, pairs):
    answer = 'Nie wiem.'
    intersection_len_prev = 0
    for index, pair in enumerate(pairs):
      user_speaks = set(self.split_and_clean(user_phrase.lower()))
      matching = set(self.split_and_clean(pair[0]))
      intersection_len = len(set.intersection(user_speaks, matching))
      if intersection_len > intersection_len_prev:
        answer = pairs[index][1]
        print(f'\tuser speaks: {user_speaks}')
        print(f'\tmatching: {matching}')
    return answer

  def run(self):
    pairs = self.create_dialog_tuples()
    user_phrase = input("ty: ")
    while True:
      if not user_phrase:
        print('END')
        break
      else:
        answer = self.find_matching(user_phrase, pairs)
        print(f'chatbot: {answer}')
      user_phrase = input("ty: ")

chatbot = Chatbot('dialogs.csv')
chatbot.run()

ty: cześć
	user speaks: {'cześć'}
	matching: {'cześć'}
chatbot: Cześć
ty: coś miłego
	user speaks: {'miły', 'coś'}
	matching: {'miły', 'powiedzieć', 'coś'}
chatbot: Jesteś najbardziej interesującym człowiekiem jakiego znam!


KeyboardInterrupt: Interrupted by user