## Создание приложение
Поздравляю, вы прошли 1 этап! Каждый из вас решил свою часть одной большой задачи — исправление опечаток. Несмотря на то, что по отдельности задача решена, воспользоваться кодом будет проблематично. Поэтому в этом блокноте мы создадим класс для нашего приложения.

Что такое класс? Простыми словами это шаблон кода, по которому создаётся объект. Класс как правило имеет атрибуты (какие-то переменные класса) и методы (какие-то функции класса). Вгляните на код ниже:

In [None]:
# Создаём класс собаки. Собака обязательно имеет имя и умеет гавкать
class Dog:
    # Создаём метод __init__, который автоматически запускается
    # при создании класса. В нём можем указать аргумент класса
    def __init__(self, name):
        self.name = name  # Переменная класса, её могут использовать
                          # методы через self.name

    # Создаём другой метод, который будет возвращать строку
    def say_woof(self):
        string = f'{self.name} says woof!'  # Переменная метода, она может быть
                                            # использована только внутри метода
        return string



dog1 = Dog('Rex')  # Иницилизируем объект класса, передавая в аргумент имя
print(dog1.name)  # Атрибут имени
print(dog1.say_woof())  # Метод класса say_woof()


Знакомо? Вы уже сталкивались с классами, просто не знали об этом. Python это объектно-ориентированный язык программирования и буквально всё в нём организовано в системе классов. Вот простой пример:

In [None]:
string = str('Damn good coffee!')  # Иницилизируем объект класса str,
                                   # передавая в аргумент строку
print(string.upper())  # Вызываем метод класса, то есть какую-то функцию,
                       # которая доступна для объектов класса


Раз уж мы пишем на питоне, то давайте позаботимся об удобстве использования нашего приложения, для этого составим класс из тех функций, которые мы уже написали. Для того, чтобы сэкономить время, скелет нашего класса уже написан:

In [None]:
# Для того, чтобы создать класс, напишем class [имя класса с большой буквы]:
class SpellChecker:
    # При создании объектов нашего класса всегда запускается функция иницилизации.
    # В ней мы сможем указать аргумент нашего класса. Кстати, в каждом методе
    # мы указываем self, чтобы обращаться к нашему же классу за функциями и
    # переменными
    def __init__(self, text):
        self.text = text  # Переменная класса, к-ая будет содержать аргумент - текст


In [None]:
# Запусти код, чтобы проверить, что получилось

spell_checker_app = SpellChecker('Damn good coffee!')
# Обратимся к переменной класса, чтобы узнать аргумент
print(spell_checker_app.text)


Отлично, скелет класса готов! Теперь осталось добавить написанные ранее функции и сделать их методами. Вот инструкция:
1. Внутри класса пишем название метода, указав в аргументе `self`. Например,
```
def say_woof(self):
```
2. Внутри метода класса вставляем то, что делает функция чтения массива слов. Добавьте в files google colab созданный одним/одной из вас файл words_massive.json и верните список слов с помощью `return`. Заметь, мы будем читать массив json в переменную без self, вот так: `words_massive = json.load(f)`. Переменные класса (те, которые с self) будем использовать только для исходного текста.
3. Проверьте, всё ли работает: запустите ячейку с кодом после того, как заполните новый метод. Он должен выдать вам количество слов в списке.

In [None]:
import json  # Библиотека для работы с json файлами

class SpellChecker:
    def __init__(self, text):
        self.text = text

    # Напиши новый метод здесь



In [None]:
# Запусти этот код, чтобы проверить, всё ли работает
spell_checker_app = SpellChecker('Damn good coffee!')
print(len(spell_checker_app.get_words_massive()))


Отлично! Первый метод добавлен. Продолжим инструкцию:
4. Добавьте метод, который будет извлекать токены из текста, переданного в аргументе. Это делается также, как и с предыдущим методом, но теперь мы будем обращаться к переменной с текстом с помощью `self.text`. Посмотрите в чем разница:
```
# Работаем с функцией
def get_tokens_dict(text):
      # Иницилизируем части речи, которые мы не будем рассматривать
      banned_pos = ['PROPN', 'SYM', 'PART', 'CCONJ', 'ADP', 'PUNCT']

      # Инициализируй doc с помощью функции nlp()
      doc = nlp(text)
```
```
# Работаем с методом
def get_tokens_dict(self):
      # Иницилизируем части речи, которые мы не будем рассматривать
      banned_pos = ['PROPN', 'SYM', 'PART', 'CCONJ', 'ADP', 'PUNCT']

      # Инициализируй doc с помощью функции nlp()
      doc = nlp(self.text)
```

Заполните ячейку с кодом ниже, скопировав ранее заполненный метод сверху:

In [None]:
import json  # Библиотека для работы с json файлами
import spacy  # Библиотека для работы с токенами
nlp = spacy.load("en_core_web_sm")  # Модель для работы с токенами

class SpellChecker:
    def __init__(self, text):
        self.text = text

    # Вставь сюда метод для создания списка слов


    # Напиши новый метод здесь




In [None]:
# Проверим, всё ли работает
spell_checker_app = SpellChecker('Damn good coffee!')
print('Количество слов в списке:', len(spell_checker_app.get_words_massive()))
print('Словарь токенов из текста:', spell_checker_app.get_tokens_dict())

Отлично! Половина пути пройдена. Продолжим:
5. Действуем по аналогии и добавляем метод, который будет рассчитывать расстояние Левенштейна: (не забудь про то, что в аргументе будет self, а затем 2 слова)

In [None]:
import json  # Библиотека для работы с json файлами
import spacy  # Библиотека для работы с токенами
nlp = spacy.load("en_core_web_sm")  # Модель для работы с токенами

class SpellChecker:
    def __init__(self, text):
        self.text = text

    # Вставь сюда метод для создания списка слов


    # Вставь сюда метод для создания словаря токенов из текста


    # Напиши новый метод здесь




In [None]:
# Проверим, всё ли работает
spell_checker_app = SpellChecker('Damn good coffee!')
print('Количество слов в списке:', len(spell_checker_app.get_words_massive()))
print('Словарь токенов из текста:', spell_checker_app.get_tokens_dict())
print(
    'Расстояние Левенштейна между словами cat и cot:',
    spell_checker_app.levenstein('cat', 'cot')
    )

6. Последняя функция это `build_dict(text)`. По аналогии добавьте её в качестве метода. Не забудьте, что все обращения к функциям теперь делаются через `self`, вот так: `self.get_tokens_dict()`.

In [None]:
import json  # Библиотека для работы с json файлами
import spacy  # Библиотека для работы с токенами
nlp = spacy.load("en_core_web_sm")  # Модель для работы с токенами

class SpellChecker:
    def __init__(self, text):
        self.text = text

    # Вставь сюда метод для создания списка слов


    # Вставь сюда метод для создания словаря токенов из текста


    # Вставь сюда метод для рассчёта расстояния Левенштейна


    # Напиши новый метод здесь




In [None]:
# Запусти эту ячейку, чтобы проверить, всё ли работает

text = """
Twin Peaks is an American mystery sirial drama televizion series
created by Mark Frost and David Lynch. It premeired on ABC on April 8, 1990,
and ran for twoo seasons until its cancellation in 1991. The show returned
in 2017 for a third season on Showtime.
"""

spell_checker_app = SpellChecker(text)
print('Количество слов в списке:', len(spell_checker_app.get_words_massive()))
print('Словарь токенов из текста:', spell_checker_app.get_tokens_dict())
print(
    'Расстояние Левенштейна между словами cat и cot:',
    spell_checker_app.levenstein('cat', 'cot')
    )
print('Словарь с исправлениями: ', spell_checker_app.build_dict())

Отлично, класс полностью готов к использованию! Теперь скопируйте класс и вставьте в файл spell_checker.py, чтобы потом получать к нему доступ из других файлов.