# Система управления базами данных MongoDB в Python (нереляционного типа)
План урока:
- SQL и NoSQL
- Что такое MongoDB и почему именно она
- Структура данных в MongoDB
- Установка MongoDB на прмере windows 10
- Работа с MongoDB из консоли
- Работа с MongoDB в Python

### SQL
- Atomicity - атомарность
- Consistency - согласованность
- Isolation - изолированность
- Durability - устойчивость

4 основопологающих признака для работы с SQL. SQL имеет большой плюс работая с изменениями как с транзакцией. Если что то пошло не так, все изменений в рамках транзакции отменяются. Достаточно удобная защищённая структура. 

NoSQL. Нереляционные базы данных. Связей нет, нет и атомарности, согласованности, изолированности, устойчивости. Выглядит как огромная свалка всего, что туда можно было положить. 

### NoSQL
- ключ-значение (Redis, Berkeley DB)
- Документоориентированные (MongoDB, CouchDB)
- Графовые (Graph, Neo4j)
- BigTable (HBase, Cassandra)

Ключ-значение это самые простые БД, с небольшой функциональностью. Больше функциональности и структурированности - MongoDB. Хронит данные более эффективно, структурированно. BigTable  БД разработанные гуглом для своих целей. 

Графовые. Набор методов для управления данными. Позволяет эффективно подстраивать связи между объектами. Множественные связи между большим колличеством объектов. Самый простой пример - любая соцсеть. Есть друзья, у них есть свои друзья, у тех жрузей также есть друзья. Это паутина со множественным связями между друзьями.  Как например найти друга своего друга. Сколько надо шогов из точки А в точку Б, чтобы найти человека. Графовые СУБД эффективно решают такую задачу. Через графовые СУБД легко доказываается теория 6 рукопожатий. 

#### MongoDB 
Документоориентированные БД. Единица хранения в данной СУБД - документ. В SQL это у нас таблица, мы в таблицу записываем какую нибудь инфорацию. В Mongo это документ. 

Что он из себя представляет? Структура похожа на json.  Суть такая же как у джейсона. У нас есть какие то определённые ключи и есть их значения. Ключи задаются в виде строк, а значения могут быть любые значения. Степень вложенности она не ограничена. Могут быть и объекты для хранения. Ограничений не существует, лишь руководствоваться здравым смыслом. супервложенными данными тяжело будет пользоваться.  В отличии от SQL где данные делятся на несколько таблиц здесь нет такого понятия как таблицы, связи между таблицами. Суть в том что вся информация целиком об одном объекте хронится в одном документе Mongo. Всё в одном пространстве в едином контейнере. В итоге база - это набор документов, которые между собой никак не связаны.  Причём внутренняя структура документов может быть совершенно разной. Mongo не накладывает никаких ограничений на хранение данных. Есть ОДНО ЕДИНСТВЕННОЕ ПРАВИЛО: это поле _id, которое автоматически генерируется для каждого документа БД. Значение этого поля должно быть уникально в рамках одной БД. Для каждого нового документо это поле генерируется автоматически. Вся информации внутри документа делится на 2 составляющие. Это техническая информация (он же _id) и всё остальное - полезные данные. 

Mongo имеет нативную поддержку словарей. Можно взять словарь и закинуть его в Mongo. Для Mongo критическая ошибка - совпадение ай ди документов БД. По умолчанию связей между документами нет никаких. 

#### Примеры запросов. 
Для SQL надо учить отдельно язык запросов, чтобы понимать как этими данными манипулировать. 

Найти все статьи из таблицы posts с тегом politics, за которые проголосовало более 10 посетителей.

### SQL:  
```
SELECT * FROM posts 
INNER JOIN posts_tag ON posts.id = posrts_tags.posts_id
INNER JOIN tags ON posts_tags.tag_id == tags.id
WHERE tags.text = "politics" AND posts.vote_count > 10;
```
    
### Mongo:
```
db.posts.find({'tags':'politics', 'vote_count': {'$gt':10}});
```



Mongo запрос привычней для классического программирования. у нас есть некая база данных с названием posts `db.posts` мы у него вызываем метод `find` в качестве параметров указывается что именно мы хотим найти 

```
({'tags':'politics', 'vote_count': {'$gt':10}}). 
```

Также используется оператор больше чем.
Greater Then ( '$gt':10) 



Mongo использует объектную модель. Mongo не пригодна для хранения большого количества данных. Mongo хорого для оперативных задач. Можно добавить любые данные в любой момент времени, но надо помнить, что этими данными ещё предстоит пользоваться. Чтобы можно было проще к ним обращаться, надо заранее продумывать структуру. 

Вся приходящая информация проходит предобработку, чтобы приобрести нужную структуру, только после этого добавляется в Mongo. Разработчики договариваются о структуре, когда используют Mongo. 

Mongo для двух разных документа создаст два разных айдишника. 

### Почему Mongo
- скорость разработки
- нет необходимости в поддержке схемы и в коде и в БД
- лёгкая масштабируемость
- гибкость при смене задачи
- удобство работы с денормализованными данными
- данные быстро меняются (дополнительные данные из API, динамический контент в HTML страницах)
- меняя схему, надо менять и приложение и БД
- БД нужна лишь до тех пор, пока нужны данные
- данные постояноо обнавляются
- нормализация не нужна
- задача не меняется
- одно приложение





### Установка на Windows 10
На официальном сайте Mongo есть информация и техническая документация. 

С сайта MongoDB.com скачивается установщик. Products -> comunity server. База данных является серверной. У неё есть клиент и сервер. 
сервер, чтобы к нему можно было подключаться и управлять базами данных. 
Клиента мы будем писать на пайтоне. 

Скачался файл `mongodb-windows-x86_64-6.0.4-signed.msi`

Запускаем установочник.  Монго установится как сервис. для этого не надо снимать галочку `install mongo as service`. Она автоматически будет стартовать при старте нашей ОС. 

После того как установим как службу, можем сразу переходить к написанию приложения на пайтоне, И работать с сервером, так как будто он всегда запущен, не зпуская его отдельно.

Для зпуска службы в ручную нужны будут иные манипуляции. Заходим в директорию с программой (по умолчанию) 
`c: windows/program files/mongo_db/Server/5.0` файл `mongod.exe` - запуск сервера в ручную.


В окне установки предложат поставить MongoDB Compass. Это клиент с графическим интерфейсом. Специальная отдельная программа с помощью которой можно подключиться к серверу и посмотреть какие БД есть.  Открыть любую БД и посмотреть внутреннее наполнение. Даже можно на ходу изменять эту самую информацию. DB Viewer. 

Есть решение Атлапс для сервера. У монго ДБ есть бесплатный сервер и небольшое пространство на этом сервере выделяется. 

`куда она ставится по умолчанию, если ничего не меняли`. 
> c: windows/program files/mongo_db/Server/5.0

Внутри папки 5.0 есть папка bin, в которой будут все основные инструменты для работы с mongo. 
файл `mongod.exe` - запуск сервера в ручную. Лучше открыть отдельное окно гитбаш и в нём запустить сервер.  вводим в гитбаш:
> $ mongod.exe

По умолчанию путь для хронения базы данных. `c:\\data\\db\\` Если не будет этой последовательности папок созданных сервер не запустится. 
Либо создаём директорию для наших баз данных. и в момент старта Монго можно указать дополнительный параметр. 
> $ mongod.exe --dbpath D:\mongo_bases

Посмотреть запущена ли служба можно посмотреть в диспетчере задач. После запуска сервера в окне башконсоли будет сообщение в логах, которое можно отыскать. 

`Listening on 127.0.0.1  `

`Waiting for connection port: 27017`

Порты настраиваются в файле `mongod.cfg`. В этом файле находятся все параметры. В ручную можно поправить, прописать. 

Ай пи адрес один, портов несколько. Каждый сервер на отдельном порту, но все на одном сервере. Основы сетевого взаимодействия. (Клиенто - Серверного заимодействия).  Когда мы будем писать клиента, мы будем указывать порт и адрес именно те, которые указаны в этом файле, чтобо точно попасть в службу MongoDB а не в какую нибудь другую, которая может по этому адресу работать. Служба может весеть только на одном порту. Все клиенты с любой точки планеты могут подключаться к нашему серверу по этому порту. Монго весит на том айпишнике на котором мы подымаем службу. 

`BindIP: 127.0.0.1 ` - ай пи с которого могут подключаться клиенты. Адрес указан по умолчанию, т.к это локальный хост. Как мне подключиться к самому себе.  Чтобы например с ноутбука с другим айпишником подключиться в этот список надо будет вводить ай пи адрес в этот список. По сути белый список - те кому можно подключаться. Можно охватить диапазон.

`BindIP: 127.0.0.1, 192.160.1.0/25 ` - добавили диапазон. 

### После того как сервер запустился. 
Помима сервера у нас есть клиент `mongo.exe`. Это консольный клиент, которые помогает подключиться к серверу. Мы им пользоваться не будем. Но посмотрим на некоторые моменты работы в консоле. 

Команды на языке Mongo shall - Внутренний язык монго для управления своими данными. В консоле гитбаш. На пайтоне всё будет смотреться совсем по иному. 

> show dbs 

посмотреть базы данных, которые у нас существуют. 

> use new_db 

создаём новую базу данных, переключаемся на существующую, если БД уже создана. Работает по принципу ссылки на базу данных. Мы создали обстрактный указатель ссылку на несуществующую БД. Теперь нам нужно чтобы эта база данных воплотилась в материальном воплощении. Чтобы это произошло внутрь БД надо добавить минимальную информацию, чтобы было что хронить. Появится физический файл. Берём ссылку на базу данных которую выбирали последней. т.е это будет `new_db`. 

> db.

База данных выбрана. 

В монго шелл-оболочке можем работать единовременно лишь с одной БД. В пайтоне нет такого ограничения, можно работать одновременно с несколькими БД.  

У монгоДБ есть особенность. Напрямую в базу данных наши документы, данные сложить не можем. Здесь используется разделение данных на дополнительные подразделы которые именуются коллекции.  У нас есть одна база данных общая, а внутри есть коллекции в которые мы ставим непосредственно документы. Предположим База Данных - Книги. в ней хронятся данные о книгах, работниках, посетителях. Монго создаст три коллекции где будет хронить эти данные. Баз данных одна, внутри колекции которые хорнят связанную информацию. 

> db.authors.insertOne({'name':'Piter'})

создаём коллекцию - авторы, добавляем запись в виде словаря. 

> show dbs

Теперь появилась БД созданная `new_db` в списке всех баз данных. Найти эту базу данных можно в той директории которую указали при запуске сервера. `--dbpath D:\mongo_bases`. 

Прочитать содержимое базы данных. Все данные показывает.

> db.authors.find({})

Добавляем ещё одного автора и находу решили указывать ещё и возраст.

> db.authors.insertOne({'name':'Anna', 'age': 65})

В ту же самую базу данных в ту же самую коллекцию кидаем новый документ. Но его структура отличается от структуры первого документа. 

> db.authors.find({})

Нет никаких проблем данные добавились. Нужно стараться следить за структурой самостоятельно, чтобы не наворотить базу в которой самому будет сложно разобраться. Нет контроля по типу данных и строгой типизации. 

Перепутаем поля

> db.authors.insertOne({'name':88, 'age': 'Genry'})

Делаем запрос и видим данныедобавились. 

> db.authors.find({})

Наша ошибка и нам с нею дальше работать. Нет связей, нет общей схемы. 
Можно передать пустые значения

> db.authors.insertOne({'name':null, 'age': null})

Помним что даже пустые ковычки это уже строка. Впайтоне чтобы не было значение надо None значение. 

Решили удалить колекцию:

> db.authors.drop()

Когда в базе данных Монго не остаётся колекций исчезает и сама база данных. 




# Работаем с MongoDB в Python

Создаём новый проект в пайчарме. Для каждого нового проекта логично выделять локальное пространство в котором и будут устоновленны только те модули, которые нужны для текущего проекта. Поэтому само создаётся виртуальное окружение venv. В нём будут находиться копия интерпритатора пайтон и в эту директорию будут устонавливаться все новые модули, которые нужны для текущего проекта. Можно перетаскивать вместе с проектом и его виртуальное окружение. 

Устанавливаем Mongo

In [None]:
!pip install pymongo

подключаем и импортируем нужный нам класс - `MongoClient`. Тот самый класс объектом которого будет являться коннектором между нашим кодом и сервером. 

In [None]:
from pymongo import MongoClient
from pprint import pprint


создаём подключение к нашей базе данных. Используем класс `MongoClient()`, в качестве параметров первым идёт ай пи на котором находится сервер, второй параметр - порт. Ай пи передаётся как строка, а порт как интовое число. 

In [None]:
client = MongoClient('127.0.0.1', 27017)

Далее мы должны создать отдельную переменную - коннектор к нашей базе данных. мы используем переменную client, подключаемся через неё к нашей базе данных `'users_db'`. Таких подключений создать можно сколько угодно. Объекты, которые будут ссылки на наши базы данных. 

In [None]:
db = client['users_db']

Удобно, но хотя и не обязательно, создать сразу указатель на коллекцию.  коллекция внутри нашей базы данных. Сначала указываем нашу базу данных? который коннектор создали ранее и указываем коллекцию к которой подключаемся. `persons` - переменная которая хронит коллекцию, само название коллекции `db.persons`.  Пока что это некая обстрактная коллекция в некой обстрактной базе данных, которых пока нет, но мы их застолбии и выбрали. 

In [None]:
persons = db.persons

Когда мы создаём сервер у нас нет разделения на пользователей. Мы просто подключаемся ананимно и имеем полное право доступа на чтение и удаление. 

##### Добавим данные 


In [2]:
doc =  {'author': 'Romanenko',
       'age': 25,
       'text': 'hello, world',
       'tags': ['cool', 'hot', 'ice'],
       'date': '29.03.1984'}
    

Чтобы добавить нам надо обратиться к бд, вызываем метод insert_now(), в качестве параметра непосредственно словарь или переменная содержащая словарь. `insert_now()` - запрос к базе данных на добавление элемента.

In [None]:
persons.insert_one(doc)

##### Вывести содержимое из БД все записи

In [None]:
for doc in persons.find({}):
    pprint(doc)

Если запустить код ещё раз данные снова добавятся и продублируютсяю. Будет 2 одинаковые записи, ошибки не выскочит. Единственное что будет отличным это `object_id`. Для двух наших документов Mongo сама сгенирировала айдишник, так как мы явно его не указали. С технической точки зрения документы разные, с логической - одним и тем же одинаково заполненные. Можем поле ай ди заполнять самостоятельно. Причём нет ограничений на айдишник. Любые значения и типы.  Монго сама проверяет есть ли такой айдишник уже, если айдишника нет монго сама генерирует. 
Если попытаемся добавить документ, а в базе данных уже есть такой же айдишник - выскочит ошибка. 

In [4]:
doc =  {'_id': 1, 
        'author': 'Ranenko',
       'age': 45,
       'text': 'hello, world, hello',
       'tags': ['cool', 'hot'],
       'date': '12.06.1988'}
    

In [None]:
persons.insert_one(doc)

Добавление в базу данных лучше делать через `try - except` для избежания повторяющихся ай ди, когда ай ди генерируем мы. 

Нам пайтон пишет об ошибке когда добавляем документ с тем же ай ди, что уже есть в БД. Отследим ошибку - DuplicateKeyError. Импортируем класс нашей ошибки дубликатов ай ди. `from pymongo.errors import DuplicateKeyError as derror`.  И дальше будем срабатывать только по данному исключению `except derror:`. 

In [None]:
from pymongo.errors import DuplicateKeyError as derror

try:
    persons.insert_one(doc) 
except derror:
    print(f'Документ с ай ди {doc['_id']} уже существует в базе')

`_id ` - нижнее подчёркивание говорит о том, что переменная локальная. Эта переменная используется только внутри текущего класса.  Хотя это технических ограничений на её область вывода не накладывает. Если использовать `__id` два нижних подчёркивания вне класса прочитать её не получится. Приватная переменная работающая в текущей области видимости.
Если не создать метод возвращающий это значение, снаружи его прочитать не получится. 

### Пакетная добавка данных 
Существует метод по пакетному добавлению данных в БД.  `insert_many()`. Принимает в себя список из словарей. Но есть очень неприятный ньюанс. При повторном запуске кода с тем же списком словарей будет ошибка при ручном указании айдишника в одном из пакетных документов.  Причём сломается на одном документе, что было до этого документа благополучно добавится. 

In [None]:
data = [{'name':'Mery', 'age': 23}, {'name':'Jein', 'age': 32}]
persons.insert_many()

Чтобы обойти такую проблему - можно использовать insert_one() в цикле, вместо пакетной вставки insert_many(). 

In [None]:
for name in data:
    try:
        persons.insert_one(name) 
    except derror:
        print(f'Документ с ай ди {name['_id']} уже существует в базе')

In [None]:
for i in range(len(data)):
    try:
        persons.insert_one(name[i]) 
    except derror:
        print(f'Сломались на {i} элементе')

### Чтение из БД
запрос к базе данных по какому то определённому критерию. 
Обращаемся к нашей коллекции `persons.` , вызываем метод `find()`, в качестве параметра метода мы передаём словарь `{'name':'Mary'}`. Мы найдём все те документы у которых 'name':'Mary'. Но вернётся нам итерируемый объект в результате работы метода. 

Чтобы вывести элементы надо проиттерировать объект например циклом for. 
В каждую итеррацию цикла в переменную `doc` будет попадать один документ. 

Если передать пустой словарь вернётся всё содержание коллекции.

In [None]:
persons.find({})

In [None]:
persons.find({'name':'Mary'})

In [None]:
for doc in persons.find({'name':'Mary'}):
    pprint(doc)

Альтернативно можно использовать тип `list`

In [None]:
result = list(persons.find({'name':'Mary'}))
pprint(result)

#### Примеры запросов 
Запросы, когда указываем 2 значения. Когда мы используем несколько значений, между ними ставится амперсант `&` . Условие выполнятся должны одновременно. Чтобы выполнялась и левая ('name':'Mary' ) и правая ('age':23) части 

In [None]:
for doc in persons.find({'name':'Mary', 'age':23}):
    pprint(doc)

Если нам нужно условие 'ИЛИ'. Тут включаются свои монговские операторы, которые решат целый круг задач.  Все монговские операторы начинаются со значка `$`. Монговский оператор ИЛИ - `$or`. Мы поставили этот оператор в качестве ключа, теперь нужно указать какое то значение. В качестве значения указываем список, то есть несколько возможных вариантов. Внутри списка у нас будут словари. Первый словарь - первый возможный вариант, второй словарь - второй возможный вариант. 

In [None]:
for doc in persons.find({'$or':[{'name':'Mary'}, {'age':23}]}):
    pprint(doc)

Если нужно сделать диапазон. Полуинтервал (больше, меньше). Полудиапазон, когда ограничиваем одним значением. Например отсеем всех, кто меньше 30 лет.

`'$gt'` - больше чем. 

`'$gte'` - больше или ровно. 

`'$lt'` - меньше чем,

`'$lte'` - меньше или ровно.


In [None]:
for doc in persons.find({'age':{'$gt':30}}):
    pprint(doc)

Чтобы выбрать интервал, например от 30 до 45

In [None]:
for doc in persons.find({'$and':[{'age':{'$gt':30}}, {'age':{'$lt':45}}]}):
    pprint(doc)

Пример от 30 до 40 лет. запрос

In [None]:
for doc in persons.find('$and':[{'age':{'$gte':30}, 'age':{'$lte':40}}]):
    pprint(doc)

Ещё одна форма запроса с in. Вхождение в список значений.

In [None]:
for doc in persons.find({'age':{'$in'}:[33, 34, 44]}):
    pprint(doc)

У МОНГО ОЧЕНЬ КЛАССНАЯ ДОКУМЕНТАЦИЯ. ВСЕГДА ЕЁ МОЖНО ПОСМОТРЕТЬ, КОГДА ВОЗНИКАЮТ ВОПРОСЫ

### Обновление данных. Update. 
У нас есть новый словарик new_data. 

In [7]:
new_data = {'author':'Manson',
            'age': 25,
            'text': 'i am cool',
            'date': '10.01.2000'}

Метод update_one(). В качестве параметра первое значение - то что мы будем искать, в качестве второго параметра словарь с указанием полей и значений, которые мы хотим в найденный документ дописать и обновить. 
Если у найденного документа есть поле, которое мы указываем, оно обновится. На место старого значения запишется новое. Если этого поля нет, оно просто создаться. 

Сам документ не перепишится и его айдишник не изменится. В него просто запишется новая информация. 

Ньюанс метода в том, что от старой записи нам могут достаться гекоторые старые поля и ключи, которых нет в новом значении. А новые значения добавятся к существующим старым неизменяющимся. В частности останется 
`'tags': ['cool', 'hot']`. Остались старые хвосты. 

In [None]:
persons.update_one({'author':'Peter'}, {'$set': new_data})

Если мы хотим полностью заменить данные без хвостов нам надо воспользоваться новым методом `replace_one`. Сначала ищем тот документ который хотим заменить `{'author':'Peter'}`. В качестве второго значения указываем просто словарь без оператора.  У нас меняются все поля кроме айдишника.

In [None]:
persons.replace_one({'author':'Peter'}, new_data)

Есть ещё методы для пакетной работы до всех найденных вхождений: 
- replace_many()
- update_many()

Например ко всем документам добавить поле с новым значением. 

Методы replace_one() и update_one() работают до первого вхождения. 

#### Удаление
- delete_many()
- delete_one()

Опасная функция. Если что то удалили - обратно не вернуть. Нет никаких резервных копий автоматических. 

In [None]:
persons.delete_one({'author':'Peter'})

Всё документы удалится например: 

Когда мы удаляем все элементы, коллекция при этом не удаляется. Удалятся именно документы, останется в итоге пустая коллекция. А БД удаляется только в том случае, когда у неё коллекций не остаётся. 

In [None]:
persons.delete_many({})

для удаления всей коллекции:

In [None]:
db.drop_collection('persons')