# Базы данных. Часть 1

**План**

=== Часть 1

1. Что такое базы данных и где они используются?
2. SQL-запросы
3. SQLite (DBrowser)

=== Часть 2

4. Работа с базами через питон

**Реляционная база данных** - это набор взаимосвязанных таблиц, в которых хранятся различные данные. **Строка** таблицы (row) содержит данные об одном объекте (например, о студенте), а **столбцы** таблицы (columns) описывают различные характеристики этих объектов — атрибутов (например, имя, курс, специальность, номер группы). Каждый столбец описывает только одну характеристику объекта и имеет *строго определенный тип данных*. Все стоки (записи) имеют одни и те же поля, только в них отображаются различная информация в зависимости от объекта. Вот так:

|Имя (строка)| Специальность (строка)| Курс (число)|
| ------------- |-------------:| -----:|
|Влад| математика| 1|
|Коля| физика| 4|
|Дима| история| 3|
|Лера| лингвистика| 1|

В реляционной базе данных каждая таблица должна иметь **первичный ключ** (primary key) — поле или комбинацию полей, которые единственным образом идентифицируют каждую строку таблицы. Если ключ состоит из нескольких полей, он называется составным. Ключ должен быть уникальным и однозначно определять запись. По значению ключа можно отыскать единственную запись. Ключи служат также для упорядочивания информации в БД. По умолчанию это по умолчанию создающееся поле Id с порядковой нумерацией.

Таблицы реляционной БД должны отвечать требованиям нормализации отношений. Нормализация отношений — это формальный аппарат ограничений на формирование таблиц, который позволяет устранить дублирование, обеспечивает непротиворечивость хранимых в базе данных, уменьшает трудозатраты на ведение базы данных.

*Реляционные таблицы могут быть связаны друг с другом*, следовательно, данные могут извлекаться одновременно из нескольких таблиц. Таблицы связываются между собой для того, чтобы в конечном счете уменьшить объем БД. Связь каждой пары таблиц обеспечивается при наличии в них одинаковых столбцов. То есть в одной таблице есть primary key, а в другой колонка **foreign key**, дублирующая значения primary key.

Существуют следующие типы информационных связей:
* один-к-одному (one-to-one) -- 
* один-ко-многим (one-to-many) --<
* многие-ко-многим (many-to-many) >--<

Связь **один-к-одному** предполагает, что одному атрибуту первой таблицы соответствует только один атрибут второй таблицы и наоборот. Связь **один-ко-многим** - это когда одному атрибуту первой таблицы соответствует несколько атрибутов второй таблицы. Связь **многие-ко-многим** - это когда одному атрибуту первой таблицы соответствует несколько атрибутов второй таблицы и наоборот. 

Для работы с БД используются специальные программы - они называются **Системами управления базами данных**, или **СУБД** (англ. *Database Management System, DBMS*). Существует множество СУБД, вот некоторые из них:

* SQLite
* MySQL
* PostgreSQL
* MongoDB
* ...

## SQL

В названии нескольких СУБД встретилось сочетание SQL. Что это такое?

**SQL** *(Structured Query Language)* - это особый язык для управления данными в БД. С помощью него можно добавлять, удалять, изменять и выбирать данные в таблицах. **Любое** обращение к базе данных называется **запросом**.

SQL - очень простой язык. Нам потребуется лишь несколько команд для операций с данными (CREATE, DELETE, DROP, SELECT, INSERT, UPDATE) и команд-ограничителей для создания более точных запросов (WHERE, IN, AND, OR, NOT, BETWEEN, LIKE, LIMIT, OFFSET). Стоит обратить внимание, что порядок слов в запросе фиксирован: сначала идет "что", затем "где" и, наконец, "с каким условием".

Для тренировки мы будем использовать интерактивный тьюториал SQLBolt.

SELECT упражнения

* https://sqlbolt.com/lesson/select_queries_introduction - основы (уроки 1-5, 8)
* https://sqlbolt.com/lesson/select_queries_with_joins - выбор данных из нескольких таблиц (уроки 6-7)
* https://sqlbolt.com/lesson/select_queries_with_expressions - работа с математическими выражениями


DML упражнения

* https://sqlbolt.com/lesson/inserting_rows
* https://sqlbolt.com/lesson/updating_rows
* https://sqlbolt.com/lesson/deleting_rows

Создание и удаление таблиц (там же описаны типы данных)

* https://sqlbolt.com/lesson/creating_tables (уроки 16-18)

# Практика #1

### Сначала пару вопросов на SQL запросы:

**Вопрос 1.** Упростите выражение:

```
SELECT x FROM table
WHERE x < 1 OR x > 0;
```

> **NULL не равен NULL !!!**

**Вопрос 2.** Допустим мы проводим полевую работу с информантами и делаем такую базу данных по реузльтатам (см. картинку). Какими отношениями связаны три таблицы на картинке?

* Может ли такое быть, что информант в бд есть, а анкету он не прошел?

* Должна ли каждая анкета обязательно соответствовать какому-то информанту?

* Может ли один и тот же информант несколько раз пройти анкету?

![](db_example.jpg)

**Вопрос 3.**

* Напишите запрос к бд на картинке, который достанет номера анкет информантов, которые старше 40 лет.

### Теперь перейдём к DBrowser

### Как мы уже говорили, есть разные СУБД и программы для работы с базами данных

База данных -- это не текстовый формат, так что просто открыть его в блокноте и посмотреть, что внутри, не получится. Для этого существуют специальные программы.

* [MySQL](https://www.mysql.com/)
* [PostgreSQL](https://www.postgresql.org/)
* [MongoDB](https://www.mongodb.com/)
* [Firebird](https://firebirdsql.org/)

[Вот тут](https://blog.capterra.com/free-database-software/) есть неплохое описание плюсов и минусов всего вышеперечисленного.

**Мы будем пробовать использовать DBrowser**

Его можно(нужно) скачать и установить отсюда: https://sqlitebrowser.org/dl/

* Создайте новую базу в DBrowser
* Создайте таблицу со студентами (Там должно быть их id; foreign key, отсылающий к другой таблице с оценками по разным предметам; имя студента; возраст; поле научных интересов). Сделайте так, чтобы id студента и foreign key, отсылающий к таблице с оценками каждого студента по разным предметам, были обязательными для заполнения полями. А имя, возраст и сфера научных интересов -- необязательными.

Например, так:

![](db_experiment.png)

Обратите внимание на то, как автоматически пишется за вас SQL запрос (Этим, кстати, можно пользоваться как шпаргалкой к написанию запросов)

* Создайте таблицу с оценками по программированию и морфологии, в которой будет фигурировать primary key отсылающий к foreign key из таблицы со студентами.

И комикс в завершение :)

![](https://external-preview.redd.it/ZOuZP6WW1lZAPrnSO8o3xXPxHXG0q42_c9lRDZbEc6M.png?auto=webp&s=3384f4292de06a2ee3cb5e82f80ae3987b31d264)
