## Базы данных

Каждая новая запись требует больше объема, и это может быть проблемой.

Чем больше данных в таблице, тем медленне БД будет работать. Чтобы
увеличить производительность, надо уменьшать объем.

Добавлять можно только один тип данных в одном поле (условие,
которое придумали для упрощения хранения данных и работы с БД)

### Реляционные БД

Реляционные – самые распространенные и надежные

Не просто таблички, а таблички со связями между ними

Почему не организовать данные в одну табличку? Потому что данные могут
повторяться, и это не очень хорошо.

У каждых данных есть ID

Клиент-серверная структура: есть сервер, на котором крутится БД,
и клиент, которые умеет к серверу обращаться. Взаимодействие происходит
на языках с общим прототипом SQL.

Язык SQL традиционно устойчив к регистру (большей части его разновидностей
все равно, большими или маленькими буквами).

### Операторы

Извлечь/выбрать – select from
Поместить значение – insert into
Обновить – update
Создать – create
Уничтожить – drop

Хочу всю строку из таблицы words, которая соответствует условию:

SELECT * FROM words WHERE pos="S" LIMIT 20

Запрос должен вернуть, например, 20 штук существительных S

Фишка еще в том, что какую-то сортировку мы можем применить уже на этапе запроса

SELECT * FROM words WHERE pos="S" LIMIT 20 ORDER BY ID 

Выдаст в порядке ID. Поместить в таблицу (все значения в таком порядке, в каком
они в таблице):

INSERT INTO words VALUES (15, "слово15", "PRO")

Создаем таблицу – пишем имя колонки и тип. Это досталось от древних
языков программирования, где надо было сразу определить тип
переменной

CREATE TABLE words (ID INT, word VARCHAR, POS VARCHAR)
или
CREATE TABLE words (ID int, word text, POS text)

Зависит от "диалекта" SQL

MySQL не очень удобна для переноса БД с компа на комп
SQLite – облегченный SQL, удобна тем, что питон по умолчанию умеет
с ним общаться (ничего устанавливать дополнительно не надо). БД
создается как файл, поэтому его легко можно перенести на другой комп.
Однако с ним неудобно работать, если нужно нескольких человек подключать
к БД.

Работаем с SQLite

Шаг 1 – установить соединение
Шаг 2 – создать курсор, которым будем обращаться к БД
Шаг 3 – создать таблицу методом execute (принимает на вход
SQL-запрос в виде строки)
Шаг 4 – сохраняем изменения коммитом

```python
import sqlite3
conn = sqlite3.connect("mydb.db")
cursor = conn.cursor()
cursor.execute("CREATE TABLE words (ID INT, word VARCHAR, POS VARCHAR)")
conn.commit()

```
Если строчка в питоне получается длинной, мы ее разбиваем на 2
части в том месте, где хотим. Используем обратный слеш:

```python
print(\
6)
```

Можно использовать многострочный комментарий – три кавычки

```python
print('''I love
linguistics''')
```
''' = """

In [1]:
print('''I love
linguistics''')

I love
linguistics


.format тоже сработает
```python
'''{}.txt'''.format(s)
```
```python
sql_query = "select * from words where pos='v'"
cursor.execute(sql_query)
print(cursor.fetchall())
```
Можно сделать в цикле питона

```python
for row in cursor.execute("SELECT"):
    print(row)

```
Создать БД с 1 таблицей
Вытащить данные и посмотреть, что за типы данных

К БД в sqlite файл можно обращаться не только через питон

In [31]:
import sqlite3
conn = sqlite3.connect("mydb.db")
cursor = conn.cursor()
cursor.execute("CREATE TABLE IF NOT EXISTS cats (ID INT, catname VARCHAR, catbride VARCHAR)")
conn.commit()

In [30]:
add_cat = """INSERT INTO cats (ID, catname, catbride) VALUES 
(1, "Нана", "Европейская"),
(2, "Айна", "Британская")"""
cursor.execute(add_cat)
conn.commit()

In [33]:
sql_query = "select * from cats"
cursor.execute(sql_query)
print(cursor.fetchall())

[(1, 'Нана', 'Европейская'), (2, 'Айна', 'Британская')]


In [32]:
for row in cursor.execute(sql_query):
    print(row)

(1, 'Нана', 'Европейская')
(2, 'Айна', 'Британская')


In [27]:
drop_cats = "DROP TABLE IF EXISTS cats"
cursor.execute(drop_cats)
conn.commit()

Выбрать что-то сразу из многих таблиц

```python
"""SELECT words.word, pos.pos FROM words, pos 
WHERE words.pos = pos.ID AND ... """
```
Чем-то похоже на join, но join для более сложных запросов

Задание:
1) Взять несколько текстов
2) Разобрать их майстемом
3) Создать базу данных, в которой были бы данные о текстах
(о словах, разборах, текстах, откуда они взяты, предложениях

слово: документ 15, предложение 4, позиция 1

In [5]:
import os
from pymystem3 import Mystem
mystem = Mystem()
# mystemmed_file = open("mystemmed.txt", "w")


PATH = '/Users/vladislavasan/PycharmProjects/python_classwork_1/the_village'
lines = []
for root, dirs, files in os.walk(PATH):
    for fl in files:
        f = open("{}/{}".format(root, fl)).read()
        marked_files = lines.append(mystem.analyze(f))
        #mystemmed_file.write(str(marked_files) + "\n")

In [25]:
#for value in a['analysis']:
texts = []
key = 'text'
for i,line in enumerate(lines):
    for a in line:
        if a[key]:
            texts.append(a[key].items)

AttributeError: 'str' object has no attribute 'items'

In [22]:
texts

['text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 'text',
 