<a href="https://colab.research.google.com/github/mukaseevru/ds-school/blob/main/lesson%205/Part_1_Intro_to_SQL.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# План занятия
 - Локальные БД. Работа с библиотекой sqlite3
 - Представление БД с использованием Pandas
 - Удаленные БД. Работа с библиотекой SQLAlchemy

# Введение

База данных может храниться локально, на том же компьютере, на котором запускается прикладное программное обеспечение для работы с базой данных или на удаленном компьютере.

Google Colab (точнее Python, запускаемый в среде Google Colab) позволяет работать и с условно «локальной» базой данных и с базой данных на удаленном сервере. 
- В первом случае может использоваться СУБД **SQLite**, которая будет хранится на облачном диске Google Drive. Для среды Google Colab это будет локальная БД.
- В случае работы с удаленной БД можно использовать **SQLAlchemy**.

Оба модуля **SQLite** и **SQLAlchemy** рассмотрим ниже.

# SQLite

**SQLite** — компактная встраиваемая реляционная база данных. Является чисто реляционной базой данных.

Слово «встраиваемый» означает, что SQLite **не использует парадигму клиент-сервер.** Модуль sqlite3 входит в установочный пакет языка Python, является компонентом стандартной библиотеки и не требует отдельной загрузки и установки.

Pipeline для работы с БД при помощи библиотеки SQLite

``` 
import sqlite3

conn = sqlite3.connect(path)

cursor = conn.cursor()

# Работа с БД
# ...
# ...

cursor.close()
conn.close()
```

## Подключение к базе данных

Для доступа к диску Google Drive сервису Google Colab необходимо дать разрешение на подключение к диску.

Для подключения и разрешения доступа Google Colab к диску Google Drive используем следующий код:

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


Подключаем модуль для работы с базой SQLite

In [2]:
import sqlite3

Непосредственно модуль sqlite3 – это API к СУБД SQLite. Своего рода адаптер, который переводит команды, написанные на Питоне, в команды, которые понимает SQLite. Как и наоборот, доставляет ответы от SQLite в python-программу.

In [3]:
dir(sqlite3)

['Binary',
 'Cache',
 'Connection',
 'Cursor',
 'DataError',
 'DatabaseError',
 'Date',
 'DateFromTicks',
 'Error',
 'IntegrityError',
 'InterfaceError',
 'InternalError',
 'NotSupportedError',
 'OperationalError',
 'OptimizedUnicode',
 'PARSE_COLNAMES',
 'PARSE_DECLTYPES',
 'PrepareProtocol',
 'ProgrammingError',
 'Row',
 'SQLITE_ALTER_TABLE',
 'SQLITE_ANALYZE',
 'SQLITE_ATTACH',
 'SQLITE_CREATE_INDEX',
 'SQLITE_CREATE_TABLE',
 'SQLITE_CREATE_TEMP_INDEX',
 'SQLITE_CREATE_TEMP_TABLE',
 'SQLITE_CREATE_TEMP_TRIGGER',
 'SQLITE_CREATE_TEMP_VIEW',
 'SQLITE_CREATE_TRIGGER',
 'SQLITE_CREATE_VIEW',
 'SQLITE_DELETE',
 'SQLITE_DENY',
 'SQLITE_DETACH',
 'SQLITE_DROP_INDEX',
 'SQLITE_DROP_TABLE',
 'SQLITE_DROP_TEMP_INDEX',
 'SQLITE_DROP_TEMP_TABLE',
 'SQLITE_DROP_TEMP_TRIGGER',
 'SQLITE_DROP_TEMP_VIEW',
 'SQLITE_DROP_TRIGGER',
 'SQLITE_DROP_VIEW',
 'SQLITE_IGNORE',
 'SQLITE_INSERT',
 'SQLITE_OK',
 'SQLITE_PRAGMA',
 'SQLITE_READ',
 'SQLITE_REINDEX',
 'SQLITE_SELECT',
 'SQLITE_TRANSACTION',
 'SQLITE

Создадим папку "my_databases", где будут хранится наши БД

In [4]:
import os
path = "./drive/My Drive/my_databases"
if not os.path.exists(path):
    os.mkdir(path)

Подключаемся к базе test.db. Если этого файла нет в каталоге, то он будет создан.

Вызов функции connect() приводит к созданию объекта-экземпляра от класса Connection. Этот объект обеспечивает связь с файлом базы данных, представляет конкретную БД в программе:

In [5]:
conn = sqlite3.connect(path + '/test.db')
print("Opened database successfully");

Opened database successfully


После того как экземпляр Connection создан, чтобы выполнять SQL-команды, надо создать еще один объект, но теперь уже от класса Cursor. Делается это с помощью метода cursor() объекта типа Connection:

In [6]:
cursor = conn.cursor()

In [7]:
cursor.execute('''
CREATE TABLE IF NOT EXISTS team_data(team text, 
                      country text, 
                      season integer, 
                      total_goals integer);''')

conn.commit()

print("Table created successfully");

#conn.close()

Table created successfully


Заполнять таблицы можно тоже с помощью **execute().**

In [8]:
# INSERTING VALUES

cursor.execute("INSERT INTO team_data VALUES('Real Madrid', 'Spain', 2019, 53);")
cursor.execute("INSERT INTO team_data VALUES('Barcelona', 'Spain', 2019, 47);")


<sqlite3.Cursor at 0x7f1beaa74d50>

Однако, если требуется вставить несколько записей, лучше воспользоваться методом **executemany():**

In [9]:
sections = [('Arsenal', 'UK', 2019, 52), ('Real Madrid', 'Spain', 2018, 49),
             ('Barcelona', 'Spain', 2018, 45), ('Arsenal', 'UK', 2018, 50 )]
cursor.executemany("INSERT INTO team_data VALUES (?, ?, ?, ?)", sections)

<sqlite3.Cursor at 0x7f1beaa74d50>

Для того, чтобы корректно завершить работу с базой данных, надо применить изменения (выполнить транзакцию) **commit()** и разорвать соединение **close()**. Обратите внимание, это делается по отношению к экземпляру Connection, а не Cursor:

In [10]:
conn.commit()
conn.close()

In [11]:
# Average goal by team

conn = sqlite3.connect(path + '/test.db')
# Создаем объект типа cursor для доступа к данным
cursor = conn.cursor()

#Запрос данных из таблицы 
sql  = ''' SELECT team, total_goals FROM team_data'''

cursor.execute(sql)

for row in cursor:
    print(row)

('Real Madrid', 53)
('Barcelona', 47)
('Arsenal', 52)
('Real Madrid', 49)
('Barcelona', 45)
('Arsenal', 50)
('Real Madrid', 53)
('Barcelona', 47)
('Arsenal', 52)
('Real Madrid', 49)
('Barcelona', 45)
('Arsenal', 50)
('Real Madrid', 53)
('Barcelona', 47)
('Arsenal', 52)
('Real Madrid', 49)
('Barcelona', 45)
('Arsenal', 50)
('Real Madrid', 53)
('Barcelona', 47)
('Arsenal', 52)
('Real Madrid', 49)
('Barcelona', 45)
('Arsenal', 50)
('Real Madrid', 53)
('Barcelona', 47)
('Arsenal', 52)
('Real Madrid', 49)
('Barcelona', 45)
('Arsenal', 50)
('Real Madrid', 53)
('Barcelona', 47)
('Arsenal', 52)
('Real Madrid', 49)
('Barcelona', 45)
('Arsenal', 50)
('Real Madrid', 53)
('Barcelona', 47)
('Arsenal', 52)
('Real Madrid', 49)
('Barcelona', 45)
('Arsenal', 50)
('Real Madrid', 53)
('Barcelona', 47)
('Arsenal', 52)
('Real Madrid', 49)
('Barcelona', 45)
('Arsenal', 50)
('Real Madrid', 53)
('Barcelona', 47)
('Arsenal', 52)
('Real Madrid', 49)
('Barcelona', 45)
('Arsenal', 50)
('Real Madrid', 53)
('Barcel

In [12]:
#Запрос данных из таблицы 
sql  = ''' SELECT team, AVG(total_goals) FROM team_data'''

cursor.execute(sql)

for row in cursor:
    print(row)

('Arsenal', 49.333333333333336)


Почему на выходе получили только 1 комманду?

In [13]:
sql  = ''' SELECT team, AVG(total_goals) AS avg_goals FROM team_data GROUP BY team;'''
cursor.execute(sql)

for row in cursor:
  print(row)

('Arsenal', 51.0)
('Barcelona', 46.0)
('Real Madrid', 51.0)


In [14]:
cursor.close()
conn.close()

In [15]:
# # First try to filter the teams with average goals higher than 50
# # This query will generate an error

# conn = sqlite3.connect(path + '/test.db')
# cursor = conn.cursor()

# sql = ''' SELECT team AS team_name,
#                             AVG(total_goals) AS avg_goals
#                           FROM team_data
#                           WHERE avg_goals > 50
#                           GROUP BY team;'''
                          
# cursor.execute(sql)

# for row in cursor:
#   print(row)
# conn.close()

In [16]:
# Now, the correct query, using the appropriate sub-query

conn = sqlite3.connect(path + '/test.db')

cursor = conn.cursor()

sql = ''' SELECT team_name, avg_goals
                          FROM (

                          -- Here we make our sub-query:
                            SELECT team AS team_name,
                            AVG(total_goals) AS avg_goals
                            FROM team_data
                            GROUP BY team) tp
                          -- End of the sub-query
                          
                          WHERE avg_goals > 50;'''

cursor.execute(sql)

for row in cursor:
  print(row)
conn.close()

('Arsenal', 51.0)
('Real Madrid', 51.0)


Для наглядного представления табличных данных можно использовать библиотеку pandas:

In [17]:
import pandas as pd


conn = sqlite3.connect(path + '/test.db')
cursor = conn.cursor()

#sql  = '''SELECT team, total_goals AS avg_goals FROM team_data GROUP BY team;'''
sql  = '''SELECT team, total_goals FROM team_data;'''
                          
cursor.execute(sql)

# Загружаем все результаты в список списков rows 
rows = cursor.fetchall()

In [18]:
pd.DataFrame( rows, columns=('Team', 'Goals') )

Unnamed: 0,Team,Goals
0,Real Madrid,53
1,Barcelona,47
2,Arsenal,52
3,Real Madrid,49
4,Barcelona,45
...,...,...
91,Barcelona,47
92,Arsenal,52
93,Real Madrid,49
94,Barcelona,45


In [19]:
sql  = '''SELECT team, total_goals AS avg_goals FROM team_data GROUP BY team;'''
                          
cursor.execute(sql)

# Загружаем все результаты в список списков rows 
rows = cursor.fetchall()

pd.DataFrame(rows, columns=('Team', 'Goals'))

Unnamed: 0,Team,Goals
0,Arsenal,50
1,Barcelona,45
2,Real Madrid,49


In [20]:
cursor.close()
conn.close()

<center><img src='https://raw.githubusercontent.com/ddvika/Data-Science-School-2020/main/lecture_5/imgs/typical_sql.tiff' height = 550></center>

# SQLAlchemy

**ORM** расшифровывается как object-relational mapping,  или объектно-реляционное отображение — подход к работе с базами данных, использующий  концепции объектно-ориентированных языков программирования.   Объектно-реляционное отображение позволяет оперировать объектами в коде, что гораздо удобнее, чем работать с запросами и таблицами.


Иными словами, можно обращаться к объектам классов для управления данными в таблицах БД. Также можно создавать, изменять, удалять, фильтровать и, самое главное, наследовать объекты классов, сопоставленные с таблицами БД, что существенно сокращает наполнение кодовой базы.

**SQLAlchemy** — это библиотека на языке Python для работы с реляционными СУБД с применением технологии ORM. Служит для синхронизации объектов Python и записей реляционной базы данных. SQLAlchemy позволяет описывать структуры баз данных и способы взаимодействия с ними на языке Python без использования SQL.

### Создадим новую базу данных с нуля
Давайте создадим новую базу данных с нуля, для этого:
1. Создадим классы для определения схемы.
2. Сопоставим схему с базой данных.
3. Добавим объекты в базу данных
4. Напишем запросы

### 1. Запустим database session

In [21]:
from sqlalchemy import create_engine
#engine = create_engine('sqlite:///example.db', echo=True)
engine = create_engine('sqlite:///:memory:', echo=True)
#engine = create_engine('sqlite:///:memory:')
conn = engine.connect()

from sqlalchemy.orm import sessionmaker
Session = sessionmaker(bind=engine)
session = Session()

2020-12-15 19:35:17,629 INFO sqlalchemy.engine.base.Engine SELECT CAST('test plain returns' AS VARCHAR(60)) AS anon_1
2020-12-15 19:35:17,631 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:17,635 INFO sqlalchemy.engine.base.Engine SELECT CAST('test unicode returns' AS VARCHAR(60)) AS anon_1
2020-12-15 19:35:17,637 INFO sqlalchemy.engine.base.Engine ()


В случае если мы хоти подкоючится к удаленной БД, код будет выглядить примерно так:

```
def connect_to_db(uid):
    # создаем объект подключения
    sql = create_engine(
        f'mysql+mysqlconnector://user{uid}:userpassword{uid}'   # LOGIN, PASSWORD
        f'@157.230.109.1/classicmodels_user_{uid}',             # HOST IP
        pool_recycle=60
    )
    connection = sql.connect()
    return connection
    # отправка комманд без чтения/записи (например удаление) в самом конце

connection = connect_to_db(uid=5)
connection
```

### 2. Вспомогательные функции для печати и вывода результатов SQL запросов

In [22]:
from IPython.display import display
import pandas as pd
import sqlalchemy

def sql(query):
    print()
    print(query)
    print()

def get_results(query):
    global engine
    q = query.statement if isinstance(query, sqlalchemy.orm.query.Query) else query
    return pd.read_sql(q, engine)

def display_results(query):
    df = get_results(query)
    display(df)
    #sql(query)

### 3. Инициализация схемы БД

Схема - это пространство имен, которое содержит именованные объекты базы данных, такие как таблицы, представления, индексы, типы данных

In [23]:
!pip install sqlalchemy_explore

Collecting sqlalchemy_explore
  Downloading https://files.pythonhosted.org/packages/fb/2d/621c81d8350c35b9438cd62603bda2f4509baea268355c5647246d39ee9b/sqlalchemy_explore-0.1.2.tar.gz
Building wheels for collected packages: sqlalchemy-explore
  Building wheel for sqlalchemy-explore (setup.py) ... [?25l[?25hdone
  Created wheel for sqlalchemy-explore: filename=sqlalchemy_explore-0.1.2-cp36-none-any.whl size=4543 sha256=c2e35fc9a9cdf41ea6b44a7df8127940757f6763faafd69fb77393a94df48d6a
  Stored in directory: /root/.cache/pip/wheels/af/7d/67/1c55901ebff236da60829800b9a2ebfa8b52c455db565a1acd
Successfully built sqlalchemy-explore
Installing collected packages: sqlalchemy-explore
Successfully installed sqlalchemy-explore-0.1.2


In [24]:
from sqlalchemy.ext.declarative import declarative_base
import sqlalchemy_explore

### the basic base class for SQLAlchemy schema objects
# Base = declarative_base(bind=engine)

### base class including utils like an __repr__ method
### see https://pypi.org/project/sqlalchemy-explore/
Base = declarative_base(cls=sqlalchemy_explore.ReflectiveMixin)

### Создание самой схемы

In [25]:
from sqlalchemy import Column, DateTime, ForeignKey, Integer, NVARCHAR, Numeric, Sequence
from sqlalchemy.orm import relationship

class Customer(Base):
    __tablename__ = 'customers'

    CustomerId = Column(Integer, Sequence('customer_id_seq'), primary_key=True)
    FirstName = Column(NVARCHAR(40), nullable=False)
    LastName = Column(NVARCHAR(20), nullable=False)
    Company = Column(NVARCHAR(80))
    Address = Column(NVARCHAR(70))
    Phone = Column(NVARCHAR(24))
    Email = Column(NVARCHAR(60), nullable=False)
    
class Item(Base):
    __tablename__ = 'items'
    
    ItemId = Column(Integer, Sequence('item_id_seq'), primary_key=True)
    Name = Column(NVARCHAR(40), nullable=False)
    Price = Column(Numeric, nullable=False)

class Purchase(Base):
    __tablename__ = 'purchases'
    
    PurchaseId = Column(Integer, Sequence('purchase_id_seq'), primary_key=True)
    ItemId = Column(ForeignKey('items.ItemId'), nullable=False, index=True)
    CustomerId = Column(ForeignKey('customers.CustomerId'), nullable=False, index=True)
    Date = Column(DateTime, nullable=False)
    
    item = relationship('Item')
    customer = relationship('Customer')

In [26]:
Purchase.ItemId.name

'ItemId'

In [27]:
Purchase.CustomerId.name

'CustomerId'

### 5. Создадим таблицы в базе данных в соответствии со схемой

In [28]:
Base.metadata.create_all(engine)

2020-12-15 19:35:23,590 INFO sqlalchemy.engine.base.Engine PRAGMA main.table_info("customers")
2020-12-15 19:35:23,592 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:23,594 INFO sqlalchemy.engine.base.Engine PRAGMA temp.table_info("customers")
2020-12-15 19:35:23,595 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:23,597 INFO sqlalchemy.engine.base.Engine PRAGMA main.table_info("items")
2020-12-15 19:35:23,598 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:23,599 INFO sqlalchemy.engine.base.Engine PRAGMA temp.table_info("items")
2020-12-15 19:35:23,600 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:23,602 INFO sqlalchemy.engine.base.Engine PRAGMA main.table_info("purchases")
2020-12-15 19:35:23,603 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:23,604 INFO sqlalchemy.engine.base.Engine PRAGMA temp.table_info("purchases")
2020-12-15 19:35:23,605 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:23,609 INFO sqlalchemy.engine.base.Engine 
CREATE

In [29]:
engine.table_names()

2020-12-15 19:35:23,634 INFO sqlalchemy.engine.base.Engine SELECT name FROM sqlite_master WHERE type='table' ORDER BY name
2020-12-15 19:35:23,636 INFO sqlalchemy.engine.base.Engine ()


['customers', 'items', 'purchases']

### 6. Создадим покупателя

In [30]:
moshe = Customer(
    FirstName='Moshe', 
    LastName='Cohen', 
    Address='Alenbi 99, Tel Aviv', 
    Phone="053-5556789", 
    Email='moshe@cohen.com')

session.add(moshe)
session.commit()

2020-12-15 19:35:23,657 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
2020-12-15 19:35:23,662 INFO sqlalchemy.engine.base.Engine INSERT INTO customers ("FirstName", "LastName", "Company", "Address", "Phone", "Email") VALUES (?, ?, ?, ?, ?, ?)
2020-12-15 19:35:23,663 INFO sqlalchemy.engine.base.Engine ('Moshe', 'Cohen', None, 'Alenbi 99, Tel Aviv', '053-5556789', 'moshe@cohen.com')
2020-12-15 19:35:23,665 INFO sqlalchemy.engine.base.Engine COMMIT


### 7. Выполним запрос

Используя язык выражений SQLAchemy

In [31]:
from sqlalchemy import select 

customers_query = select([Customer.FirstName, Customer.Email])
results = conn.execute(customers_query)

print()
for row in results:
    print(row)

print()
print(type(row)) # rows are of type sqlalchemy.engine.result.RowProxy

2020-12-15 19:35:23,693 INFO sqlalchemy.engine.base.Engine SELECT customers."FirstName", customers."Email" 
FROM customers
2020-12-15 19:35:23,696 INFO sqlalchemy.engine.base.Engine ()

('Moshe', 'moshe@cohen.com')

<class 'sqlalchemy.engine.result.RowProxy'>


In [32]:
display_results(customers_query)

2020-12-15 19:35:23,709 INFO sqlalchemy.engine.base.OptionEngine SELECT customers."FirstName", customers."Email" 
FROM customers
2020-12-15 19:35:23,711 INFO sqlalchemy.engine.base.OptionEngine ()


Unnamed: 0,FirstName,Email
0,Moshe,moshe@cohen.com


### 8. Добавим еще покупателей

In [33]:
Lisa = Customer(
    FirstName='Lisa', 
    LastName='Cohen', 
    Address='Alenbi 99, Tel Aviv', 
    Phone="052-1234565", 
    Email='lisa@cohen.com')

session.add(Lisa)
session.commit()

2020-12-15 19:35:23,750 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
2020-12-15 19:35:23,752 INFO sqlalchemy.engine.base.Engine INSERT INTO customers ("FirstName", "LastName", "Company", "Address", "Phone", "Email") VALUES (?, ?, ?, ?, ?, ?)
2020-12-15 19:35:23,754 INFO sqlalchemy.engine.base.Engine ('Lisa', 'Cohen', None, 'Alenbi 99, Tel Aviv', '052-1234565', 'lisa@cohen.com')
2020-12-15 19:35:23,756 INFO sqlalchemy.engine.base.Engine COMMIT


In [34]:
Nika = Customer(
    FirstName='Nika', 
    LastName='Rave', 
    Address='Green st, LA', 
    Phone="330-1234565", 
    Email='Nika@rave.com')

session.add(Nika)
session.commit()

2020-12-15 19:35:23,768 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
2020-12-15 19:35:23,771 INFO sqlalchemy.engine.base.Engine INSERT INTO customers ("FirstName", "LastName", "Company", "Address", "Phone", "Email") VALUES (?, ?, ?, ?, ?, ?)
2020-12-15 19:35:23,774 INFO sqlalchemy.engine.base.Engine ('Nika', 'Rave', None, 'Green st, LA', '330-1234565', 'Nika@rave.com')
2020-12-15 19:35:23,776 INFO sqlalchemy.engine.base.Engine COMMIT


Посмотрим теперь на таблицу:

In [35]:
customers_query = select([Customer.FirstName, Customer.Email])
display_results(customers_query)

2020-12-15 19:35:23,789 INFO sqlalchemy.engine.base.OptionEngine SELECT customers."FirstName", customers."Email" 
FROM customers
2020-12-15 19:35:23,791 INFO sqlalchemy.engine.base.OptionEngine ()


Unnamed: 0,FirstName,Email
0,Moshe,moshe@cohen.com
1,Lisa,lisa@cohen.com
2,Nika,Nika@rave.com


In [36]:
Customer.__dict__

mappingproxy({'Address': <sqlalchemy.orm.attributes.InstrumentedAttribute at 0x7f1c04661410>,
              'Company': <sqlalchemy.orm.attributes.InstrumentedAttribute at 0x7f1c04661468>,
              'CustomerId': <sqlalchemy.orm.attributes.InstrumentedAttribute at 0x7f1c04661200>,
              'Email': <sqlalchemy.orm.attributes.InstrumentedAttribute at 0x7f1c046611a8>,
              'FirstName': <sqlalchemy.orm.attributes.InstrumentedAttribute at 0x7f1c04661518>,
              'LastName': <sqlalchemy.orm.attributes.InstrumentedAttribute at 0x7f1c046614c0>,
              'Phone': <sqlalchemy.orm.attributes.InstrumentedAttribute at 0x7f1c04661308>,
              '__doc__': None,
              '__init__': <function __init__>,
              '__mapper__': <Mapper at 0x7f1c04664a90; Customer>,
              '__module__': '__main__',
              '__table__': Table('customers', MetaData(bind=None), Column('CustomerId', Integer(), table=<customers>, primary_key=True, nullable=False, defa

Операторы **desc**, **asc**, **order_by**

Оператор SQL ORDER BY выполняет сортировку выходных значений. Оператор SQL ORDER BY можно применять как к числовым столбцам, так и к строковым. В последнем случае, сортировка будет происходить по алфавиту.

`ORDER BY column_name [ASC | DESC]`

ASC - по возрастанию, DESC - по убыванию

In [37]:
from sqlalchemy import desc, asc

customers_query = select([Customer.FirstName, Customer.LastName, Customer.Email])
customers_query = customers_query.order_by(asc(Customer.FirstName))

display_results(customers_query)

2020-12-15 19:35:23,862 INFO sqlalchemy.engine.base.OptionEngine SELECT customers."FirstName", customers."LastName", customers."Email" 
FROM customers ORDER BY customers."FirstName" ASC
2020-12-15 19:35:23,866 INFO sqlalchemy.engine.base.OptionEngine ()


Unnamed: 0,FirstName,LastName,Email
0,Lisa,Cohen,lisa@cohen.com
1,Moshe,Cohen,moshe@cohen.com
2,Nika,Rave,Nika@rave.com


In [38]:
customers_query = customers_query.order_by(desc(Customer.FirstName))

display_results(customers_query)

2020-12-15 19:35:23,911 INFO sqlalchemy.engine.base.OptionEngine SELECT customers."FirstName", customers."LastName", customers."Email" 
FROM customers ORDER BY customers."FirstName" ASC, customers."FirstName" DESC
2020-12-15 19:35:23,913 INFO sqlalchemy.engine.base.OptionEngine ()


Unnamed: 0,FirstName,LastName,Email
0,Lisa,Cohen,lisa@cohen.com
1,Moshe,Cohen,moshe@cohen.com
2,Nika,Rave,Nika@rave.com


**where**
Оператор SQL WHERE служит для задания дополнительного условия выборки, операций вставки, редактирования и удаления записей.

`where condition`

In [39]:
customers_query = select([Customer.FirstName, Customer.LastName, Customer.Email])
customers_query = customers_query.where(Customer.FirstName == 'Lisa')

display_results(customers_query)

2020-12-15 19:35:23,955 INFO sqlalchemy.engine.base.OptionEngine SELECT customers."FirstName", customers."LastName", customers."Email" 
FROM customers 
WHERE customers."FirstName" = ?
2020-12-15 19:35:23,958 INFO sqlalchemy.engine.base.OptionEngine ('Lisa',)


Unnamed: 0,FirstName,LastName,Email
0,Lisa,Cohen,lisa@cohen.com


Документация по операторам в SQLAchemy:

https://docs.sqlalchemy.org/en/13/core/sqlelement.html

## SQLAchemy + Pandas

In [40]:
import pandas as pd

In [41]:
#выведем название нашей таблицы
Customer.__tablename__

'customers'

In [42]:
df = pd.read_sql('SELECT * FROM customers', conn)
df.tail()

2020-12-15 19:35:24,019 INFO sqlalchemy.engine.base.Engine PRAGMA main.table_info("SELECT * FROM customers")
2020-12-15 19:35:24,022 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:24,024 INFO sqlalchemy.engine.base.Engine PRAGMA temp.table_info("SELECT * FROM customers")
2020-12-15 19:35:24,027 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:24,029 INFO sqlalchemy.engine.base.Engine SELECT * FROM customers
2020-12-15 19:35:24,031 INFO sqlalchemy.engine.base.Engine ()


Unnamed: 0,CustomerId,FirstName,LastName,Company,Address,Phone,Email
0,1,Moshe,Cohen,,"Alenbi 99, Tel Aviv",053-5556789,moshe@cohen.com
1,2,Lisa,Cohen,,"Alenbi 99, Tel Aviv",052-1234565,lisa@cohen.com
2,3,Nika,Rave,,"Green st, LA",330-1234565,Nika@rave.com


In [43]:
# Если хотим получить отсортированные значения - ключевая команда ORDER BY
df = pd.read_sql("""
SELECT 
    *
FROM
    customers
ORDER BY 
    LastName ASC;
""", conn)

df.head()

2020-12-15 19:35:24,080 INFO sqlalchemy.engine.base.Engine PRAGMA main.table_info("
SELECT 
    *
FROM
    customers
ORDER BY 
    LastName ASC;
")
2020-12-15 19:35:24,082 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:24,084 INFO sqlalchemy.engine.base.Engine PRAGMA temp.table_info("
SELECT 
    *
FROM
    customers
ORDER BY 
    LastName ASC;
")
2020-12-15 19:35:24,086 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:24,088 INFO sqlalchemy.engine.base.Engine 
SELECT 
    *
FROM
    customers
ORDER BY 
    LastName ASC;

2020-12-15 19:35:24,090 INFO sqlalchemy.engine.base.Engine ()


Unnamed: 0,CustomerId,FirstName,LastName,Company,Address,Phone,Email
0,1,Moshe,Cohen,,"Alenbi 99, Tel Aviv",053-5556789,moshe@cohen.com
1,2,Lisa,Cohen,,"Alenbi 99, Tel Aviv",052-1234565,lisa@cohen.com
2,3,Nika,Rave,,"Green st, LA",330-1234565,Nika@rave.com


In [44]:
# Если хотим получить уникальные значения - ключевая команда DISTINCT
df = pd.read_sql("""
SELECT 
    DISTINCT LastName
FROM
    customers
ORDER BY 
    LastName;
""", conn)

df.head()

2020-12-15 19:35:24,127 INFO sqlalchemy.engine.base.Engine PRAGMA main.table_info("
SELECT 
    DISTINCT LastName
FROM
    customers
ORDER BY 
    LastName;
")
2020-12-15 19:35:24,129 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:24,132 INFO sqlalchemy.engine.base.Engine PRAGMA temp.table_info("
SELECT 
    DISTINCT LastName
FROM
    customers
ORDER BY 
    LastName;
")
2020-12-15 19:35:24,133 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:24,135 INFO sqlalchemy.engine.base.Engine 
SELECT 
    DISTINCT LastName
FROM
    customers
ORDER BY 
    LastName;

2020-12-15 19:35:24,137 INFO sqlalchemy.engine.base.Engine ()


Unnamed: 0,LastName
0,Cohen
1,Rave



<center><img src='https://github.com/ddvika/Data-Science-School-2020/blob/main/lecture_5/imgs/i-know-sql.jpg?raw=true'></center>

# ДЗ

- Решить первые 20 задач с сайта https://www.sql-ex.ru (Раздел SELECT(обучающий этап)). Оценивается пропорционально кол-ву выполненных задач. + 20 % (еще 15 задач)
- Дополнить таблицу 'items' и 'purchases' 5ью экземплярами (каждую) на Ваш Выбор. Важно: они должны быть привязаны к существующим покупателям Lisa, Nika, Moshe.
- При помощи запроса SQLAlchemy вывести все покупки Lisa. Вывести тоже самое при помощи Pandas.

Решить первые 20 задач с сайта https://www.sql-ex.ru (Раздел SELECT(обучающий этап)). Оценивается пропорционально кол-ву выполненных задач. + 20 % (еще 15 задач)
<center><img src='https://github.com/mukaseevru/ds-school/blob/main/lesson%205/sql-ex.ru_(35_cases).png?raw=true'></center>

In [45]:
# Дополнить таблицу 'items' и 'purchases' 5ью экземплярами (каждую) на Ваш Выбор. Важно: они должны быть привязаны к существующим покупателям Lisa, Nika, Moshe.

PC = Item(
    Name='PC', 
    Price=1000)
session.add(PC)
session.commit()

Laptop = Item(
    Name='Laptop', 
    Price=1500)
session.add(Laptop)
session.commit()

Mobile = Item(
    Name='Mobile', 
    Price=999)
session.add(Mobile)
session.commit()

Monitor = Item(
    Name='Monitor', 
    Price=300)
session.add(Monitor)
session.commit()

Mouse = Item(
    Name='Mouse', 
    Price=100)
session.add(Mouse)
session.commit()

2020-12-15 19:35:24,175 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
2020-12-15 19:35:24,177 INFO sqlalchemy.engine.base.Engine INSERT INTO items ("Name", "Price") VALUES (?, ?)
2020-12-15 19:35:24,178 INFO sqlalchemy.engine.base.Engine ('PC', 1000.0)
2020-12-15 19:35:24,182 INFO sqlalchemy.engine.base.Engine COMMIT
2020-12-15 19:35:24,186 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
2020-12-15 19:35:24,187 INFO sqlalchemy.engine.base.Engine INSERT INTO items ("Name", "Price") VALUES (?, ?)
2020-12-15 19:35:24,188 INFO sqlalchemy.engine.base.Engine ('Laptop', 1500.0)
2020-12-15 19:35:24,190 INFO sqlalchemy.engine.base.Engine COMMIT
2020-12-15 19:35:24,194 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
2020-12-15 19:35:24,196 INFO sqlalchemy.engine.base.Engine INSERT INTO items ("Name", "Price") VALUES (?, ?)
2020-12-15 19:35:24,197 INFO sqlalchemy.engine.base.Engine ('Mobile', 999.0)
2020-12-15 19:35:24,201 INFO sqlalchemy.engine.base.Engine COMMIT
2020-12-15 19:35:2

In [46]:
items_query = select([Item.ItemId, Item.Name, Item.Price])
display_results(items_query)

2020-12-15 19:35:24,228 INFO sqlalchemy.engine.base.OptionEngine SELECT items."ItemId", items."Name", items."Price" 
FROM items
2020-12-15 19:35:24,231 INFO sqlalchemy.engine.base.OptionEngine ()


  "storage." % (dialect.name, dialect.driver)


Unnamed: 0,ItemId,Name,Price
0,1,PC,1000.0
1,2,Laptop,1500.0
2,3,Mobile,999.0
3,4,Monitor,300.0
4,5,Mouse,100.0


In [47]:
import numpy as np
import datetime as dt

purchase_1 = Purchase(
    ItemId=1, 
    CustomerId=1,
    Date=dt.datetime(2020,12,14))
session.add(purchase_1)
session.commit()

purchase_2 = Purchase(
    ItemId=2, 
    CustomerId=1,
    Date=dt.datetime(2020,12,14))
session.add(purchase_2)
session.commit()

purchase_3 = Purchase(
    ItemId=4, 
    CustomerId=1,
    Date=dt.datetime(2020,12,14))
session.add(purchase_3)
session.commit()

purchase_4 = Purchase(
    ItemId=3, 
    CustomerId=2,
    Date=dt.datetime(2020,12,11))
session.add(purchase_4)
session.commit()

purchase_5 = Purchase(
    ItemId=1, 
    CustomerId=2,
    Date=dt.datetime(2020,12,12))
session.add(purchase_5)
session.commit()

2020-12-15 19:35:24,281 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
2020-12-15 19:35:24,285 INFO sqlalchemy.engine.base.Engine INSERT INTO purchases ("ItemId", "CustomerId", "Date") VALUES (?, ?, ?)
2020-12-15 19:35:24,287 INFO sqlalchemy.engine.base.Engine (1, 1, '2020-12-14 00:00:00.000000')
2020-12-15 19:35:24,289 INFO sqlalchemy.engine.base.Engine COMMIT
2020-12-15 19:35:24,292 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
2020-12-15 19:35:24,294 INFO sqlalchemy.engine.base.Engine INSERT INTO purchases ("ItemId", "CustomerId", "Date") VALUES (?, ?, ?)
2020-12-15 19:35:24,296 INFO sqlalchemy.engine.base.Engine (2, 1, '2020-12-14 00:00:00.000000')
2020-12-15 19:35:24,298 INFO sqlalchemy.engine.base.Engine COMMIT
2020-12-15 19:35:24,300 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
2020-12-15 19:35:24,302 INFO sqlalchemy.engine.base.Engine INSERT INTO purchases ("ItemId", "CustomerId", "Date") VALUES (?, ?, ?)
2020-12-15 19:35:24,304 INFO sqlalchemy.engine.base.Eng

In [48]:
purchases_query = select([Purchase.PurchaseId, Purchase.ItemId, Purchase.CustomerId, Purchase.Date])
display_results(purchases_query)

2020-12-15 19:35:24,339 INFO sqlalchemy.engine.base.OptionEngine SELECT purchases."PurchaseId", purchases."ItemId", purchases."CustomerId", purchases."Date" 
FROM purchases
2020-12-15 19:35:24,342 INFO sqlalchemy.engine.base.OptionEngine ()


Unnamed: 0,PurchaseId,ItemId,CustomerId,Date
0,1,1,1,2020-12-14
1,2,2,1,2020-12-14
2,3,4,1,2020-12-14
3,4,3,2,2020-12-11
4,5,1,2,2020-12-12


In [49]:
customers_query = select([Customer.CustomerId, Customer.FirstName, Customer.Email])
display_results(customers_query)

2020-12-15 19:35:24,390 INFO sqlalchemy.engine.base.OptionEngine SELECT customers."CustomerId", customers."FirstName", customers."Email" 
FROM customers
2020-12-15 19:35:24,392 INFO sqlalchemy.engine.base.OptionEngine ()


Unnamed: 0,CustomerId,FirstName,Email
0,1,Moshe,moshe@cohen.com
1,2,Lisa,lisa@cohen.com
2,3,Nika,Nika@rave.com


In [50]:
# При помощи запроса SQLAlchemy вывести все покупки Lisa.
purchases_query = select([Purchase.PurchaseId, Purchase.ItemId, Purchase.CustomerId, Purchase.Date])
purchases_query = purchases_query.where(Purchase.CustomerId == 2)
display_results(purchases_query)

2020-12-15 19:35:24,434 INFO sqlalchemy.engine.base.OptionEngine SELECT purchases."PurchaseId", purchases."ItemId", purchases."CustomerId", purchases."Date" 
FROM purchases 
WHERE purchases."CustomerId" = ?
2020-12-15 19:35:24,436 INFO sqlalchemy.engine.base.OptionEngine (2,)


Unnamed: 0,PurchaseId,ItemId,CustomerId,Date
0,4,3,2,2020-12-11
1,5,1,2,2020-12-12


In [51]:
# Вывести тоже самое при помощи Pandas.
df = pd.read_sql('SELECT * FROM purchases WHERE CustomerId=2', conn)
df.head()

2020-12-15 19:35:24,463 INFO sqlalchemy.engine.base.Engine PRAGMA main.table_info("SELECT * FROM purchases WHERE CustomerId=2")
2020-12-15 19:35:24,464 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:24,467 INFO sqlalchemy.engine.base.Engine PRAGMA temp.table_info("SELECT * FROM purchases WHERE CustomerId=2")
2020-12-15 19:35:24,468 INFO sqlalchemy.engine.base.Engine ()
2020-12-15 19:35:24,470 INFO sqlalchemy.engine.base.Engine SELECT * FROM purchases WHERE CustomerId=2
2020-12-15 19:35:24,471 INFO sqlalchemy.engine.base.Engine ()


Unnamed: 0,PurchaseId,ItemId,CustomerId,Date
0,4,3,2,2020-12-11 00:00:00.000000
1,5,1,2,2020-12-12 00:00:00.000000
