<h1>Запросы SQL из базы данных PostgreSQL (локальный сервер  PostgreSQL )<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#Подключение-к-базе-данных-с-помощью-Python" data-toc-modified-id="Подключение-к-базе-данных-с-помощью-Python-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>Подключение к базе данных с помощью Python</a></span></li><li><span><a href="#Запросы" data-toc-modified-id="Запросы-2"><span class="toc-item-num">2&nbsp;&nbsp;</span>Запросы</a></span></li></ul></div>

## Подключение к базе данных с помощью Python

Для подключения к базе данных часто используют библиотеку SQLAlchemy — она одна из самых распространённых. 

Прежде чем использовать библиотеку, нужно её установить. Запустите команду для установки SQLAlchemy в вашей тетрадке Jupyter Notebook. Знак ! перед командой обозначает, что её нужно передать консоли.

In [1]:
!pip install sqlalchemy



Импортируем остальные библиотеки. Функция create_engine() из библиотеки SQLAlchemy служит для подключения к базе данных и выполнения SQL-запроса

In [2]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sqlalchemy import create_engine



Для подключения к базе данных вам понадобится:
- имя пользователя базы данных и пароль;
- адрес сервера базы данных, включая порт;
- название базы данных.

Эти данные удобно записать в объект, чтобы потом их было легко поправить. Для подключения к базе данных Практикума используйте следующие данные:

In [3]:
db_config = {
    'user': 'postgres', # имя пользователя
    'pwd': '5432', # пароль
    'host': 'localhost',
    'port': 5432, # порт подключения
    'db': '2_st_database' # название базы данных
} 

После того как данные для авторизации записаны в объект db_config, нужно передать функции create_engine() строку для соединения с базой данных. Строка содержит информацию об используемой СУБД, а также все данные для авторизации.

Строку для подключения можно сформировать с помощью метода .format()

In [4]:
connection_string = 'postgresql://{}:{}@{}:{}/{}'.format(
    db_config['user'],
    db_config['pwd'],
    db_config['host'],
    db_config['port'],
    db_config['db'],
)

Чтобы создать соединение, строку с данными для подключения передают функции create_engine()

In [5]:
engine = create_engine(connection_string)

Готово! К базе подключились, теперь можно извлекать результаты SQL-запроса

## Запросы

In [6]:
query = '''
SELECT *
FROM newtable
'''

In [7]:
data_1 = pd.read_sql_query(query, con = engine)

In [8]:
data_1

Unnamed: 0,user_id,group,ab_test
0,D1ABA3E2887B6A73,A,recommender_system_test
1,A7A3664BD6242119,A,recommender_system_test
2,DABC14FDDFADD29E,A,recommender_system_test
3,04988C5DF189632E,A,recommender_system_test
4,482F14783456D21B,B,recommender_system_test
...,...,...,...
18263,1D302F8688B91781,B,interface_eu_test
18264,3DE51B726983B657,A,interface_eu_test
18265,F501F79D332BE86C,A,interface_eu_test
18266,63FBE257B05F2245,A,interface_eu_test


Создадим тестовый датафрейм и зальём его в нашу базу данных **2_st_database**

In [9]:
new_df = pd.DataFrame({'number': [1,2,3,4,5]})
new_df

Unnamed: 0,number
0,1
1,2
2,3
3,4
4,5


In [10]:
# Параметр if_exists = 'replace' - нужен для того, чтобы перезаписывать таблицу test_1 в базу данных, в случае, если мы перегружаем тетрадку 
# Jupyter, если не поставим, будет ошибка. 
# Параметр index=False, нужен, чтобы в базу данных записалась таблица без индексов

new_df.to_sql('test_1',con = engine,if_exists = 'replace',index=False)

Выполняем запрос по вновь добавленной в базу данных таблице test_1

In [11]:
query = '''select * 
from test_1 '''

In [12]:
data_2 = pd.read_sql_query(query, con = engine)
data_2

Unnamed: 0,number
0,1
1,2
2,3
3,4
4,5


Всё работает, созданная таблица `test_1` в jupyter отражется также в клиенте DBeaver. В DBeaver также можно создавать тестовые датафреймы. 