# Настройка ноутбука

In [4]:
import pandas as pd
import numpy as np
from sklearn import datasets
import datetime as dt

from pandasql import sqldf

In [2]:
import warnings
warnings.filterwarnings('ignore')

In [3]:
from IPython.core.display import display, HTML
display(HTML("<style>.container { width:100% !important; }</style>"))

# Описние

Ноутбук с набором практик по работе со строка с помощью языка PostgreSQL

## Ресурсы

- [PosgreSQL doc: Date/Time Types](https://www.postgresql.org/docs/current/datatype-datetime.html)
- [PosgreSQL doc: Data Type Formatting Functions](https://www.postgresql.org/docs/current/functions-formatting.html)

# Практики

## Выделить данные за определенный период

### Примеры задач

- [Stratascratch: Customer Revenue In March - Medium](https://platform.stratascratch.com/coding/9782-customer-revenue-in-march?code_type=1)
- [Stratascratch: Number of violations - Medium](https://platform.stratascratch.com/coding/9728-inspections-that-resulted-in-violations?code_type=1)

### Получить текущий год

```sql
select value from data where date_part('year', current_date) - year_col <= 20
```

#### Примеры задач:

- [Stratascratch: Find the top-ranked songs for the past 20 years - Medium](https://platform.stratascratch.com/coding/10283-find-the-top-ranked-songs-for-the-past-30-years?code_type=1)

### Выделить данные за определенный год-месяц

```sql
select 
    val1, val2, val3, ...
from df 
where to_char(order_date, 'yyyy-mm') = '2019-03'
```

### Выделить данные за определенный период

```sql
select
    val1, val2, val3, ...
from df
where date(date_col) between date_start and date_end

```

### Выделить данные за определенный период в течении дня

```python
date_start = '2022-08-01'
date_end = '2022-08-01'

time_start = '00:00:00'
time_end = '06:00:00'

datetime_start = f'{date_start} {time_start}' 
datetime_end = f'{date_end} {time_end}'
```

```sql
select
    val1, val2, val3, ...
from
    df
where 
    to_char(ch.timestamp, 'YYYY-MM-DD HH24:MI:SS') >= 'datetime_start' 
    and 
    to_char(ch.timestamp, 'YYYY-MM-DD HH24:MI:SS') <= 'datetime_end'
```

### Посчитать количество дней/месяцев/лет между датами

```sql
select 
      start_date, end_date
    , end_date - start_date as n_days
    , (end_date - start_date)::decimal / 30 as n_months
    , (end_date - start_date)::decimal / 365 as n_years
from data
```

**Замечание:** я пробовал использовать для расчета выражения
```sql
extract(month FROM age(end_date, start_date))
date_part('month', age(end_date, start_date))
```
однако результат этих функций видимо зависит от настроек базы или сервера и может отличатся от результата первых вариантов на 2 месяца. Поэтому пока я предпочитаю простой подход.

#### Примеры задач:

- [Stratascratch: Risky Projects - Medium](https://platform.stratascratch.com/coding/10304-risky-projects?code_type=1)