Профессия Data Science  
Блок 2. Подгрузка данных  
**SQL-5. Типы данных**

---

## **✍ Оглавление:**

2. Типы данных в PostgreSQL
3. Даты: основные типы
4. Функции и операторы для работы с датами

---

## **2. Типы данных в PostgreSQL**

**ОБЗОР ТИПОВ ДАННЫХ**

Особенностью хранения данных в БД является их строгая **типизация**, то есть точное и явное определение типов. Необходимость в типизации обусловлена тем, что компьютер по-разному обрабатывает даты, целые или дробные числа, строки.

Поэтому при создании таблицы БД обязательно указывают типы данных, которые будут сохраняться в каждом из её полей, — от этого зависит, какие значения допустимы в этих полях.

Типы данных — это один из основных видов ограничений в PostgreSQL.

**ОСНОВНЫЕ ТИПЫ ДАННЫХ В POSTGRESQL**

**SQL** — это язык со строгой типизацией, в котором каждый элемент данных имеет некоторый тип, определяющий его поведение и допустимое использование.

Типы данных в PostgreSQL можно разделить на несколько групп. К основным относятся:

- числовые типы — для хранения чисел (целых и дробных);  
- типы даты/времени — для хранения даты, времени, часовых поясов;  
- символьные типы — для хранения символов или строк;  
- логический тип — для хранения значений типа «истина», «ложь».

**В зависимости от требований к хранимой информации необходимо правильно применять типы данных. На это есть как минимум две причины.**

1. Разные типы данных могут занимать разный **объём памяти**.

2. На преобразование типов данных тратится **время**.

## **3. Даты: основные типы**

→ Любой анализ событий во времени подразумевает работу с датой или временем.

Для них в Postgres существует несколько типов данных.

**TIMESTAMP**

**Timestamp** — наиболее распространённый тип данных, так как он содержит и дату, и время, а также используется в любых логах событий, временных рядах и в большинстве системных таблиц.

Согласно стандарту ISO, значение выглядит как "2019-07-14 01:35:44.702165+00", где перечислены через точку год-месяц-день, время и часовой пояс.

Для получения текущего значения даты и времени в Postgres используются функции **CURRENT_TIMESTAMP** (есть в стандарте SQL) и **NOW()** (есть в большинстве баз данных).

**SELECT NOW() и SELECT CURRENT_TIMESTAMP**

**TIMESTAMP WITH TIME ZONE**

**Timestamp with time zone** позволяет хранить сведения о часовом поясе, что может быть удобно при анализе географически распределённых временных данных для единообразия хранения.

Сначала попробуем узнать, в каком часовом поясе выводятся временные данные в настоящий момент. Для этого выполните команду

**show timezone**

В результате вы увидите GMT — это наиболее частая установка по умолчанию для баз данных. 

Список часовых поясов можно увидеть в системном справочнике pg_timezone_names.

***select now() at time zone 'Europe/Moscow'***

Указание at time zone позволяет переводить дату/время без часового пояса в дату/время с часовым поясом и обратно, а также пересчитывать значения времени для различных часовых поясов.

**Задание 3.1 (External resource)**

select now() at time zone 'America/Los_Angeles' as now

**DATE**

С типом date вы уже знакомы, его реализация предельно проста. Отметим только, что тип timestamp (with/without time zone) можно легко перевести в соответствующую дату, используя синтаксис

***"timestamp_column"::date***

И наоборот, тип date преобразуется в timestamp (дата и 00:00:00) с помощью

***"date_column"::timestamp***

Для получения текущей даты можно использовать

***select CURRENT_DATE***

или

***select now()::date***

**Задание 3.2 (External resource)**

WITH x AS   
(SELECT '2018-12-31 21:00:00+00'::timestamp WITH time zone ts)  
SELECT (ts at time zone 'Europe/Moscow')::date dt_msk, (ts)::date dt_utc  
FROM x

**INTERVAL**

**Interval** — тип данных, позволяющий хранить разницу между двумя временными метками. 

Интервалы хранят данные в трёх отдельных полях — месяцах, днях, секундах. Это сделано из-за того, что количество дней в месяце и часов в дне может быть разным. Пример значения такого типа: "195 days -10:52:23.563955".

## **4. Функции и операторы для работы с датами**