# Типы данных в статистике

---

**Источники:**

[Statistical data type](https://en.wikipedia.org/wiki/Statistical_data_type)

[Data Types in Statistics](https://towardsdatascience.com/data-types-in-statistics-347e152e8bee)

[ОСНОВНЫЕ ТИПЫ ДАННЫХ](https://books.irrp.org.ua/data-design/osnovnye-tipy-dannyh/)

[Типы данных в статистике](https://www.machinelearningmastery.ru/data-types-in-statistics-347e152e8bee/)

[Статистические типы данных, используемые в машинном обучении](https://nuancesprog.ru/p/9713/)

[Шкала](https://ru.wikipedia.org/wiki/%D0%A8%D0%BA%D0%B0%D0%BB%D0%B0)

[Level of measurement](https://en.wikipedia.org/wiki/Level_of_measurement)

[Измерение и шкалы](https://forecasting.svetunkov.ru/etextbook/about/scales/)

[2.3. ШКАЛЫ ИЗМЕРЕНИЙ](http://gis.web.tstu.ru/metodic/gis/terminpon/glava2_3.html)

[What is the difference between ordinal, interval and ratio variables? Why should I care?](https://www.graphpad.com/support/faq/what-is-the-difference-between-ordinal-interval-and-ratio-variables-why-should-i-care/)

[Nominal, Ordinal, Interval and Ratio Data](https://microbenotes.com/nominal-ordinal-interval-and-ratio-data/)

[Nominal, Ordinal, Interval, and Ratio Data](https://matthewrenze.com/articles/the-four-subtypes-of-data-in-data-science/)

[Levels of Measurement: Nominal, Ordinal, Interval and Ratio](https://www.statology.org/levels-of-measurement-nominal-ordinal-interval-and-ratio/)

[Variables in quantitative reserach](https://revisesociology.com/tag/ordinal/)

[Levels of Measurement](https://theintactone.com/2019/03/04/brm-u3-topic-3-level-of-measurement-nominal-ordinal-interval-and-ratio/)

[Quantitative techniques in research](https://www.slideshare.net/crlmgn/quantitative-techniques-in-research)

[Methodology and statistics for clinical research – Part 1: descriptive statistics](https://www.hkcfp.org.hk/Upload/HK_Practitioner/2018/hkp2018vol40Sep/update_article.html)

[Шкалирование](https://studme.org/296261/marketing/shkalirovanie)

[Шкала измерений](https://stankiexpert.ru/tehnologii/shkala-izmerenii.html)

[Шкала в психологии. Виды шкал и их характеристика](https://psyera.ru/shkala-v-psihologii-vidy-shkal-i-ih-harakteristika_15450.htm)

[Методы получения данных мониторинга 1 Предложения по разработке регламента проведения сбора и анализа экспертных мнений](https://refdb.ru/look/2713918.html)

[Шкала измерения переменной](https://www.ibm.com/support/knowledgecenter/ru/SSLVMB_25.0.0/spss/base/dataedit_define_variable_measurement.html)

[ПЕРЕМЕННЫЕ И ШКАЛЫ](http://www.tryphonov.ru/tryphonov3/terms3/varsca.htm#0)

[ИНТЕРВАЛЬНАЯ ПЕРЕМЕННАЯ](http://www.tryphonov.ru/tryphonov3/terms3/itvar.htm)

[Типы статистических шкал](http://www.datuapstrade.lv/rus/spss/section_5/2/)

[Типы шкал (Type of scale)](https://wiki.loginom.ru/articles/scale-type.html)

---

## Подготовка окружения

In [1]:
# ВНИМАНИЕ: необходимо удостовериться, что виртуальная среда выбрана правильно!

# Для MacOS/Ubuntu
# !which pip

# Для Windows
# !where pip

In [2]:
# !conda install pandas numpy matplotlib -y

In [3]:
import pandas as pd

pd.__version__

'1.2.3'

## Типы шкал и их свойства согласно классификации Стэнли Смита Стивенса

Хорошее понимание разных типов данных (шкал измерений) — основное условие для проведения разведочного анализа данных (exploratory data analysis = **EDA**), ведь **для определённых типов данных можно использовать только ограниченный набор статистических измерений**.

Чтобы решить, какой метод визуализации выбрать, также необходимо понимать, с какими данными предстоит работать.

Можно думать о типах данных как о способе категоризации разновидностей переменных.

Шкалы измерений классифицируются по типам измеряемых данных, которые определяют допустимые для данной шкалы отношения, в том числе те, что соответствуют математическим преобразованиям значений шкалы. Современная классификация шкал была предложена в 1946 году **Стэнли Смитом Стивенсом**.


<img src="images/scales_info.png" />

<img src="images/measure_scales.png" />

<img src="images/scales_of_measurement.png" />

<img src="images/scales.jpg"/>

<img src="images/type_scales.png"/>


<img src="images/scale_choose.png" height="450" width="450"/>

## Примеры

### Опросник
- Пол (качественная номинальная шкала, две категории = дихотомическая):
    - 1 = мужской
    - 2 = женский
- Семейное положение (качественная номинальная шкала)
    - 1 = холост/не замужем
    - 2 = женат/замужем
    - 3 = вдовец/вдова
    - 4 = разведен(а)
- Курение (качественная порядковая=ранговая шкала)
    - 1 = некурящий
    - 2 = изредка курящий
    - 3 = интенсивно курящий
    - 4 = очень интенсивно курящий
- Месячный доход (качественная порядковая=ранговая шкала)
    - 1 = до 30000
    - 2 = 30001 - 50000    
    - 3 = более 50000
- Коэффициент интеллекта (IQ) (дискретная интервальная шкала) 
- Возраст (лет) (непрерывная шкала отношений)

| Статистическая шкала | Эмпирическая значимость | Примеры |
| --- | --- | --- |
| Номинальная | Нет | Пол, семейное положение |
| Порядковая (ранговая) | Порядок чисел | Курение, месячный доход |
| Интервальная | Разность чисел | Коэффициент интеллекта (IQ) |
| Шкала отношений | Отношение чисел | Возраст (лет) |

### Геоинформационная система (ГИС)
<img src="images/gis_measures.jpg" />

### В спортивных соревнованиях

<img src="images/measurement_scales_example_1.jpg" height="500" width="500" />

### Кофе и мороженое

<img src="images/measurement_scales_example_2.jpg" height="500" width="500"/>