# Векторы в R

## Значение векторов

- **Вектор** - базовая структура данных в R
- На векторах основаны более сложные структуры данных: матрица, список, дата фрейм, фактор
- *Векторизация* - главная концепция языка. Она встретится еще во многих местах, но пока что важно понять, что в R для применения функции к множеству значений не нужно заводить цикл и применять функцию к каждому значению поочередно. В большинстве случаев будет достаточно применить эту функцию непосредственно к вектору, содержащему все значения.


## Что такое вектор

- **Вектор** - индексированный набор данных одного типа (говорят, что вектора в R - атомарные)
- Язык R не различает скалярные и векторные величины. Скаляр в R - это вектор единичной длины
- Индексация векторов в R начинается с единицы, а не с нуля
- Для создания векторов можно использовать функцию ***vector***

In [1]:
x <- vector(length = 3)
x[1] <- 3
x[2] <- 2
x[3] <- 1
x

In [2]:
# Пример концепции векторизации
x <- sqrt(x)
x

## Создание векторов: функция *c*

- Функция ***с*** позволяет создавать векторы, не используя поэлементное присваивание

In [3]:
y <- c(4, 5, 6)
y

- Функция может быть вложенной и принимать переменные

In [6]:
y <- c(x, 5, 6, pi, c(7, 8))
y

## Создание векторов: оператор *:*

Данный оператор позволяет создавать числовые последовательности с шагом 1

In [7]:
1:5

In [8]:
5:-5

In [10]:
4.3:7.7
# Дробные значения также работают, только большая граница может не включаться

## Создание векторов: функция *seq*

Позволяет создавать более сложные последовательности:
1. C различным шагом

In [12]:
seq(1, 2, by = 0.2)

  2. Разной длины (шаг расчитывается автоматически)

In [23]:
seq(1, 4, length.out = 13)

## Создание векторов: функция *rep*

Позволяет создавать специфичные векторы с повторениями

In [25]:
rep(c(1, 3), times = 3)

In [26]:
rep(1:4, each = 3)

In [28]:
rep(c(1, 2, 3, 4), length.out = 10)

# Приведение типов

Про типы переменных в R рассказывалось ранее, и, что логично, типы векторов в целом никак не отличаются. Правда, может оказаться, что программист пытается поместить в вектор данные разных типов, но вектора в R атомарны (включают лишь однотипыне данные). Никакого противоречия здесь нет, и такая ситуация, действительно, иногда необходима.  
  
- Язык R умеет приводить данные разных типов в векторе к одному по схеме:
### logical - integer - double - character
Это значит, что все элементы будут приведены к самому правому (имеющемуся в векторе) из схемы

In [38]:
z <- c(TRUE, 1.5, "qwerty")
# Здесь самый правый тип у строки "qwerty" - character, значит остальные элементы будут приведены к нему.
# TRUE будет из logical переведено в строку "TRUE" - character
# 1.5 будет из double переведено в строку "1.5"
z
typeof(z)

- Принудительное приведение типов осуществляется функциями ***as.****:

In [40]:
z <- c(1, 1.25, 2.9, TRUE, "qwerty")
#as.numeric(z)
as.double(z)
# R предупредит нас, что не все элементы смогли преобразоваться в нужный нам тип и были заменены NA (здесь это элементы
# TRUE и "qwerty")

"в результате преобразования созданы NA"

In [41]:
as.integer(z)
# При приведении у дробных значений отбрасывается дробная часть

"в результате преобразования созданы NA"

# Длина вектора: функция *length*

- У каждого вектора, кроме типа, есть такая характеристика, как длина:

In [44]:
x <- 0:10
length(x)

- Длина определяется автоматически при создании и изменении вектора, но её можно принудительно менять:

In [47]:
length(x) <- 3
# При изменении длины на меньшую вектор "обрезается"
x

In [49]:
length(x) <- 8
# При изменении длины на большую в конец вектора дописываются NA
x

# Именованные векторы

- Элементы векторы могут быть пронумерованы (\*имя\* = \*значение\*):

In [53]:
y <- c(un = 1, deux = 2, trois = 3, "number" = 20, 100)
names(y)
y

- Можно проименовать элементы, переприсвоив вектору ***names*** новый вектор с именами:

In [52]:
names(y) <- c("один", "два", "три", "двадцать", "сто")
y

- Чтобы стереть имена элементов, достаточно присвоить вектору ***names*** значение *NULL*:

In [55]:
names(y) <- NULL
y

# Векторная арифметика

Арифметические операторы в R *векторизованы* (т.е. применяются поэлементно):

In [57]:
1:5 + c(-1.5, -1, 6)
# Если элементов в одном векторе не хватает до длины второго, то суммирование начинается циклически с начала вектора

"длина большего объекта не является произведением длины меньшего объекта"

In [58]:
1:3 * 1:-1

In [59]:
c(TRUE, FALSE, TRUE) & c(100, 1, 0)

# Векторизация

Многие функции в R имеют встроенную поддержку *векторизации*:

In [60]:
sqrt(1:9)
# Векторизирована

In [61]:
sum(1:9)
# Не векторизирована