## R Vector

<br>

- 다른 언어의 배열, List 같은 개념.
- 여러 변수들을 하나의 이름으로 묶은 집합.
- 항목 변경 가능, 추가 작업이 가능.
- 각 항목에 이름을 부여해 인덱스 뿐만 아니라 이름으로도 접근이 가능.
    - 다른 언어는 index가 0부터 시작하지만, R은 1부터 시작.
- 벡터 항목의 요소들은 **한가지 데이터 타입**이어야 함.
    - 그렇지 않은 경우 **강제 형변환이 발생**함.
        * **정수형, 실수형이 섞이면 정수형은 실수형으로 형 변환** 됨.

In [8]:
x <- -1 : 5 # -1 부터 5까지 벡터 생성.
x
is.vector(x) 
x + 2 # 각각의 값에 +2를 함.

# x를 문자로 바꾸고 싶으면?
c <- as.character(x)
c
# 파이썬 같은 경우 int(변수), str(변수)로 했지만
# R은 as.character, as.numeric을 통해 형변환을 한다.
as.numeric(c)

# Factor로도 변환이 가능.
factor(x)

### Vector 항목에 이름 설정

<br>

- names() 함수를 이용해 이름 설정.
    - 반환값은 지정한 이름값을 문자열 벡터에 할당.

In [19]:
coffee <- c(1000, 3000, 4500, 5000) # 벡터 생성

# 생성한 벡터에 1:1로 이름을 넣어줌.
names(coffee) <- c('아메리카노', '카페라떼', '카페모카', '카라멜 마끼아또')

coffee # 각 변수마다 이름이 붙여진 걸 확인할 수 있음.

**Vector 또한 합치는 것이 가능.**

<br>

    단순히 + 연산하면 에러남. '이항연산자에 수치가 아닌 인수입니다'
    (수치형 Vector끼린 수치연산 가능.)

In [20]:
coffee_1 <- c('아메리카노', '카페라떼')
coffee_2 <- c('카페모카', '헤이즐넛', '녹차라떼')

# 이 둘을 합칠 수 있나? 있다.
# Vector를 이용해 또 다른 Vector를 생성하는 셈.
coffee_menu <- c(coffee_1, coffee_2)
coffee_menu

### Vector 항목 접근

<br>

1. Index 번호로 접근
    - **변수[index번호]** 로 접근이 가능함. 
        * 주의 : **R의 index는 1부터 시작.** (다른 언어처럼 0부터 시작이 X)
    - 특정 구간 만큼의 접근?
        * Python의 index slicing처럼 **[시작index : 끝index]**를 통해 접근 가능.
    - 특정 항목만 제외하고 접근?
        * **[-'제외할 항목의 index']** 로 접근 가능.
2. 벡터 이름으로 접근
    - **변수['변수이름']** 으로 접근이 가능함.

In [21]:
# coffee변수의 2번째 요소에 접근?
coffee[2] # index 접근
coffee['아메리카노'] # 이름 접근

In [22]:
# Vector내 특정 원소의 값을 변경?
coffee
coffee[1] <- 2500
coffee

In [23]:
coffee[1:3] # index slicing으로 접근
coffee[-3] # 3번째 항목만을 제외하고 접근

### Vector 연산 작업

<br>

- 특정 항목에 접근해 계산 작업을 할 수 있음.
    - 벡터변수[index번호 or 이름] +-*/ 연산
- 전체에 대한 연산작업을 일괄적으로도 할 수 있음.
    - 벡터변수 +-*/ 연산

In [27]:
# 특정 항목만을 변경
coffee[2] + 500
coffee
# 전체 항목 변경
coffee + 1000
coffee

    볼 수 있듯이, 항목 연산 시에만 항목의 값이 변함.
    추후 다시 불러오면 그 항목은 바뀌지 않은 상태.
    R은 동적인 언어.
    
    직접적으로 <- 연산자를 통해 값을 바꾸지 않는 이상 값은 바뀌지 않음.

### Vector 집합 연산

<br>

- 벡터를 하나의 집합으로 간주해 교집합, 합집합, 일치여부 등의 연산이 가능함.
- 주요 함수?
    1. **identical(x, y)** : x, y의 항목이 일치하면 TRUE, 일치하지 않으면 FALSE
    2. **union(x, y)** : 합집합 계산
    3. **intersect(x, y)** : 교집합 계산
    4. **setdiff(x, y)** : 차집합 계산
    5. **setequal(x, y)** : x, y의 구성 값이 동일하면 TRUE, 동일하지 않으면 FALSE
    
<br>

- identical, setequal의 차이점?
    * identical : 두 vector의 항목들이 완전히 일치하는지 확인.
    * setequal : 두 vector의 구성되는 값들이 일치하는지 확인.
    
<br>

- x : 100 200 300 // y : 100 100 200 200 200 300 에 대해
    - identical은 **각 항목들이 완전히 일치하지 않고, 갯수도 다르므로 FALSE**를 반환.
    - setequal은 **구성되는 값들이 100, 200, 300으로 일치하므로 TRUE**를 반환.
        * y는 구성되는 값의 갯수가 다르지만, 구성되는 값은 100 200 300. 
            - 즉, x와 y의 구성되는 값이 같음.
 

In [33]:
shop1 <- c(15, 10, 7, 3)
shop2 <- c(20, 17, 2, 8)

# 둘의 사칙연산이 가능.
shop1 + shop2 # 항목간 1:1로 연산이 이뤄짐.

ashop <- c('아메리카노', '카푸치노', '카페모카')
bshop <- c('아메리카노', '카페모카', '모카치노')

UnionShop <- union(ashop, bshop) # 합집합
UnionShop

IntersectShop <- intersect(ashop, bshop) # 교집합
IntersectShop

DiffShop <- setdiff(ashop, bshop) # 차집합 (ashop - bshop)
DiffShop

identical(ashop, bshop) # 두 벡터 내용이 일치하는지?

cshop <- c('아메리카노', '카페모카', '카푸치노', '카페모카')

setequal(ashop, cshop) # 두 벡터의 구성 값이 동일?

### Vector에 연속된 값 할당

<br>

- 연속적인 데이터를 벡터에 할당할 수 있음.
    - **seq(시작값, 끝값, 증가값)** : 시작값 부터 끝값까지 일정한 증가값 만큼씩의 값을 벡터에 할당.
    - **rep(반복할 벡터항목, times(또는 each))**
        - times : 반복할 **벡터항목 전체를 몇 번 반복**할 것인지?
        - each : 반복할 **벡터항목 각각을 몇 번 반복**할 것인지?

In [44]:
y <- seq(0, 1000, 200) # 0부터 1000까지 200씩 증가하도록 벡터 생성.
y

part <- rep(1:3, times=2) # 1~3까지의 숫자를 2번 반복.
part
part2 <- rep(1:3, each=3) # 1~3까지의 각 숫자를 3번씩 반복.
part2

### Vector의 길이 구하기

<br>

1. **length(벡터)** : 해당 벡터의 길이 반환.
2. **NROW(벡터)** : 벡터 뿐만 아니라 행렬의 행, 데이터프레임의 행 수를 계산해 보여줌.

In [45]:
NROW(coffee)
length(coffee)

In [48]:
m <- seq(0, 100, length = 5) # 0부터 1000까지 연속값을 할당, 벡터의 길이는 5만큼.
m # 0 ~ 100 구간 안에서 length만큼의 덩어리로 짤라서 반환.
n <- seq(0, 100, length = 8)
n # 덩어리가 딱 떨어지지 않으면 소수점으로 까지 나눠서 반환.

### 공 Vector 선언

<br>

파이썬에서 myList = [] 처럼 비어있는 벡터를 선언할 수 있음.

<br>

- vector(mode = '벡터에 들어갈 자료형', length = '길이')
    - 벡터에 들어갈 자료형 : numeric 등등...
    - 길이 : 생성하고 싶은 빈칸 갯수 지정.

In [53]:
a <- vector(mode = 'numeric')
a # 실제로 공 벡터라서 출력물이 없음.
is.vector(a) # 내용이 없지만 벡터는 벡터. TRUE를 반환.

b <- vector(mode = 'numeric', length = 10) # 10개의 빈 벡터 생성.
b
b[1] <- 20 # 빈 벡터 첫번째에 값 대입
b # 값이 대체됨을 확인.