# 연속 데이터 타입

- 단일 데이터 n개를 가지고 있는 자료 구조
- 연속형, 시퀀스형 표현
- 튜플만 수정불가

|타입명|기호|특징|크기|
| -- | -- | -- | -- |
|리스트|[]|- list()<br>- []<br>- 순서 (인덱스) 0<br>- 값 중복 0|- len()|
|딕셔너리|{}|- dict()<br>- {}<br>- 순서 (인덱스) X<br>- 값 중복 0, 키 중복 X<br>- 키와 값의 세트로 구성<br>- 타언어와 통신시 json으로 대응됨|- len()|
|튜플|()|- tuple()<br>- ()<br>- 순서 (인덱스) 0<br>- 값 중복 0<br>- 단순하게 값을 묶는다.|- len()|
|집합|{}|- set()<br>- {}<br>- 순서 (인덱스) X<br>- 값 중복 X : 중복제거|- len()|
|배열|ndarray|- numpy의 자료구조, 행렬|- shape()|
|시리즈|Series|- pandas의 자료구조, 1차원 구조|- shape()|
|데이터프레임|DataFrame|- pandas의 자료구조, 2차원 구조|- shape()|
|텐서|Tensor|- 딥러닝 중요 엔진들의 자료구조, tensorflow, pytorch|- shape()|


# 리스트

### 1. 생성

In [1]:
# 동적 생성 : 리스트의 멤버를 나중에 추가할 경우 사용
a = list()
a, type(a), len(a)

([], list, 0)

In [2]:
# 정적 생성 : 리스트의 멤버를 바로 추가하면서 생성하는 경우
# 그러나, 나중에 멤버를 추가하는 형태에서 사용은 가능하다.
a = [1, 2, 3, 4]
a, type(a), len(a)

([1, 2, 3, 4], list, 4)

In [3]:
b = ['노브랜드버거','롯데리아','서브웨이']
b

['노브랜드버거', '롯데리아', '서브웨이']

### 2. 리스트 합치기

In [4]:
# 리스트 합치기, 리스트의 타입이 달라도 하나의 리스트로 만드는데 문제없다
# 구성원의 멤버 타입은 중요하지 않다. (배열은 멤버 타입을 중요시 한다.)
# 리턴값이 리스트로 나왔다 > 사본 출력
c = a + b
c

[1, 2, 3, 4, '노브랜드버거', '롯데리아', '서브웨이']

### 3. 인덱싱

In [5]:
# 인덱싱
# 변수[인덱스]
# 차원축소 : 리스트에서 인덱싱을 수행하니 값이 나왔다.
# 벡터 -> 스칼라를 취했다
c[4]

'노브랜드버거'

### 4. 슬라이싱

In [6]:
# 슬라이싱
# 변수[시작인덱스:끝인덱스:step(기본값1)]
c[:] # 원본카피


[1, 2, 3, 4, '노브랜드버거', '롯데리아', '서브웨이']

In [7]:
# 처음부터 2번째까지, 뒤에서 두번째부터 끝까지
c[:2], c[:-2]

([1, 2], [1, 2, 3, 4, '노브랜드버거'])

In [8]:
# 수정 -> 원본 수정
# 인덱싱 수정
c[2] = 100
c

[1, 2, 100, 4, '노브랜드버거', '롯데리아', '서브웨이']

In [9]:
# 슬라이싱 수정
# 수정의 값은 연속형만 가능하다
c[:2] = "1"
c[2:3] = "10"

In [10]:
c

['1', 100, '1', '0', '노브랜드버거', '롯데리아', '서브웨이']

### 5. 추가

In [11]:
# 추가
c.append(10)
c

['1', 100, '1', '0', '노브랜드버거', '롯데리아', '서브웨이', 10]

### 6. 삭제

In [12]:
# 삭제
# 파이썬 표현 내에서 특정 변수를 해제하는 방법 : del
del c[0]

In [13]:
del c[:2]

In [14]:
c

['0', '노브랜드버거', '롯데리아', '서브웨이', 10]

In [15]:
c.clear()
c

[]

In [16]:
# 원본이 수정되서 c에 a가 이어붙어진다.
c.extend(a)
c

[1, 2, 3, 4]

In [17]:
c.insert(2,100)

In [18]:
c

[1, 2, 100, 3, 4]

### 7. 분해

In [19]:
# 리스트도 분해가 가능하다 (배열, 객체 "구조 분해":js에서는 부른다)
a,b,c = [1,2,3]
a

1

# 딕셔너리

### 1. 구성

In [None]:
# 동적구성
dic = dict()
dic, type(dic), len(dic)

({}, dict, 0)

In [None]:
# 정적구성
dic = {'name':'부산대'}
dic, type(dic), len(dic)

({'name': '부산대'}, dict, 1)

In [None]:
# 멤버 구성
# 키 : 값
# 키는 함수를 제외하고는 모두 다 가능하다
# 주로, 문자열, 수치 등을 사용
# Java:Map, JS:객체, ios:NSDictionary, 데이터:json등 동일구조를 가짐
# 주로 [{}, {}, {}, ...] 이런 구조를 주로 많이 사용
# 키는 고유하다
exchange = {
    'na':'미국',
    'code':'USD',
    'buy':1118.10,
    'sell':1110.10
}
exchange

{'buy': 1118.1, 'code': 'USD', 'na': '미국', 'sell': 1110.1}

### 2. 인덱싱

In [None]:
# 인덱싱
# 0, 1, 2와 같은 순서적 키가 없으므로
# 값을 대변하는 키를 넣어서 값을 취한다.
exchange['na']

'미국'

In [None]:
# 슬라이싱
# X

In [None]:
# 수정
exchange['buy'] = 1119.10
exchange

{'buy': 1119.1, 'code': 'USD', 'na': '미국', 'sell': 1110.1}

In [None]:
# 함수로 값을 추출
exchange.get('buy')

1119.1

### 3. 함수사용

In [None]:
# None : 값이 없다, 할당이 안됬다, 비유적으로 Null
# 데이터 분석으로 가면 NaN을 사용 <-> 분석에서는 결측치라고 부른다.
# 해당 키가 없어도 시스템이 종료되지 않는다.(안정적)
print(exchange.get('buy1'))

None


In [None]:
# 인덱싱은 해당 키가 없으면 셧다운 -> 불안정적한 사용법
exchange['buy1']

KeyError: ignored

In [None]:
# 추가, 딕셔너리에 데이터를 추가한다면 키와 값이 세트로 필요하다
# 아래의 경우 1은 키, 100은 값이다.
exchange[1]=100
exchange

{1: 100, 'buy': 1119.1, 'code': 'USD', 'na': '미국', 'sell': 1110.1}

# 튜플

### 1. 구성

In [None]:
# 동적 구현
tu = tuple()
tu, type(tu), len(tu)

((), tuple, 0)

In [None]:
# 정적 구현
# 멤버수가 1개인 경우, 그룹화하는 연산자와 구분이 안된다.
# 멤버가 1개이면 ,를 넣어서 표식을 주어야 한다.
tu = (1,)
tu, type(tu), len(tu)

((1,), tuple, 1)

In [None]:
tu = (1,2,3,4,5)
tu

(1, 2, 3, 4, 5)

In [None]:
# 인덱싱
tu[0]

1

In [None]:
# 슬라이싱
tu[1:2]

(2,)

In [None]:
# 추가 X -> readonly, immutable 수정/추가/삭제 불가, 읽기전용
# 용도는 단순하게 값을 묶는다
# 함수의 리턴값이 여러개일 경우, 
# 자동으로 튜플로 리턴된다(리턴값을 나열하면) -> 함수편에서 확인

# 튜플의 멤버수대로 변수를 나열해서 받아주면 -> 분해
# 멤버들을 하나씩 각각 변수에 대입해서 분해한다.
a,b,c,d,e = tu

In [None]:
type(a), a, b, c, d, e

(int, 1, 2, 3, 4, 5)

In [None]:
# 만약에 나는 3번째 값은 사용할 일이 없다.
a,b,_,d,e = tu
# 더미변수,받아만 주고 사용은 안한다 => _ 사용

In [None]:
def test():
  # 함수에서 여러개의 값을 리턴할때 -> 튜플로 리턴된다
  return 1,2,4
a = test()
type(a)

tuple

# 집합

In [None]:
# 중복제거할 대상으로부터 중복제거를 함으로써 생성
a = list('hello world')
a

['h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd']

In [None]:
# 순서 없이 고유한 값만 추출
b = list(set(a))
b

['e', ' ', 'd', 'r', 'h', 'w', 'o', 'l']

In [None]:
b.sort()
b

[' ', 'd', 'e', 'h', 'l', 'o', 'r', 'w']

In [None]:
# C / C++로 모듈을 만들고 Cython으로 연결하여 Python으로 api를 생성
# 느려서 잘 사용하지 않는다. (set)
# 합집합
# 교집합
# 차집합

In [None]:
a = set([4,5,8,4,2,1,5,6,3,9])
b = set([4,2,1,8,1,20,4,826,74])
a, b

({1, 2, 3, 4, 5, 6, 8, 9}, {1, 2, 4, 8, 20, 74, 826})

In [None]:
# 합집합
a.union(b)

{1, 2, 3, 4, 5, 6, 8, 9, 20, 74, 826}

In [None]:
# 교집합
a.intersection(b)

{1, 2, 4, 8}

In [None]:
# 차집합(방향성)
# a - b, b - a 
a.difference(b), b.difference(a)

({3, 5, 6, 9}, {20, 74, 826})