## NumPy Library
- Numerical Python의 약자(numpy)
- Python에서 수치계산을 위한 핵심 라이브러리
- ndarray(N-dimensional array) 자료 구조를 지원

In [1]:
import numpy as np

### ndarray(N-dimensional array)
1. 다양한 수학 함수 지원
2. 빠른 연산 속도
3. 브로드 캐스팅(차원을 동일시 하는 기능)
4. 다차원의 배열 지원

- array 내부에는 동일한 자료형을 가짐
- 각 값들은 인덱스(index)가 부여되어 있습니다.(순서가 있다.)

#### 1.ndarray 생성하기
- np.array(리스트 or 튜플)

In [2]:
#ndarray 생성하기 : 1차원(첫번째 방법)
#시퀀스 자료형을 형변환 하는 방법

#list 생성
list1 = [1,2,3,4,5]

arr1 = np.array(list1)
arr1

array([1, 2, 3, 4, 5])

In [3]:
#ndarray 생성하기 : 1차원(두번째 방법)
#직접 array화 시켜주는 방법

#list 생성
arr2 = np.array([2,3,4,5,6])
arr2

array([2, 3, 4, 5, 6])

In [4]:
#ndarray 생성하기 : 2차원
#차원을 인식함
list2 = [[1,2,3],[4,5,6]]

arr3 = np.array(list2)
arr3

array([[1, 2, 3],
       [4, 5, 6]])

In [5]:
list2

[[1, 2, 3], [4, 5, 6]]

In [6]:
#브로드 캐스팅
#차원 수를 동일시하는 기능
list1 = [1,2,3]
list2 = [4,5,6]
print(list1+list2, end="\n\n")

#ndarray의 경우 차원을 인식해서 각가의 요소들의 연산을 수행
arr1 = np.array(list1)
arr2 = np.array(list2)
print(arr1+arr2)

#2차원과 1차원을 더했더니, 각각의 요소들을 찾아서 연산을 수행
arr3 = np.array([[1,2,3],[4,5,6]])
arr4 = np.array([7,8,9])
print(arr3+arr4)

#1차원과 0차원(요소 하나)를 곱했더니, 각각의 요소들을 찾아서 연산을 수행
arr5 = np.array([1,1,1])
arr5*5

[1, 2, 3, 4, 5, 6]

[5 7 9]
[[ 8 10 12]
 [11 13 15]]


array([5, 5, 5])

#### 2.ndarray 확인하기 ▷ "속성"이나 "키워드"(함수가 아님)

In [7]:
#array의 모양(크기) 확인하기
#2차원 ▷ (행,열)
#1차원 ▷ (요소 개수,)
print(arr3.shape)
print(arr4.shape)

(2, 3)
(3,)


In [8]:
#array의 차원 확인
print(arr3.ndim)
print(arr4.ndim)

2
1


In [9]:
#array의 전체 요소 개수 확인하기

#len() ▷ 배열의 첫번째 차원의 "길이"를 반환
#size ▷ 각각의 요소들의 개수를 반환

print(arr3.size)
print(arr4.size)

6
3


In [10]:
arr6 = np.array([[[1,2],[3,4]],[[5,6],[7,8]]])

print(arr6)
print(f"배열의 모양 : {arr6.shape}")
print(f"배열의 차원 : {arr6.ndim}")
print(f"배열의 요소개수 : {arr6.size}")

[[[1 2]
  [3 4]]

 [[5 6]
  [7 8]]]
배열의 모양 : (2, 2, 2)
배열의 차원 : 3
배열의 요소개수 : 8


In [11]:
#일일이 print문으로 array의 속성들을 확인하려면 귀찮음..
#그래서 함수화 시켜줄거임

def array_info(array) :
    print(array)
    print(f"shape(모양) : {array.shape}")
    print(f"ndim(차원수) : {array.ndim}")
    print(f"size(요소 전체 개수) : {array.size}")
    print(f"dtype(데이터 타입) : {array.dtype}")

In [12]:
array_info(arr6)

[[[1 2]
  [3 4]]

 [[5 6]
  [7 8]]]
shape(모양) : (2, 2, 2)
ndim(차원수) : 3
size(요소 전체 개수) : 8
dtype(데이터 타입) : int32


##### 2.1 ndarray dtype 및 shape 변경

In [13]:
#ndarray 생성 ▷ 요소의 데이터 타입을 직접 지정해서 생성 가능

list3 = [[1.7,4.2,3.6],[4.1,2.9,5.8]]
temp1 = np.array(list3)
temp2 = np.array(list3, dtype = np.int64)

array_info(temp1)
print()
array_info(temp2)

[[1.7 4.2 3.6]
 [4.1 2.9 5.8]]
shape(모양) : (2, 3)
ndim(차원수) : 2
size(요소 전체 개수) : 6
dtype(데이터 타입) : float64

[[1 4 3]
 [4 2 5]]
shape(모양) : (2, 3)
ndim(차원수) : 2
size(요소 전체 개수) : 6
dtype(데이터 타입) : int64


In [14]:
#만들어진 array의 요소 데이터 타입 바꾸기
#astype(np.데이터타입)

temp1 = temp1.astype(np.int64)
array_info(temp1)

[[1 4 3]
 [4 2 5]]
shape(모양) : (2, 3)
ndim(차원수) : 2
size(요소 전체 개수) : 6
dtype(데이터 타입) : int64


In [15]:
#array의 모양 바꿔주기
#2차원의 경우 행과 열의 값이 맞게 떨어져야 함 ▷ size(요소 전체 개수)가 같아야 함
#reshape(행,열)
temp1 = temp1.reshape(3,2)

In [16]:
temp1

array([[1, 4],
       [3, 4],
       [2, 5]], dtype=int64)

#### 3.특정한 값으로 ndarray 생성하기

In [17]:
#모든 값을 0으로 초기화
#np.zeros((행,열)) ▷ 2차원 이상의 array인 경우 튜플로 감싸주어야 함

arr_zeros = np.zeros((5,2))
arr_zeros

array([[0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.]])

In [18]:
#모든 값을 1로 초기화
#np.ones((행,열)) ▷ 2차원 이상의 array인 경우 튜플로 감싸주어야 함

arr_ones = np.ones((5,2))
arr_ones = arr_ones.astype(np.int64)
arr_ones

array([[1, 1],
       [1, 1],
       [1, 1],
       [1, 1],
       [1, 1]], dtype=int64)

In [19]:
#모든 값을 원하는 값으로 초기화
#np.full((행,열),원하는 값) ▷ 2차원 이상의 array인 경우 튜플로 감싸주어야 함
arr_full = np.full((5,2),5)
arr_full

array([[5, 5],
       [5, 5],
       [5, 5],
       [5, 5],
       [5, 5]])

In [20]:
#랜덤값으로 배열 생성하기(int형)
#np.random.randint(시작값, 끝값{,size=(행,열)})

#random 라이브러리의 randint는 끝값을 포함했었음 ▷ 매우 번거로움
#np에서 제공하는 randint는 끝값을 포함하지 않음

arr_random = np.random.randint(1,5, size = (2,3))
arr_random

array([[2, 4, 3],
       [2, 2, 4]])

In [21]:
#실습 2
#1~50이 담긴 1차원 array 생성(리스트 활용)
arr_list = [1]
for i in range(2,51) :
    arr_list.append(i)
    
arr_list
arr_list = np.array(arr_list)
arr_list

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,
       35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50])

In [22]:
#ndarray 범위 만들기
#np.arange(시작값, 끝값, 증감량)
arr_list2 = np.arange(1,51)
arr_list2
arr_list2 = arr_list2.reshape(5,10)
arr_list2

array([[ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
       [21, 22, 23, 24, 25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36, 37, 38, 39, 40],
       [41, 42, 43, 44, 45, 46, 47, 48, 49, 50]])

In [23]:
#0~1까지의 랜덤 값으로 배열 생성
#rand(행,열)
np.random.rand(5,5)

array([[0.86320025, 0.26098983, 0.14054792, 0.71780962, 0.38173407],
       [0.03595581, 0.42310837, 0.01827564, 0.3824417 , 0.29986281],
       [0.71943459, 0.49810682, 0.1235551 , 0.40044655, 0.34328318],
       [0.36632942, 0.65785206, 0.33371143, 0.41281718, 0.34572006],
       [0.66140274, 0.30808546, 0.82249923, 0.88416838, 0.26402351]])

#### 4.ndarray 연산
- ndarray의 특징은 <b>요소별 연산</b>에 특화
- 브로드캐스팅 : 차원을 동일시 하는 기능

In [24]:
#브로드 캐스팅
#차원 수를 동일시하는 기능
list1 = [1,2,3]
list2 = [4,5,6]
print(list1+list2, end="\n\n")

#ndarray의 경우 차원을 인식해서 각가의 요소들의 연산을 수행
arr1 = np.array(list1)
arr2 = np.array(list2)
print(arr1+arr2)

#2차원과 1차원을 더했더니, 각각의 요소들을 찾아서 연산을 수행
arr3 = np.array([[1,2,3],[4,5,6]])
arr4 = np.array([7,8,9])
print(arr3+arr4)

#1차원과 0차원(요소 하나)를 곱했더니, 각각의 요소들을 찾아서 연산을 수행
arr5 = np.array([1,1,1])
arr5*5

[1, 2, 3, 4, 5, 6]

[5 7 9]
[[ 8 10 12]
 [11 13 15]]


array([5, 5, 5])

In [25]:
#각각의 요소에 +3씩 연산
arr3+3

array([[4, 5, 6],
       [7, 8, 9]])

#### 5.ndarray 인덱싱 & 슬라이싱
- 인덱싱(indexing) : 값을 가리키다 ▷ 자료 구조 내에서 '1개의 요소'에 접근
- 슬라이싱(slicing) : 값을 잘라오다 ▷ 자료 구조 내에서 '여러 개의 요소'에 접근
- 인덱스 : 데이터의 순서 ▷ 방번호

In [26]:
#1차원 array 생성 후 인덱싱
arr_1 = np.arange(10) #시작값 생략 가능
arr_1

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [27]:
#slicing
arr_1[3:9]

array([3, 4, 5, 6, 7, 8])

In [28]:
#slicing 하고 한번에 데이터 넣기
list1 = []
for i in range(10) :
    list1.append(i)
list1

#리스트값 수정
#리스트는 슬라이싱하고 값을 넣게 되면, 범위 자체가 하나의 요소로 변환
list1[3:8] = [10]
print(list1)

#array값 수정
#array는 슬라이싱된 요소들에 각각 하나씩 값을 수정
arr_1[3:8] = 10
arr_1

[0, 1, 2, 10, 8, 9]


array([ 0,  1,  2, 10, 10, 10, 10, 10,  8,  9])

##### 5.1 2차원 Array 인덱싱 & 슬라이싱
- 인덱싱 : array명[행,열]
- 슬라이싱 : array명[행의 시작값:행의 끝값,열의 시작값:열의 끝값 ]

In [29]:
arr2 = np.arange(1,51).reshape(5,10)
arr2

array([[ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
       [21, 22, 23, 24, 25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36, 37, 38, 39, 40],
       [41, 42, 43, 44, 45, 46, 47, 48, 49, 50]])

In [30]:
print(arr2[3][3]) #일반인덱싱, 두번의 연산을 수행
print(arr2[3,3])  #튜플인덱싱, 한번의 연산을 수행

#2차원 array 슬라이싱
#array명[행의시작값:행의끝값, 열의시작값:열의끝값]
arr2[2:5,:9]

34
34


array([[21, 22, 23, 24, 25, 26, 27, 28, 29],
       [31, 32, 33, 34, 35, 36, 37, 38, 39],
       [41, 42, 43, 44, 45, 46, 47, 48, 49]])

In [31]:
#실습1
print(arr2[:5,0])

[ 1 11 21 31 41]


In [32]:
#실습2
print(arr2[:4,:5])

[[ 1  2  3  4  5]
 [11 12 13 14 15]
 [21 22 23 24 25]
 [31 32 33 34 35]]


In [33]:
#실습3
print(arr2[[2,2,3,3,3],[2,3,2,3,4]])

[23 24 33 34 35]


In [34]:
#Fancy 인덱싱 ▷ 다중 인덱싱(정수 배열 인덱싱)
#array명[[행1,행2,...],[열1,열2,....]]

![image.png](attachment:image.png)

In [35]:
#1.데이터 읽어오기(.txt파일 형식의 확장자 읽어오기)
#np.loadtxt('경로 및 파일명.확장자',delimiter='구분자',dtype=np.데이터타입)

In [36]:
data = np.loadtxt('./data/height_weight(p).txt',delimiter=',')
data

array([[175.2   , 180.3   , 175.    , 169.2   , 185.2   , 188.    ,
        177.6   , 178.2   , 177.    , 179.    ],
       [144.5824, 193.952 , 174.5568, 152.7372, 121.22  , 156.9248,
        160.892 , 151.8556, 163.096 , 180.728 ]])

##### 데이터 경로 지정
1. 절대경로
- / 
    - 루트 디렉토리, 파일 시스템의 가장 상위 디렉토리
    ---
2. 상대경로
- ./ 
    - 현재 디렉토리
    - 생략 시 defalt(python)
- ../
    - 상위 디렉토리
    - 한 단계 위 디렉토리

In [37]:
#BMI 지수 구하기
#pound의 단위를 kg 형태로 바꿔주어야 함 ▷ kg == pound/2.204

#1.키 데이터 가져오기
#2.몸무게 데이터 가져오기
#3.키 데이터의 단위 변경
#4.몸무게 데이터의 단위 변경
#5.BMI 지수 구하기

In [38]:
# 키 데이터 단위 변경 후 따로 모으기
arr_height = data[0,:10] / 100
arr_weight = data[1,:10] /2.204
bmi_arr = arr_weight / (arr_height**2)

bmi_arr

array([21.37153104, 27.07018468, 25.86122449, 24.20652885, 16.03543423,
       20.14486193, 23.14392095, 21.69720651, 23.62028791, 25.59220998])

#### 6. ndarray 연산 함수

In [43]:
#랜덤 array

arr = np.random.randint(1,10,size=(2,5))
arr

array([[7, 1, 2, 1, 7],
       [6, 9, 8, 9, 6]])

In [44]:
#sum() : 합계

#python 내장함수 sum
print(sum(arr))

#numpy sum
print(arr.sum())
print(np.sum(arr))

[13 10 10 10 13]
56
56


In [45]:
#mean() : 평균
print(arr.mean())
print(np.mean(arr))

5.6
5.6


In [46]:
#sqrt() : 제곱근(루트)
#sqrt() 함수는 array에 접근해서 작성하는게 아닌
#각 함수 사용법들이 다르다!!
print(arr.sqrt())

AttributeError: 'numpy.ndarray' object has no attribute 'sqrt'

In [47]:
print(np.sqrt(arr))

[[2.64575131 1.         1.41421356 1.         2.64575131]
 [2.44948974 3.         2.82842712 3.         2.44948974]]


##### Universally 함수
- 이외에도 굉장히 많은 수학적 함수를 가지고 있음
- 단일 배열에 사용하는 함수
![image.png](attachment:image.png)
- 서로 다른 배열 간에 사용하는 함수
![image-2.png](attachment:image-2.png)

#### 7. Boolean 인덱싱
- 배열 안에서 조건을 충족(특정 조건을 만족)하는 True인 값들만 추출해주는 인덱싱 방법
- 간단히 말해서 필터링을 연상하면 됨

In [49]:
# array 생성
score = np.array([80,90,55,70,20])
score

array([80, 90, 55, 70, 20])

In [51]:
#80점 이상인 데어터만 추출

#1. mask 만들기
mask = score >= 80
mask

array([ True,  True, False, False, False])

In [53]:
#2.인덱싱
score[mask]

array([80, 90])

In [54]:
score[score>=80]

array([80, 90])

## 영화데이터 분석 - 평점(실습)

In [58]:
movie = np.loadtxt('./data/new_ratings.dat',delimiter='|',dtype=np.int64)

array([[        1,      1193,         5, 978300760],
       [        1,       661,         3, 978302109],
       [        1,       914,         3, 978301968],
       ...,
       [     6040,       562,         5, 956704746],
       [     6040,      1096,         4, 956715648],
       [     6040,      1097,         4, 956715569]], dtype=int64)

##### 사용자ID | 영화ID | 영화평점(별점) | 입력시간(타임스태프)

In [59]:
movie

array([[        1,      1193,         5, 978300760],
       [        1,       661,         3, 978302109],
       [        1,       914,         3, 978301968],
       ...,
       [     6040,       562,         5, 956704746],
       [     6040,      1096,         4, 956715648],
       [     6040,      1097,         4, 956715569]], dtype=int64)

In [60]:
array_info(movie)

[[        1      1193         5 978300760]
 [        1       661         3 978302109]
 [        1       914         3 978301968]
 ...
 [     6040       562         5 956704746]
 [     6040      1096         4 956715648]
 [     6040      1097         4 956715569]]
shape(모양) : (1000209, 4)
ndim(차원수) : 2
size(요소 전체 개수) : 4000836
dtype(데이터 타입) : int64


In [63]:
#전체 데이터의 평점 추출
movie[:,2]
np.mean(movie[:,2]).round(2)

3.58

In [65]:
#평점을 메긴 사용자가 총 몇명인지?
#np.unique() => 유일한 값을 반환

user_id = np.unique(movie[:,0])
user_id.size

6040

##### 1번 사용자가 매긴 평점의 평균을 구해보자
- 사용자ID가 1번인 사용자에게 접근
- 1번 사용자가 매긴 평점들의 평균을 구하자

In [71]:
#boolean 인덱싱을 활용해서 아이디가 1번인 데이터만 추출
user_id1= movie[movie[:,0] == 1]
#1번 사용자가 매긴 평점들의 평균
np.mean(user_id1[:,2]).round(2)

4.19

In [91]:
#boolean 인덱싱을 활용해서 아이디가 2번인 데이터만 추출
user_id2 = movie[movie[:,0] == 2]
#2번 사용자가 매긴 평점들의 평균
a = np.mean(user_id2[:,2]).round(2)
type(a)

numpy.float64

##### 각각의 사용자가 매긴 평점의 평균 모두 구해보자!
- list 활용

In [95]:
#반복문의 실행 현황을 알려주는 라이브러리
from tqdm import tqdm as tq

In [101]:
arr_avg = []
for i in tq(user_id) :
    id_avg = np.mean(movie[movie[:,0] == i,2]).round(2)
    arr_avg.append([i,id_avg])

100%|█████████████████████████████████████████████████████████████████████████████| 6040/6040 [00:22<00:00, 270.47it/s]


In [133]:
#리스트 컴프리헨션(List Comprension)
#리스트의 append() 알고리즘을 한 줄로 작성할 수 있도록 파이썬에서  제공하는 문법
#직관적으로 리스트에 데이터를 추가하는 방법
arr_avg1 = [ [i,np.mean(movie[movie[:,0] == i,2]).round(0)] for i in tq(user_id) ]
arr_avg1

100%|█████████████████████████████████████████████████████████████████████████████| 6040/6040 [00:21<00:00, 274.60it/s]


[[1, 4.0],
 [2, 4.0],
 [3, 4.0],
 [4, 4.0],
 [5, 3.0],
 [6, 4.0],
 [7, 4.0],
 [8, 4.0],
 [9, 4.0],
 [10, 4.0],
 [11, 3.0],
 [12, 4.0],
 [13, 3.0],
 [14, 3.0],
 [15, 3.0],
 [16, 3.0],
 [17, 4.0],
 [18, 4.0],
 [19, 4.0],
 [20, 4.0],
 [21, 3.0],
 [22, 3.0],
 [23, 3.0],
 [24, 4.0],
 [25, 4.0],
 [26, 3.0],
 [27, 4.0],
 [28, 4.0],
 [29, 4.0],
 [30, 3.0],
 [31, 4.0],
 [32, 4.0],
 [33, 3.0],
 [34, 4.0],
 [35, 4.0],
 [36, 4.0],
 [37, 4.0],
 [38, 4.0],
 [39, 4.0],
 [40, 3.0],
 [41, 3.0],
 [42, 4.0],
 [43, 4.0],
 [44, 4.0],
 [45, 3.0],
 [46, 4.0],
 [47, 4.0],
 [48, 3.0],
 [49, 4.0],
 [50, 3.0],
 [51, 4.0],
 [52, 4.0],
 [53, 4.0],
 [54, 4.0],
 [55, 4.0],
 [56, 4.0],
 [57, 3.0],
 [58, 4.0],
 [59, 3.0],
 [60, 3.0],
 [61, 3.0],
 [62, 4.0],
 [63, 3.0],
 [64, 4.0],
 [65, 4.0],
 [66, 4.0],
 [67, 4.0],
 [68, 4.0],
 [69, 4.0],
 [70, 4.0],
 [71, 4.0],
 [72, 4.0],
 [73, 3.0],
 [74, 4.0],
 [75, 4.0],
 [76, 4.0],
 [77, 3.0],
 [78, 4.0],
 [79, 4.0],
 [80, 4.0],
 [81, 4.0],
 [82, 4.0],
 [83, 4.0],
 [84, 4.0],
 

##### 위에서 구한 각 사용자들의 평균 평점 중 4점 이상만 구하기
- list형 => boolean 인덱싱 X
- 4점 이상의 사용자들의 개수를 세어보면 "1544"

In [129]:
#리스트는 고급인덱싱(불리언 인덱싱)이 불가함
#그래서 array화
#근데 담고 봤더니 동일한 자료형만 array 특징 때문에 id값마저 실수로 담김..
#그래서 int형으로 바꾸면서 형변환
arr_avg_44 = np.array(arr_avg1,dtype=np.int64)

In [161]:
#각 사용자의 1번열(평균 평점)에 접근해서 평균 평점이 4점 이상인 행만 불리언 인덱싱
arr_avg_44[arr_avg_44[:,1]>=4]

array([[   1,    4],
       [   4,    4],
       [   7,    4],
       ...,
       [6027,    4],
       [6032,    4],
       [6034,    4]], dtype=int64)

In [159]:
print(arr_avg1)

for i in range(len(arr_avg1)) :
    if arr_avg1[i][1] < 4 :
        arr_avg1.remove(arr_avg1[i])
len(arr_avg1)

[[1, 4.0], [2, 4.0], [3, 4.0], [4, 4.0], [6, 4.0], [7, 4.0], [8, 4.0], [9, 4.0], [10, 4.0], [12, 4.0], [17, 4.0], [18, 4.0], [19, 4.0], [20, 4.0], [24, 4.0], [25, 4.0], [27, 4.0], [28, 4.0], [29, 4.0], [31, 4.0], [32, 4.0], [34, 4.0], [35, 4.0], [36, 4.0], [37, 4.0], [38, 4.0], [39, 4.0], [42, 4.0], [43, 4.0], [44, 4.0], [46, 4.0], [47, 4.0], [49, 4.0], [51, 4.0], [52, 4.0], [53, 4.0], [54, 4.0], [55, 4.0], [56, 4.0], [58, 4.0], [62, 4.0], [64, 4.0], [65, 4.0], [66, 4.0], [67, 4.0], [68, 4.0], [69, 4.0], [70, 4.0], [71, 4.0], [72, 4.0], [74, 4.0], [75, 4.0], [76, 4.0], [78, 4.0], [79, 4.0], [80, 4.0], [81, 4.0], [82, 4.0], [83, 4.0], [84, 4.0], [86, 4.0], [88, 4.0], [90, 4.0], [91, 5.0], [94, 4.0], [95, 4.0], [96, 4.0], [97, 4.0], [98, 4.0], [101, 5.0], [103, 4.0], [105, 4.0], [106, 4.0], [107, 4.0], [109, 4.0], [111, 4.0], [112, 4.0], [113, 4.0], [114, 4.0], [115, 4.0], [116, 4.0], [118, 4.0], [119, 4.0], [120, 4.0], [121, 4.0], [124, 4.0], [125, 4.0], [126, 4.0], [127, 4.0], [128, 4.

4314

##### 분석한 결과를 csv파일로 저장

In [162]:
#np.savetxt("저장할 파일명.확장자",array명, delimiter='구분자', fmt='데이터 표현')
np.savetxt("영화평점 분석.csv",arr_avg_44,delimiter=',',fmt='%.3f')