## Numpy
- 복잡한 빅데이터의 수학/과학 계산을 위해 만들어진 라이브러리
- 반복문 없이 전체 배열 연산이 가능한 표준 함수들 제공
- 배열: 같은 자료형의 원소들이 연속적인 형태로 구성된 자료 구조로 다량의 데이터를 그룹으로 관리하기 위해 사용

In [3]:
import numpy as np

In [4]:
test_list = [1,2,3,4,5]
arr = np.array(test_list)
arr

array([1, 2, 3, 4, 5])

In [5]:
type(arr)

numpy.ndarray

In [6]:
# 배열 연산시 내부 각각의 값에 직접 연산됨.
arr+1

array([2, 3, 4, 5, 6])

In [7]:
arr*2

array([ 2,  4,  6,  8, 10])

In [8]:
# 2차원 배열
arr2 = np.array([[1,2,3],
                 [4,5,6]])
arr2

array([[1, 2, 3],
       [4, 5, 6]])

In [9]:
# shape: 배열의 형태 확인(행,열)
arr2.shape # arr2는 2행 3열

(2, 3)

In [10]:
#size: 배열의 값 전체 개수
arr2.size

6

In [11]:
# dtype: 배열 내 데이터의 타입
arr2.dtype

dtype('int32')

In [12]:
# ndim: 배열의 차원 확인
arr2.ndim

2

In [13]:
arr3 = np.array([[[1,2],[3,4],[5,6]],
                 [[7,8],[9,10],[11,12]]])
arr3

array([[[ 1,  2],
        [ 3,  4],
        [ 5,  6]],

       [[ 7,  8],
        [ 9, 10],
        [11, 12]]])

In [14]:
# arr3의 형태, 차원, 전체 요소 개수
print("arr3의 형태: ",arr3.shape) # (2,3,2): 2행 3열인 것이 2개 있음
print("arr3의 차원: ",arr3.ndim)
print("arr3의 전체 요소 개수", arr.size)

arr3의 형태:  (2, 3, 2)
arr3의 차원:  3
arr3의 전체 요소 개수 5


In [15]:
# 0으로 배열 생성
arr_zeros = np.zeros((3,4)) # 0으로만 이루어진 3행 4열 배열 만들기
arr_zeros

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [16]:
arr_ones = np.ones((2,3,4)) # 1로만 이루어진 3행 4열 배열 2개 만들기
arr_ones

array([[[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]],

       [[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]]])

In [17]:
# 특정 값으로 배열 생성
arr_full = np.full((2,3,2),2) # (shape, 값)을 적으면 됨.
arr_full

array([[[2, 2],
        [2, 2],
        [2, 2]],

       [[2, 2],
        [2, 2],
        [2, 2]]])

### 다차원 배열 생성에 유용한 함수
- arange: 연속된 수치로 배열 생성
- reshape: 생성된 배열의 shape를 재설정

In [19]:
# 반복문을 사용하지 않고도 연속된 배열 생성 가능
arr4 = np.arange(1,51,1)
arr4

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,
       35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50])

In [20]:
# 1부터 50까지 중에 1,11,21,31,41로 배열 생성하기
arr5 = np.arange(1,51,10)
arr5

array([ 1, 11, 21, 31, 41])

In [21]:
arr4.reshape(5,10) # (5,11)은 에러남.

array([[ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
       [21, 22, 23, 24, 25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36, 37, 38, 39, 40],
       [41, 42, 43, 44, 45, 46, 47, 48, 49, 50]])

In [22]:
arr6 = arr4.reshape(25,2) # arr4에 직접적으로 적용되지 않음. 변수에 저장해야함.
arr6

array([[ 1,  2],
       [ 3,  4],
       [ 5,  6],
       [ 7,  8],
       [ 9, 10],
       [11, 12],
       [13, 14],
       [15, 16],
       [17, 18],
       [19, 20],
       [21, 22],
       [23, 24],
       [25, 26],
       [27, 28],
       [29, 30],
       [31, 32],
       [33, 34],
       [35, 36],
       [37, 38],
       [39, 40],
       [41, 42],
       [43, 44],
       [45, 46],
       [47, 48],
       [49, 50]])

In [23]:
# 실수값으로 배열 생성
arr7 = np.array([1.2,2.3,3.7])
arr7

array([1.2, 2.3, 3.7])

In [24]:
arr7.dtype

dtype('float64')

In [25]:
# 실수 배열을 정수형으로 변경(정수 자리만 남기고 소숫점 이하는 사라짐)
arr8 = np.array([1.2,2.3,3.7], dtype = np.int32)
arr8

array([1, 2, 3])

In [26]:
# 정수 배열을 실수형으로 변경(.뒤에 0이 생략된 상태)
arr9 = np.array([1,2,3], dtype = np.float32)
arr9

array([1., 2., 3.], dtype=float32)

### 랜덤 값 생성

In [28]:
# rand = 0~1사이의 난수값 생성
arr10 = np.random.rand(2,3) # 2행 3열의 배열에 각각 0~1 사이의 랜덤한 값을 생성
arr10

array([[0.81877074, 0.05188067, 0.65519833],
       [0.57875713, 0.07141982, 0.29223669]])

In [29]:
# randint : 정해진 범위 내에서 정수값을 랜덤하게 생성
arr11 = np.random.randint(2,10) # 2~9 사이에서 랜덤한 정수 생성
arr11

4

In [30]:
# 0~4 사이의 값 중에서 랜덤하게 10개 정수 생성
arr12 = np.random.randint(5, size=10)
arr12

array([0, 4, 3, 3, 0, 4, 3, 3, 4, 0])

In [31]:
arr13 = np.random.randint(5, size=(4,2))
arr13

array([[2, 1],
       [3, 0],
       [2, 1],
       [0, 1]])

### 랜덤 시드(random seed) 설정
- 컴퓨터는 완전한 랜덤을 구현하지 못함.
- 난수가 나오는 것을 흉내내는 알고리즘으로 만들어진 유사난수를 사용하여 랜덤한 것처럼 느끼는 것
- 랜덤 시드는 난수를 생서하는 알고리즘에 들어가는 입력값(일반적으로 시간)을 고정시킴.
- 출력되는 값이 고정됨!!!!!

In [33]:
np.random.seed(2) # 인공지능 학습할 때 쓰임;;;
np.random.randint(5, size = (2,3))

array([[0, 0, 3],
       [2, 3, 0]])

### array 연산

In [35]:
# 배열끼리 연산 가능, 같은 shape의 배열끼리만 연산 가능
arr14 = np.array([[1,2],
                  [3,4]])
print(arr14 + arr14)
print(arr14 * arr14)

[[2 4]
 [6 8]]
[[ 1  4]
 [ 9 16]]


### array 접근
- 인덱싱
- numpy 슬라이싱

In [37]:
arr14[0]

array([1, 2])

In [38]:
arr14[0][1]

2

In [39]:
arr15 = np.arange(10)
arr15

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [40]:
# 1~7까지 출력
arr15[1:8]

array([1, 2, 3, 4, 5, 6, 7])

In [41]:
arr15[4:9] = 99
arr15

array([ 0,  1,  2,  3, 99, 99, 99, 99, 99,  9])

In [42]:
arr16 = np.arange(50).reshape(5,10)
arr16

array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
       [40, 41, 42, 43, 44, 45, 46, 47, 48, 49]])

In [43]:
# 0,1번 인덱스 행의 모든 값을 출력(arr명[행의 범위, 열의 범위])
arr16[0:2,:]

array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14, 15, 16, 17, 18, 19]])

In [44]:
# 모든 행의 첫번째 열을 출력
arr16[:,0]

array([ 0, 10, 20, 30, 40])

In [45]:
arr16[0:4, 0:5]

array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34]])

In [46]:
arr17 = np.arange(18).reshape(3,6)
arr17

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17]])

In [47]:
# 1번부터 끝까지 2칸씩 뛰어넘어 인덱싱-> 1::2
arr17[1: ,1::2]

array([[ 7,  9, 11],
       [13, 15, 17]])

In [48]:
# 전치: 배열의 행과 열을 바꿔줌.
arr18 = arr17.T
arr18

array([[ 0,  6, 12],
       [ 1,  7, 13],
       [ 2,  8, 14],
       [ 3,  9, 15],
       [ 4, 10, 16],
       [ 5, 11, 17]])

### numpy 배열의 Boolean 인덱싱
- 특정 조건에 맞으면 True, 아니면 False 값으로 배열을 만들어 True 인 값에 접근하는 방법

In [50]:
arr19 = np.array(np.random.randint(50,100,size=8))
arr19

array([57, 84, 99, 81, 61, 71, 97, 81])

In [51]:
arr19>=70

array([False,  True,  True,  True, False,  True,  True,  True])

In [52]:
arr19 % 2 == 0

array([False,  True, False, False, False, False, False, False])

In [53]:
# Boolean 값이 아니라 실제 값을 보고 싶은 경우
# 배열명[배열 내에서 찾고자 하는 조건식]
arr19[arr19 % 2 == 0]

array([84])

In [54]:
# 값이 짝수면 0으로 변경하는 코드
arr20 = np.array([[6,9,6,8,7],
                 [2,3,5,4,1]])
arr20[arr20 % 2 == 0] = 0
arr20

array([[0, 9, 0, 0, 7],
       [0, 3, 5, 0, 1]])

### BMI 지수 확인 및 인덱싱

In [56]:
# 데이터 로드(상대경로: 현재 경로부터 쓰면 됨.)
# 절대경로는 window부터 맨 처음 경로부터 써줘야함.
data = np.loadtxt('data/height_weight.txt',delimiter=',') # delimiter: txt 파일에서 데이터를 구분하는 구분자를 설정해줌.
data

array([[175.2, 180.3, 175. , 169.2, 185.2, 188. , 177.6, 178.2, 177. ,
        179. ],
       [ 65.6,  88. ,  79.2,  69.3,  55. ,  71.2,  73. ,  68.9,  74. ,
         82. ]])

#### 데이터를 불러오면 항상 간단한 속성들을 파악해야함.
- 배열 형태
- 배열 차원 수
- 배열 전체 요소 개수

In [58]:
data.shape

(2, 10)

In [59]:
data.size

20

In [60]:
data.ndim

2

In [61]:
# 데이터에서 키와 몸무게를 각각 변수에 담기
# 키
height = data[0]/100 # m로 만들기

# 몸무게
weight = data[1]

print("키:",height)
print("몸무게:",weight)

키: [1.752 1.803 1.75  1.692 1.852 1.88  1.776 1.782 1.77  1.79 ]
몸무게: [65.6 88.  79.2 69.3 55.  71.2 73.  68.9 74.  82. ]


![image.png](attachment:af1e3b12-bc2e-4a4c-8a33-8fde00cbc707.png)

In [63]:
# BMI 공식에 대입해보기
BMI = weight/(height*height)
BMI

array([21.37153104, 27.07018468, 25.86122449, 24.20652885, 16.03543423,
       20.14486193, 23.14392095, 21.69720651, 23.62028791, 25.59220998])

In [64]:
# BMI가 23 이상인 것만 출력
BMI[BMI>=23]

array([27.07018468, 25.86122449, 24.20652885, 23.14392095, 23.62028791,
       25.59220998])

- numpy 배열 Boolean 인덱싱에서는 파이썬 문법인 논리 연산자(and, or, not)을 사용할 수 없고 비트 연산자(&,|,~)를 사용
- numpy는  R언어의 연산자인 비트 연산을 기반으로 만들어졌기 때문
- 비트 연산자
  - &: and 연산
  - |: or 연산
  - ~: not 연산
- 파이썬에선 0을 False로 보고 나머지 숫자를 True로 보기 때문에 숫자 and 연산 시 False인 0으로 출력

In [66]:
# BMI가 23 이상, 25이하인 사람 몇 명인지
BMI[(23<=BMI) & (BMI<=25)].size

3

In [67]:
0 and 3

0

In [68]:
0&3

0

In [69]:
0 or 3

3

In [70]:
0|3

3

In [71]:
# 둘 다 0이 아니라면 좌측 값으로 출력됨.
1 or 4

1

In [72]:
1|4

5

### numpy 배열 관련 유용한 함수들
- sum: 합
- mean: 평균
- median: 중앙값
- sqrt: 제곱근
- abs: 절댓값
- around: 반올림

In [74]:
arr21 = np.random.randint(1, 10, size = (4,7))
arr21

array([[5, 5, 6, 8, 4, 7, 5],
       [4, 8, 7, 2, 4, 6, 9],
       [5, 7, 4, 3, 1, 5, 3],
       [5, 2, 8, 9, 3, 9, 8]])

In [75]:
print(np.sum(arr21)) # numpy 지원 함수
print(arr21.sum()) # python 기본 함수

152
152


In [76]:
print(np.mean(arr21)) # numpy 지원 함수
print(arr21.mean()) # python 기본 함수

5.428571428571429
5.428571428571429


In [77]:
arr22 = np.arange(1,10,3)
arr22

array([1, 4, 7])

In [78]:
np.median(arr22)

4.0

In [79]:
np.sqrt(arr22)

array([1.        , 2.        , 2.64575131])

In [80]:
arr23 = np.array([1,4,0,-5,-3])
np.abs(arr23)

array([1, 4, 0, 5, 3])

In [81]:
arr24 = np.array([1.2, 3.4,9.1, 8.8])
np.around(arr24)

array([1., 3., 9., 9.])

### 영화 평점 분석 예제

In [83]:
# 데이터 로드
# genfromtxt: 텍스트 형식의 파일로부터 데이터를 로드해주는 함수
# dtype = np.int64 -> 실수 형태의 데이터를 정수로 변환
movie_ratings = np.genfromtxt('data/ratings.dat', delimiter = '::', dtype = np.int64)
movie_ratings
# 칼럼명: 사용자 아이디, 영화 아이디, 사용자가 매긴 영화평점, 입력시간

array([[        1,      1193,         5, 978300760],
       [        1,       661,         3, 978302109],
       [        1,       914,         3, 978301968],
       ...,
       [     6040,       562,         5, 956704746],
       [     6040,      1096,         4, 956715648],
       [     6040,      1097,         4, 956715569]], dtype=int64)

In [84]:
# 데이터 파악하기
print(movie_ratings.shape)
print(movie_ratings.size)
print(movie_ratings.ndim)

(1000209, 4)
4000836
2


In [85]:
# 전체 영화 평점 평균 구하기
ratings = movie_ratings[:,2]
ratings

array([5, 3, 3, ..., 5, 4, 4], dtype=int64)

In [86]:
np.mean(ratings)

3.581564453029317

### 1번 사용자가 매긴 평점의 평균 구하기
- 사용자 아이디의 유니크 값 확인, 비어 있는 값 있는지 확인
- 사용자 아이디 유니크 값 개수 확인
- 1번 사용자의 데이터에 접근
- 1번 사용자가 매긴 평점들의 평균 구하기

In [88]:
# 평점을 매긴 사용자가 몇 명인지 알아보자
# unique: ()안 값에서 유일한 값을 구해주는 함수
user_id = np.unique(movie_ratings[:,0])
user_id.size # 사용자는 총 6040명

6040

In [89]:
userid1 = movie_ratings[movie_ratings[:,0] == 1][:,2]
userid1

array([5, 3, 3, 4, 5, 3, 5, 5, 4, 4, 5, 4, 4, 4, 5, 4, 3, 4, 5, 4, 3, 3,
       5, 5, 3, 5, 4, 4, 4, 3, 4, 4, 4, 4, 4, 4, 5, 5, 4, 5, 5, 5, 4, 4,
       4, 5, 5, 4, 5, 4, 4, 4, 4], dtype=int64)

In [90]:
np.mean(userid1)

4.188679245283019

In [91]:
# 한꺼번에도 가능
np.mean(movie_ratings[movie_ratings[:,0] == 1][:,2])

4.188679245283019

- 전체 영화 평점이 3.58점이었는데 1번 사용자가 4.18점인걸로 보아 1번 사용자는 평점을 후하게 주는 편!

### 각 사용자가 매긴 평점들의 평균 구하기
- 빈 리스트를 만들고 각 사용자별 id와 평점의 평균값을 넣어보자 -> 반복문 사용

In [94]:
user_mean_list = []

for i in user_id:
    mean = np.mean(movie_ratings[movie_ratings[:,0] == i][:,2])
    user_mean_list.append([i, mean])

user_mean_list

[[1, 4.188679245283019],
 [2, 3.7131782945736433],
 [3, 3.9019607843137254],
 [4, 4.190476190476191],
 [5, 3.1464646464646466],
 [6, 3.9014084507042255],
 [7, 4.32258064516129],
 [8, 3.884892086330935],
 [9, 3.7358490566037736],
 [10, 4.114713216957606],
 [11, 3.2773722627737225],
 [12, 3.8260869565217392],
 [13, 3.388888888888889],
 [14, 3.32],
 [15, 3.3233830845771144],
 [16, 3.0285714285714285],
 [17, 4.075829383886256],
 [18, 3.6491803278688524],
 [19, 3.5725490196078433],
 [20, 4.083333333333333],
 [21, 2.909090909090909],
 [22, 3.0673400673400675],
 [23, 3.3157894736842106],
 [24, 3.948529411764706],
 [25, 3.7411764705882353],
 [26, 2.96],
 [27, 4.171428571428572],
 [28, 3.7570093457943927],
 [29, 3.5833333333333335],
 [30, 3.488372093023256],
 [31, 3.73109243697479],
 [32, 3.625],
 [33, 3.498721227621483],
 [34, 3.8658536585365852],
 [35, 3.54040404040404],
 [36, 4.199430199430199],
 [37, 3.69811320754717],
 [38, 3.58],
 [39, 3.564516129032258],
 [40, 3.4479166666666665],
 [41, 

### 사용자별 평점 평균이 4점 이상인 사용자만 구해보기

In [96]:
# list를 array로 바꿔주기!
user_mean_array = np.array(user_mean_list)
user_mean_array

array([[1.00000000e+00, 4.18867925e+00],
       [2.00000000e+00, 3.71317829e+00],
       [3.00000000e+00, 3.90196078e+00],
       ...,
       [6.03800000e+03, 3.80000000e+00],
       [6.03900000e+03, 3.87804878e+00],
       [6.04000000e+03, 3.57771261e+00]])

In [97]:
# set_printoptions: 배열 출력시 출력 형태를 설저하는 함수
# suppress: 소수점 자리수 고정 출력 설정 on
# precision: 출력되는 소수점 자릿수
np.set_printoptions(suppress=True, precision=2)
user_mean_array

array([[   1.  ,    4.19],
       [   2.  ,    3.71],
       [   3.  ,    3.9 ],
       ...,
       [6038.  ,    3.8 ],
       [6039.  ,    3.88],
       [6040.  ,    3.58]])

In [98]:
# 전체 행 다 출력하는 방법!
# sys: 시스템 관련 변수와 함수를 직접 제어할 수 있게 해주는 모듈
import sys
# threshold=sys.maxsize: 전체길이만큼 모두 출력(디폴트는 1000개까지)
np.set_printoptions(threshold=sys.maxsize)

In [99]:
rating_over4 = user_mean_array[user_mean_array[:,1]>=4][:,0]
rating_over4

array([   1.,    4.,    7.,   10.,   17.,   20.,   27.,   36.,   43.,
         46.,   53.,   54.,   55.,   64.,   65.,   67.,   69.,   74.,
         75.,   76.,   81.,   82.,   86.,   88.,   91.,   97.,  101.,
        103.,  105.,  106.,  109.,  112.,  121.,  124.,  125.,  126.,
        128.,  129.,  130.,  138.,  150.,  152.,  153.,  156.,  158.,
        161.,  162.,  164.,  171.,  177.,  183.,  184.,  186.,  187.,
        189.,  196.,  205.,  210.,  213.,  215.,  220.,  222.,  228.,
        230.,  231.,  233.,  234.,  235.,  239.,  244.,  246.,  248.,
        252.,  255.,  257.,  259.,  265.,  266.,  270.,  274.,  275.,
        283.,  285.,  288.,  291.,  297.,  299.,  300.,  307.,  309.,
        311.,  313.,  316.,  320.,  322.,  325.,  330.,  332.,  336.,
        339.,  341.,  343.,  345.,  346.,  356.,  366.,  367.,  372.,
        374.,  375.,  376.,  379.,  381.,  382.,  399.,  404.,  408.,
        412.,  413.,  417.,  420.,  421.,  427.,  434.,  437.,  444.,
        446.,  447.,

In [100]:
len(rating_over4)

1544

- 평점 4점 이상을 준 사용자는 총 1544명!

### 10번 영화의 평점 평균을 구하고, 각 영화별 평점의 평균을 2차원 리스트로 출력하기

In [103]:
np.mean(movie_ratings[movie_ratings[:,1] == 10][:,2])

3.5405405405405403

In [104]:
movie_id = np.unique(movie_ratings[:,1])
movie_id

array([   1,    2,    3,    4,    5,    6,    7,    8,    9,   10,   11,
         12,   13,   14,   15,   16,   17,   18,   19,   20,   21,   22,
         23,   24,   25,   26,   27,   28,   29,   30,   31,   32,   33,
         34,   35,   36,   37,   38,   39,   40,   41,   42,   43,   44,
         45,   46,   47,   48,   49,   50,   52,   53,   54,   55,   56,
         57,   58,   59,   60,   61,   62,   63,   64,   65,   66,   67,
         68,   69,   70,   71,   72,   73,   74,   75,   76,   77,   78,
         79,   80,   81,   82,   83,   84,   85,   86,   87,   88,   89,
         90,   92,   93,   94,   95,   96,   97,   98,   99,  100,  101,
        102,  103,  104,  105,  106,  107,  108,  110,  111,  112,  113,
        114,  116,  117,  118,  119,  120,  121,  122,  123,  124,  125,
        126,  127,  128,  129,  130,  131,  132,  133,  134,  135,  136,
        137,  138,  139,  140,  141,  142,  144,  145,  146,  147,  148,
        149,  150,  151,  152,  153,  154,  155,  1

In [105]:
movie_id_list = []
for i in movie_id:
    ratings_by_movie = np.mean(movie_ratings[movie_ratings[:,1] == i][:,2])
    movie_id_list.append([i, ratings_by_movie])

movie_id_list

[[1, 4.146846413095811],
 [2, 3.20114122681883],
 [3, 3.01673640167364],
 [4, 2.7294117647058824],
 [5, 3.0067567567567566],
 [6, 3.8787234042553194],
 [7, 3.410480349344978],
 [8, 3.014705882352941],
 [9, 2.656862745098039],
 [10, 3.5405405405405403],
 [11, 3.7938044530493706],
 [12, 2.3625],
 [13, 3.2626262626262625],
 [14, 3.542483660130719],
 [15, 2.458904109589041],
 [16, 3.7932551319648096],
 [17, 4.027544910179641],
 [18, 3.337579617834395],
 [19, 2.480719794344473],
 [20, 2.5375],
 [21, 3.6238938053097347],
 [22, 3.3492063492063493],
 [23, 2.857142857142857],
 [24, 3.1794871794871793],
 [25, 3.6510204081632653],
 [26, 3.53],
 [27, 2.9344262295081966],
 [28, 4.055865921787709],
 [29, 4.062034739454094],
 [30, 3.6486486486486487],
 [31, 3.1134751773049647],
 [32, 3.945731303772336],
 [33, 3.0],
 [34, 3.8914905768132497],
 [35, 3.3142857142857145],
 [36, 3.9579741379310347],
 [37, 3.5],
 [38, 2.8214285714285716],
 [39, 3.6233480176211454],
 [40, 3.933333333333333],
 [41, 3.9586776

### 구한 배열이나 리스트 등의 집합을 파일로 저장하기

In [194]:
# savetxt: 텍스트 기반의 파일 형식으로 저장(csv로 저장하려면 구분자에 콤마를 넣어줘야함.)
# 저장할 경로 및 파일명, 실제 데이터, 구분자, 표현방식(.3f는 소수점 3자리까지 표현하라는 뜻)
np.savetxt('data/movie_mean.csv', movie_id_list, delimiter=',',fmt='%.3f')