In [1]:
import numpy as np
import pandas as pd

# 600명의 사용자 id 생성
user_ids = np.arange(1, 601)

# 1363개의 병원 id 생성
hospital_ids = np.arange(1, 1364)

# 각 사용자별로 랜덤하게 10개의 병원 선택
np.random.seed(4)
selected_hospitals = np.random.choice(hospital_ids, size=(600, 10), replace=True) #복원추출

# 선택된 10개의 병원에 대해 1~5사이의 랜덤한 평점 부여
np.random.seed(4)
ratings = np.random.randint(1, 6, size=(600, 10))

# 데이터프레임 생성
df = pd.DataFrame(data=np.column_stack((np.repeat(user_ids, 10), selected_hospitals.ravel(), ratings.ravel())),
                  columns=['user_id', 'id', 'rating'])
df

Unnamed: 0,user_id,id,rating
0,1,1147,3
1,1,175,2
2,1,440,1
3,1,710,1
4,1,361,3
...,...,...,...
5995,600,798,3
5996,600,432,3
5997,600,1114,3
5998,600,2,3


In [2]:
df.describe()

Unnamed: 0,user_id,id,rating
count,6000.0,6000.0,6000.0
mean,300.5,682.227167,3.005333
std,173.219276,394.75319,1.419498
min,1.0,1.0,1.0
25%,150.75,336.0,2.0
50%,300.5,686.0,3.0
75%,450.25,1027.0,4.0
max,600.0,1363.0,5.0


In [3]:
# csv 파일로 저장
df.to_csv('ratings.csv', index=False)

### 병원별 counts 수, 평점 column생성

In [4]:
df1 = df.sort_values(by='id' ,ascending=True) #id 별 재정렬
(df1['id']==1).sum()#병원별 평가 데이터 갯수 . 1번 병원의 평가데이터는 8개

8

In [5]:
df1.head(10)

Unnamed: 0,user_id,id,rating
3844,385,1,5
583,59,1,2
369,37,1,2
2986,299,1,4
95,10,1,5
5290,530,1,4
5781,579,1,1
3338,334,1,3
4136,414,2,2
420,43,2,1


In [6]:
df1.iloc[3,2]

4

In [7]:
df1['id'].unique()

array([   1,    2,    3, ..., 1361, 1362, 1363])

In [8]:
meta = pd.read_csv('hospital.csv')
meta

Unnamed: 0,id,name,location,phonenumber,category,province,xpos,ypos
0,1,해오름요양병원,경기도 안산시 단원구 선부동 1034번지 8호,,"침구과, 한방신경정신과, 한방안·이비인후·피부과, 한방내과, 비뇨기과, 정형외과, ...",경기,126.807603,37.342222
1,2,세명요양병원,경기도 안산시 상록구 본오1동 904번지 13호 외 1필지,,"침구과, 사상체질과, 한방재활의학과, 한방신경정신과, 한방안·이비인후·피부과, 한방...",경기,126.862995,37.290667
2,3,양주큰길요양병원,경기도 양주시 광적면 가납리 495-2번지,,"내과, 신경과, 외과, 정형외과, 신경외과, 산부인과, 재활의학과, 가정의학과, 한방내과",경기,126.995532,37.810187
3,4,중앙효요양병원,경기도 의정부시 의정부동 237번지 7호,,"외과, 침구과",경기,127.045456,37.746234
4,5,돌담요양병원,경기도 양주시 백석읍 기산리 381-5번지,,"침구과, 한방내과, 가정의학과, 마취통증의학과, 외과, 신경과, 내과",경기,126.937848,37.772088
...,...,...,...,...,...,...,...,...
1358,1359,의료법인홍익의료재단파스카요양병원,"충청북도 청주시 청원구 내수읍 마산길 8-11, ()",043-900-1004,가정의학과,충북,127.538810,36.717401
1359,1360,이가양정요양병원,"광주광역시 광산구 하남울로 10, (하남동)",062-675-7777,가정의학과,광주,126.802241,35.181146
1360,1361,평심요양병원,"경상남도 양산시 하북면 신평로 37, 2~6층",055-800-7090,가정의학과,경남,129.086478,35.491624
1361,1362,현송요양병원,"전라남도 여수시 해산4길 37-0, (해산동)",061-691-1000,가정의학과,전남,127.633647,34.802020


## 병원별(id)로 새로운 평점 데이터프레임 생성

In [12]:
df2 = pd.DataFrame()

id_list = df1['id'].unique()

for id in id_list:
        id_ratings = df1.loc[df1['id'] == id, 'rating']
        average_rating = id_ratings.mean()
        df2 = df2.append({'id': id, 'average_rating': average_rating}, ignore_index=True)


In [13]:
df2 # rating안된 병원도 있음.

Unnamed: 0,id,average_rating
0,1.0,3.250000
1,2.0,2.250000
2,3.0,3.000000
3,4.0,3.500000
4,5.0,3.142857
...,...,...
1343,1359.0,1.750000
1344,1360.0,3.333333
1345,1361.0,2.333333
1346,1362.0,5.000000


In [17]:
for i in range(len(df2['id'])):
    print(df2.loc[i, :])

id                1.00
average_rating    3.25
Name: 0, dtype: float64
id                2.00
average_rating    2.25
Name: 1, dtype: float64
id                3.0
average_rating    3.0
Name: 2, dtype: float64
id                4.0
average_rating    3.5
Name: 3, dtype: float64
id                5.000000
average_rating    3.142857
Name: 4, dtype: float64
id                6.000000
average_rating    2.166667
Name: 5, dtype: float64
id                7.000000
average_rating    2.857143
Name: 6, dtype: float64
id                8.0
average_rating    3.6
Name: 7, dtype: float64
id                9.0
average_rating    2.0
Name: 8, dtype: float64
id                10.0
average_rating     5.0
Name: 9, dtype: float64
id                11.000000
average_rating     2.833333
Name: 10, dtype: float64
id                12.0
average_rating     4.0
Name: 11, dtype: float64
id                13.00
average_rating     3.75
Name: 12, dtype: float64
id                14.0
average_rating     5.0
Name: 13, dty

### id->정수, 평점->소수점 첫째자리까지

In [18]:
df2_1 = df2.astype({'id':int, 'average_rating':float})

In [19]:
df2_1['average_rating'] = df2_1['average_rating'].round(1)

In [20]:
df2_1

Unnamed: 0,id,average_rating
0,1,3.2
1,2,2.2
2,3,3.0
3,4,3.5
4,5,3.1
...,...,...
1343,1359,1.8
1344,1360,3.3
1345,1361,2.3
1346,1362,5.0


### 기존 데이터와 병원 id로 합치기

In [21]:
meta

Unnamed: 0,id,name,location,phonenumber,category,province,xpos,ypos
0,1,해오름요양병원,경기도 안산시 단원구 선부동 1034번지 8호,,"침구과, 한방신경정신과, 한방안·이비인후·피부과, 한방내과, 비뇨기과, 정형외과, ...",경기,126.807603,37.342222
1,2,세명요양병원,경기도 안산시 상록구 본오1동 904번지 13호 외 1필지,,"침구과, 사상체질과, 한방재활의학과, 한방신경정신과, 한방안·이비인후·피부과, 한방...",경기,126.862995,37.290667
2,3,양주큰길요양병원,경기도 양주시 광적면 가납리 495-2번지,,"내과, 신경과, 외과, 정형외과, 신경외과, 산부인과, 재활의학과, 가정의학과, 한방내과",경기,126.995532,37.810187
3,4,중앙효요양병원,경기도 의정부시 의정부동 237번지 7호,,"외과, 침구과",경기,127.045456,37.746234
4,5,돌담요양병원,경기도 양주시 백석읍 기산리 381-5번지,,"침구과, 한방내과, 가정의학과, 마취통증의학과, 외과, 신경과, 내과",경기,126.937848,37.772088
...,...,...,...,...,...,...,...,...
1358,1359,의료법인홍익의료재단파스카요양병원,"충청북도 청주시 청원구 내수읍 마산길 8-11, ()",043-900-1004,가정의학과,충북,127.538810,36.717401
1359,1360,이가양정요양병원,"광주광역시 광산구 하남울로 10, (하남동)",062-675-7777,가정의학과,광주,126.802241,35.181146
1360,1361,평심요양병원,"경상남도 양산시 하북면 신평로 37, 2~6층",055-800-7090,가정의학과,경남,129.086478,35.491624
1361,1362,현송요양병원,"전라남도 여수시 해산4길 37-0, (해산동)",061-691-1000,가정의학과,전남,127.633647,34.802020


In [25]:
vote_rating_hospital = meta.merge(df2_1, how='left',on='id') 
vote_rating_hospital # meta데이터프레임의 id 기준으로 병원데이터와 병원별 평점데이터 합치기(평점 없는 병원 NaN)

Unnamed: 0,id,name,location,phonenumber,category,province,xpos,ypos,average_rating
0,1,해오름요양병원,경기도 안산시 단원구 선부동 1034번지 8호,,"침구과, 한방신경정신과, 한방안·이비인후·피부과, 한방내과, 비뇨기과, 정형외과, ...",경기,126.807603,37.342222,3.2
1,2,세명요양병원,경기도 안산시 상록구 본오1동 904번지 13호 외 1필지,,"침구과, 사상체질과, 한방재활의학과, 한방신경정신과, 한방안·이비인후·피부과, 한방...",경기,126.862995,37.290667,2.2
2,3,양주큰길요양병원,경기도 양주시 광적면 가납리 495-2번지,,"내과, 신경과, 외과, 정형외과, 신경외과, 산부인과, 재활의학과, 가정의학과, 한방내과",경기,126.995532,37.810187,3.0
3,4,중앙효요양병원,경기도 의정부시 의정부동 237번지 7호,,"외과, 침구과",경기,127.045456,37.746234,3.5
4,5,돌담요양병원,경기도 양주시 백석읍 기산리 381-5번지,,"침구과, 한방내과, 가정의학과, 마취통증의학과, 외과, 신경과, 내과",경기,126.937848,37.772088,3.1
...,...,...,...,...,...,...,...,...,...
1358,1359,의료법인홍익의료재단파스카요양병원,"충청북도 청주시 청원구 내수읍 마산길 8-11, ()",043-900-1004,가정의학과,충북,127.538810,36.717401,1.8
1359,1360,이가양정요양병원,"광주광역시 광산구 하남울로 10, (하남동)",062-675-7777,가정의학과,광주,126.802241,35.181146,3.3
1360,1361,평심요양병원,"경상남도 양산시 하북면 신평로 37, 2~6층",055-800-7090,가정의학과,경남,129.086478,35.491624,2.3
1361,1362,현송요양병원,"전라남도 여수시 해산4길 37-0, (해산동)",061-691-1000,가정의학과,전남,127.633647,34.802020,5.0


In [26]:
vote_rating_hospital.to_csv('rating_plus_hospital.csv', index=False)