# Implementation of the SCORE algorithm to PLIC-MILANO datase
## it will add a new column called 'score'

In [28]:
import pandas as pd
import os
import math

# defining functions for the SCORE algorithm

In [29]:
def step1(age,sex,chd=True):
    #CHD
    if (chd):            #constants for chd
        if (sex):              # 0 for men and 1 for women
            a=-29.8
            p = 6.36
        else:
            a=-22.1
            p = 4.71
        
    else:                #constants for non chd
        if (sex):
            a = -31.0
            p = 6.62
        else:

            a = -26.7
            p = 5.64
            
    #print("a =", a, "; p =",p)
    if age>20:
        s = math.exp(-(math.exp(a))*(age-20)**p)
    else:
        s =0
    return s

In [30]:
def step2(chol, SBP, smoker, chd=True):
    if chd:  
        c_smoker = 0.71
        c_chol = 0.24
        c_SBP = 0.018
    else:
        c_smoker = 0.63
        c_chol = 0.02
        c_SBP = 0.022
    
    w = (c_chol*(chol-6))+(c_SBP*(SBP-120))+(c_smoker*smoker)
    return w

In [31]:
def score_algorithm( age, chol, SBP, sex, smoker):
    #CHD 
    s = step1(age,sex)
    s10 = step1(age+10,sex)
    
    w = step2(chol, SBP, smoker)
    
    s=s**(math.exp(w))
    s10=s10**(math.exp(w))
    try:
        stot=s10/s
    except:
        stot=1              
    riskc = 1 -stot
    
    
    #NON CHD
    s = step1(age,sex,chd=False)
    s10 = step1(age+10,sex, chd=False)
  
    w = step2(chol, SBP, smoker, chd=False)
    
    s=s**(math.exp(w))
    s10=s10**(math.exp(w)) 
    try:
        stot=s10/s
    except:
        stot=1
    risknon = 1 -stot  
    
    
    #print ("risk CHD: ", riskc *100)
    #print ("risk nonCHD: " ,risknon * 100)
    risktot = 1 - (1-riskc) * (1-risknon)
    
    
    #print('total RISK:',risktot)
    return risktot

# Importing CSV file

In [32]:
#importing csv file
data_frame = pd.read_csv("chiesa_cleaned.csv")

In [35]:
data_frame['ana_fis:complete_smoke_CHIESA']

0      9.0
1      1.0
2      1.0
3      1.0
4      1.0
5      1.0
6      1.0
7      1.0
8      1.0
9      1.0
10     1.0
11     1.0
12     1.0
13     1.0
14     1.0
15     1.0
16     1.0
17     1.0
18     1.0
19     1.0
20     1.0
21     1.0
22     1.0
23    -1.0
24     1.0
25     1.0
26     1.0
27     1.0
28     1.0
29     1.0
      ... 
616    7.0
617    1.0
618    6.0
619    1.0
620    1.0
621    1.0
622    1.0
623    3.0
624    1.0
625   -1.0
626    4.0
627    4.0
628    1.0
629    1.0
630    4.0
631   -1.0
632    1.0
633    1.0
634    2.0
635    4.0
636    1.0
637    3.0
638    1.0
639    6.0
640    1.0
641    1.0
642    1.0
643    1.0
644    1.0
645    3.0
Name: ana_fis:complete_smoke_CHIESA, Length: 646, dtype: float64

In [34]:
for i, el in enumerate(data_frame.columns):
    print (i, el)

0 cod_pz
1 ana:gender
2 ana:age
3 ana:education
4 ana:occupation
5 ana_fis:menarche
6 ana_fis:pregnancies_n
7 ana_fis:abortion_n
8 ana_fis:menopause_yn
9 ana_fis:menopause_age
10 ana_fis:induced_menopause_yn
11 ana_fis:alcohols_yn
12 ana_fis:wine_yn
13 ana_fis:b_wine
14 ana_fis:beer_yn
15 ana_fis:b_beer
16 ana_fis:spirits_yn
17 ana_fis:b_spirits
18 ana_fis:complete_smoke_CHIESA
19 ana_fis:physical_activity_yn
20 ana_fis:physical_activity_kind
21 ana_fis:physical_activity_intensity
22 ana_fis:physical_activity_hours
23 ana_fis:chd_yn
24 ana_fis:angina_yn
25 ana_fis:silent_ischaemia_yn
26 ana_fis:ima_yn
27 ana_fis:bypass_yn
28 ana_fis:ptca_yn
29 ana_fis:strokes_yn
30 ana_fis:tia_yn
31 ana_fis:peripheral_arteriopathy_limbs_yn
32 ana_fis:peripheral_arteriopathy_tsa_yn
33 ana_fis:aortic_arteriopathy_yn
34 ana_fis:atrial_fibrillation_yn
35 ana_fis:major_arrhythmias_yn
36 ana_fis:valve_diseases_yn
37 ana_fis:type_valve_diseases
38 ana_fis:ivs_yn
39 ana_fis:imbalance_yn
40 ana_fis:venous_throm

# processing of column 'smoking'

In [9]:
#function to control smoking column values as 'ex', 'other'.... and convert them to 'si
def check_smoking_column():
        for i,el in enumerate(data_frame['ana_fis:smoking']):
                if (not(el.startswith('si', 0,len(data_frame['ana_fis:smoking'][i])) or el.startswith('no', 0,len(data_frame['ana_fis:smoking'][i])))):
                    data_frame['ana_fis:smoking'][i]='si'
                    print(i, "fatto")

In [10]:
#function for the smoking column and changing every 'si' in 1 and every 'no' in 0
def bool_smoking_column():
        for i,el in enumerate(data_frame['ana_fis:smoking']):
            if (el=='si'):
                data_frame['ana_fis:smoking'][i]=1
            elif (el=='no'):
                data_frame['ana_fis:smoking'][i]=0

In [11]:
check_smoking_column()


A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  """


0 fatto
2 fatto
3 fatto
5 fatto
6 fatto
8 fatto
11 fatto
17 fatto
25 fatto
27 fatto
28 fatto
29 fatto
31 fatto
32 fatto
33 fatto
34 fatto
35 fatto
36 fatto
37 fatto
38 fatto
40 fatto
41 fatto
42 fatto
44 fatto
47 fatto
50 fatto
51 fatto
52 fatto
53 fatto
56 fatto
57 fatto
58 fatto
60 fatto
61 fatto
62 fatto
66 fatto
67 fatto
68 fatto
69 fatto
70 fatto
71 fatto
72 fatto
73 fatto
81 fatto
85 fatto
91 fatto
92 fatto
93 fatto
96 fatto
98 fatto
100 fatto
101 fatto
104 fatto
106 fatto
108 fatto
109 fatto
111 fatto
113 fatto
114 fatto
115 fatto
116 fatto
118 fatto
119 fatto
124 fatto
130 fatto
132 fatto
135 fatto
136 fatto
137 fatto
138 fatto
139 fatto
141 fatto
142 fatto
145 fatto
148 fatto
153 fatto
156 fatto
158 fatto
160 fatto
161 fatto
168 fatto
169 fatto
170 fatto
171 fatto
172 fatto
174 fatto
175 fatto
177 fatto
181 fatto
182 fatto
185 fatto
189 fatto
190 fatto
194 fatto
197 fatto
198 fatto
199 fatto
201 fatto
202 fatto
204 fatto
206 fatto
214 fatto
215 fatto
219 fatto
224 fatto
227 fa

1680 fatto
1681 fatto
1682 fatto
1683 fatto
1686 fatto
1690 fatto
1691 fatto
1692 fatto
1694 fatto
1696 fatto
1697 fatto
1698 fatto
1701 fatto
1702 fatto
1703 fatto
1705 fatto
1711 fatto
1713 fatto
1714 fatto
1715 fatto
1718 fatto
1720 fatto
1721 fatto
1723 fatto
1724 fatto
1728 fatto
1730 fatto
1733 fatto
1734 fatto
1735 fatto
1736 fatto
1737 fatto
1741 fatto
1746 fatto
1747 fatto
1748 fatto
1749 fatto
1751 fatto
1754 fatto
1757 fatto
1758 fatto
1760 fatto
1767 fatto
1769 fatto
1775 fatto
1777 fatto
1779 fatto
1780 fatto
1783 fatto
1788 fatto
1789 fatto
1790 fatto
1791 fatto
1792 fatto
1795 fatto
1796 fatto
1797 fatto
1799 fatto
1801 fatto
1804 fatto
1809 fatto
1811 fatto
1813 fatto
1815 fatto
1816 fatto
1817 fatto
1818 fatto
1819 fatto
1826 fatto
1827 fatto
1830 fatto
1832 fatto
1833 fatto
1837 fatto
1838 fatto
1841 fatto
1842 fatto
1845 fatto
1846 fatto
1848 fatto
1850 fatto
1851 fatto
1853 fatto
1855 fatto
1857 fatto
1858 fatto
1859 fatto
1861 fatto
1865 fatto
1866 fatto
1867 fatto

3234 fatto
3235 fatto
3236 fatto
3237 fatto
3240 fatto
3241 fatto
3242 fatto
3244 fatto
3246 fatto
3249 fatto
3254 fatto
3256 fatto
3258 fatto
3260 fatto
3261 fatto
3262 fatto
3263 fatto
3264 fatto
3271 fatto
3272 fatto
3275 fatto
3277 fatto
3278 fatto
3282 fatto
3283 fatto
3286 fatto
3287 fatto
3290 fatto
3291 fatto
3293 fatto
3295 fatto
3296 fatto
3298 fatto
3300 fatto
3302 fatto
3303 fatto
3304 fatto
3306 fatto
3310 fatto
3311 fatto
3312 fatto
3313 fatto
3314 fatto
3316 fatto
3317 fatto
3318 fatto
3320 fatto
3321 fatto
3323 fatto
3325 fatto
3328 fatto
3330 fatto
3331 fatto
3332 fatto
3335 fatto
3337 fatto
3342 fatto
3344 fatto
3346 fatto
3348 fatto
3349 fatto
3355 fatto
3356 fatto
3357 fatto
3358 fatto
3360 fatto
3362 fatto
3363 fatto
3364 fatto
3365 fatto
3368 fatto
3372 fatto
3374 fatto
3378 fatto
3379 fatto
3380 fatto
3381 fatto
3382 fatto
3384 fatto
3389 fatto
3392 fatto
3393 fatto
3398 fatto
3400 fatto
3403 fatto
3407 fatto
3416 fatto
3418 fatto
3419 fatto
3420 fatto
3429 fatto

4777 fatto
4780 fatto
4782 fatto
4787 fatto
4789 fatto
4791 fatto
4793 fatto
4794 fatto
4800 fatto
4801 fatto
4802 fatto
4803 fatto
4805 fatto
4807 fatto
4808 fatto
4809 fatto
4810 fatto
4813 fatto
4817 fatto
4819 fatto
4823 fatto
4824 fatto
4825 fatto
4826 fatto
4827 fatto
4829 fatto
4834 fatto
4837 fatto
4838 fatto
4843 fatto
4845 fatto
4848 fatto
4852 fatto
4861 fatto
4863 fatto
4864 fatto
4865 fatto
4874 fatto
4877 fatto
4879 fatto
4880 fatto
4882 fatto
4884 fatto
4886 fatto
4890 fatto
4891 fatto
4892 fatto
4894 fatto
4896 fatto
4897 fatto
4898 fatto
4899 fatto
4903 fatto
4904 fatto
4908 fatto
4910 fatto
4911 fatto
4912 fatto
4913 fatto
4920 fatto
4921 fatto
4922 fatto
4925 fatto
4927 fatto
4931 fatto
4932 fatto
4933 fatto
4935 fatto
4937 fatto
4940 fatto
4943 fatto
4944 fatto
4947 fatto
4949 fatto
4950 fatto
4951 fatto
4953 fatto
4956 fatto
4957 fatto
4959 fatto
4962 fatto
4966 fatto
4968 fatto
4969 fatto
4971 fatto
4974 fatto
4977 fatto
4982 fatto
4985 fatto
4987 fatto
4988 fatto

In [12]:
bool_smoking_column()

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  """
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  import sys


In [13]:
data_frame.groupby('ana_fis:smoking').count()

Unnamed: 0_level_0,cod_pz,visit:visit,ana:visits_carried_out,ana:standardised_visits,ana:gender,ana:age,ana:education,ana_fis:menarche,ana_fis:pregnancies_n,ana_fis:abortion_n,...,eco_art:steatosis_yn,eco_art:steatosis_degree,eco_art:enlarged_liver,eco_art:aorta_calcifications,eco_art:epicardial_fat,eco_art:ea,eco_art:ea_low,eco_art:fe,eco_art:siv,eco_art:lbm
ana_fis:smoking,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
0,2999,2999,2999,2999,2999,2999,2999,2999,2999,2999,...,2999,2999,2999,2999,2999,2999,2999,2999,2999,2999
1,2781,2781,2781,2781,2781,2781,2781,2781,2781,2781,...,2781,2781,2781,2781,2781,2781,2781,2781,2781,2781


# Add new column 

In [14]:
#adding a new column with 'default ' as value
data_frame['SCORE']='default'

In [15]:
data_frame['SCORE']

0       default
1       default
2       default
3       default
4       default
5       default
6       default
7       default
8       default
9       default
10      default
11      default
12      default
13      default
14      default
15      default
16      default
17      default
18      default
19      default
20      default
21      default
22      default
23      default
24      default
25      default
26      default
27      default
28      default
29      default
         ...   
5750    default
5751    default
5752    default
5753    default
5754    default
5755    default
5756    default
5757    default
5758    default
5759    default
5760    default
5761    default
5762    default
5763    default
5764    default
5765    default
5766    default
5767    default
5768    default
5769    default
5770    default
5771    default
5772    default
5773    default
5774    default
5775    default
5776    default
5777    default
5778    default
5779    default
Name: SCORE, Length: 578

In [16]:
column_list=['ana:age','ana:gender','ana_fis:smoking','lab:total_cholesterol','esa_obi:sbp']
column_list.append('SCORE')
print(column_list)

['ana:age', 'ana:gender', 'ana_fis:smoking', 'lab:total_cholesterol', 'esa_obi:sbp', 'SCORE']


In [17]:

data_frame[column_list].head()

Unnamed: 0,ana:age,ana:gender,ana_fis:smoking,lab:total_cholesterol,esa_obi:sbp,SCORE
0,72,0,1,265,140.0,default
1,68,1,0,262,130.0,default
2,53,0,1,256,140.0,default
3,50,0,1,176,160.0,default
4,59,0,0,221,180.0,default


In [18]:
#new panda frame with the column i want
score_frame=data_frame[column_list]

# Applying the SCORE algorithm for each row of the dataset

In [19]:
score_frame.loc[870:875]

Unnamed: 0,ana:age,ana:gender,ana_fis:smoking,lab:total_cholesterol,esa_obi:sbp,SCORE
870,31,0,0,194,130.0,default
871,29,1,0,181,120.0,default
872,46,0,0,251,140.0,default
873,42,1,0,205,110.0,default
874,49,0,1,213,120.0,default
875,61,0,1,193,120.0,default


In [21]:

for index, row in score_frame.iterrows():
    row['lab:total_cholesterol']*=0.02586   #converting total cholesterol level from mg/dL to mmol/L
    row['SCORE']=score_algorithm(row['ana:age'],row['lab:total_cholesterol'], row['esa_obi:sbp'], row['ana:gender'],
                                 row['ana_fis:smoking'])
    data_frame['SCORE'][index]=row['SCORE']*100      #from 0% to a 100%
    print (index, data_frame['SCORE'][index])
    

0 18.261459844126836
1 3.306980674179061
2 3.8757469101267095
3 2.8720446820682866
4 6.301846185516602


A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  


5 7.891548363139345
6 1.1146141864392445
7 1.694142353335093
8 6.75744216653179
9 1.7385795122595304
10 2.1233931334782463
11 0.994661289833465
12 1.9351921636190816
13 0.5387946152504819
14 2.048167262441891
15 4.38395782433002
16 1.0980135298087945
17 15.419615317820245
18 3.416941814844743
19 2.0694453190765794
20 4.2411168591683035
21 0.11469984305977343
22 2.5993109248470314
23 5.7402171383455265
24 2.5392321208932644
25 7.989293322586677
26 0.5124609832169447
27 2.2762279153285325
28 1.7351429802293539
29 3.1769043250282403
30 2.2183888497344983
31 3.566816931491712
32 6.951440177266932
33 2.7973972157728566
34 9.269903582881012
35 7.414665620821226
36 4.738134110437264
37 3.3480287819326104
38 0.08666249913831248
39 0.4552554425997668
40 0.187333559059788
41 6.059450055431848
42 2.210834691754815
43 0.14657036189300587
44 0.706993925241195
45 0.00044276831097089797
46 0.006290266810093925
47 0.5287218839955199
48 1.3854450672330598
49 1.7347347516534772
50 1.4803398948059265
51 

369 1.528958595343799
370 6.234628236829042
371 0.009599729105436161
372 0.3963027738030256
373 7.098014415776777
374 1.5055655442119176
375 5.336010452527118
376 0.28607952789813096
377 4.66445787153662
378 1.596605613458646
379 0.45351091698648816
380 3.9719565113425337
381 6.386741726056311
382 0.003813553895415378
383 1.1308240791523705
384 0.2941169453182013
385 1.9635436052444222
386 6.312789560097487
387 0.7314970432335199
388 4.311278881188518
389 0.18137681771622782
390 0.034677687093531695
391 1.090820953972138
392 1.9980920470955787
393 1.2725245622098869
394 1.9892027639785925
395 1.9659129120172647
396 3.0233204429193083
397 0.7688110517791502
398 0.27684262276237437
399 0.5330678354228402
400 20.05212273810616
401 1.2332817405195207
402 0.10289197742817668
403 3.3434341223187447
404 1.4711003064652117
405 2.3332558884859966
406 0.6047038736421428
407 0.9892248943772386
408 6.0242735720024365
409 3.8837070535276297
410 7.166332168113954
411 2.093537230453346
412 13.4324159

735 0.11845806654110502
736 1.871766307338163
737 3.157757637568348
738 0.8889336298473549
739 10.267442786027658
740 0.309082335124089
741 0.010166115496645922
742 1.4396184082072438
743 1.5506399049756259
744 0.1274029904476892
745 8.545413973375716
746 1.1725095565447985
747 0.5496304494365889
748 3.84510936391953
749 0.024957567666938907
750 0.0005934671005847214
751 0.45318232877046283
752 0.007593046968468187
753 9.084869203976332
754 0.04625665440148863
755 3.877612259134444
756 4.348960291786785
757 0.4485560797531374
758 4.439417722918648
759 0.03453036932741238
760 0.05997108002158136
761 0.07843422906453901
762 0.8205418374914952
763 0.6662515639544564
764 0.005740888748761996
765 0.34989445947705144
766 0.9701678746657283
767 1.7185221744126067
768 0.3897602704694414
769 3.5960857435440308
770 12.13246377380316
771 1.1955656775260337
772 3.389143257311633
773 0.014303336148768775
774 0.0005039764367609223
775 2.5128841388772694
776 0.7774416359108138
777 0.01318791735210878

1091 3.1136943193411315
1092 5.950537213733787
1093 1.6044279676243
1094 8.234600450994723
1095 2.038417331288145
1096 1.2642646458020823
1097 2.8991417637650785
1098 0.07277585177652979
1099 1.4374342034350174
1100 4.514821024521865
1101 2.6799119255760395
1102 0.20637047698228717
1103 3.9166161310116077
1104 5.763606034318847
1105 8.716140538757266
1106 0.5472623040288838
1107 1.5719444526965387
1108 4.842024432420844
1109 2.7488334476424625
1110 0.9073653000226445
1111 2.508373776503914
1112 13.22825946632481
1113 14.676809137537827
1114 1.258309917387812
1115 6.831902900379827
1116 2.1183549238232624
1117 0.9270738051048388
1118 2.336584278798215
1119 2.5911352485813777
1120 16.82781233538818
1121 2.3728680597522978
1122 3.9224245970955196
1123 11.725853641883576
1124 2.7580785752222114
1125 0.829171921873928
1126 2.9427668781422223
1127 16.648268908754492
1128 2.9338452149813343
1129 0.49694986349824166
1130 9.603500596573223
1131 2.055047410642097
1132 1.7654668852056576
1133 1.4

1443 2.1230040513829374
1444 4.507713548352321
1445 35.60643832100222
1446 4.010574572282732
1447 4.087052813057035
1448 6.024456171781878
1449 4.989730028689654
1450 11.177428845968551
1451 1.4488593538470318
1452 1.7054531658974859
1453 8.079572213576046
1454 1.7330366606431058
1455 2.758810764506403
1456 1.0478337939557658
1457 1.9803340352609888
1458 0.881095669668952
1459 2.1560220504207916
1460 5.192217880420202
1461 2.0293518512729425
1462 19.41686631503654
1463 3.1970675888267963
1464 2.702598476541984
1465 5.246003334419369
1466 0.18574875599848273
1467 2.883095380782086
1468 7.477592457095927
1469 2.631561290624962
1470 8.463968403146671
1471 0.4633150823734056
1472 4.191694125978307
1473 2.1204914834372035
1474 2.6904382636843582
1475 2.1850054435465838
1476 4.2869536709628004
1477 10.091518858698512
1478 3.2850973853176146
1479 8.720866474127465
1480 6.465931868047969
1481 8.703228895750959
1482 4.98126837851628
1483 0.08839577354320394
1484 0.5078967464966722
1485 0.239758

1790 7.929738093954553
1791 1.5715112450603086
1792 0.11590751545529354
1793 0.021290449699984393
1794 0.9012576773105629
1795 8.63747922701117
1796 7.056864271513142
1797 2.8276155408550885
1798 1.5867773676126795
1799 0.36424422278824586
1800 2.1872215810159745
1801 11.820728738783393
1802 2.651974837755866
1803 1.2556219897672527
1804 1.1981126684592613
1805 0.778363568220064
1806 6.787616290817644
1807 0.17242619857869013
1808 0.40050347637575756
1809 3.6885116148852592
1810 1.0860947252537834
1811 11.879720857576414
1812 3.051196356869612
1813 0.5097222814476998
1814 1.7800873471790934
1815 12.142256384179273
1816 0.018033643130876964
1817 0.6231647965944775
1818 7.470488401759889
1819 1.6039779541209165
1820 4.790643885046153
1821 0.5781591315348056
1822 2.1314149507982827
1823 2.4295112033605126
1824 0.6438539803766519
1825 5.345630254887357
1826 8.602318847294487
1827 0.007264016404806561
1828 1.0503157787028705
1829 0.38862347853299006
1830 2.87515129257383
1831 6.683267796034

2145 0.8650218831434464
2146 2.6768562359689385
2147 3.9938874701249016
2148 0.12323165349082954
2149 0.7212288424607194
2150 6.042661235845115
2151 1.9992928676795474
2152 5.596571245548043
2153 0.9830633350785378
2154 0.47310458621304674
2155 0.002520855509813291
2156 2.7185627237351406
2157 1.43747651779631
2158 0.12174619452435254
2159 0.00020412545854719966
2160 14.608809346814233
2161 10.809615514306048
2162 1.6458807522493624
2163 0.1694003456577553
2164 7.18347616114875
2165 0.3701461593635602
2166 0.6357365504112034
2167 0.0010083091650403553
2168 5.757280839951995
2169 0.6842751044967343
2170 0.6267868864831772
2171 0.3099352307594394
2172 0.8680945802044926
2173 0.5828826696180012
2174 4.794117369887219
2175 0.8938894423846766
2176 1.7891674692479098
2177 5.2729667892672865
2178 0.01733907394135814
2179 0.23504352123653316
2180 0.09704866539345103
2181 2.063511793517636
2182 5.5226360909044985
2183 1.0662595673963104
2184 9.778567929204918
2185 0.708247127912387
2186 0.02250

2489 2.2860723459394827
2490 0.827919554946599
2491 1.4213712143555823
2492 2.4829920404453976
2493 6.412484107638017
2494 0.3814760064977052
2495 3.27053399311773
2496 0.9582416909811431
2497 0.609403437263234
2498 6.110885943014555
2499 5.457603619711149
2500 1.0536195813874327
2501 5.438296128121123
2502 1.1497209273411357
2503 1.9276369715525155
2504 0.015875523548936066
2505 4.911297971470441
2506 3.396707641679342
2507 1.1782436134870955
2508 0.9956666091802902
2509 3.6152232224108682
2510 8.64552961434092
2511 1.6358618497528177
2512 5.22239596927172
2513 0.5888628360672499
2514 2.1613237574412802
2515 1.5350881627033908
2516 2.2081452554844283
2517 2.0783719573350234
2518 0.5608701800435489
2519 8.25162361181383
2520 0.14803709478052873
2521 3.986375810424958
2522 0.26612934603971183
2523 2.37735509239001
2524 6.692427559786529
2525 1.4329031785956903
2526 2.7322840089678
2527 2.904868152204987
2528 0.4092750145295976
2529 0.863303128752102
2530 1.6313615107167
2531 1.501056620

2846 0.3642435022933599
2847 0.7356305690921494
2848 0.35989250237354886
2849 0.11824195776902746
2850 1.8823351102533081
2851 3.7512646604990874
2852 2.608737128666694
2853 1.0365507506234106
2854 1.922850448902813
2855 2.444257065285893
2856 0.406772854160653
2857 5.64219692877449
2858 7.833613872954559
2859 2.5077235219722493
2860 3.3687750229474234
2861 2.1713685506897784
2862 0.7422753532379645
2863 1.1104919425948379
2864 6.4756996978785
2865 1.175346276339062
2866 1.8646836769219521
2867 1.6683985014085856
2868 4.7863389580666045
2869 5.282951125044955
2870 2.4265639673955897
2871 6.438590719709092
2872 0.634697992313682
2873 1.1114487732262202
2874 6.766793229291346
2875 1.5245803143352221
2876 0.5392274361982752
2877 2.296324547898465
2878 12.34121622115233
2879 0.7601927841824674
2880 0.5093061450648362
2881 0.9383789376604779
2882 6.512528672775975
2883 8.979855299868088
2884 4.447858071983568
2885 1.6122236750867214
2886 0.7045811446704242
2887 2.232089135718307
2888 3.5180

3195 12.385319253614869
3196 1.3363391555118675
3197 3.7549564014106807
3198 0.20784621971976502
3199 3.1713897497649857
3200 13.398367017183265
3201 0.7814685954990352
3202 2.1396790282508404
3203 0.6510837432656236
3204 5.949317220155015
3205 0.22941161946508082
3206 2.0758133357810404
3207 8.972100675349292
3208 0.006544397181740269
3209 4.114416876821892
3210 12.145479879641385
3211 2.2762690502212024
3212 0.06368929287842162
3213 8.414218798306983
3214 4.145658063306367
3215 15.973021825504418
3216 12.37898761790176
3217 1.1313034041023684
3218 0.15947723697937732
3219 0.5769629431971013
3220 6.9183804478081035
3221 2.957924375044463
3222 0.5919508907683113
3223 2.105541928516297
3224 12.314591624390347
3225 8.289354673049566
3226 5.398809031526364
3227 4.66709797440169
3228 16.055176838391482
3229 5.674702703744461
3230 23.021594744622643
3231 3.646362143958104
3232 9.851572153973297
3233 26.281940741863497
3234 0.049178153242557254
3235 12.454921150307074
3236 2.1635642644332598

3548 3.077818659829157
3549 4.862840675686442
3550 4.347625327118443
3551 1.0749823012441762
3552 0.8889849298902686
3553 1.4685040144389983
3554 7.4859263133212455
3555 3.120688727257792
3556 0.08123671935136301
3557 0.15692229081765152
3558 0.3468896855099213
3559 0.3566228669230731
3560 5.568961064529376
3561 0.0011191436524615739
3562 1.2487188828383289
3563 0.009697861568158661
3564 2.003054601898857
3565 6.564603912935829
3566 5.11639461897343
3567 2.6451144485373446
3568 0.028710532412024037
3569 2.125571860065212
3570 0.0258510186942007
3571 1.581624865753395
3572 6.433259727385066
3573 3.6066195196421513
3574 1.2887643869278764
3575 3.7417848462629855
3576 8.762254280545124
3577 2.7413305144390554
3578 11.015615860844342
3579 7.870074188179766
3580 6.183168851738186
3581 1.9871618935720536
3582 2.0359025455839785
3583 3.4104582924808446
3584 0.7989146863996766
3585 6.844951733703697
3586 4.613246892137157
3587 1.6804197612241056
3588 0.445616126565751
3589 6.79217387189005
359

3900 9.247802438302454
3901 2.827057668899491
3902 12.429114693742438
3903 2.1263681987704564
3904 17.78944214330418
3905 2.3957387223679127
3906 9.912686371152956
3907 5.489659013889292
3908 5.3784009990660575
3909 0.40336862823284747
3910 0.8426605333718529
3911 4.75063058259888
3912 1.0249270121573395
3913 3.2211774472414523
3914 1.0023124315493237
3915 2.6388400595992123
3916 9.004698473080019
3917 3.666318019949566
3918 3.5482883597894643
3919 1.9664098758845117
3920 2.301358513482654
3921 0.4579537819695334
3922 2.7418609290090323
3923 3.7997694458897113
3924 0.9626516763284965
3925 5.4348558588597
3926 1.6253904674718656
3927 3.830971682175044
3928 3.0934966814159193
3929 2.193629791797469
3930 7.507575204524519
3931 1.2006037968454786
3932 3.9117898005246676
3933 11.52625306083438
3934 4.101161772220618
3935 1.455961217857571
3936 3.450655913271772
3937 2.726416268030041
3938 9.215320494341327
3939 0.7080649438530817
3940 8.783313705292873
3941 4.882429248212993
3942 2.42379055

4254 4.385284147790647
4255 11.313331676636562
4256 4.7657827864943325
4257 3.8610228720309614
4258 25.732529254631707
4259 4.472299216690445
4260 3.0025591664176177
4261 4.6388254316789945
4262 15.596550927172437
4263 19.298260482401595
4264 5.899739934211845
4265 1.413886609592463
4266 6.705082318393862
4267 10.01563789364579
4268 3.6134706511306014
4269 1.7454494116463937
4270 1.127053110670151
4271 0.23395099931862173
4272 21.065288476653087
4273 2.178694272797399
4274 6.08136238485063
4275 3.65707734233639
4276 2.833503017842387
4277 1.1716813542969828
4278 0.39715380800224853
4279 7.135043761313975
4280 2.9903730013808083
4281 1.7171648747166368
4282 1.4127578766832682
4283 0.43067428758821746
4284 4.926101875681265
4285 5.990683079751802
4286 15.384465075935672
4287 2.3167930990557695
4288 0.9621486312845651
4289 2.955238472326571
4290 10.066361550514713
4291 1.827958523388118
4292 1.1071828315764032
4293 0.8104616321077507
4294 0.34574325423397667
4295 3.447159691590662
4296 7.

4603 5.802783775890474
4604 4.178475790302727
4605 9.449798516286956
4606 1.5452099498215355
4607 4.957177738588658
4608 17.104195205408978
4609 1.1448023355225323
4610 10.615126625750747
4611 4.876775134242994
4612 2.14714269296159
4613 5.229790688714964
4614 4.172040582552827
4615 17.65783298297271
4616 3.3358348041935604
4617 6.294904586329886
4618 2.5603051807288946
4619 0.05422637421211851
4620 0.1793570375761111
4621 0.2759437889239491
4622 4.192614812425576
4623 1.1019795896980877
4624 0.45531193518874025
4625 11.556462050632755
4626 16.29482084956325
4627 17.271828812718926
4628 14.082108773726098
4629 2.4382099495695253
4630 13.828475549191644
4631 29.13017842473454
4632 4.992523532415127
4633 0.24909442529396086
4634 0.9004124915057865
4635 0.6696070118332509
4636 0.9916245162231885
4637 6.7645744091621385
4638 25.055914635498922
4639 15.080626154546216
4640 9.490450846471244
4641 1.29792652705647
4642 5.557705571363036
4643 0.4065889365851616
4644 4.6517375282213
4645 17.504

4954 5.143012201311725
4955 5.683552951476212
4956 31.08580916353725
4957 0.01584000167864641
4958 0.18199765312209015
4959 4.410221307937379
4960 3.172730441925531
4961 3.0306345675289226
4962 18.351329580758367
4963 0.8351334211682993
4964 2.4329261987313777
4965 3.143700496198576
4966 3.7384023203130057
4967 7.15222242528527
4968 13.228723866019788
4969 12.228671818319503
4970 5.498591928693886
4971 9.81734964239548
4972 11.952662165578998
4973 1.5811642408894433
4974 1.8890448746597732
4975 2.4382099495695253
4976 3.712852648878362
4977 16.39754550978375
4978 1.6313615107167
4979 6.490978779150447
4980 0.09572620152271671
4981 0.007540585428922331
4982 5.032892336357753
4983 3.399788404124904
4984 5.1874562709493315
4985 2.9197037048236285
4986 3.243695438472427
4987 46.71632712150722
4988 27.7875879411832
4989 0.2743622780503552
4990 1.132369713746506
4991 6.830020258627334
4992 2.632380900169784
4993 4.053267993847209
4994 8.025006023578907
4995 4.76105740879974
4996 2.1910274815

5304 12.550480735906932
5305 3.96854742561904
5306 21.311915967795624
5307 4.299754294099567
5308 7.882927631086445
5309 3.7737620160755103
5310 5.111721381948808
5311 11.519753621534534
5312 6.163079534890093
5313 20.295601415178055
5314 20.712386978385076
5315 6.4726756840069015
5316 20.14907379990468
5317 21.80419679163299
5318 6.071951639938
5319 3.1829082846597245
5320 0.7897984193014018
5321 7.313495477782606
5322 7.535227289764979
5323 3.6552008588032536
5324 2.5709438402854112
5325 1.6275649813631388
5326 8.735884704277375
5327 12.960273030647318
5328 1.3878930622966301
5329 9.540458362629556
5330 4.533671178886944
5331 30.287609789326975
5332 5.06135054922402
5333 0.7344637420547584
5334 9.434326582979368
5335 13.311213498738395
5336 26.506872576931293
5337 3.9608767606041484
5338 14.547127885010823
5339 7.265292931382028
5340 6.711848750290395
5341 8.71986444722559
5342 8.856951395928458
5343 1.8848095656205932
5344 24.038928422775776
5345 29.11001585677867
5346 3.60967360042

5656 1.2890469952539951
5657 4.183128533667824
5658 9.242391117982518
5659 1.514597537883211
5660 0.6200244115239562
5661 15.445553882358155
5662 14.259464698257796
5663 4.55826087764446
5664 5.500577917196104
5665 1.8716778981066051
5666 8.006175060507504
5667 7.674803730074398
5668 6.787332820363945
5669 8.763081892130732
5670 4.483702189961736
5671 2.7260066216577172
5672 1.1079239232156701
5673 0.4724692205496872
5674 5.691943557216527
5675 2.442283772126441
5676 4.759520684480378
5677 14.805498113569659
5678 10.435108163679384
5679 9.31810326987571
5680 7.424417101860636
5681 5.837248491436931
5682 5.265638554238972
5683 5.172975971606409
5684 1.428378582550982
5685 5.872762019028976
5686 1.7762667545074495
5687 1.5218727725423098
5688 15.595466765384913
5689 7.4055746641412785
5690 8.965940326244493
5691 2.847444685072553
5692 0.8041623284650967
5693 5.4105272345894795
5694 4.719040943799124
5695 1.75638676815425
5696 2.4892162151729402
5697 3.7020962965966575
5698 12.41468059267

In [22]:
data_frame.head(100)

Unnamed: 0,cod_pz,visit:visit,ana:visits_carried_out,ana:standardised_visits,ana:gender,ana:age,ana:education,ana_fis:menarche,ana_fis:pregnancies_n,ana_fis:abortion_n,...,eco_art:steatosis_degree,eco_art:enlarged_liver,eco_art:aorta_calcifications,eco_art:epicardial_fat,eco_art:ea,eco_art:ea_low,eco_art:fe,eco_art:siv,eco_art:lbm,SCORE
0,0,0,2,2,0,72,3,-1.0,-1.0,-1.0,...,-1.0,-1.0,-1.0,-1,-1,-1.0,-1.0,-1.0,-1.0,18.2615
1,1,0,2,2,1,68,5,16.0,1.0,-1.0,...,-1.0,-1.0,-1.0,-1,-1,-1.0,-1.0,-1.0,-1.0,3.30698
2,2,0,2,2,0,53,4,-1.0,-1.0,-1.0,...,-1.0,-1.0,-1.0,-1,-1,-1.0,-1.0,-1.0,-1.0,3.87575
3,3,0,2,2,0,50,6,-1.0,-1.0,-1.0,...,-1.0,-1.0,-1.0,-1,-1,-1.0,-1.0,-1.0,-1.0,2.87204
4,4,0,2,2,0,59,6,-1.0,-1.0,-1.0,...,-1.0,-1.0,-1.0,-1,-1,-1.0,-1.0,-1.0,-1.0,6.30185
5,5,0,2,2,0,62,6,-1.0,-1.0,-1.0,...,-1.0,-1.0,-1.0,-1,-1,-1.0,-1.0,-1.0,-1.0,7.89155
6,6,0,2,2,0,49,6,-1.0,-1.0,-1.0,...,-1.0,-1.0,-1.0,-1,-1,-1.0,-1.0,-1.0,-1.0,1.11461
7,7,0,2,2,1,60,3,12.0,2.0,-1.0,...,-1.0,-1.0,-1.0,-1,-1,-1.0,-1.0,-1.0,-1.0,1.69414
8,8,0,2,2,0,56,4,-1.0,-1.0,-1.0,...,-1.0,-1.0,-1.0,-1,-1,-1.0,-1.0,-1.0,-1.0,6.75744
9,9,0,2,2,1,61,3,12.0,4.0,-1.0,...,-1.0,-1.0,-1.0,-1,-1,-1.0,-1.0,-1.0,-1.0,1.73858


In [24]:
data_frame.groupby('SCORE').count()

Unnamed: 0_level_0,cod_pz,visit:visit,ana:visits_carried_out,ana:standardised_visits,ana:gender,ana:age,ana:education,ana_fis:menarche,ana_fis:pregnancies_n,ana_fis:abortion_n,...,eco_art:steatosis_yn,eco_art:steatosis_degree,eco_art:enlarged_liver,eco_art:aorta_calcifications,eco_art:epicardial_fat,eco_art:ea,eco_art:ea_low,eco_art:fe,eco_art:siv,eco_art:lbm
SCORE,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
0.000000,9,9,9,9,9,9,9,9,9,9,...,9,9,9,9,9,9,9,9,9,9
0.000043,1,1,1,1,1,1,1,1,1,1,...,1,1,1,1,1,1,1,1,1,1
0.000061,1,1,1,1,1,1,1,1,1,1,...,1,1,1,1,1,1,1,1,1,1
0.000100,1,1,1,1,1,1,1,1,1,1,...,1,1,1,1,1,1,1,1,1,1
0.000133,1,1,1,1,1,1,1,1,1,1,...,1,1,1,1,1,1,1,1,1,1
0.000150,1,1,1,1,1,1,1,1,1,1,...,1,1,1,1,1,1,1,1,1,1
0.000152,1,1,1,1,1,1,1,1,1,1,...,1,1,1,1,1,1,1,1,1,1
0.000185,1,1,1,1,1,1,1,1,1,1,...,1,1,1,1,1,1,1,1,1,1
0.000204,1,1,1,1,1,1,1,1,1,1,...,1,1,1,1,1,1,1,1,1,1
0.000221,1,1,1,1,1,1,1,1,1,1,...,1,1,1,1,1,1,1,1,1,1


# Exporting the new DATASET

In [25]:
filename="./milano_cleaned_wSCORE.csv"

In [26]:
export_csv = data_frame.to_csv (filename, index = None, header=True) 

In [None]:
## read the new dataset

In [None]:
data_frame = pd.read_csv(filename,error_bad_lines=False, sep=',', low_memory=False)
data_frame[column_list][::-1]