# Play around with different models

I have 4 initial clean dataframes for 'big' models that till have many columns:
1. df1 = missing values dropped, and category 1 columns dropped
2. df2 = missing values dropped, and category 1 & 2 columns dropped
3. df3 = missing values dropped, and cat1 dropped
4. df4 = missing values dropped, and cat 1 & 2 dropped

Imports, read in data, start with overfit models and then simplify. Afterwards, start with simpler model and work my way up. Look back at heatmaps to eliminate more columns/ examine coefficients and p-values within df to eliminate more columns.

Basic Steps for each model:
1. Define X and y (Remove ID variables) 
2. Train-test split
3. Pre-processing
    - One hot encoding
    - Simple Imputer (for df3 & df4)
    - Interaction Variables/ Polynomial Features (try with and without)
    - Manually create some interaction variables
4. Instantiate Linear Regression Model
5. Analyze scores & submit to Kaggle

In [27]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.preprocessing import PolynomialFeatures, StandardScaler, OneHotEncoder
from sklearn.compose import ColumnTransformer

In [14]:
# Model 1 with df1 (simplest clean dataset- missings dropped, some columns dropped)

df1 = pd.read_csv('datasets/df1.csv')

In [15]:
df1.head()

Unnamed: 0.1,Unnamed: 0,Id,PID,MS SubClass,MS Zoning,Lot Frontage,Lot Area,Street,Lot Shape,Land Contour,...,Enclosed Porch,3Ssn Porch,Screen Porch,Pool Area,Fence,Misc Val,Mo Sold,Yr Sold,Sale Type,SalePrice
0,1,544,531379050,0 60\n1 60\n2 20\n3 ...,RL,43.0,11492,Pave,IR1,Lvl,...,0,0,0,0,,0,4,2009,WD,220000
1,2,153,535304180,0 60\n1 60\n2 20\n3 ...,RL,68.0,7922,Pave,Reg,Lvl,...,0,0,0,0,,0,1,2010,WD,109000
2,3,318,916386060,0 60\n1 60\n2 20\n3 ...,RL,73.0,9802,Pave,Reg,Lvl,...,0,0,0,0,,0,4,2010,WD,174000
3,4,255,906425045,0 60\n1 60\n2 20\n3 ...,RL,82.0,14235,Pave,IR1,Lvl,...,0,0,0,0,,0,3,2010,WD,138500
4,5,138,535126040,0 60\n1 60\n2 20\n3 ...,RL,137.0,16492,Pave,IR1,Lvl,...,0,0,0,0,,0,6,2010,WD,190000


In [16]:
df1.shape

(1598, 75)

In [32]:
df1_X = df1.drop(columns=['Unnamed: 0', 'Id', 'PID', 'SalePrice'])
df1_y = df1['SalePrice']

In [47]:
X1_train, X1_test, y1_train, y1_test = train_test_split(df1_X, df1_y, test_size= 0.2, random_state=4)

In [48]:
#Make lists of the numeric and string columns:
df1_str = list(df1_X.select_dtypes(include=['object']).columns)
df1_num = list(df1_X.select_dtypes(include=['int', 'float']).columns)


In [49]:
ct = ColumnTransformer([
    ('poly', PolynomialFeatures(include_bias=False), df1_num),
    ('scaler', StandardScaler(), df1_num), 
    ('oh', OneHotEncoder(sparse_output=False, drop='first'), df1_str)
], remainder='passthrough')  # 'passthrough' allows non-transformed columns to pass through

# Fit and transform the training data using the ColumnTransformer
X1_train_transformed = ct.fit_transform(X1_train)

# Transform the test data using the fitted ColumnTransformer
X1_test_transformed = ct.transform(X1_test)

#Pre-processing:
#Referred to lesson 305 Feature Engineering
ct = ColumnTransformer([
    ('poly', PolynomialFeatures(include_bias=False), df1_num),
    ('oh', OneHotEncoder(sparse_output=False, drop='first'), df1_str)
], remainder='drop')

In [51]:
lr = LinearRegression()
lr.fit(df1_X, df1_y)

ValueError: could not convert string to float: '0        60\n1        60\n2        20\n3        60\n4        50\n5        20\n6       180\n7        20\n8        20\n9        60\n10      160\n11       20\n12       70\n13      160\n14       20\n15       20\n16       70\n17       20\n18       20\n19       60\n20       20\n21      120\n22       60\n23       20\n24      190\n25       20\n26       20\n27       50\n28      190\n29       50\n30       20\n31       70\n32      120\n33       20\n34       20\n35       20\n36      160\n37       20\n38       20\n39       20\n40       20\n41       20\n42       85\n43       50\n44       20\n45       70\n46       50\n47       70\n48       20\n49      160\n50      160\n51       50\n52       60\n53      160\n54       20\n55       60\n56      160\n57       20\n58       20\n59       60\n60       60\n61       60\n62       20\n63       50\n64       20\n65       20\n66       70\n67      160\n68       20\n69      120\n70       20\n71       20\n72       20\n73      160\n74       20\n75       30\n76       30\n77       30\n78       90\n79       50\n80       70\n81       20\n82       50\n83       20\n84      120\n85      120\n86       20\n87       20\n88       20\n89      160\n90       80\n91       60\n92       60\n93       90\n94       80\n95      120\n96       80\n97       20\n98      120\n99       60\n100      20\n101      30\n102      20\n103      30\n104      60\n105     190\n106     160\n107      50\n108      20\n109     160\n110      70\n111      20\n112      50\n113      20\n114      20\n115      20\n116      20\n117     120\n118     190\n119      60\n120      30\n121      20\n122      20\n123      30\n124      50\n125      60\n126      60\n127      70\n128      60\n129      80\n130     120\n131      60\n132     160\n133     120\n134      30\n135     160\n136      50\n137     120\n138      60\n139      70\n140      20\n141      60\n142      20\n143      20\n144      20\n145      50\n146      85\n147      20\n148      60\n149      50\n150      20\n151      60\n152      20\n153      60\n154      20\n155      20\n156     120\n157      60\n158     190\n159      20\n160      30\n161      60\n162      90\n163     160\n164      20\n165     160\n166      50\n167     160\n168     190\n169      85\n170      20\n171      50\n172      20\n173      70\n174      20\n175      70\n176      60\n177      20\n178      60\n179     160\n180      20\n181      20\n182      20\n183      20\n184      60\n185      20\n186      50\n187      20\n188      60\n189      60\n190      60\n191      20\n192      20\n193      20\n194      90\n195      20\n196      20\n197      50\n198      60\n199      20\n200     180\n201      60\n202      60\n203      75\n204      60\n205      50\n206      70\n207      20\n208     120\n209      85\n210      20\n211      20\n212      20\n213      20\n214      20\n215     120\n216      20\n217      50\n218      20\n219      30\n220      60\n221      20\n222     160\n223      20\n224      80\n225      20\n226     120\n227      60\n228     190\n229      80\n230     120\n231      80\n232      70\n233      20\n234      80\n235      70\n236      20\n237      60\n238      20\n239      50\n240      20\n241      20\n242     120\n243      20\n244      30\n245      20\n246     160\n247      20\n248      20\n249      50\n250      60\n251      20\n252      70\n253      20\n254      20\n255      50\n256      20\n257      60\n258     190\n259      50\n260      30\n261      30\n262      20\n263      20\n264      30\n265     120\n266      20\n267      20\n268      60\n269     160\n270      60\n271      20\n272      60\n273      20\n274      20\n275      80\n276      20\n277     120\n278     160\n279      20\n280      30\n281     120\n282     160\n283      60\n284      80\n285      20\n286      20\n287      20\n288      60\n289      90\n290      90\n291      50\n292      80\n293     120\n294     120\n295     120\n296      30\n297     180\n298      50\n299      60\n300     120\n301      50\n302      70\n303      80\n304      20\n305      20\n306      20\n307      50\n308      75\n309     120\n310      20\n311      60\n312      50\n313      60\n314      20\n315     160\n316     120\n317      60\n318      20\n319      60\n320      50\n321      60\n322      20\n323      20\n324      20\n325      70\n326      90\n327     120\n328      20\n329      20\n330      50\n331      80\n332      60\n333      75\n334     190\n335      60\n336      50\n337     190\n338      60\n339     120\n340      20\n341      70\n342     160\n343     190\n344     160\n345      60\n346      80\n347      60\n348      20\n349      60\n350      50\n351      20\n352      20\n353      50\n354      20\n355      20\n356      50\n357      50\n358      20\n359      20\n360      20\n361      60\n362      30\n363      50\n364      20\n365      50\n366      85\n367      50\n368      20\n369      60\n370      80\n371      70\n372      20\n373      80\n374      70\n375      20\n376      80\n377      20\n378      20\n379      75\n380      20\n381      60\n382      75\n383      45\n384      20\n385      20\n386      20\n387      20\n388      20\n389      80\n390      90\n391      20\n392      60\n393      80\n394     190\n395     160\n396      50\n397      20\n398      60\n399      20\n400      90\n401      70\n402      20\n403     160\n404      60\n405      60\n406     160\n407     190\n408      70\n409      70\n410      30\n411      20\n412      30\n413      50\n414      20\n415      70\n416      20\n417      60\n418      20\n419      70\n420      60\n421      20\n422      20\n423      50\n424     190\n425      75\n426     190\n427      80\n428      60\n429     120\n430     160\n431      60\n432      30\n433      85\n434      60\n435      20\n436     190\n437      90\n438      20\n439      70\n440      20\n441     190\n442      20\n443      30\n444      60\n445     190\n446      20\n447      60\n448      60\n449      60\n450      85\n451      20\n452      85\n453      20\n454     160\n455      50\n456      50\n457      70\n458     120\n459      50\n460      20\n461      20\n462      30\n463     120\n464      20\n465      60\n466      60\n467      50\n468      70\n469      60\n470      20\n471      50\n472      50\n473      20\n474      50\n475      20\n476     160\n477     160\n478      60\n479      60\n480      20\n481      60\n482      60\n483      20\n484      20\n485      20\n486      75\n487      30\n488      20\n489      60\n490      60\n491      85\n492      20\n493      70\n494      20\n495      50\n496      20\n497      50\n498      20\n499      90\n500      60\n501      30\n502      60\n503      20\n504     120\n505      60\n506      20\n507      60\n508      20\n509      60\n510      70\n511     120\n512      20\n513      40\n514      30\n515      50\n516      60\n517      20\n518      70\n519     160\n520      70\n521      20\n522      60\n523      50\n524      20\n525      20\n526      20\n527      70\n528      20\n529      60\n530      90\n531      20\n532      20\n533      50\n534      90\n535      20\n536      60\n537      20\n538      60\n539      50\n540      20\n541     120\n542     190\n543      60\n544      70\n545      20\n546      20\n547      50\n548      50\n549      20\n550      50\n551      50\n552      20\n553      20\n554      20\n555      50\n556      20\n557      20\n558      70\n559     120\n560      50\n561      20\n562     190\n563      60\n564     120\n565      80\n566      80\n567      20\n568      60\n569      50\n570      85\n571     160\n572      20\n573      70\n574      60\n575     120\n576      30\n577      20\n578     120\n579      90\n580      90\n581      30\n582     120\n583     120\n584      50\n585     160\n586      85\n587      20\n588      70\n589      20\n590      20\n591     120\n592      20\n593      20\n594      20\n595      60\n596     120\n597      20\n598      20\n599      50\n600      20\n601      60\n602     190\n603      20\n604      20\n605      20\n606      60\n607      20\n608      20\n609      60\n610      20\n611      60\n612      50\n613      60\n614      80\n615      20\n616      20\n617     160\n618     120\n619      45\n620      20\n621      20\n622      20\n623      20\n624      50\n625      20\n626      60\n627      60\n628      20\n629      50\n630      60\n631      60\n632      20\n633     190\n634     120\n635      20\n636      90\n637      20\n638      90\n639      50\n640     120\n641      60\n642      90\n643      70\n644      70\n645      60\n646      20\n647      20\n648      60\n649      70\n650      20\n651      20\n652      30\n653      50\n654      20\n655      20\n656      70\n657      80\n658      50\n659      20\n660      70\n661      60\n662      20\n663      90\n664      20\n665      20\n666      20\n667      70\n668      60\n669      20\n670      20\n671      20\n672      20\n673     160\n674      20\n675      20\n676      60\n677     180\n678      20\n679      70\n680      20\n681      70\n682      20\n683      30\n684      60\n685      20\n686      50\n687      20\n688      60\n689     190\n690     190\n691      60\n692      50\n693      20\n694      20\n695      20\n696      30\n697     160\n698      70\n699      20\n700     190\n701      80\n702      80\n703      50\n704      30\n705     190\n706      20\n707      60\n708      30\n709      20\n710      20\n711      20\n712      90\n713      50\n714      20\n715      20\n716      85\n717      50\n718      20\n719      60\n720      20\n721      20\n722      20\n723      70\n724     160\n725     120\n726      60\n727      20\n728     120\n729      80\n730      20\n731      60\n732      20\n733      20\n734      60\n735      60\n736      30\n737      20\n738      30\n739      20\n740      20\n741      20\n742      20\n743      90\n744      90\n745      20\n746      90\n747      60\n748      85\n749      20\n750      20\n751      20\n752      20\n753      80\n754      20\n755      20\n756     120\n757      20\n758      20\n759      60\n760      80\n761      80\n762      60\n763      85\n764      80\n765      90\n766     190\n767      60\n768      50\n769      20\n770      60\n771      60\n772      90\n773     190\n774      60\n775      20\n776     190\n777      80\n778      20\n779      20\n780      20\n781      20\n782      40\n783      50\n784      70\n785      50\n786      20\n787     160\n788      80\n789      60\n790      20\n791      90\n792      20\n793      20\n794      20\n795      60\n796     160\n797      30\n798      20\n799      60\n800      20\n801      60\n802      20\n803      90\n804      70\n805      60\n806     180\n807      30\n808      20\n809      20\n810      60\n811      80\n812      20\n813      20\n814      30\n815      60\n816     160\n817      50\n818      20\n819      85\n820      50\n821      50\n822     190\n823      60\n824      20\n825      20\n826      20\n827      20\n828      50\n829      20\n830      20\n831      75\n832     120\n833      20\n834      50\n835      60\n836      60\n837     120\n838      20\n839      20\n840      20\n841      20\n842     120\n843      30\n844     120\n845     120\n846     120\n847     120\n848      20\n849      20\n850      20\n851      20\n852      20\n853      50\n854      30\n855      30\n856      20\n857      20\n858     190\n859      20\n860      20\n861      90\n862      60\n863      20\n864      60\n865      20\n866      20\n867      20\n868      20\n869      70\n870      30\n871      90\n872     160\n873      30\n874      80\n875      20\n876      20\n877      85\n878      90\n879      60\n880      60\n881      20\n882      45\n883      50\n884      60\n885      30\n886      60\n887      60\n888      60\n889      60\n890      60\n891      50\n892      20\n893     190\n894      45\n895      60\n896      20\n897      60\n898      20\n899      60\n900      50\n901     190\n902      20\n903      20\n904      60\n905      20\n906     160\n907      60\n908      20\n909     120\n910     160\n911      20\n912      50\n913      20\n914      20\n915      20\n916     120\n917      60\n918      50\n919      30\n920      20\n921      20\n922      20\n923      20\n924      90\n925      30\n926      20\n927      60\n928      20\n929     120\n930      20\n931      20\n932      20\n933      50\n934      20\n935      60\n936      60\n937      50\n938      60\n939      20\n940      20\n941      60\n942      30\n943     190\n944      80\n945      50\n946      20\n947      50\n948      80\n949      20\n950     160\n951      70\n952      20\n953      60\n954      20\n955      20\n956     120\n957      20\n958      60\n959      20\n960      60\n961      85\n962      20\n963     160\n964      20\n965      50\n966      80\n967      20\n968      60\n969      60\n970      20\n971      60\n972      50\n973      20\n974      50\n975     160\n976      20\n977      20\n978      20\n979      20\n980      20\n981      50\n982      20\n983      60\n984      90\n985      20\n986      20\n987     160\n988      60\n989      60\n990      20\n991      20\n992      20\n993      20\n994      20\n995      20\n996      50\n997      20\n998      20\n999      60\n1000     20\n1001     30\n1002     20\n1003     20\n1004     60\n1005    120\n1006     60\n1007     90\n1008    120\n1009     85\n1010     50\n1011     20\n1012     20\n1013     20\n1014    120\n1015     20\n1016     90\n1017     70\n1018     20\n1019     50\n1020     60\n1021     20\n1022     30\n1023     20\n1024     20\n1025     20\n1026     70\n1027     50\n1028     20\n1029     20\n1030     60\n1031     20\n1032     60\n1033     60\n1034     20\n1035     75\n1036    120\n1037     20\n1038     20\n1039     40\n1040    160\n1041    160\n1042     50\n1043     80\n1044    120\n1045     80\n1046     20\n1047     20\n1048     80\n1049     90\n1050     20\n1051    190\n1052     20\n1053     20\n1054     50\n1055     20\n1056     60\n1057     90\n1058     20\n1059    120\n1060     20\n1061     20\n1062     30\n1063     20\n1064     50\n1065     50\n1066     90\n1067     60\n1068     70\n1069     60\n1070     60\n1071     85\n1072    120\n1073    190\n1074     90\n1075     20\n1076     50\n1077     50\n1078     20\n1079     50\n1080     20\n1081     60\n1082     20\n1083     30\n1084     20\n1085     20\n1086     50\n1087     60\n1088     45\n1089     30\n1090     70\n1091     20\n1092     60\n1093     30\n1094     20\n1095     20\n1096     60\n1097     70\n1098    190\n1099     20\n1100     20\n1101     90\n1102     20\n1103     20\n1104    120\n1105     20\n1106     80\n1107     20\n1108     20\n1109    190\n1110     20\n1111     60\n1112     70\n1113     60\n1114     85\n1115    120\n1116     30\n1117     20\n1118     20\n1119    120\n1120     30\n1121    160\n1122     20\n1123     20\n1124     80\n1125     90\n1126     60\n1127     20\n1128     20\n1129     20\n1130     20\n1131    160\n1132     20\n1133     60\n1134     75\n1135     20\n1136     20\n1137     90\n1138    160\n1139     60\n1140     60\n1141     75\n1142     20\n1143     60\n1144     20\n1145     30\n1146     60\n1147     20\n1148     20\n1149     20\n1150     20\n1151    160\n1152     20\n1153     60\n1154     20\n1155     60\n1156     20\n1157     50\n1158     20\n1159     30\n1160     60\n1161     20\n1162     20\n1163     20\n1164     20\n1165     20\n1166     90\n1167     20\n1168     60\n1169     20\n1170     60\n1171     80\n1172     20\n1173     20\n1174     20\n1175    120\n1176     50\n1177     60\n1178     30\n1179     20\n1180     50\n1181     50\n1182     20\n1183     20\n1184     20\n1185     20\n1186     20\n1187     20\n1188     20\n1189     50\n1190     20\n1191     30\n1192     20\n1193     50\n1194     20\n1195     20\n1196     20\n1197    120\n1198     20\n1199     20\n1200     20\n1201     60\n1202     60\n1203     80\n1204     50\n1205     60\n1206     20\n1207     60\n1208     20\n1209     20\n1210     20\n1211    120\n1212     70\n1213     20\n1214     20\n1215    120\n1216    120\n1217    190\n1218     20\n1219     20\n1220     30\n1221     20\n1222     20\n1223    120\n1224     20\n1225     20\n1226    160\n1227     20\n1228     60\n1229     60\n1230     60\n1231    120\n1232    120\n1233     20\n1234     50\n1235     70\n1236     60\n1237     20\n1238     60\n1239     50\n1240     60\n1241     20\n1242    120\n1243     20\n1244     60\n1245     30\n1246     45\n1247     50\n1248     20\n1249     80\n1250    120\n1251     70\n1252     20\n1253    190\n1254     20\n1255     20\n1256     90\n1257    120\n1258     20\n1259     60\n1260     50\n1261     60\n1262     60\n1263     60\n1264     60\n1265     80\n1266     60\n1267     20\n1268     20\n1269     20\n1270     90\n1271     60\n1272     60\n1273     20\n1274    160\n1275     60\n1276    120\n1277     20\n1278     60\n1279     20\n1280    120\n1281    120\n1282     20\n1283     60\n1284     60\n1285     60\n1286     60\n1287     50\n1288     20\n1289     20\n1290     50\n1291     60\n1292     30\n1293     60\n1294    160\n1295     30\n1296     20\n1297    120\n1298     20\n1299    120\n1300     60\n1301     50\n1302     50\n1303     60\n1304     80\n1305     20\n1306     80\n1307     70\n1308    120\n1309     30\n1310     20\n1311    120\n1312     70\n1313    120\n1314     60\n1315     50\n1316     60\n1317     30\n1318     70\n1319     80\n1320     60\n1321    160\n1322     20\n1323     60\n1324     20\n1325     90\n1326     80\n1327     20\n1328     50\n1329     60\n1330     60\n1331     20\n1332     50\n1333     50\n1334     60\n1335     20\n1336     20\n1337     60\n1338     20\n1339     50\n1340     70\n1341     20\n1342     60\n1343     60\n1344     80\n1345     50\n1346     20\n1347     60\n1348    180\n1349     90\n1350    120\n1351    120\n1352    160\n1353     70\n1354     20\n1355     80\n1356     30\n1357     20\n1358     20\n1359     75\n1360     70\n1361     20\n1362     20\n1363     50\n1364     50\n1365     50\n1366     90\n1367     60\n1368     20\n1369     70\n1370     20\n1371     60\n1372     30\n1373     50\n1374     30\n1375    120\n1376     70\n1377     90\n1378     60\n1379     50\n1380     20\n1381     30\n1382     60\n1383     20\n1384    190\n1385     30\n1386     85\n1387     20\n1388     20\n1389     50\n1390     60\n1391     20\n1392     60\n1393     60\n1394     50\n1395     20\n1396     20\n1397     60\n1398     20\n1399     20\n1400     90\n1401     60\n1402     20\n1403     85\n1404     20\n1405     20\n1406     20\n1407     70\n1408     20\n1409     60\n1410     90\n1411     20\n1412     20\n1413     60\n1414    120\n1415     50\n1416     80\n1417     50\n1418     20\n1419     50\n1420     20\n1421     60\n1422     50\n1423     20\n1424     60\n1425     20\n1426     60\n1427     90\n1428     20\n1429     30\n1430     60\n1431    160\n1432     90\n1433     75\n1434     60\n1435     60\n1436     60\n1437    120\n1438    120\n1439     30\n1440     50\n1441     20\n1442     20\n1443     30\n1444     70\n1445     80\n1446     20\n1447    160\n1448    120\n1449     60\n1450     60\n1451     90\n1452     50\n1453     20\n1454     50\n1455    160\n1456     60\n1457     20\n1458     20\n1459     60\n1460     60\n1461     80\n1462     20\n1463    160\n1464     20\n1465    120\n1466    190\n1467     20\n1468    160\n1469    120\n1470     85\n1471     60\n1472     70\n1473     60\n1474    120\n1475     20\n1476     20\n1477    120\n1478     80\n1479     20\n1480    120\n1481     20\n1482     90\n1483    160\n1484     70\n1485     50\n1486     50\n1487     80\n1488     50\n1489    160\n1490     50\n1491     20\n1492     20\n1493     50\n1494     20\n1495     20\n1496     20\n1497    120\n1498     85\n1499     80\n1500     20\n1501     50\n1502     20\n1503     20\n1504     20\n1505     20\n1506     20\n1507     50\n1508     50\n1509     20\n1510    160\n1511     45\n1512    120\n1513     20\n1514     20\n1515    150\n1516     20\n1517     20\n1518     20\n1519     90\n1520     20\n1521     80\n1522     60\n1523     20\n1524     20\n1525    120\n1526     80\n1527    160\n1528     50\n1529     20\n1530     20\n1531     50\n1532     20\n1533     60\n1534    160\n1535     20\n1536     80\n1537     20\n1538     85\n1539     20\n1540     60\n1541     80\n1542     60\n1543     60\n1544    180\n1545     90\n1546    120\n1547     20\n1548     20\n1549     20\n1550     60\n1551     60\n1552    160\n1553     60\n1554     20\n1555     60\n1556     60\n1557     20\n1558     20\n1559     60\n1560     20\n1561     20\n1562     80\n1563     50\n1564     50\n1565     20\n1566     90\n1567     60\n1568     50\n1569     20\n1570     20\n1571     20\n1572     60\n1573     20\n1574     20\n1575     20\n1576     20\n1577     20\n1578     20\n1579     50\n1580     20\n1581     60\n1582     60\n1583     60\n1584     90\n1585    160\n1586     50\n1587     20\n1588    120\n1589     20\n1590     80\n1591     30\n1592     60\n1593     20\n1594     90\n1595     75\n1596     30\n1597     20\n1598     20\n1599     80\n1600     50\n1601     20\n1602     60\n1603     20\n1604     60\n1605     90\n1606     60\n1607     80\n1608     80\n1609     20\n1610     80\n1611    120\n1612    120\n1613    120\n1614     50\n1615     20\n1616     20\n1617     60\n1618     60\n1619     50\n1620     90\n1621     20\n1622     20\n1623     20\n1624     20\n1625     60\n1626     60\n1627    120\n1628     30\n1629     20\n1630     60\n1631     20\n1632     20\n1633     20\n1634     20\n1635     20\n1636    120\n1637     70\n1638     30\n1639     20\n1640     50\n1641     20\n1642     20\n1643     30\n1644     20\n1645    190\n1646     80\n1647     20\n1648     20\n1649     60\n1650     20\n1651     60\n1652     60\n1653     20\n1654     20\n1655     30\n1656     20\n1657     60\n1658     70\n1659     20\n1660     20\n1661     40\n1662     60\n1663     50\n1664     60\n1665     50\n1666     20\n1667     20\n1668     60\n1669     85\n1670    120\n1671     20\n1672     20\n1673    120\n1674     60\n1675     50\n1676     20\n1677     20\n1678     20\n1679     20\n1680     60\n1681     90\n1682     70\n1683     30\n1684     20\n1685     60\n1686     90\n1687     60\n1688     70\n1689     30\n1690     60\n1691     20\n1692     60\n1693     20\n1694     50\n1695     60\n1696     20\n1697    160\n1698     70\n1699     20\n1700     60\n1701     50\n1702     60\n1703     20\n1704     20\n1705    180\n1706     20\n1707     70\n1708     20\n1709     20\n1710     20\n1711     20\n1712     70\n1713     20\n1714     20\n1715     20\n1716     30\n1717     60\n1718     20\n1719     60\n1720     30\n1721     80\n1722     30\n1723     80\n1724     60\n1725     50\n1726     20\n1727     60\n1728     60\n1729     20\n1730    160\n1731    120\n1732     60\n1733     60\n1734     20\n1735     20\n1736     30\n1737     60\n1738     20\n1739     60\n1740     20\n1741     20\n1742     60\n1743     30\n1744     60\n1745     60\n1746    120\n1747     60\n1748     60\n1749     30\n1750     60\n1751     20\n1752     45\n1753     20\n1754     30\n1755    160\n1756     50\n1757     20\n1758    120\n1759     70\n1760     80\n1761     20\n1762     60\n1763     60\n1764     60\n1765     50\n1766     20\n1767     20\n1768     60\n1769    120\n1770     20\n1771     20\n1772    160\n1773     60\n1774     20\n1775     60\n1776     70\n1777     30\n1778     80\n1779     20\n1780     60\n1781     20\n1782     70\n1783     20\n1784     20\n1785     90\n1786     60\n1787    120\n1788    160\n1789     90\n1790     20\n1791     90\n1792     20\n1793     70\n1794     50\n1795    120\n1796     60\n1797     30\n1798     20\n1799     20\n1800     60\n1801     60\n1802     60\n1803     20\n1804     70\n1805     20\n1806     20\n1807     60\n1808     80\n1809     50\n1810     60\n1811    160\n1812     60\n1813    120\n1814     50\n1815     20\n1816     60\n1817     20\n1818     50\n1819     20\n1820     60\n1821     20\n1822     60\n1823     30\n1824    120\n1825     20\n1826     30\n1827     80\n1828     20\n1829     20\n1830    160\n1831     60\n1832     60\n1833     80\n1834    160\n1835     60\n1836     20\n1837     20\n1838    160\n1839     60\n1840     20\n1841     90\n1842     30\n1843     60\n1844     45\n1845     20\n1846     20\n1847     45\n1848     50\n1849     60\n1850     60\n1851     20\n1852     20\n1853     20\n1854     20\n1855    120\n1856    120\n1857     20\n1858     20\n1859     90\n1860     20\n1861     30\n1862     30\n1863     20\n1864     60\n1865     20\n1866     60\n1867     20\n1868     60\n1869     20\n1870     50\n1871     60\n1872    120\n1873     80\n1874     60\n1875     20\n1876     50\n1877     20\n1878     90\n1879     60\n1880     20\n1881    120\n1882     60\n1883     60\n1884     60\n1885     20\n1886     20\n1887     20\n1888    160\n1889     90\n1890    160\n1891     20\n1892     50\n1893     30\n1894     20\n1895     20\n1896     60\n1897     75\n1898     20\n1899     60\n1900     60\n1901     60\n1902     50\n1903     60\n1904     20\n1905     50\n1906     80\n1907     20\n1908     60\n1909     60\n1910     60\n1911     50\n1912    120\n1913     85\n1914    120\n1915     45\n1916     50\n1917     20\n1918     50\n1919     20\n1920     50\n1921     20\n1922     50\n1923     20\n1924     60\n1925     20\n1926     20\n1927     20\n1928     30\n1929     20\n1930     60\n1931     60\n1932     85\n1933     60\n1934     20\n1935     20\n1936     20\n1937     20\n1938     20\n1939     75\n1940     20\n1941     60\n1942     20\n1943     20\n1944     20\n1945     50\n1946     20\n1947     80\n1948     90\n1949     60\n1950     20\n1951     20\n1952     30\n1953    120\n1954     60\n1955     20\n1956     80\n1957     60\n1958    180\n1959     80\n1960     60\n1961     50\n1962    120\n1963     60\n1964     20\n1965    190\n1966     90\n1967     60\n1968     50\n1969     20\n1970     60\n1971     50\n1972    190\n1973     60\n1974    190\n1975     20\n1976     60\n1977     60\n1978     70\n1979     20\n1980     80\n1981    180\n1982    180\n1983     20\n1984     20\n1985     60\n1986     60\n1987    120\n1988     20\n1989     20\n1990     60\n1991     90\n1992     80\n1993     70\n1994     70\n1995     20\n1996     50\n1997     60\n1998     20\n1999     50\n2000     20\n2001     60\n2002     20\n2003     20\n2004    160\n2005     50\n2006    160\n2007    160\n2008     90\n2009     20\n2010     30\n2011     20\n2012     60\n2013     60\n2014    120\n2015     20\n2016     20\n2017     30\n2018     60\n2019     60\n2020     60\n2021     60\n2022     20\n2023    120\n2024     60\n2025     60\n2026     70\n2027     90\n2028     20\n2029     20\n2030     50\n2031     20\n2032     80\n2033    120\n2034     20\n2035     30\n2036     60\n2037     20\n2038     80\n2039    160\n2040     50\n2041     60\n2042     50\n2043     70\n2044     60\n2045     20\n2046     20\n2047     30\n2048     50\n2049     20\n2050     60\nName: MS SubClass, dtype: int64'