# Decision Tree Model
Use scikit learn decision tree models to evalute effectiveness for climbing data

In [19]:
import pandas as pd

In [21]:
train=pd.read_csv('filtered_data/categorized_data.csv')
train_df=pd.DataFrame(train)
train_df.head()

Unnamed: 0.1,Unnamed: 0,expid,myear,fname,lname,sex,calcage,citizen,status,leader,...,totmembers,smtmembers,mdeaths,o2used,pkgroup,pkname,heightm,heightf,lat,long
0,0,ANN180101,1980,Wolfgang,Broeg,1,32,171,60,0,...,8,4,0,True,0,Annapurna I,8091,26545,28.596111,83.820278
1,1,ANN180101,1980,Gustav,Harder,1,32,171,236,1,...,8,4,0,True,0,Annapurna I,8091,26545,28.596111,83.820278
2,2,ANN180101,1980,Nikolaus (Klaus),Harder,1,35,171,60,0,...,8,4,0,True,0,Annapurna I,8091,26545,28.596111,83.820278
3,3,ANN180101,1980,Erika,Heimrath,0,30,171,60,0,...,8,4,0,True,0,Annapurna I,8091,26545,28.596111,83.820278
4,4,ANN180101,1980,Thomas (Flo),Hummler,1,26,171,60,0,...,8,4,0,True,0,Annapurna I,8091,26545,28.596111,83.820278


In [23]:
train_df.columns

Index(['Unnamed: 0', 'expid', 'myear', 'fname', 'lname', 'sex', 'calcage',
       'citizen', 'status', 'leader', 'deputy', 'sherpa', 'tibetan',
       'msuccess', 'msolo', 'mo2used', 'death', 'peakid', 'year', 'season',
       'nation', 'leaders', 'sponsor', 'success', 'totmembers', 'smtmembers',
       'mdeaths', 'o2used', 'pkgroup', 'pkname', 'heightm', 'heightf', 'lat',
       'long'],
      dtype='object')

## Create Decision Tree Model

In [24]:
from sklearn import tree
import numpy as np
from sklearn.model_selection import train_test_split
import graphviz 
import pydotplus
import sklearn
import pickle

In [25]:
# Create the Decision Tree Classifier
clf = tree.DecisionTreeClassifier()

In [26]:
# Split the columns to separate the features from the result/target data
features = train_df[['myear','sex','calcage','citizen','status','leader','deputy','sherpa','tibetan','msolo','mo2used',
                     'pkgroup','season','nation','leaders','sponsor','totmembers','smtmembers','o2used']]
target = train_df['msuccess'].astype('str')

# Split the data into training and testing sets
features_train, features_test, target_train, target_test = train_test_split(features, target, random_state=41)

In [27]:
# Train the model
clf.fit(features_train, target_train)

DecisionTreeClassifier(class_weight=None, criterion='gini', max_depth=None,
            max_features=None, max_leaf_nodes=None,
            min_impurity_decrease=0.0, min_impurity_split=None,
            min_samples_leaf=1, min_samples_split=2,
            min_weight_fraction_leaf=0.0, presort=False, random_state=None,
            splitter='best')

In [29]:
# Plot the Decision Tree
dot_data = tree.export_graphviz(
   clf, out_file=None,
   feature_names=['myear','sex','calcage','citizen','status','leader','deputy','sherpa','tibetan','msolo','mo2used',
                     'pkgroup','season','nation','leaders','sponsor','totmembers','smtmembers','o2used'],
   class_names=list(target.unique()),  
   filled=True, rounded=True,  
   special_characters=True)  

In [30]:
# Save the graphic representation of the tree into an image file
graph = pydotplus.graph_from_dot_data(dot_data)
graph.write_png("SummitSuccess.png")

# Display the tree
graph = graphviz.Source(dot_data)  

dot: graph is too large for cairo-renderer bitmaps. Scaling by 0.212535 to fit



In [31]:
# Score the model on the training data
clf.score(features_train, target_train)

0.9939821539738535

In [32]:
features_test

Unnamed: 0,myear,sex,calcage,citizen,status,leader,deputy,sherpa,tibetan,msolo,mo2used,pkgroup,season,nation,leaders,sponsor,totmembers,smtmembers,o2used
21483,2006,1,48,151,85,0,0,0,0,0,0,3,1,78,529,883,25,0,True
22927,2007,1,32,89,219,0,0,1,0,0,1,3,1,53,2708,1306,4,2,True
31609,2012,1,34,128,60,0,0,0,0,0,1,1,1,62,1929,-1,3,0,True
28029,2010,1,35,10,60,0,0,0,0,0,0,1,3,27,2108,510,12,0,False
6386,1990,1,22,46,60,0,0,0,0,0,1,3,3,25,2081,1110,11,0,True
11915,1992,0,22,104,60,0,0,0,0,0,0,7,3,59,1469,2209,13,3,False
740,1996,1,0,89,219,0,0,1,0,0,0,0,3,9,1983,574,8,0,False
12549,1998,1,0,89,219,0,0,1,0,0,0,3,3,80,480,2070,1,0,False
9656,1990,1,22,123,60,0,0,0,0,0,0,4,1,59,177,3246,10,0,False
30912,2012,1,48,29,60,0,0,0,0,0,1,0,1,16,2749,1008,2,2,True


In [33]:
# Predict the bins for the test data
p = clf.predict(features_test)
for i in range(0, len(p)):
    print(p[i] == target_test.tolist()[i], p[i], target_test.tolist()[i])

True False False
False False True
True False False
True False False
True False False
True False False
True False False
True False False
True False False
True True True
True False False
True False False
True False False
True False False
True False False
True True True
True True True
True False False
True True True
True False False
False False True
True True True
False True False
False True False
False True False
True True True
True True True
True False False
True False False
True False False
True False False
True False False
True True True
True True True
True False False
True True True
True False False
True True True
True False False
True False False
True False False
True False False
True True True
True False False
True False False
True False False
False True False
True False False
True False False
True False False
False False True
True False False
True False False
True True True
True True True
True False False
True False False
True False False
True True True
True False False
True False

False False True
True False False
True False False
True True True
True False False
True True True
False False True
True False False
True False False
False True False
True False False
True True True
True True True
True False False
True False False
True True True
True False False
True False False
True True True
True False False
True False False
True True True
True False False
True True True
True True True
True False False
True False False
True True True
True True True
True False False
True False False
True False False
True True True
True True True
True False False
True True True
True False False
True True True
False False True
True True True
True True True
True False False
False False True
False False True
True False False
True False False
True False False
True True True
True True True
True True True
True False False
True True True
True False False
True False False
True False False
True False False
False False True
True False False
True False False
True False False
True False False
True 

True False False
False False True
True True True
True True True
True True True
False False True
True True True
False False True
True True True
True True True
False False True
True True True
True False False
True False False
True False False
True True True
True False False
True True True
True True True
False False True
False False True
True False False
True True True
True False False
True False False
True False False
True False False
True True True
True False False
True True True
True True True
True False False
True False False
True True True
True False False
True True True
True False False
True False False
True False False
True True True
True False False
True False False
True False False
True False False
False False True
True True True
True False False
True False False
True False False
True False False
True False False
True False False
True False False
True False False
True True True
True False False
True True True
True False False
True False False
True True True
True False False
False

False True False
True False False
True True True
True False False
True True True
True True True
True False False
True False False
True False False
True False False
True True True
True True True
True False False
True True True
True True True
False True False
True False False
True True True
False True False
True True True
True False False
True True True
True False False
True False False
False True False
True False False
True True True
True True True
True True True
True False False
True True True
True False False
True True True
True False False
True True True
True False False
True False False
True False False
False True False
True False False
True False False
True False False
True False False
True True True
True True True
True True True
True False False
False False True
True False False
True False False
False True False
True False False
True False False
True False False
True True True
True False False
True False False
True False False
True False False
True False False
True False False
Tru

True False False
True False False
True False False
True False False
True True True
False False True
True True True
True False False
True True True
True False False
True False False
True True True
False False True
True True True
True False False
True True True
True True True
True False False
True False False
True False False
True False False
True False False
True False False
True False False
False False True
False False True
True False False
True False False
True True True
True False False
False False True
True True True
True False False
False True False
True True True
True False False
True False False
False True False
True True True
False True False
True False False
True False False
False True False
True True True
True True True
True True True
True False False
True True True
True True True
True False False
True True True
False False True
True False False
True True True
True True True
True True True
True False False
True False False
False False True
True True True
False False True
True 

False True False
False True False
True False False
True True True
False True False
True False False
False True False
True False False
True False False
True True True
True False False
True False False
False False True
True True True
False True False
False False True
True True True
True False False
True False False
True False False
True True True
True False False
True True True
True False False
True True True
True True True
True False False
True True True
True True True
True True True
True False False
True True True
True False False
True True True
True False False
False True False
True False False
True True True
True True True
True True True
False True False
True True True
True True True
True True True
True False False
True False False
True False False
True False False
True True True
True False False
True False False
True False False
True True True
True False False
True True True
True True True
True False False
True True True
True True True
True False False
False False True
False False T

True True True
True True True
True True True
True False False
True True True
True True True
True True True
True False False
True False False
True False False
True False False
True False False
True True True
True True True
False False True
True True True
False False True
True True True
True False False
True False False
True False False
True False False
True False False
True False False
True True True
True False False
True False False
True True True
True False False
False False True
True True True
True False False
True True True
True False False
True True True
True False False
True False False
True False False
False False True
True False False
True False False
True True True
True True True
True False False
True False False
True False False
True False False
False True False
True False False
True True True
False True False
True True True
True True True
True True True
False False True
True False False
True False False
False True False
True True True
True False False
True False False
True Fa

True False False
False True False
True False False
True True True
True False False
True False False
False True False
True False False
True False False
True False False
True False False
True True True
False True False
True False False
True True True
True True True
True False False
True False False
True True True
True False False
True True True
True False False
True False False
True True True
True False False
True True True
False False True
True False False
True True True
False True False
True False False
True False False
True False False
True False False
True False False
True False False
True True True
True False False
True False False
True False False
True False False
True True True
True False False
True False False
True False False
True True True
True False False
False False True
True False False
True True True
True False False
False True False
True True True
True False False
False False True
True True True
True True True
True False False
True False False
True False False
True True Tr

True False False
True True True
True False False
False True False
True False False
True False False
True True True
True False False
True True True
True False False
True True True
True True True
True True True
True False False
True True True
True False False
True False False
False True False
True False False
True False False
True False False
False True False
True True True
False False True
True False False
True False False
True False False
True False False
False True False
True False False
True False False
True False False
True False False
False False True
True True True
False False True
True True True
True False False
True False False
True False False
False False True
True True True
True False False
True False False
True True True
True False False
False True False
False True False
True True True
True False False
True True True
True True True
False False True
True False False
True False False
False False True
True False False
True False False
True True True
True True True
True False Fal

True False False
True False False
True False False
True False False
True True True
True False False
True True True
True False False
True True True
True True True
True True True
True False False
True False False
True True True
True False False
True False False
True True True
True True True
True False False
True False False
True False False
True False False
True False False
False True False
True False False
True False False
True False False
True False False
True False False
True False False
True True True
True False False
True True True
True True True
False True False
True False False
True False False
True True True
True True True
True False False
True False False
True True True
False False True
True False False
True False False
True True True
True True True
True True True
False True False
True False False
False False True
True True True
False True False
True True True
True True True
False True False
False True False
True False False
True True True
True True True
False False True
True Fa

True False False
True False False
True True True
True False False
False False True
True True True
False False True
True False False
True False False
False True False
True True True
True True True
True False False
True False False
False True False
True True True
True True True
True True True
True False False
True False False
True False False
True False False
True False False
True False False
True True True
True True True
True True True
True False False
True False False
True False False
False True False
True False False
True True True
True False False
True False False
True False False
True True True
True False False
True False False
False True False
True False False
True False False
True False False
True False False
True False False
True False False
True False False
False True False
True True True
True False False
True False False
True False False
True False False
True False False
True False False
True False False
True False False
False False True
True True True
False False True
True Fal

True False False
True True True
False True False
True True True
True False False
True True True
False False True
True True True
True True True
True False False
True False False
True False False
True False False
True False False
False False True
False True False
True True True
True False False
True False False
True False False
True False False
True False False
True False False
True False False
True False False
True False False
True True True
False False True
True False False
True False False
True False False
True True True
True False False
True False False
False False True
False False True
True False False
True False False
True True True
True False False
True False False
True False False
False False True
True False False
True True True
True False False
True False False
True True True
True True True
True True True
True True True
True False False
True False False
True True True
False False True
True False False
True True True
True False False
True False False
True True True
True False Fal

True False False
True False False
True False False
True False False
True False False
True True True
True False False
True False False
True True True
True False False
True False False
True True True
True False False
True False False
True False False
False False True
True False False
True False False
False True False
True False False
True True True
False True False
True True True
True False False
True False False
False True False
True True True
True True True
True True True
True True True
True True True
True False False
True False False
True False False
True False False
False False True
True True True
True True True
False False True
True True True
True False False
True True True
True False False
True False False
True True True
True True True
False True False
True True True
True False False
False True False
True True True
True False False
True True True
True False False
False False True
False True False
True False False
True False False
True False False
True False False
True False False
T

True False False
True True True
True False False
True True True
True True True
True False False
True False False
True False False
True False False
True False False
True True True
True True True
True True True
True True True
True False False
True False False
True True True
True True True
True False False
True False False
True False False
False False True
True False False
True False False
True False False
False True False
True False False
True False False
True False False
True True True
False False True
True False False
True False False
True False False
True False False
True False False
True False False
True True True
True False False
True True True
False True False
True False False
True True True
False True False
True False False
True False False
True False False
True False False
True True True
True False False
True False False
True True True
True True True
True False False
True False False
True True True
True False False
True False False
True False False
True False False
True False Fal

In [34]:
# Score the model on the test data
clf.score(features_test, target_test)

0.8614857854326624

In [35]:
# Check the accuracy score for the predicted values
sklearn.metrics.accuracy_score(target_test,p)

0.8614857854326624

In [36]:
# Save the model to a file
filename = "SummitDecisionTree.pkl"
pickle.dump(clf, open(filename, "wb"))

In [37]:
# load the model from disk
loaded_clf = pickle.load(open(filename, "rb"))

In [38]:
loaded_clf.score(features_test, target_test)

0.8614857854326624