# Getting started

We'll install `keras-pandas`

```bash
pip install -U keras-pandas
```

In [1]:
from keras import Model
from keras.layers import Dense

from keras_pandas.Automater import Automater
from keras_pandas.lib import load_titanic

  from ._conv import register_converters as _register_converters
Using TensorFlow backend.


## Data

Let's say we want to look at the the [titanic data set](https://www.kaggle.com/c/titanic/data)

In [4]:
observations = load_titanic()
observations.head(2)

Unnamed: 0,survived,pclass,name,sex,age,siblings_spouses_aboard,parents_children_aboard,fare
0,0,3,Mr. Owen Harris Braund,male,22.0,1,0,7.25
1,1,1,Mrs. John Bradley (Florence Briggs Thayer) Cum...,female,38.0,1,0,71.2833


## Model

And that we're interested in building a model, using `keras-pandas`. 

We'd start by creating an automater:

In [7]:
# Transform the data set, using keras_pandas
categorical_vars = ['pclass', 'sex', 'survived']
numerical_vars = ['age', 'siblings_spouses_aboard', 'parents_children_aboard', 'fare']
text_vars = ['name']

auto = Automater(categorical_vars=categorical_vars, numerical_vars=numerical_vars, text_vars=text_vars,
                response_var='survived')

# Transform the data set
X, y = auto.fit_transform(observations)
X, y

([array([2., 0., 2., 0., 2., 2., 0., 2., 2., 1., 2., 0., 2., 2., 2., 1., 2.,
         1., 2., 2., 1., 1., 2., 0., 2., 2., 2., 0., 2., 2., 0., 0., 2., 1.,
         0., 0., 2., 2., 2., 2., 2., 1., 1., 2., 2., 2., 2., 2., 2., 2., 2.,
         0., 1., 0., 0., 1., 2., 1., 2., 2., 0., 0., 2., 0., 2., 1., 2., 2.,
         2., 1., 2., 1., 2., 2., 2., 2., 2., 1., 2., 2., 2., 2., 0., 1., 2.,
         2., 2., 0., 2., 2., 2., 0., 2., 2., 2., 0., 0., 1., 1., 2., 2., 0.,
         2., 2., 2., 2., 2., 2., 2., 0., 2., 2., 2., 2., 2., 2., 1., 0., 2.,
         1., 2., 1., 1., 0., 2., 2., 2., 2., 2., 2., 2., 2., 1., 1., 1., 0.,
         0., 2., 0., 2., 2., 2., 2., 1., 1., 2., 2., 1., 1., 1., 0., 2., 2.,
         2., 0., 2., 2., 2., 2., 2., 1., 2., 2., 2., 2., 0., 2., 0., 2., 0.,
         2., 2., 2., 0., 2., 2., 0., 1., 2., 2., 1., 2., 1., 2., 0., 2., 0.,
         2., 2., 1., 1., 2., 1., 0., 0., 2., 2., 2., 1., 2., 2., 2., 2., 2.,
         2., 2., 2., 2., 0., 2., 1., 2., 1., 2., 0., 2., 1., 0., 1., 2., 1.,

And then using that automater to train a model:

In [9]:
# Start model with provided input nub
x = auto.input_nub

# Fill in your own hidden layers
x = Dense(32)(x)
x = Dense(32, activation='relu')(x)
x = Dense(32)(x)

# End model with provided output nub
x = auto.output_nub(x)

model = Model(inputs=auto.input_layers, outputs=x)
model.compile(optimizer='Adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# Train model
model.fit(X, y, epochs=4, validation_split=.2)

Train on 709 samples, validate on 178 samples
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4


<keras.callbacks.History at 0x11c9d9790>