In [1]:
import csv
import itertools
import operator
import numpy as np
import nltk
import sys
from datetime import datetime
from utils import *
import pickle

import matplotlib.pyplot as plt
%matplotlib inline

In [2]:

# Download NLTK model data (you need to do this once)# Downl 
# nltk.download("book")

In [3]:
vocabulary_size = 8000
unknown_token = "UNKNOWN_TOKEN"
sentence_start_token = "SENTENCE_START"
sentence_end_token = "SENTENCE_END"

# Read the data and append SENTENCE_START and SENTENCE_END tokens
print "Reading CSV file..."
with open('textfile.txt', 'rb') as f:
    reader = csv.reader(f, skipinitialspace=True)
    reader.next()
    # Split full comments into sentences
    sentences = itertools.chain(*[nltk.sent_tokenize(x[0].decode('utf-8').lower()) for x in reader])
    # Append SENTENCE_START and SENTENCE_END
    sentences = ["%s %s %s" % (sentence_start_token, x, sentence_end_token) for x in sentences]
print "Parsed %d sentences." % (len(sentences))
    
# Tokenize the sentences into words
tokenized_sentences = [nltk.word_tokenize(sent) for sent in sentences]

# Count the word frequencies
word_freq = nltk.FreqDist(itertools.chain(*tokenized_sentences))
print "Found %d unique words tokens." % len(word_freq.items())

# Get the most common words and build index_to_word and word_to_index vectors
vocab = word_freq.most_common(vocabulary_size-1)
index_to_word = [x[0] for x in vocab]
index_to_word.append(unknown_token)
word_to_index = dict([(w,i) for i,w in enumerate(index_to_word)])

print "Using vocabulary size %d." % vocabulary_size
print "The least frequent word in our vocabulary is '%s' and appeared %d times." % (vocab[-1][0], vocab[-1][1])

# Replace all words not in our vocabulary with the unknown token
for i, sent in enumerate(tokenized_sentences):
    tokenized_sentences[i] = [w if w in word_to_index else unknown_token for w in sent]

print "\nExample sentence: '%s'" % sentences[0]
print "\nExample sentence after Pre-processing: '%s'" % tokenized_sentences[0]

Reading CSV file...
Parsed 79170 sentences.
Found 65440 unique words tokens.
Using vocabulary size 8000.
The least frequent word in our vocabulary is 'fortunately' and appeared 10 times.

Example sentence: 'SENTENCE_START i joined a new league this year and they have different scoring rules than i'm used to. SENTENCE_END'

Example sentence after Pre-processing: '[u'SENTENCE_START', u'i', u'joined', u'a', u'new', u'league', u'this', u'year', u'and', u'they', u'have', u'different', u'scoring', u'rules', u'than', u'i', u"'m", u'used', u'to', u'.', u'SENTENCE_END']'


In [4]:
# Create the training data
X_train = np.asarray([[word_to_index[w] for w in sent[:-1]] for sent in tokenized_sentences])
y_train = np.asarray([[word_to_index[w] for w in sent[1:]] for sent in tokenized_sentences])


In [5]:
X_train1 = []
for element in X_train:
    X_train2 = []
    for element1 in element:
        X_train2.append([element1])
    X_train1.append(X_train2)

In [13]:
for i in X_train1:
    print(len(i))

20
10
28
18
24
15
27
9
25
16
45
15
8
32
7
3
7
10
11
19
21
28
17
13
17
6
3
16
9
11
25
35
12
5
7
12
20
12
11
14
25
10
19
19
32
21
30
12
38
25
19
24
14
7
15
6
30
10
14
22
44
11
8
14
18
9
5
72
32
38
8
43
54
7
25
63
12
16
8
13
7
13
9
14
33
23
13
17
41
33
36
63
13
14
27
10
15
14
24
23
18
12
12
7
11
19
10
9
6
7
25
25
43
8
17
21
28
3
21
21
5
6
16
11
19
6
5
9
30
27
19
13
37
7
10
30
17
15
14
16
26
12
5
30
28
9
11
15
30
16
7
7
15
35
15
26
19
29
22
10
7
11
5
28
35
16
23
16
31
13
29
33
32
26
4
19
27
22
7
17
26
20
20
23
45
35
16
37
13
29
15
21
23
2
30
14
5
49
19
38
6
18
31
9
26
18
14
20
20
13
30
11
28
17
20
14
8
23
21
12
25
29
26
7
31
19
18
12
10
31
44
31
29
46
23
15
23
22
3
18
19
23
18
25
33
38
13
16
12
16
7
39
14
7
26
34
12
7
13
5
15
18
16
8
16
15
19
12
31
43
30
13
10
41
55
18
17
7
33
18
11
30
12
20
38
24
21
30
33
25
48
44
32
37
26
36
128
55
52
2
8
21
19
18
23
27
15
8
15
11
11
11
21
12
47
12
26
50
3
28
23
24
14
14
14
8
14
14
17
8
26
12
28
25
16
16
12
13
17
14
22
12
22
17
29
14
13
22
24
11
6
11
49


12
23
49
11
29
12
14
6
11
16
60
23
16
11
20
18
22
17
2
23
9
20
8
16
27
25
14
6
27
6
15
49
21
9
12
25
5
13
17
33
15
16
26
31
18
31
39
36
45
12
22
14
25
21
14
53
33
27
9
18
9
18
23
11
12
15
37
29
29
15
38
4
20
20
10
27
46
17
11
6
4
15
20
24
25
34
50
38
30
21
25
69
23
44
15
12
9
30
18
10
45
20
9
12
15
27
13
4
29
17
25
30
24
24
14
9
12
12
13
8
19
17
11
19
9
21
55
31
31
16
18
17
19
23
2
29
49
23
3
12
34
11
35
39
17
45
24
10
9
8
43
18
6
21
23
26
18
8
18
9
27
23
18
23
13
11
28
30
14
47
33
13
32
49
164
44
22
18
9
21
41
27
19
19
26
4
25
47
61
20
42
20
33
11
35
9
49
7
36
57
8
26
28
20
9
106
36
9
7
19
25
14
27
11
8
7
19
32
21
12
32
14
30
36
24
17
11
14
12
10
11
8
26
35
26
34
34
22
15
24
34
32
18
9
14
16
7
17
25
20
26
20
21
23
4
33
34
13
24
19
36
14
21
45
28
17
8
18
44
6
13
31
24
57
19
27
5
27
18
19
25
8
7
11
24
20
35
21
11
10
8
15
24
9
27
15
11
25
21
22
17
37
8
16
28
25
26
22
44
4
31
11
12
22
18
21
12
25
18
16
21
31
16
18
17
19
23
2
19
23
15
10
14
19
26
31
5
30
11
34
39
22
23
36
25
12
37
33
38
26

26
26
17
46
5
21
13
23
43
26
25
11
21
16
29
15
27
18
20
26
24
26
22
39
21
35
28
19
38
16
33
15
26
10
10
15
16
12
55
43
14
7
26
26
5
19
42
20
5
42
35
27
12
13
23
36
10
50
11
18
19
25
17
21
13
6
3
9
9
8
12
17
5
15
10
22
20
3
19
16
9
28
31
35
17
20
18
19
18
17
19
13
23
2
30
17
5
6
9
20
24
20
13
20
13
9
24
6
9
13
15
26
20
10
15
12
43
9
23
14
31
13
31
3
8
29
55
8
24
17
34
19
17
6
7
34
19
8
19
20
9
29
9
16
10
8
9
15
12
7
15
41
26
26
26
22
12
18
30
17
25
53
23
8
20
16
37
22
19
22
18
27
27
9
26
5
9
11
5
10
10
8
8
9
13
7
15
7
22
14
8
17
8
11
21
24
13
12
52
10
5
16
30
28
34
24
25
9
4
25
17
24
12
9
12
15
10
15
16
6
9
17
29
28
8
21
12
14
10
14
23
16
26
32
49
16
28
28
19
21
18
11
17
19
15
12
22
14
23
26
7
71
18
49
19
21
28
11
25
24
6
12
31
9
8
9
70
41
78
40
17
26
26
23
23
35
14
24
13
20
25
18
15
8
2
16
28
8
13
8
13
8
13
8
35
8
20
9
7
8
3
25
13
23
5
11
15
39
33
32
10
3
15
17
27
21
21
25
5
20
14
72
53
25
24
16
19
26
40
27
47
73
34
18
14
21
19
7
25
23
23
20
11
16
21
7
11
19
13
5
10
27
13
15
26
5
15
16

45
27
13
14
25
21
11
28
21
9
16
18
11
12
48
69
7
18
42
19
8
9
6
7
52
34
39
3
16
14
16
5
22
36
45
28
22
25
6
8
15
23
4
51
4
24
15
17
17
45
6
49
57
57
21
36
26
12
17
14
25
3
30
39
5
23
19
9
8
5
13
15
19
28
6
15
29
16
7
30
42
23
11
43
4
12
11
6
18
6
33
33
28
7
17
9
44
9
4
35
12
24
25
18
19
34
5
10
4
27
76
4
14
10
28
14
19
8
10
22
26
30
9
11
15
23
24
22
9
16
32
23
20
17
5
11
24
18
27
14
16
21
26
22
23
25
13
19
21
14
18
42
18
10
11
13
28
29
26
37
11
11
25
25
30
68
29
10
33
35
22
39
12
14
10
2
2
53
27
21
7
14
40
13
17
13
21
24
29
12
8
48
15
14
15
27
16
15
21
23
2
40
13
42
61
38
10
33
7
5
48
17
30
24
23
41
21
21
16
11
5
17
24
19
23
26
8
19
13
13
52
13
32
14
18
27
13
12
10
24
16
16
46
55
25
27
19
43
15
21
11
9
23
34
27
27
21
16
19
65
9
20
33
25
48
24
13
23
2
19
26
19
13
23
2
5
5
15
17
21
27
26
12
18
9
8
10
23
9
16
18
14
14
16
9
22
16
61
19
16
39
23
27
19
68
58
19
24
17
25
26
24
4
22
17
31
10
22
9
18
9
31
10
18
32
24
8
44
18
28
32
35
4
32
7
4
5
11
22
14
8
40
15
22
21
17
13
48
30
31
27
21
21
25


17
5
46
21
29
25
38
81
22
14
50
25
25
8
20
23
17
25
32
13
7
26
29
45
27
10
43
3
5
19
8
30
25
14
5
7
20
26
20
13
18
29
14
38
32
13
26
17
3
4
12
21
10
13
19
18
17
15
10
23
11
23
24
20
18
18
11
4
46
34
32
21
25
34
8
13
2
2
27
26
4
17
20
25
52
13
26
42
7
40
16
22
36
18
5
11
21
21
28
22
5
34
28
25
56
17
22
23
31
39
44
19
21
20
20
8
28
39
24
21
33
38
4
11
11
35
24
51
59
54
8
59
29
15
11
20
35
20
10
25
19
7
29
23
2
11
12
6
41
4
49
45
14
32
8
36
11
16
24
13
19
22
15
26
26
3
59
29
24
20
19
10
13
23
2
26
20
14
7
12
29
31
17
27
7
30
15
32
20
12
7
14
6
25
30
27
7
20
19
18
15
15
14
12
3
9
3
3
13
24
22
39
27
11
23
6
18
61
26
40
22
26
30
22
22
23
10
11
8
8
18
20
9
6
17
8
5
5
13
12
9
15
14
7
25
14
17
17
31
16
19
22
27
16
31
16
18
17
19
23
2
33
14
26
20
10
15
45
66
47
6
16
12
12
16
24
28
52
18
24
19
15
23
56
24
27
31
27
9
9
13
38
20
15
10
17
17
7
4
9
9
20
21
30
26
14
27
18
16
13
25
14
18
16
4
23
22
20
7
12
46
4
58
21
10
38
14
14
11
18
3
14
15
26
6
16
34
10
26
23
31
10
8
11
21
12
8
8
13
55
34
13
46
17
1

28
26
27
11
27
13
16
20
13
13
15
5
28
10
33
26
14
10
18
12
3
22
28
28
24
23
28
9
19
11
24
11
24
10
24
11
23
17
12
18
16
18
7
16
29
12
25
10
15
14
14
43
13
20
18
36
15
55
23
23
9
5
11
5
9
10
9
11
20
25
29
24
45
29
11
16
7
32
34
24
49
3
11
6
53
37
33
7
35
18
18
24
34
18
52
10
17
31
5
21
25
29
5
7
11
28
6
11
27
12
28
15
8
12
22
34
23
24
12
7
17
10
19
6
10
11
28
37
17
18
19
72
29
39
46
74
21
19
17
9
15
16
118
15
29
11
14
22
30
160
19
13
58
3
8
11
7
16
9
3
16
3
9
15
30
11
30
30
20
4
36
56
46
37
32
24
27
20
25
19
51
16
17
37
10
49
25
6
16
21
6
39
20
7
32
9
23
5
7
9
37
9
29
23
3
4
6
18
5
33
25
40
38
14
9
14
18
9
24
9
34
21
8
21
15
15
39
5
19
15
23
10
26
9
9
12
12
25
18
14
25
11
5
22
13
48
3
21
29
40
30
12
26
15
18
14
22
12
11
28
6
33
12
13
12
18
23
16
22
20
21
18
11
8
8
34
16
15
14
11
16
24
9
26
12
15
27
14
21
19
6
14
13
6
14
12
14
17
6
8
5
4
7
9
24
12
17
15
31
8
16
24
6
32
32
13
6
27
10
6
6
19
37
11
27
30
6
15
37
18
13
23
6
15
19
21
25
28
21
24
17
17
20
37
30
12
13
13
15
7
12
13
9
16
39
6
18

4
26
9
25
21
29
15
30
15
31
3
20
30
32
35
15
31
11
6
15
12
29
9
15
24
46
5
5
12
24
9
10
18
36
19
16
12
21
14
3
20
17
28
37
35
36
59
25
11
9
8
22
27
29
4
37
19
16
27
32
8
22
37
30
11
37
27
26
27
34
23
25
25
23
20
64
37
22
20
32
17
33
16
36
17
37
12
18
8
64
25
29
33
21
22
22
34
21
13
21
43
40
14
27
30
13
23
11
13
8
20
18
20
32
7
4
12
17
6
30
10
58
13
26
29
64
27
9
48
4
50
38
16
39
17
41
10
17
16
8
15
17
25
27
18
20
30
12
17
16
29
10
13
34
5
15
31
14
19
11
13
3
67
9
46
4
19
17
6
8
7
20
10
26
16
37
43
8
7
8
11
15
11
9
14
15
8
11
8
9
22
13
15
13
16
9
10
11
20
8
3
28
34
16
25
27
20
16
25
15
24
22
23
15
33
15
29
2
31
6
6
28
24
18
28
9
10
10
10
36
18
5
5
22
39
20
12
8
60
14
3
15
15
10
19
28
34
19
13
29
4
6
43
11
19
8
22
24
3
20
12
21
20
22
13
7
47
11
44
14
9
23
15
21
8
29
18
10
23
19
15
12
12
23
23
9
21
8
16
21
26
23
26
28
15
12
8
13
16
32
7
37
12
27
64
32
24
10
17
44
8
18
15
24
13
13
8
18
12
31
16
12
20
192
37
12
30
34
45
20
23
16
37
15
28
21
24
26
35
25
39
4
16
8
17
16
6
27
12
7
12
33
25
12


41
17
38
10
13
17
19
9
20
15
9
28
8
30
60
29
42
12
61
11
18
12
21
23
18
20
32
23
30
6
52
8
15
27
16
9
31
6
35
20
11
24
30
16
10
7
34
21
9
22
15
9
14
9
12
22
12
10
18
12
31
11
18
13
35
27
41
17
20
45
23
3
13
23
2
14
28
18
6
38
13
38
5
62
16
13
21
22
13
24
23
43
39
13
50
20
9
25
21
19
19
14
12
11
8
16
27
25
24
22
14
21
9
36
22
20
41
13
8
15
31
19
7
8
13
18
8
20
11
10
15
21
15
33
19
12
12
14
21
15
16
35
18
31
17
10
8
6
3
21
37
16
12
27
9
9
16
16
22
12
39
11
32
12
26
34
16
19
29
18
7
9
15
10
35
31
12
31
56
10
18
22
12
17
17
39
14
15
20
34
17
17
33
10
11
14
12
5
16
10
4
16
7
27
9
26
9
22
16
17
9
16
21
16
14
29
15
3
6
22
13
13
13
8
26
8
22
502
29
17
15
12
26
24
17
12
24
19
5
9
9
18
28
10
5
48
6
26
33
22
20
11
23
9
16
15
37
8
6
18
15
13
13
15
32
21
22
22
27
53
11
22
11
10
7
8
18
16
10
7
7
18
17
6
21
18
39
11
24
10
33
9
9
18
37
13
14
23
17
41
31
21
28
5
23
4
15
3
30
17
8
12
6
3
10
9
28
10
4
27
3
9
14
11
13
28
24
11
10
24
18
23
19
17
6
2
115
20
11
43
9
6
16
19
11
18
12
15
15
17
47
40
19
23
18
3

7
8
52
32
19
30
25
16
10
21
27
11
12
9
20
6
13
22
14
5
5
9
16
18
32
14
16
33
40
22
21
8
17
22
18
25
16
17
16
33
30
28
34
24
21
24
15
29
8
24
14
20
19
15
35
29
6
30
23
20
30
8
9
16
26
17
17
22
33
8
14
15
12
8
27
9
22
5
20
7
2
25
15
18
7
17
20
21
12
8
11
9
12
19
19
35
11
8
19
20
24
10
23
56
19
29
4
51
6
29
5
14
13
23
2
50
27
27
47
14
41
6
10
30
44
18
7
27
8
29
15
33
18
9
19
20
21
23
53
50
11
8
8
19
8
3
32
20
15
12
19
20
35
20
24
13
8
27
9
37
20
7
38
22
5
34
19
20
40
20
19
19
13
22
8
9
64
24
7
14
15
10
9
22
6
32
35
20
72
16
19
14
7
23
4
46
29
11
46
34
13
16
23
2
11
52
29
24
16
2
22
22
29
15
28
20
35
9
5
20
17
29
48
27
27
47
19
26
27
11
65
6
18
23
12
23
13
19
27
31
30
14
38
34
12
28
17
21
3
31
22
57
25
14
27
47
7
11
25
19
23
7
20
8
51
33
16
8
9
34
8
3
27
43
17
7
46
32
5
38
18
4
27
20
7
21
9
18
24
23
7
35
49
13
9
33
11
28
20
14
34
36
8
24
18
7
3
25
7
57
17
20
18
23
21
30
17
43
22
12
29
18
9
11
13
18
22
35
19
28
24
19
13
12
35
15
20
8
20
14
8
11
57
13
31
20
8
24
21
29
24
15
36
12
10
12
25
14

32
12
19
35
12
6
12
37
34
35
14
20
25
42
27
20
28
19
17
39
8
12
18
8
12
24
16
31
15
18
33
9
19
38
66
14
13
13
22
8
26
14
15
27
20
5
13
17
21
14
19
14
13
25
17
17
29
14
15
18
24
13
27
37
23
50
6
8
16
7
24
37
27
11
9
11
15
23
30
10
38
28
19
11
16
31
13
32
15
11
3
4
16
13
9
4
14
27
3
22
16
53
27
22
12
24
16
14
8
30
24
19
19
20
20
15
13
13
6
14
30
9
35
10
22
17
21
17
16
15
10
6
8
8
10
13
14
40
16
13
22
11
19
22
15
15
11
15
6
14
5
20
10
16
3
9
15
17
19
4
30
23
2
38
28
5
13
14
17
20
21
29
8
50
21
8
13
30
35
27
11
34
16
16
27
14
17
6
7
15
40
15
4
8
17
11
6
58
24
9
25
14
10
4
25
53
40
27
47
34
21
43
17
31
22
11
18
32
29
25
31
36
25
19
10
7
33
20
26
10
30
31
19
15
24
47
27
34
31
41
27
16
26
28
37
9
9
20
7
23
27
34
10
20
6
14
8
5
5
11
7
43
14
11
41
14
25
8
22
43
27
27
47
4
19
27
13
26
10
13
39
18
25
8
26
18
39
23
9
8
18
8
27
17
8
3
23
35
16
47
38
19
28
38
13
22
9
15
12
44
30
20
15
15
3
14
33
3
9
43
65
33
34
19
29
23
52
12
8
7
20
32
17
20
12
20
26
33
30
22
7
16
26
17
26
30
10
6
35
19
7
21
16
55
3

25
70
3
31
11
5
14
34
17
19
51
25
10
31
6
24
38
25
4
17
22
29
13
22
19
6
14
10
5
24
29
28
21
17
33
40
10
15
17
13
21
40
74
17
21
10
6
10
30
14
2
10
20
41
14
37
23
19
20
21
48
18
10
23
18
4
41
20
31
65
12
14
13
24
15
27
43
17
18
16
17
3
22
32
11
11
5
7
8
9
12
39
17
11
14
48
4
25
27
46
42
21
12
19
11
12
17
24
11
28
9
39
30
36
17
47
53
119
9
16
23
30
23
24
28
7
123
31
22
226
43
39
7
16
20
11
17
16
34
20
19
39
19
47
37
21
13
32
17
29
41
8
11
42
29
10
9
10
22
4
25
22
13
32
5
30
8
55
23
13
8
32
31
29
13
13
24
19
17
18
11
13
56
9
9
56
14
19
19
40
8
12
23
12
27
51
17
3
3
9
47
17
24
12
13
37
3
64
29
27
17
26
19
26
14
9
16
20
19
14
28
20
11
26
33
9
13
13
42
4
11
17
5
20
87
23
31
34
27
35
15
25
44
24
27
8
169
17
24
10
20
11
14
22
17
5
49
24
7
17
15
11
29
2
3
10
6
11
59
39
26
41
33
26
29
18
34
19
24
30
37
24
4
6
17
7
12
23
5
86
38
7
11
21
7
3
18
16
11
12
31
21
11
27
39
18
7
5
12
12
11
15
26
33
18
10
3
5
7
19
9
9
9
14
3
8
34
25
19
32
18
31
65
5
28
17
27
15
28
12
10
26
9
11
33
42
29
14
2
10
12
13
9


17
24
10
20
11
14
22
17
5
8
57
29
12
12
25
6
50
22
10
16
31
19
24
20
16
9
14
12
4
10
20
13
22
6
34
13
9
24
37
19
9
24
43
19
28
17
21
10
16
16
4
5
36
26
23
8
4
14
16
38
41
17
19
35
26
25
4
11
22
15
8
20
25
28
21
19
12
19
20
13
10
21
13
27
24
14
16
22
12
25
24
38
31
26
33
19
22
17
37
19
28
3
46
47
21
20
26
31
9
42
16
34
23
13
5
18
21
20
13
14
28
17
12
11
24
30
28
15
18
16
26
6
37
12
38
23
26
60
12
35
32
18
21
17
18
41
21
24
14
22
68
13
23
2
37
20
8
16
21
16
28
14
7
11
47
26
12
16
18
16
31
27
8
24
25
24
27
9
15
8
14
19
20
24
7
45
31
8
12
8
26
13
21
9
12
4
17
25
14
24
29
17
33
10
19
49
39
3
10
34
4
27
18
19
16
13
10
12
15
6
33
10
27
24
39
11
12
27
7
13
22
12
39
30
23
21
19
69
19
69
47
8
14
33
5
27
30
16
18
17
9
13
13
3
3
49
35
30
8
21
41
5
29
12
12
14
22
23
2
8
15
50
36
19
18
15
9
5
12
22
9
22
29
16
36
25
10
13
26
33
8
7
13
10
40
20
21
25
66
10
15
11
20
35
20
10
25
19
7
29
23
2
13
11
9
16
10
14
17
6
11
13
32
24
4
13
11
21
29
24
13
10
12
19
22
8
15
33
17
10
5
15
11
58
12
5
40
20
10
3
26
20


23
4
10
9
30
4
16
23
6
22
34
20
11
6
21
37
14
12
13
21
8
7
36
19
17
7
4
10
18
17
57
14
31
3
4
20
3
6
16
18
12
13
25
3
16
15
8
53
7
16
39
12
20
20
13
16
5
16
17
20
18
20
14
23
22
6
5
4
22
21
11
12
28
29
22
16
34
12
22
14
22
5
14
8
41
48
6
38
8
15
11
11
32
18
12
28
12
20
22
16
35
14
20
16
10
3
8
8
17
29
6
24
31
44
22
14
6
22
16
14
51
16
12
25
14
22
9
2
12
24
9
23
26
38
7
13
8
13
26
19
21
17
24
24
34
20
21
30
13
42
29
8
41
5
33
27
15
21
11
5
15
3
5
8
6
19
4
13
31
27
15
33
40
123
48
26
47
21
23
17
12
17
6
9
5
16
26
7
12
16
20
12
8
24
8
15
32
3
3
6
8
24
9
7
32
18
18
16
10
68
72
37
14
7
30
33
24
26
30
7
12
34
8
11
31
33
19
32
39
35
7
16
26
8
14
20
36
8
11
18
26
30
29
11
12
18
27
15
14
22
30
34
8
6
23
23
18
58
7
27
19
10
8
50
52
6
19
12
20
20
39
29
85
32
4
9
37
5
44
24
18
26
12
13
16
9
11
14
6
17
13
21
17
33
17
7
18
37
8
18
20
9
6
30
36
22
16
29
53
25
19
27
60
56
36
62
49
4
37
4
8
17
10
51
30
13
23
2
9
21
12
11
37
29
8
32
9
16
8
5
16
14
24
10
11
31
17
25
21
45
6
14
9
26
7
35
37
11
28
10
17
20

23
11
9
24
7
17
12
13
25
34
28
33
71
16
25
37
33
20
30
25
46
47
7
17
19
15
8
37
33
20
3
7
6
20
20
14
10
25
38
44
19
4
11
22
13
34
7
25
29
11
28
31
20
11
22
6
41
32
36
11
9
30
11
31
27
9
32
55
137
13
26
25
19
37
19
9
19
10
10
21
11
12
14
26
17
27
7
7
8
13
13
19
31
18
19
27
25
14
17
12
7
20
15
13
15
23
19
14
7
17
23
23
14
22
12
13
21
26
27
37
9
31
8
19
22
39
34
14
9
11
36
70
12
14
27
9
21
22
12
10
17
22
16
17
15
16
15
23
16
8
15
11
16
19
14
11
7
8
14
7
4
13
21
4
14
6
28
11
10
23
21
24
16
8
8
7
13
16
13
14
19
16
20
25
25
32
14
12
12
51
12
4
7
10
12
10
9
22
26
20
4
19
30
45
26
19
41
14
19
8
26
30
35
13
42
29
13
23
2
45
3
49
14
27
23
13
16
9
6
24
31
5
26
21
40
26
26
22
29
46
10
22
20
4
16
8
8
11
29
35
5
3
23
24
74
3
18
17
25
16
33
65
27
17
18
19
33
20
16
15
40
31
26
18
36
15
21
15
12
27
14
22
17
3
18
25
69
41
21
9
7
22
10
3
25
48
27
30
20
6
19
9
23
20
3
15
18
8
35
10
26
11
14
12
11
17
36
17
31
34
17
14
12
25
8
3
14
11
23
21
10
10
34
50
11
13
12
31
13
23
2
10
19
15
21
11
27
4
4
9
39
36
21
12

40
20
32
19
29
21
24
18
47
36
27
17
17
27
6
10
65
26
17
3
4
8
13
37
14
10
26
7
3
6
16
23
15
34
14
35
11
21
11
25
20
46
19
17
26
16
20
18
23
28
16
11
10
5
48
19
3
14
21
4
20
33
9
4
15
19
16
38
22
17
16
19
15
30
17
5
42
11
13
19
5
6
23
21
17
13
49
22
71
9
7
11
12
34
6
26
23
16
9
14
20
13
13
15
15
15
7
22
13
23
17
18
20
21
3
38
18
10
64
27
21
9
11
19
7
25
25
20
20
56
19
31
13
23
37
31
22
8
15
38
12
38
16
44
6
13
31
23
16
10
6
20
6
25
19
22
20
68
32
9
7
26
18
30
9
8
19
27
16
13
4
4
4
20
22
14
14
19
18
25
15
5
14
10
17
11
8
15
30
4
9
16
43
32
11
17
47
39
38
18
6
50
41
32
16
27
22
10
12
6
17
33
34
28
19
12
5
6
11
34
20
10
9
12
9
4
40
50
51
25
14
29
16
24
9
53
39
11
35
26
22
9
32
20
9
29
23
22
19
30
29
21
21
26
18
13
13
23
17
16
30
3
6
5
18
7
25
7
14
11
14
23
10
17
9
3
4
8
21
10
3
15
8
58
7
7
25
12
21
21
26
34
14
49
16
8
25
17
4
3
12
31
6
9
15
17
9
11
2
21
8
19
33
89
37
10
33
11
27
14
27
34
33
47
17
39
10
38
8
17
19
9
27
29
34
23
15
16
3
15
29
33
43
28
17
28
50
9
25
27
13
45
10
22
14
28
16
31

72
35
22
15
17
19
24
14
18
16
17
8
10
4
34
17
16
30
10
14
15
8
12
15
13
18
13
11
12
9
3
3
4
15
8
9
13
23
14
5
26
8
22
4
21
25
32
18
21
11
29
14
21
25
18
15
17
11
27
12
26
27
19
22
26
20
29
22
32
30
16
28
49
27
22
26
21
26
14
21
5
16
14
12
12
25
11
13
11
19
12
23
9
36
47
75
27
31
14
18
11
20
9
19
28
5
15
7
6
6
17
7
44
4
21
8
10
26
11
26
21
21
9
24
32
17
6
13
31
13
4
20
13
21
7
11
13
18
20
24
6
11
16
19
25
18
13
11
34
24
44
18
20
17
9
8
20
19
12
10
14
9
12
35
26
38
21
14
12
21
20
10
17
27
9
16
3
19
26
10
19
13
17
28
14
9
8
36
36
15
24
28
11
8
16
12
7
10
9
17
18
11
42
13
21
21
15
24
23
21
18
18
44
41
21
28
27
27
32
19
4
13
24
23
21
29
8
46
41
5
8
58
43
12
17
51
94
15
23
15
51
13
10
13
16
16
13
34
40
11
17
18
19
31
38
32
20
39
30
29
7
22
23
47
66
31
16
18
17
19
23
2
29
17
8
22
16
9
17
9
16
9
19
9
17
26
47
35
22
7
13
11
8
17
9
6
34
20
13
24
17
62
24
28
14
14
3
10
3
15
3
26
3
27
3
20
21
54
13
23
2
49
11
24
14
24
18
26
17
12
26
8
28
3
6
3
20
46
24
49
37
24
6
9
16
21
18
30
14
37
65
28
32
24
13

3
8
67
68
22
52
32
8
58
67
12
27
32
24
18
119
13
14
23
15
28
18
7
47
48
39
6
44
15
12
9
17
27
14
13
14
11
19
17
20
10
27
9
10
12
8
23
29
10
14
38
10
4
16
37
24
31
35
26
9
20
46
4
11
24
22
21
20
19
25
7
22
8
12
24
24
13
18
33
20
44
8
15
7
18
18
7
11
23
15
12
3
2
5
38
11
12
17
44
57
58
28
33
10
21
27
17
17
14
10
36
41
14
72
17
18
24
13
29
10
12
8
21
11
50
14
8
20
12
14
19
7
20
31
6
9
20
25
21
34
11
10
18
48
76
31
27
33
38
31
12
13
38
12
18
28
26
31
18
39
158
43
25
21
7
19
14
60
17
18
7
14
5
6
38
21
21
17
46
37
29
29
24
55
48
24
20
19
13
23
2
46
9
66
10
13
10
36
16
39
34
27
10
18
16
56
7
30
19
5
47
85
17
20
16
13
21
28
5
53
8
33
59
14
53
9
25
19
32
30
44
21
24
11
25
16
7
4
4
21
15
12
41
39
8
22
26
14
28
35
8
41
46
17
6
22
10
18
4
10
8
8
28
36
13
16
17
26
17
20
16
29
22
8
6
19
21
24
23
16
32
30
60
3
19
18
16
14
13
12
6
16
18
13
25
36
20
29
39
12
11
20
16
36
23
40
13
17
18
22
6
7
39
3
23
18
16
28
34
39
15
26
16
7
7
14
19
43
13
45
28
50
33
16
40
19
40
3
40
17
23
33
35
30
9
46
16
3
6
15
15
19

14
6
44
13
12
17
33
14
8
15
20
17
15
50
21
17
12
17
13
18
8
50
19
19
26
21
6
6
41
15
43
16
17
26
8
13
22
24
15
7
15
11
27
8
12
24
15
30
31
20
35
20
3
29
34
22
36
7
10
10
7
14
8
47
18
30
33
57
18
30
12
14
20
3
63
17
17
22
18
18
39
6
21
20
28
31
15
58
39
31
37
5
16
21
11
26
20
10
15
16
8
18
11
11
14
21
9
8
7
38
47
21
14
62
43
15
10
65
28
25
11
18
17
12
42
25
27
28
18
7
6
30
41
60
29
15
18
48
12
21
55
47
60
17
27
40
37
18
18
50
12
20
7
9
171
20
16
22
25
41
27
24
61
6
40
12
10
14
33
13
21
8
14
25
15
20
22
20
14
10
17
30
14
32
6
9
37
9
14
30
24
29
4
5
27
101
8
16
22
34
20
16
76
12
19
18
15
15
27
19
8
29
14
18
24
9
18
20
21
24
11
28
22
19
21
30
19
10
19
13
10
13
16
14
24
40
34
32
8
39
8
20
3
8
28
23
22
33
76
35
18
15
11
27
22
60
22
18
26
44
14
12
23
12
5
7
23
13
39
11
3
26
16
3
3
23
15
16
29
10
22
16
10
4
10
29
13
16
27
26
10
33
14
18
54
27
25
21
232
24
27
8
19
36
37
17
30
38
23
29
9
35
37
27
30
31
23
21
19
31
32
33
28
32
17
25
13
23
2
25
10
7
25
10
4
20
25
16
138
18
15
10
16
16
7
7
23
19
22

17
36
40
17
4
5
13
25
97
19
33
12
35
30
11
39
23
25
50
27
8
25
15
24
16
25
23
18
19
8
30
32
6
23
25
8
23
33
36
29
14
39
12
14
20
18
14
15
16
15
36
28
10
10
23
26
27
12
19
12
46
19
37
31
11
18
11
8
9
31
44
4
34
8
22
22
11
21
14
30
8
13
9
39
5
28
33
24
19
15
9
7
62
14
10
23
8
21
11
45
30
33
17
15
15
22
6
10
10
35
35
5
8
3
11
33
5
20
15
19
19
47
17
4
46
29
11
46
34
13
16
23
2
4
6
67
7
54
8
6
19
19
21
6
13
37
3
4
9
19
12
20
16
22
18
12
6
6
12
20
22
16
28
18
11
43
16
16
25
30
23
28
16
35
23
10
11
8
27
31
26
9
21
19
17
20
10
14
22
30
23
25
9
18
51
15
7
10
29
3
12
2
32
21
34
21
33
33
28
19
13
8
34
13
13
9
20
13
11
16
15
22
10
14
17
36
30
15
14
20
12
41
9
10
20
21
15
16
12
18
5
10
23
8
31
25
44
16
10
16
14
64
12
21
7
8
21
36
40
13
8
10
10
9
29
8
14
9
40
29
26
33
25
5
33
25
18
10
13
41
23
14
14
34
37
22
36
10
24
3
48
23
3
39
77
3
22
19
31
18
13
26
24
11
17
4
3
16
59
23
12
18
32
29
44
17
14
5
31
20
26
29
13
33
16
18
21
7
19
13
18
50
11
5
5
7
6
4
17
19
17
27
18
16
26
37
26
20
6
13
23
2
20
11
22
8

21
23
9
6
12
20
13
12
23
12
8
8
20
19
15
11
14
18
30
31
20
17
39
32
21
13
41
21
17
2
16
27
38
29
17
38
14
14
9
39
8
33
11
7
10
18
24
46
5
48
22
21
37
38
38
26
26
35
3
22
23
35
36
5
4
25
20
10
9
10
6
5
8
24
28
10
25
32
24
37
21
53
16
36
9
24
15
13
24
14
20
17
13
12
12
21
2
14
32
11
14
13
17
14
23
37
26
27
9
27
22
34
23
5
33
17
26
31
25
22
77
11
17
18
36
18
15
17
8
12
18
13
15
3
3
10
18
7
9
4
8
7
12
15
17
44
6
26
31
17
14
16
43
12
11
9
9
11
10
17
9
17
60
47
14
10
35
10
18
18
21
5
15
12
13
12
11
29
11
3
26
21
9
13
13
11
25
13
30
135
32
24
10
30
17
16
14
36
47
23
2
5
33
36
6
13
10
19
6
6
30
15
8
29
39
17
14
23
16
10
22
18
10
15
21
34
27
33
27
29
39
11
32
24
12
15
15
13
8
6
20
13
27
14
24
25
30
19
9
11
21
13
15
3
6
13
39
3
7
8
47
10
18
15
18
29
13
28
26
14
16
12
26
14
17
12
12
32
34
9
33
17
13
11
27
29
62
34
33
15
17
10
16
36
45
33
13
24
17
29
18
5
8
19
8
6
3
17
11
48
5
22
22
8
21
16
10
11
9
13
11
24
13
21
6
18
13
14
13
5
8
18
9
15
14
5
7
35
12
25
19
25
28
36
30
35
18
29
19
8
19
19
14
32
17

10
7
10
53
29
38
20
23
33
21
47
47
25
15
14
12
14
13
32
28
30
63
9
22
15
21
29
14
32
45
15
38
20
9
11
15
27
44
14
7
4
30
11
29
8
10
20
15
19
6
5
8
9
3
5
6
12
5
11
13
10
18
19
17
14
23
2
3
49
11
15
7
5
29
16
12
17
10
12
17
17
26
3
49
9
3
45
19
29
14
27
10
4
9
7
9
8
3
10
11
6
7
11
9
19
30
35
31
19
17
11
66
42
10
14
41
47
41
27
5
20
13
25
7
5
14
25
8
9
7
37
23
20
34
12
25
21
22
14
19
13
32
15
20
5
14
15
44
27
28
5
35
4
9
41
3
11
39
35
13
24
5
9
19
9
7
23
7
14
18
35
20
21
18
14
18
27
15
11
35
34
10
43
9
4
26
13
13
27
24
40
30
31
69
34
5
12
18
18
31
65
27
16
10
14
21
4
11
29
18
7
5
6
25
21
19
7
32
22
24
26
23
7
7
15
29
16
10
7
31
38
5
15
17
21
9
21
15
14
19
4
13
14
25
15
24
22
14
39
50
4
9
42
17
66
25
35
28
34
29
46
27
16
31
8
16
37
7
8
16
16
8
7
14
26
6
9
22
7
21
29
12
13
15
27
7
33
9
37
15
23
15
25
21
33
16
31
8
2
37
18
10
9
4
7
24
12
20
20
19
54
16
22
38
38
34
23
43
5
22
35
6
45
25
42
19
23
22
24
46
13
36
28
12
18
28
31
22
14
5
59
7
36
13
40
10
24
42
49
33
21
33
18
5
24
30
24
11
15
33
25

27
29
18
32
14
16
7
20
11
33
44
14
24
18
26
17
14
26
12
14
13
22
10
29
13
20
21
3
27
24
56
51
33
19
6
29
30
21
8
15
10
15
23
13
12
17
20
26
21
75
27
47
89
6
8
21
14
14
12
9
7
9
15
14
8
10
21
20
24
39
14
31
16
18
17
19
23
2
11
4
32
25
17
13
6
15
25
27
37
15
76
27
35
15
26
24
24
13
47
9
43
24
4
43
46
29
11
8
6
37
22
31
8
21
20
18
26
8
7
45
42
19
24
14
23
37
46
21
20
8
54
36
20
30
39
35
14
14
24
9
9
11
3
8
5
6
4
78
16
11
8
24
18
36
26
22
16
8
4
4
12
8
4
14
6
9
4
8
12
14
6
12
5
8
6
12
15
6
10
5
9
37
16
20
25
16
19
8
40
17
25
12
24
19
21
45
28
13
12
15
21
9
19
10
15
10
9
9
10
15
3
10
18
11
9
20
21
17
15
2
16
14
29
7
21
22
22
21
18
25
27
14
8
10
33
24
7
23
34
27
13
23
2
23
34
27
13
23
2
51
56
14
22
11
33
30
17
19
21
14
10
20
3
5
12
21
18
28
4
26
40
15
3
15
8
12
8
15
20
17
3
8
23
22
28
5
38
9
33
25
17
6
43
21
45
16
14
15
22
35
16
29
12
10
5
4
6
12
18
28
13
10
19
5
20
32
7
25
10
14
20
6
5
19
10
16
18
46
20
68
4
7
10
24
43
11
13
18
17
23
19
15
14
19
21
16
24
16
14
21
13
25
22
8
24
25
20
10
8
35

15
14
7
15
35
28
37
17
18
19
72
29
39
13
10
27
24
40
27
11
6
10
11
13
14
18
15
3
12
32
15
20
266
12
11
11
5
12
6
20
13
12
32
22
19
27
14
10
14
14
8
32
33
28
12
22
3
10
20
23
16
9
27
14
22
16
29
6
32
36
21
33
6
40
76
34
19
43
28
39
44
8
14
10
53
18
16
25
12
22
32
5
29
20
17
50
7
16
19
13
19
27
16
44
23
17
17
23
37
25
15
5
12
10
15
32
13
6
33
51
18
40
4
39
16
4
7
8
23
18
8
26
45
22
6
36
15
20
14
36
19
46
15
8
19
8
11
23
10
27
24
46
19
14
24
5
12
14
15
3
15
23
2
44
11
12
12
35
12
14
12
15
19
12
20
17
8
4
24
42
30
25
24
6
4
7
34
16
24
7
20
33
24
16
31


In [7]:
pickle.dump(X_train1[:10000],open("train_text",'wb'))
pickle.dump(X_train1[10000:20000],open("test_text",'wb'))

In [None]:
check = 10
for i in X_train:
    if max(i) < check:
        check = max(i)

In [None]:
check