In [1]:
import numpy as np
import pandas as pd
import time
from IPython.core.debugger import set_trace
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from gensim.parsing.preprocessing import STOPWORDS
from gensim.parsing.preprocessing import remove_stopwords

In [2]:
data_frame = pd.read_csv('../data/job_train.csv')
data_frame.dropna()
data_frame.head(5)

Unnamed: 0,title,location,description,requirements,telecommuting,has_company_logo,has_questions,fraudulent
0,Architect (Middleware - MQ) - Kuwait,"KW, KU,","On behalf of our client, a well known multinat...",-Working technical knowledge of IT systems and...,0,1,0,0
1,Interviewing Now for Sales Rep Positions -- wi...,"US, TX, Corpus Christi","We are Argenta Field Solutions, a rapidly expa...",#NAME?,0,1,0,0
2,Process Controls Staff Engineer - Foxboro I/A ...,"US, TX, USA Southwest",Experienced Process Controls Staff Engineer is...,At least 10 years of degreed professional expe...,0,0,0,0
3,Experienced Telemarketer Wanted - Digital Solu...,"AU, NSW,",If you have a passion for people and love to s...,"Responsibilities - Prospecting, following up a...",0,1,0,0
4,Senior Network Engineer,"GB, ENG, London",As the successful Senior Network Engineer you ...,Essential skills:•Juniper switching/routing/se...,0,1,0,0


In [3]:
data_frame.columns

Index(['title', 'location', 'description', 'requirements', 'telecommuting',
       'has_company_logo', 'has_questions', 'fraudulent'],
      dtype='object')

In [4]:
data_frame.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8940 entries, 0 to 8939
Data columns (total 8 columns):
 #   Column            Non-Null Count  Dtype 
---  ------            --------------  ----- 
 0   title             8940 non-null   object
 1   location          8783 non-null   object
 2   description       8939 non-null   object
 3   requirements      7614 non-null   object
 4   telecommuting     8940 non-null   int64 
 5   has_company_logo  8940 non-null   int64 
 6   has_questions     8940 non-null   int64 
 7   fraudulent        8940 non-null   int64 
dtypes: int64(4), object(4)
memory usage: 558.9+ KB


In [5]:
data_frame.isnull().sum()

title                  0
location             157
description            1
requirements        1326
telecommuting          0
has_company_logo       0
has_questions          0
fraudulent             0
dtype: int64

In [6]:
#cleaning missing values in the columns

#location
data_frame['location'] = data_frame.location.fillna('none')

#description
data_frame['description'] = data_frame.description.fillna('not specified')

#requirements
data_frame['requirements'] = data_frame.description.fillna('not specified')

#drop unnecassary columns
data_frame.drop(['telecommuting','has_questions'],axis = 1, inplace = True)

#mapping fraudulent to T and F, where there is  0 and 1 respectively
data_frame['has_company_logo'] = data_frame.has_company_logo.map({1 : 't', 0 : 'f'})
data_frame['fraudulent'] = data_frame.fraudulent.map({1 : 't', 0 : 'f'})

In [7]:
data_frame.isnull().sum()

title               0
location            0
description         0
requirements        0
has_company_logo    0
fraudulent          0
dtype: int64

In [8]:
data_frame.head()

Unnamed: 0,title,location,description,requirements,has_company_logo,fraudulent
0,Architect (Middleware - MQ) - Kuwait,"KW, KU,","On behalf of our client, a well known multinat...","On behalf of our client, a well known multinat...",t,f
1,Interviewing Now for Sales Rep Positions -- wi...,"US, TX, Corpus Christi","We are Argenta Field Solutions, a rapidly expa...","We are Argenta Field Solutions, a rapidly expa...",t,f
2,Process Controls Staff Engineer - Foxboro I/A ...,"US, TX, USA Southwest",Experienced Process Controls Staff Engineer is...,Experienced Process Controls Staff Engineer is...,f,f
3,Experienced Telemarketer Wanted - Digital Solu...,"AU, NSW,",If you have a passion for people and love to s...,If you have a passion for people and love to s...,t,f
4,Senior Network Engineer,"GB, ENG, London",As the successful Senior Network Engineer you ...,As the successful Senior Network Engineer you ...,t,f


In [9]:
#remove any unnecassary web tags in the data set
data_frame['title'] = data_frame.title.str.replace(r'<[^>]*>', '')
data_frame['description'] = data_frame.description.str.replace(r'<[^>]*>', '')
data_frame['requirements'] = data_frame.requirements.str.replace(r'<[^>]*>', '')

In [10]:
data_frame.head()

Unnamed: 0,title,location,description,requirements,has_company_logo,fraudulent
0,Architect (Middleware - MQ) - Kuwait,"KW, KU,","On behalf of our client, a well known multinat...","On behalf of our client, a well known multinat...",t,f
1,Interviewing Now for Sales Rep Positions -- wi...,"US, TX, Corpus Christi","We are Argenta Field Solutions, a rapidly expa...","We are Argenta Field Solutions, a rapidly expa...",t,f
2,Process Controls Staff Engineer - Foxboro I/A ...,"US, TX, USA Southwest",Experienced Process Controls Staff Engineer is...,Experienced Process Controls Staff Engineer is...,f,f
3,Experienced Telemarketer Wanted - Digital Solu...,"AU, NSW,",If you have a passion for people and love to s...,If you have a passion for people and love to s...,t,f
4,Senior Network Engineer,"GB, ENG, London",As the successful Senior Network Engineer you ...,As the successful Senior Network Engineer you ...,t,f


In [11]:
# removing the characters in data set that are not words and has white spaces 
for column in data_frame.columns:
    data_frame[column] = data_frame[column].str.replace(r'\W', ' ').str.replace(r'\s$','')

In [12]:
data_frame.head()

Unnamed: 0,title,location,description,requirements,has_company_logo,fraudulent
0,Architect Middleware MQ Kuwait,KW KU,On behalf of our client a well known multinat...,On behalf of our client a well known multinat...,t,f
1,Interviewing Now for Sales Rep Positions wi...,US TX Corpus Christi,We are Argenta Field Solutions a rapidly expa...,We are Argenta Field Solutions a rapidly expa...,t,f
2,Process Controls Staff Engineer Foxboro I A ...,US TX USA Southwest,Experienced Process Controls Staff Engineer is...,Experienced Process Controls Staff Engineer is...,f,f
3,Experienced Telemarketer Wanted Digital Solu...,AU NSW,If you have a passion for people and love to s...,If you have a passion for people and love to s...,t,f
4,Senior Network Engineer,GB ENG London,As the successful Senior Network Engineer you ...,As the successful Senior Network Engineer you ...,t,f


In [13]:
# mapping back the columns to original binary values
#data_frame['has_company_logo'] = data_frame.has_company_logo.map({'t': 1, 'f':0})
data_frame['fraudulent'] = data_frame.fraudulent.map({'t': 1, 'f':0})

In [14]:
data_frame

Unnamed: 0,title,location,description,requirements,has_company_logo,fraudulent
0,Architect Middleware MQ Kuwait,KW KU,On behalf of our client a well known multinat...,On behalf of our client a well known multinat...,t,0
1,Interviewing Now for Sales Rep Positions wi...,US TX Corpus Christi,We are Argenta Field Solutions a rapidly expa...,We are Argenta Field Solutions a rapidly expa...,t,0
2,Process Controls Staff Engineer Foxboro I A ...,US TX USA Southwest,Experienced Process Controls Staff Engineer is...,Experienced Process Controls Staff Engineer is...,f,0
3,Experienced Telemarketer Wanted Digital Solu...,AU NSW,If you have a passion for people and love to s...,If you have a passion for people and love to s...,t,0
4,Senior Network Engineer,GB ENG London,As the successful Senior Network Engineer you ...,As the successful Senior Network Engineer you ...,t,0
...,...,...,...,...,...,...
8935,Financial Analyst,GR I Paiania,Financial analysis reporting and review of de...,Financial analysis reporting and review of de...,t,0
8936,Customer Service Associate Part Time,CA ON Peterborough,The Customer Service Associate will be based i...,The Customer Service Associate will be based i...,t,0
8937,Sales Manager,UA 61 Ternopil,Responsibilitiesactive sales realization of c...,Responsibilitiesactive sales realization of c...,f,0
8938,Administrative Assistant,US CA Santa Ana,In addition to clerical and administrative du...,In addition to clerical and administrative du...,f,1


In [15]:
all_gensim_stop_words = STOPWORDS
print(all_gensim_stop_words)

frozenset({'thereby', 'hers', 'five', 'i', 'somehow', 'sincere', 'third', 'forty', 'perhaps', 'almost', 'my', 'where', 'call', 'once', 'anywhere', 'mill', 'otherwise', 'besides', 'anyone', 'before', 'whereupon', 'ltd', 'only', 'bottom', 'keep', 'is', 'interest', 'somewhere', 'myself', 'four', 'rather', 'among', 'latterly', 'part', 'name', 'any', 'than', 'why', 'one', 'thin', 'also', 'say', 'de', 'full', 'until', 'upon', 'ever', 'never', 'found', 'various', 'there', 'much', 'out', 'each', 'no', 'still', 'please', 'same', 'whether', 'this', 'eight', 'always', 'anything', 'thick', 'not', 'ourselves', 'everything', 'wherein', 'namely', 'though', 'towards', 'last', 'hundred', 'others', 'has', 'our', 'km', 'onto', 'he', 'ours', 'whereas', 'up', 'whoever', 'first', 'do', 'just', 'doesn', 'whatever', 'would', 'being', 'someone', 'it', 'con', 'put', 'you', 'whom', 'every', 'down', 'between', 'again', 'amongst', 'regarding', 'own', 'how', 'cannot', 'detail', 'although', 'her', 'less', 'herself',

In [16]:
data_frame.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8940 entries, 0 to 8939
Data columns (total 6 columns):
 #   Column            Non-Null Count  Dtype 
---  ------            --------------  ----- 
 0   title             8940 non-null   object
 1   location          8940 non-null   object
 2   description       8940 non-null   object
 3   requirements      8940 non-null   object
 4   has_company_logo  8940 non-null   object
 5   fraudulent        8940 non-null   int64 
dtypes: int64(1), object(5)
memory usage: 419.2+ KB


In [17]:
data_frame.head()

Unnamed: 0,title,location,description,requirements,has_company_logo,fraudulent
0,Architect Middleware MQ Kuwait,KW KU,On behalf of our client a well known multinat...,On behalf of our client a well known multinat...,t,0
1,Interviewing Now for Sales Rep Positions wi...,US TX Corpus Christi,We are Argenta Field Solutions a rapidly expa...,We are Argenta Field Solutions a rapidly expa...,t,0
2,Process Controls Staff Engineer Foxboro I A ...,US TX USA Southwest,Experienced Process Controls Staff Engineer is...,Experienced Process Controls Staff Engineer is...,f,0
3,Experienced Telemarketer Wanted Digital Solu...,AU NSW,If you have a passion for people and love to s...,If you have a passion for people and love to s...,t,0
4,Senior Network Engineer,GB ENG London,As the successful Senior Network Engineer you ...,As the successful Senior Network Engineer you ...,t,0


In [18]:
def clean_all_columns(column_name):
    data_frame[column_name] = data_frame[column_name].apply(lambda x: " ".join([i for i in x.lower().split() if i not in all_gensim_stop_words]))

In [19]:
#text_columns = ['title', 'location', 'description', 'requirements', 'has_company_logo']
#data_frame.drop(['fraudulent'],axis = 1, inplace = True)

text_columns = list(data_frame.columns.values)
text_columns.remove('fraudulent')
#print(text_columns)
set_trace()

for columns in text_columns:
    clean_all_columns(columns)

--Return--
None
> [0;32m<ipython-input-19-2258e9370f48>[0m(7)[0;36m<module>[0;34m()[0m
[0;32m      5 [0;31m[0mtext_columns[0m[0;34m.[0m[0mremove[0m[0;34m([0m[0;34m'fraudulent'[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m      6 [0;31m[0;31m#print(text_columns)[0m[0;34m[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m----> 7 [0;31m[0mset_trace[0m[0;34m([0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0m[0;32m      8 [0;31m[0;34m[0m[0m
[0m[0;32m      9 [0;31m[0;32mfor[0m [0mcolumns[0m [0;32min[0m [0mtext_columns[0m[0;34m:[0m[0;34m[0m[0;34m[0m[0m
[0m
ipdb> continue


In [20]:
data_frame

Unnamed: 0,title,location,description,requirements,has_company_logo,fraudulent
0,architect middleware mq kuwait,kw ku,behalf client known multinational retail compa...,behalf client known multinational retail compa...,t,0
1,interviewing sales rep positions management tr...,tx corpus christi,argenta field solutions rapidly expanding awar...,argenta field solutions rapidly expanding awar...,t,0
2,process controls staff engineer foxboro tricon...,tx usa southwest,experienced process controls staff engineer re...,experienced process controls staff engineer re...,f,0
3,experienced telemarketer wanted digital solutions,au nsw,passion people love sell telephone roles overv...,passion people love sell telephone roles overv...,t,0
4,senior network engineer,gb eng london,successful senior network engineer jncia certi...,successful senior network engineer jncia certi...,t,0
...,...,...,...,...,...,...
8935,financial analyst,gr paiania,financial analysis reporting review department...,financial analysis reporting review department...,t,0
8936,customer service associate time,ca peterborough,customer service associate based peterborough ...,customer service associate based peterborough ...,t,0
8937,sales manager,ua 61 ternopil,responsibilitiesactive sales realization compa...,responsibilitiesactive sales realization compa...,f,0
8938,administrative assistant,ca santa ana,addition clerical administrative duties indivi...,addition clerical administrative duties indivi...,f,1


In [21]:
dummies = pd.get_dummies(data_frame[['title','location','description','requirements','has_company_logo','fraudulent']],drop_first=True)

data_frame = pd.concat([data_frame.drop(['title','location','description','requirements','has_company_logo','fraudulent'], axis=1), dummies],axis=1)

In [22]:
data_frame.shape

(8940, 22882)

In [23]:
data_frame.columns

Index(['fraudulent', 'title_1st level support engineers ms dynamics nav',
       'title_2 time caregivers gentle kind woman disabilities',
       'title_2 time caregivers independent compassionate woman',
       'title_2 year analyst program',
       'title_200k management position experienced merchant cash advance reps',
       'title_2015 mba advisory consulting associate',
       'title_2015 mba internship research associate',
       'title_2015 mba research associate',
       'title_2015 undergrad account management associate',
       ...
       'requirements_μεγαλώνουμε την ομάδα μας και χρειαζόμαστε έναν end web developer για να αναλάβει την τεχνική υλοποίηση μερικών από τα web sites και portals που έχουμε αναλάβει ανάμεσα στα πράγματα που θα κάνει μέσα στην ημέρα του είναι να συνεργάζεται με τον technical lead της ομάδας του ώστε να καταλάβει τι πρέπει να υλοποιηθεί και ποιος είναι ο καλύτερος τρόπος για να γίνει να αναπτύσσει end εφαρμογές και themes σε επίπεδο css js και html 

In [24]:
data_frame

Unnamed: 0,fraudulent,title_1st level support engineers ms dynamics nav,title_2 time caregivers gentle kind woman disabilities,title_2 time caregivers independent compassionate woman,title_2 year analyst program,title_200k management position experienced merchant cash advance reps,title_2015 mba advisory consulting associate,title_2015 mba internship research associate,title_2015 mba research associate,title_2015 undergrad account management associate,...,requirements_μεγαλώνουμε την ομάδα μας και χρειαζόμαστε έναν end web developer για να αναλάβει την τεχνική υλοποίηση μερικών από τα web sites και portals που έχουμε αναλάβει ανάμεσα στα πράγματα που θα κάνει μέσα στην ημέρα του είναι να συνεργάζεται με τον technical lead της ομάδας του ώστε να καταλάβει τι πρέπει να υλοποιηθεί και ποιος είναι ο καλύτερος τρόπος για να γίνει να αναπτύσσει end εφαρμογές και themes σε επίπεδο css js και html κώδικα σε έργα που αφορούν web sites news portals e shops facebook applicationsνα συνεργάζεται με τους designers της ομάδας μας για να μπορέσει να φέρει στη ζωή τα πράγματα που έχουν ονειρευτεί και σχεδιάσει τόσο σε εικαστικό επίπεδο δουλεύοντας στα psds που έχουν παράξει αλλά και σε interactive επίπεδο με javascript μηχανισμούς και micro interactionsνα συνεργάζεται με τους end ανθρώπους μας που είναι υπεύθυνοι για την τεχνική υλοποίηση των εφαρμογώννα διευκρινίζει έγκαιρα θέματα που μπορεί να καθυστερήσουν το έργο ή να μην επιτρέψουν να έχουμε το καλύτερο δυνατό αποτέλεσμα και να τηρεί τα χρονοδιαγράμματα που όλοι μαζί έχουμε συμφωνήσει και υποσχεθεί στον πελάτηνα χρησιμοποιεί τα εργαλεία που έχουμε επιλέξει και να τηρεί τις διαδικασίες που έχουμε ορίσεινα δοκιμάζει υπεύθυνα ότι όλα λειτουργούν όπως πρέπει για να είναι έτοιμα για μεταφορά στο περιβάλλον της παραγωγήςνα γνωρίζεις ότι σε μας το design είναι μια τελείως διαφορετική δουλειά από το web development γιατί σε κάποιες εταιρείες οι ίδιοι άνθρωποι σχεδιάζουν και υλοποιούν τo end τμήμα του έργου οπότε δεν απαιτούμε να έχεις και γραφιστικές ικανότητες όμως η αίσθηση του όμορφου και του χρηστικού επιβάλλεται,requirements_μεγαλώνουμε την ομάδα μας και χρειαζόμαστε έναν project manager για να αναλάβει την διαχείρηση κάποιων από τα έργα που έχουμε αναλάβει ανάμεσα στα πράγματα που θα κάνει μέσα στην ημέρα του είναι να συνεργάζεται με τους account managers για να υποδέχεται σωστά τα νέα έργα ή τις απαιτήσεις για νέες λειτουργίες υπαρχόντων έργων που έρχονται στην εταιρείανα συμμετέχει στη διαδικασία ανάλυσης και καθορισμού των προδιαγραφών κατανοώντας και καταγράφοντας με ακρίβεια και λεπτομέρεια τις λειτουργικές ανάγκες του έργουνα μεταφέρει με επιτυχία στο δημιουργικό τμήμα τις προδιαγραφές που αφορούν την ux και eικαστική σχεδίαση του έργου και να φροντίζει για την ομαλή επικοινωνία και έγκριση των παραδοτέων να μεταφέρει με επιτυχία στο τεχνικό τμήμα τις προδιαγραφές που αφορούν την λειτουργικότητα του έργου και να εξασφαλίζει ότι το παραγόμενο αποτέλεσμα δεν απέχει από αυτό που έχει συμφωνηθεί να μεταφέρει με επιτυχία στο τμήμα digital marketing τις προδιαγραφές που αφορούν τυχόν προωθητικές ενέργειες marketing ή διαφήμισης και να ελέγχει την σωστή υλοποίηση τους να φροντίζει για τη σωστή προετοιμασία και συγκέντρωση του περιεχομένου στην περίπτωση που αποτελεί μέρος του έργουνα προετοιμάζει και να επικοινωνεί τα κατάλληλα reports προόδου έργου και να διευκρινίζει έγκαιρα θέματα που μπορεί να καθυστερήσουν το έργο να προετοιμάζει τις ομάδες του πελάτη που θα παραλάβουν και θα διαχειριστούν το νέο web property αν είναι μέσα στις υποχρεώσεις μαςνα χρησιμοποιεί τα εργαλεία που έχουμε επιλέξει και να τηρεί τις διαδικασίες που έχουμε ορίσει,requirements_μεγαλώνουμε την ομάδα μας και χρειαζόμαστε έναν senior php web developer για να αναλάβει την τεχνική υλοποίηση μερικών από τα web sites και portals που έχουμε αναλάβει ανάμεσα στα πράγματα που θα κάνει μέσα στην ημέρα του είναι να συνεργάζεται με τον technical lead της ομάδας του ώστε να καταλάβει τι πρέπει να υλοποιηθεί και ποιος είναι ο καλύτερος τρόπος για να γίνει να αναπτύσσει end υπηρεσίες βάσεις δεδομένων και εφαρμογές σε έργα που αφορούν web sites news portals e shops facebook applications mobile εφαρμογέςνα συνεργάζεται με τους end ανθρώπους μας που είναι υπεύθυνοι για την τεχνική υλοποίηση του theming με τη βοήθεια css js και html κώδικα και να διευκολύνει τη δουλειά τους παράγοντας τον end κώδικα που απαιτείται να διευκρινίζει έγκαιρα θέματα που μπορεί να καθυστερήσουν το έργο ή να μην επιτρέψουν να έχουμε το καλύτερο δυνατό αποτέλεσμα και να τηρεί τα χρονοδιαγράμματα που όλοι μαζί έχουμε συμφωνήσει και υποσχεθεί στον πελάτηνα χρησιμοποιεί τα εργαλεία που έχουμε επιλέξει και να τηρεί τις διαδικασίες που έχουμε ορίσεινα δοκιμάζει υπεύθυνα ότι όλα λειτουργούν όπως πρέπει για να είναι έτοιμα για μεταφορά στο περιβάλλον της παραγωγής,requirements_μεγαλώνουμε την ομάδα μας και χρειαζόμαστε έναν systems administrator που θα αναλάβει την εγκατάσταση ενημέρωση παρακολούθηση βελτιστοποίηση και υποστήριξη των infrastructure υποδομών που λειτουργούμε σε συνεργαζόμενους hosting παρόχους μας ανάμεσα στα πράγματα που θα κάνει είναι να εγκαθιστά παραμετροποιεί και να υποστηρίζει λειτουργικά συστήματα linux στον εξοπλισμό που διατηρούμε για τις ανάγκες φιλοξενίας των web sites και portals μας να παραμετροποιεί εφαρμογές web servers database servers proxy servers memory management όπως είναι apache nginx varnish mysql memcache apc στους servers που λειτουργούμε να εγκαθιστά νέες εφαρμογές στους web και database servers που χρησιμοποιούμε με βάση τις ανάγκες των έργων μαςνα διατηρεί ενημερωμένες και ασφαλείς τις εκδόσεις των λειτουργικών συστημάτων και των εφαρμογών που χρησιμοποιούμε σε επίπεδο δικτύου και συστημάτων να υποστηρίζει τα συστήματά μας σε ώρες εκτός γραφείου και αργίες σε συνεργασία με τα υπόλοιπα μέλη της τεχνικής μας ομάδας να παρακολουθεί μέσα από κατάλληλες εφαρμογές την απόδοση των εφαρμογών και συστημάτων μας και να κάνει τις απαραίτητες διορθωτικές κινήσεις αν χρειαστείνα λειτουργεί και να ελέγχει την σωστή εκτέλεση διαδικασιών backup για όλες τις εφαρμογές και τις βάσεις δεδομένωννα τηρεί καταγεγραμμένες με οργάνωση και ασφάλεια τις απαραίτητες πληροφορίες πρόσβασης και λειτουργίας των συστημάτων μας,requirements_ονομάζομαι καμπανός νίκος είμαι απόφοιτος του τμήματος πληροφορικής του πανεπιστημίου πειραιώς είμαι ιδρυτής και υπεύθυνος για 2 project το foodle url_56f5921c5ec85ca5cb5d1061a43e326efcb9d1bfa439c8214f3bfeb0725bc261 και το hang url_76a25c484475fb45fc909d553a9ae71c55b976dc839b33a87c41c6fe2c932d55 και τα 2 έχουν βραβευτεί σε διαγωνισμό καινοτομίας amp επιχειρηματικότητας foodle δουλεύεται εδώ και 1 χρόνο και είναι σε προχωρημένο στάδιο το hang γεννήθηκε σαν ιδέα την περασμένη βδομάδα όπου και βραβεύτηκε και τα 2 project έχουν βρει στέγη πλέον σε δικό μας γραφείο στο cube ψάχνουμε developers είσαι junior developer αλλά θες να μάθεις είσαι ninja coder και θες να δοκιμάσεις τις γνώσεις σου σε ένα real project με πολλές υποσχέσεις για επιτυχία θες να γνωρίσεις τον κόσμο των start ή απλά να σε δει κάποια στιγμή η μαμά σου στην εφημερίδα αν θες να είσαι εσύ ο δικός μας developer και να γίνεις μέλος μιας πολύ δημιουργικής ομάδας απλά απάντησε στην αίτηση και έλα να σε γνωρίσουμε εκ μέρους των foodle amp ηang aroundκαμπανός νίκος,requirements_ποιοί είμαστε είμαστε μία startup εταιρεία που δημιουργεί μία ηλεκτρονική πλατφόρμα για να φέρει σε επαφή άδεια φορτηγά με εμπορευματικά φορτία προς μεταφορά κερδίσαμε το athens startup weekend 2013 url_32b12af735d3f16e60c944775cddb9865612dc1c193f7525402737c20a21c895 με το όνομα fr8 evolving transit και έχουμε ενταχθεί στο incubator accelerator πρόγραμμα της eurobank και του corallia που ονομάζεται egg enter grow url_936c8589acda3cfd47844193ec02ea2f4f5b44dff4074776c33ef657fa24dd5c τι ζητάμε για την εξέλιξη και ανάπτυξη της startup εταιρείας μας αναζητούμε να εντάξουμε ένα νέο μέλος στην ομάδα μας με απώτερο στόχο να αναλάβει το ρόλο του mobile developer στην εταιρεία στο πλαίσιο των αξιών μας θεωρούμε ότι το ιδανικό είναι να βρίσκουμε νέους φιλόδοξους ανθρώπους που πιστέυουν στην ιδέα μας και στη startup κουλτούρα προκειμένου να εξελιχθούν μέσα από το project και να αποτελέσουν μόνιμους συνεργάτες μας time job,requirements_στην baked web strategy ψάχνουμε δημιουργικό άτομο με τρελά για τα social media να κόβει το μυαλό του και να γυαλίζει το μάτι του ο ρόλος του να διαχειρισθεί projects στα social media για πελάτες σε ελλάδα και εξωτερικό,requirements_το social taste ζητά να προσλάβει πωλητή για direct sales για τις υπηρεσίες του ο πωλητής θα είναι υπεύθυνος για την επίτευξη συμφωνίας με καταστήματα εστίασης και την ένταξή τους στο δίκτυο του social taste το social taste url_2a3ee958595ab950ecf641c272741a378f39bc05454a65c99be892245ecaec9c είναι μια καινοτόμα και ταχεία αναπτυσσόμενη υπηρεσία saas η οποία επιτρέπει σε καταστήματα εστίασης να δέχονται παραγγελίες μέσα από τη σελίδα τους στο facebook τον ιστότοπό τους ή συνεργαζόμενα sites με μεγάλη ταχύτητα ασφάλεια και αξιοπιστία,requirements_το url_bb79581a561837ad604b8fc4ab629753b36407cc3bc76c42e6e46d74bb78eba2 αναζητεί φιλόδοξο και ταλαντούχο web developer για πρακτική άσκηση 2 μηνών με προοπτικές μόνιμης απασχόλησης μετά το πέρας αυτής τι είναι το url_bb79581a561837ad604b8fc4ab629753b36407cc3bc76c42e6e46d74bb78eba2 το url_bb79581a561837ad604b8fc4ab629753b36407cc3bc76c42e6e46d74bb78eba2 είναι μία επαγγελματική διαδικτυακή πλατφόρμα μέσω της οποίας έρχονται σε επαφή εργοδότες και δουλευταράδες για την εκτέλεση μιας εργασίας ή για τη σύναψη μιας νέας συνεργασίας βρίσκεται στον αέρα περίπου 3 μήνες έχοντας τύχει ευρύτερης υποδοχής από εργοδότες και επαγγελματίες καταγράφοντας εντυπωσιακή ανάπτυξη σε αριθμό μελών και εργασιών,has_company_logo_t
0,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,1
1,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,1
2,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
3,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,1
4,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
8935,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,1
8936,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,1
8937,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
8938,1,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0


In [25]:
data_frame.columns

Index(['fraudulent', 'title_1st level support engineers ms dynamics nav',
       'title_2 time caregivers gentle kind woman disabilities',
       'title_2 time caregivers independent compassionate woman',
       'title_2 year analyst program',
       'title_200k management position experienced merchant cash advance reps',
       'title_2015 mba advisory consulting associate',
       'title_2015 mba internship research associate',
       'title_2015 mba research associate',
       'title_2015 undergrad account management associate',
       ...
       'requirements_μεγαλώνουμε την ομάδα μας και χρειαζόμαστε έναν end web developer για να αναλάβει την τεχνική υλοποίηση μερικών από τα web sites και portals που έχουμε αναλάβει ανάμεσα στα πράγματα που θα κάνει μέσα στην ημέρα του είναι να συνεργάζεται με τον technical lead της ομάδας του ώστε να καταλάβει τι πρέπει να υλοποιηθεί και ποιος είναι ο καλύτερος τρόπος για να γίνει να αναπτύσσει end εφαρμογές και themes σε επίπεδο css js και html 

In [26]:
X = data_frame.drop('fraudulent', axis = 1).values
y = data_frame['fraudulent'].values

In [27]:
x_train, x_test, y_train, y_test = train_test_split(X,y,test_size=0.25,random_state=101)

In [29]:
predictions = []
pred_proba = []
from sklearn.linear_model import PassiveAggressiveClassifier 

# Creating model 
model = PassiveAggressiveClassifier(C = 0.5, random_state = 5) 
  
# Fitting model  
model.fit(x_train, y_train)

  
# Making prediction on test set 
test_pred = model.predict(x_test) 
  
# Model evaluation 
print(f"Test Set Accuracy : {model.accuracy_score(y_test, test_pred) * 100} %\n\n")   
  
print(f"Classification Report : \n\n{model.classification_report(y_test, test_pred)}") 

# tree=DecisionTreeClassifier(max_depth = 10) 
# tree.fit(x_train, y_train) 
# predictions = tree.predict(x_test)
# pred_proba = tree.predict_proba(x_test)
# tree.score(x_test,y_test)



AttributeError: 'PassiveAggressiveClassifier' object has no attribute 'accuracy_score'

In [None]:
scores=[]

start = time.time()
for i in range(1,10):
    tree = DecisionTreeClassifier(max_depth = i)
    tree.fit(x_train, y_train)
    scores.append(tree.score(x_test,y_test))
end = (time.time() - start) / 60.0
print("total time:")
print(end)
print()
print("max f1 score:")
print(np.max(scores))

In [None]:
print("Scores:")
print()
print(scores)