In [1]:
import pickle
import joblib
from konlpy.tag import Okt
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.linear_model import SGDClassifier
from sklearn.pipeline import Pipeline
import csv

In [2]:
def openStopword():
    f = open('dataset/stopwords/stopwords.csv', 'r', encoding='utf-8')
    reader = csv.reader(f)
    stopwords = list()

    for row in reader:
        stopwords.append(row[0])

    return stopwords

In [3]:
def tokenizer(raw, pos=["Noun","Verb"], stopword=openStopword()):
    return [
        word for word, tag in okt.pos(
            raw, 
            norm=True,
            stem=True
            )
            if len(word) > 1 and tag in pos and word not in stopword
        ]

In [4]:
okt = Okt()

In [5]:
keyword_names = ['글로벌역량', '능동', '도전', '성실', '소통', '인내심', '정직', '주인의식', '창의', '팀워크']

In [6]:
vectorize = TfidfVectorizer(
    ngram_range=(1,2),
    tokenizer=tokenizer,
    max_df=0.95,
    min_df=0,
    sublinear_tf=True
)

In [7]:
filename = 'SVMmodel.joblib'
clf_from_pickle = joblib.load(filename)

In [8]:
def SVMpredict(text):
    result = clf_from_pickle.predict([text])
    return keyword_names[result[0]-1]

In [9]:
def SVMdecision(text):
    return clf_from_pickle.decision_function([text]).tolist()

In [10]:
SVMpredict("1. 삼성취업을 선택한 이유와 입사 후 회사에서 이루고 싶은 꿈을 기술하십시오. (700자)\n[ 우물 밖 개구리가 되자! ]\n저의 미래지향적 사고를 보여주는 좌우명입니다. 현재에 안주하기보다는 목표를 세우고 더 넓은 세상을 꿈꿉니다. 온라인으로만 경험을 쌓기보다는 박람회 참가나 업체 방문 등을 통해 직접 고객들과 부딪히며 실무능력을 기를 수 있었습니다. 그래서 고객들을 만나고, 설득하는 과정들은 저에게 영업직무를 매력적으로 느끼게 하였고 이 때문에 직접적인 교감이 통(通)하는 영업 관리자가 되고 싶다고 생각하였습니다.\n저는 보험업계는 수많은 경쟁사에 대비하기 위해 절대적인 우위가 필요하다 생각합니다. 스마트 금융시대가 도입된 현재, 삼성은 타 경쟁사를 압도하는 속도로 변화의 주도권을 잡고 있습니다. ‘가족력 컨설팅 앱’ 이라는 질병 발현 예측 컨설팅 시스템을 최초로 도입하는 등 스마트 보험 시대의 선두기업이라는 절대적 우위를 차지하고 있습니다.\n삼성화재의 변화의 중심에서 스마트 시대에 맞춘 효율적 영업관리와 함께 RC 분들과 교감할 수 있는 중추적 구실을 하고 싶습니다. 그리고 변화에 대한 교육을 통해 이를 실무에서 능동적으로 수행할 수 있게끔 멘토의 역할을 해 나가겠습니다. 관리자라는 명분을 버리고 RC 분들과 하나가 된다는 마음으로 지점을 이끌어 나가 개인의 고유한 역량을 모두 발휘할 수 있도록 도와주는 동반자가 되고 싶습니다.\n2. 본인의 성장과정을 간략히 기술하되 현재의 자신에게 가장 큰 영향을 끼친 사건, 인물 등을 포함하여 기술하시기 바랍니다. (1500자 이내)\n[ 수처작주(隨處作主) : 가는 곳마다 주인이 되라 ]\n태권도 동아리 활동을 하며, 회장을 역임했습니다. 제가 회장을 맡기 전 동아리의 운영상황이 열악하여 노력에 비해 성과를 내기가 어려운 상태였습니다. 경제적인 지원도 부족하여 운영이 버거울 때도 있었지만 동아리 발전이라는 한 가지 목표를 향해 뜻을 모아 문제를 하나씩 해결해 나갔습니다.\n첫 번째, 운동시설의 구축을 위해 학생회관 내 사용하지 않는 공간에 운동용 매트를 설치하여 체육관으로 만들고자 하였습니다. 이를 위해 교내 관리부서의 담당자들에게 매주 방문하여 동아리에 얼마나 절실하게 운동시설이 필요한지에 대해 논리적으로 설명하였습니다. 그뿐만 아니라 총 동아리 회장 및 다른 동아리 회장들의 승인을 얻어야 했기 때문에 운동 여건 보장에 대하여 호소력 짙은 목소리로 대표자들을 설득하였고, 마침내 승인을 받아 지원금을 통해 운동 여건을 조성하는데 성공을 할 수 있었습니다.\n안정적인 운동시설 기반의 확립으로 인해 동아리 활동은 점차 활기를 찾아갔으며, 신입생들이 유입되는데 기여를 하였습니다. 동아리 내에 사람이 많이 유입되고 기초 인프라가 구축되어 다양한 동아리 활동을 진행할 수 있었으며, 2017년 1학기와 2학기 연속으로 우수동아리에 선정되는 성과를 이뤄낼 수 있었습니다.\n두번째, 전국 동아리 선수권 시합을 준비하였습니다. 시합 준비를 위해 신입생들과 함께 하루도 빠트리지 않고 훈련을 하였고 이것이 선수들에게 동기부여가 되어 시합에서 종합 준우승이라는 우수한 성과를 거둘 수 있었으며 이를 통해 동아리를 전국적으로 알리는 데 기여할 수 있었습니다. 이러한 노력 덕분에 저희 동아리는 1년 만에 우수동아리와 종합 준우승이라는 자랑스러운 성과를 이루어 냈습니다.\n동아리 회장을 하면서 쌓은 다양한 경험을 토대로 형성된 저만의 리더십 능력과 조직의 문제점을 찾아 개선하려는 운용능력은 삼성화재에 입사 후 지점을 더욱 효율적으로 운용하는데 기여할 것이라 장담합니다.\n\n[ 용호: 용감하고 호기롭게 도전하는 남자 ]\n교내 동아리인 IBPC(국제경영지원센터)활동을 통해 2015 ‘할랄엑스포’를 참가했었습니다. 온라인으로 제안서를 보내는 과정과 달리, 박람회에서 고객들을 설득하기란 쉬운 일이 아니었습니다. 특히 많은 사람들 사이에서 이목을 집중시키는 것은 매우 어려웠습니다. 당시 제품은 ‘물 없이 감는 샴푸 ’였는데, 고민하던 찰나에 부스 안에서 직접 샴푸를 하는 것은 어떨까? 생각이 들어 곧바로 시행하여 지나가는 관람객들의 시선을 사로잡을 수 있었습니다. 직접 시연하는 것을 보고, 제품을 사용해보고 가는 고객들이 점차 증가하였고 그 결과, 이틀만에 제공수량을 매진 시키는 성과를 이뤄냈습니다. 이러한 현장 경험을 통해 고객들에게 먼저 적극적으로 다가가는 것이 가장 중요하다고 생각하였습니다. 때문에 보험업에서 가장 중요한 것은 적극적으로 고객에게 먼저 다가가 소통하여 만족도를 높이는 것이라 생각합니다. 그러므로 저는 다양한 경험을 통해 체득한 것을 삼성화재의 영업인으로써 펼쳐 나아가고 싶습니다\n3. 최근 사회이슈 중 중요 하다고 생각되는 한 가지를 선택하고 이에 관한 자신의 견해를 기술해주시기 바랍니다.(1000자 이내)\n4차산업혁명 돌풍에 따라 기술이 혁신적으로 발전하면서 고객들의 기대수준은 매우 향상되었습니다. 이에 따라 기업은 기존의 접근 방식에서 벗어나 더욱 차별화되고 개인 맞춤형적 방식으로 고객을 설득하여 브랜드 가치를 제고해야 할 필요성이 있습니다.\n즉, 기존의 수직적으로 고객을 여기던 마케팅에서 탈피하여 고객과 수평적인 관계를 형성하는 새로운 패러다임이 제시되어야 하는 것입니다. 이러한 패러다임이 성립되기 위해서는 기업의 기술 발전 및 직원에 대한 복지 향상이 필요하며 보험 업태는 다음과 같은 접근 방식을 통해 현재의 방식을 개선해 나가는 모습을 보여야 합니다.\n첫째, 혁신적 기술과 고객 맞춤형 서비스를 결합하여 브랜드 충성도를 강화해야 합니다. 같은 보험설계를 받더라도 타 사와 차별화된 요소를 도입하여 고객들이 맞춤형 서비스를 제공받도록 해야 합니다. 현재 삼성화재는 스마트 컨설팅의 선두주자로서 ‘가족력 컨설팅 앱’이나 ‘마이 키즈 컨설팅 앱’을 효율적으로 운용하고 있습니다.이 어플들은 고객에 대한 맞춤형 컨설팅을 더욱 용이하게 하기 때문에 브랜드 충성도 제고에 효과적인 접근 방식이라 생각합니다. 따라서 혁신적인 기술 개발을 기반으로 고객들에게 ‘커스터마이징’적인 요소를 제공해야 한다는 것입니다.\n두 번째로 RC분들에 대한 차별화된 복지여건을 제공해야 합니다. RC분들은 가장 직접적으로 고객들과 밀접해 있기 때문에 RC분들에 대한 지원 및 개발이 지속적으로 이루어 진다면 이는 고객만족도를 높이는데 기여할 수 있다고 생각합니다. 이를 위해 RC분들을 지원하면서 수평적이고 안정된 사내 문화 형성이 마련되어야 한다고 생각합니다.\n기술의 혁신적인 발전에 따라, 고객들을 대하는 양상도 함께 변화하고 있습니다. 따라서 삼성화재는 뛰어난 기술력 선점을 바탕으로 인간적인 마케팅과 따듯한 브랜드 이미지 형성을 위해 노력해야 하는 시점입니다. 이 두 가지 요소가 함께 도모된다면 삼성은 타 사가 넘볼 수 없는 압도적인 브랜드 파워를 지속적으로 유지할 것입니다..")

'주인의식'

In [11]:
resume = SVMdecision("1. 삼성취업을 선택한 이유와 입사 후 회사에서 이루고 싶은 꿈을 기술하십시오. (700자)\n[ 우물 밖 개구리가 되자! ]\n저의 미래지향적 사고를 보여주는 좌우명입니다. 현재에 안주하기보다는 목표를 세우고 더 넓은 세상을 꿈꿉니다. 온라인으로만 경험을 쌓기보다는 박람회 참가나 업체 방문 등을 통해 직접 고객들과 부딪히며 실무능력을 기를 수 있었습니다. 그래서 고객들을 만나고, 설득하는 과정들은 저에게 영업직무를 매력적으로 느끼게 하였고 이 때문에 직접적인 교감이 통(通)하는 영업 관리자가 되고 싶다고 생각하였습니다.\n저는 보험업계는 수많은 경쟁사에 대비하기 위해 절대적인 우위가 필요하다 생각합니다. 스마트 금융시대가 도입된 현재, 삼성은 타 경쟁사를 압도하는 속도로 변화의 주도권을 잡고 있습니다. ‘가족력 컨설팅 앱’ 이라는 질병 발현 예측 컨설팅 시스템을 최초로 도입하는 등 스마트 보험 시대의 선두기업이라는 절대적 우위를 차지하고 있습니다.\n삼성화재의 변화의 중심에서 스마트 시대에 맞춘 효율적 영업관리와 함께 RC 분들과 교감할 수 있는 중추적 구실을 하고 싶습니다. 그리고 변화에 대한 교육을 통해 이를 실무에서 능동적으로 수행할 수 있게끔 멘토의 역할을 해 나가겠습니다. 관리자라는 명분을 버리고 RC 분들과 하나가 된다는 마음으로 지점을 이끌어 나가 개인의 고유한 역량을 모두 발휘할 수 있도록 도와주는 동반자가 되고 싶습니다.\n2. 본인의 성장과정을 간략히 기술하되 현재의 자신에게 가장 큰 영향을 끼친 사건, 인물 등을 포함하여 기술하시기 바랍니다. (1500자 이내)\n[ 수처작주(隨處作主) : 가는 곳마다 주인이 되라 ]\n태권도 동아리 활동을 하며, 회장을 역임했습니다. 제가 회장을 맡기 전 동아리의 운영상황이 열악하여 노력에 비해 성과를 내기가 어려운 상태였습니다. 경제적인 지원도 부족하여 운영이 버거울 때도 있었지만 동아리 발전이라는 한 가지 목표를 향해 뜻을 모아 문제를 하나씩 해결해 나갔습니다.\n첫 번째, 운동시설의 구축을 위해 학생회관 내 사용하지 않는 공간에 운동용 매트를 설치하여 체육관으로 만들고자 하였습니다. 이를 위해 교내 관리부서의 담당자들에게 매주 방문하여 동아리에 얼마나 절실하게 운동시설이 필요한지에 대해 논리적으로 설명하였습니다. 그뿐만 아니라 총 동아리 회장 및 다른 동아리 회장들의 승인을 얻어야 했기 때문에 운동 여건 보장에 대하여 호소력 짙은 목소리로 대표자들을 설득하였고, 마침내 승인을 받아 지원금을 통해 운동 여건을 조성하는데 성공을 할 수 있었습니다.\n안정적인 운동시설 기반의 확립으로 인해 동아리 활동은 점차 활기를 찾아갔으며, 신입생들이 유입되는데 기여를 하였습니다. 동아리 내에 사람이 많이 유입되고 기초 인프라가 구축되어 다양한 동아리 활동을 진행할 수 있었으며, 2017년 1학기와 2학기 연속으로 우수동아리에 선정되는 성과를 이뤄낼 수 있었습니다.\n두번째, 전국 동아리 선수권 시합을 준비하였습니다. 시합 준비를 위해 신입생들과 함께 하루도 빠트리지 않고 훈련을 하였고 이것이 선수들에게 동기부여가 되어 시합에서 종합 준우승이라는 우수한 성과를 거둘 수 있었으며 이를 통해 동아리를 전국적으로 알리는 데 기여할 수 있었습니다. 이러한 노력 덕분에 저희 동아리는 1년 만에 우수동아리와 종합 준우승이라는 자랑스러운 성과를 이루어 냈습니다.\n동아리 회장을 하면서 쌓은 다양한 경험을 토대로 형성된 저만의 리더십 능력과 조직의 문제점을 찾아 개선하려는 운용능력은 삼성화재에 입사 후 지점을 더욱 효율적으로 운용하는데 기여할 것이라 장담합니다.\n\n[ 용호: 용감하고 호기롭게 도전하는 남자 ]\n교내 동아리인 IBPC(국제경영지원센터)활동을 통해 2015 ‘할랄엑스포’를 참가했었습니다. 온라인으로 제안서를 보내는 과정과 달리, 박람회에서 고객들을 설득하기란 쉬운 일이 아니었습니다. 특히 많은 사람들 사이에서 이목을 집중시키는 것은 매우 어려웠습니다. 당시 제품은 ‘물 없이 감는 샴푸 ’였는데, 고민하던 찰나에 부스 안에서 직접 샴푸를 하는 것은 어떨까? 생각이 들어 곧바로 시행하여 지나가는 관람객들의 시선을 사로잡을 수 있었습니다. 직접 시연하는 것을 보고, 제품을 사용해보고 가는 고객들이 점차 증가하였고 그 결과, 이틀만에 제공수량을 매진 시키는 성과를 이뤄냈습니다. 이러한 현장 경험을 통해 고객들에게 먼저 적극적으로 다가가는 것이 가장 중요하다고 생각하였습니다. 때문에 보험업에서 가장 중요한 것은 적극적으로 고객에게 먼저 다가가 소통하여 만족도를 높이는 것이라 생각합니다. 그러므로 저는 다양한 경험을 통해 체득한 것을 삼성화재의 영업인으로써 펼쳐 나아가고 싶습니다\n3. 최근 사회이슈 중 중요 하다고 생각되는 한 가지를 선택하고 이에 관한 자신의 견해를 기술해주시기 바랍니다.(1000자 이내)\n4차산업혁명 돌풍에 따라 기술이 혁신적으로 발전하면서 고객들의 기대수준은 매우 향상되었습니다. 이에 따라 기업은 기존의 접근 방식에서 벗어나 더욱 차별화되고 개인 맞춤형적 방식으로 고객을 설득하여 브랜드 가치를 제고해야 할 필요성이 있습니다.\n즉, 기존의 수직적으로 고객을 여기던 마케팅에서 탈피하여 고객과 수평적인 관계를 형성하는 새로운 패러다임이 제시되어야 하는 것입니다. 이러한 패러다임이 성립되기 위해서는 기업의 기술 발전 및 직원에 대한 복지 향상이 필요하며 보험 업태는 다음과 같은 접근 방식을 통해 현재의 방식을 개선해 나가는 모습을 보여야 합니다.\n첫째, 혁신적 기술과 고객 맞춤형 서비스를 결합하여 브랜드 충성도를 강화해야 합니다. 같은 보험설계를 받더라도 타 사와 차별화된 요소를 도입하여 고객들이 맞춤형 서비스를 제공받도록 해야 합니다. 현재 삼성화재는 스마트 컨설팅의 선두주자로서 ‘가족력 컨설팅 앱’이나 ‘마이 키즈 컨설팅 앱’을 효율적으로 운용하고 있습니다.이 어플들은 고객에 대한 맞춤형 컨설팅을 더욱 용이하게 하기 때문에 브랜드 충성도 제고에 효과적인 접근 방식이라 생각합니다. 따라서 혁신적인 기술 개발을 기반으로 고객들에게 ‘커스터마이징’적인 요소를 제공해야 한다는 것입니다.\n두 번째로 RC분들에 대한 차별화된 복지여건을 제공해야 합니다. RC분들은 가장 직접적으로 고객들과 밀접해 있기 때문에 RC분들에 대한 지원 및 개발이 지속적으로 이루어 진다면 이는 고객만족도를 높이는데 기여할 수 있다고 생각합니다. 이를 위해 RC분들을 지원하면서 수평적이고 안정된 사내 문화 형성이 마련되어야 한다고 생각합니다.\n기술의 혁신적인 발전에 따라, 고객들을 대하는 양상도 함께 변화하고 있습니다. 따라서 삼성화재는 뛰어난 기술력 선점을 바탕으로 인간적인 마케팅과 따듯한 브랜드 이미지 형성을 위해 노력해야 하는 시점입니다. 이 두 가지 요소가 함께 도모된다면 삼성은 타 사가 넘볼 수 없는 압도적인 브랜드 파워를 지속적으로 유지할 것입니다..")

In [12]:
company_decision = [[-1.037130696722559309e+00, -9.585070147284189268e-01, -9.974816779480838447e-01, -9.960434378430856883e-01, -1.044291144562182971e+00, -1.011416175802230422e+00, -1.082306028024373701e+00, -9.723745689274718718e-01, -1.054980302160777761e+00, -1.038985179996822383e+00],
[-1.022905058780172016e+00, -9.729714011140895291e-01, -9.979109424116415772e-01, -9.960838890592615957e-01, -1.035563573794652914e+00, -1.006832867792128772e+00, -1.079813400441117510e+00, -9.743427615183873902e-01, -1.045494667635081809e+00, -1.025537419468688594e+00],
[-1.016472614211637815e+00, -9.766467738352675454e-01, -1.000375379621457395e+00, -9.978555971847123951e-01, -1.038529457331845096e+00, -1.005774030426986432e+00, -1.073706419588563943e+00, -9.765262185815020146e-01, -1.042025601114519251e+00, -1.037331119062074425e+00],
[-1.019009529590173768e+00, -9.757679547367305029e-01, -1.000952694031802315e+00, -1.001619339550971599e+00, -1.030700573938479581e+00, -1.010927717493489641e+00, -1.073901315828346359e+00, -9.765517184248780902e-01, -1.048375640102809703e+00, -1.034617815315719946e+00],
[-1.010540533808717001e+00, -9.654996280275474074e-01, -9.992614800895766036e-01, -9.941822080072016954e-01, -1.034704905158396748e+00, -1.021293330430268931e+00, -1.068412167230169185e+00, -9.774429429272191161e-01, -1.036193310539011980e+00, -1.018506850812170628e+00]]

In [13]:
company = ['samsung','hyundai','LG','SK','CJ']

In [14]:
company_dict = {company[i]:company_decision[i] for i in range(5)}

In [15]:
company_dict

{'samsung': [-1.0371306967225593,
  -0.9585070147284189,
  -0.9974816779480838,
  -0.9960434378430857,
  -1.044291144562183,
  -1.0114161758022304,
  -1.0823060280243737,
  -0.9723745689274719,
  -1.0549803021607778,
  -1.0389851799968224],
 'hyundai': [-1.022905058780172,
  -0.9729714011140895,
  -0.9979109424116416,
  -0.9960838890592616,
  -1.035563573794653,
  -1.0068328677921288,
  -1.0798134004411175,
  -0.9743427615183874,
  -1.0454946676350818,
  -1.0255374194686886],
 'LG': [-1.0164726142116378,
  -0.9766467738352675,
  -1.0003753796214574,
  -0.9978555971847124,
  -1.038529457331845,
  -1.0057740304269864,
  -1.073706419588564,
  -0.976526218581502,
  -1.0420256011145193,
  -1.0373311190620744],
 'SK': [-1.0190095295901738,
  -0.9757679547367305,
  -1.0009526940318023,
  -1.0016193395509716,
  -1.0307005739384796,
  -1.0109277174934896,
  -1.0739013158283464,
  -0.9765517184248781,
  -1.0483756401028097,
  -1.03461781531572],
 'CJ': [-1.010540533808717,
  -0.9654996280275474,

In [16]:
resume = resume[0]

In [31]:
import operator

def Compare(resume):
    compare_dict = {}
    for i in range(len(company_dict)):#5
        tmp = []
        for j in range(len(resume)):#10
            tmp.append(abs(company_dict[company[i]][j] - resume[j]))
        compare_dict[company[i]] = sum(tmp)
    return sorted(compare_dict.items(), key=operator.itemgetter(1),reverse=True)

In [32]:
Compare(resume)

[('SK', 0.21486081489987852),
 ('LG', 0.20458490060926626),
 ('samsung', 0.19987576214527425),
 ('hyundai', 0.18774687487295294),
 ('CJ', 0.1774032020398355)]

In [35]:
import numpy as np
company_np = np.asarray(company_decision)

In [36]:
company_np

array([[-1.0371307 , -0.95850701, -0.99748168, -0.99604344, -1.04429114,
        -1.01141618, -1.08230603, -0.97237457, -1.0549803 , -1.03898518],
       [-1.02290506, -0.9729714 , -0.99791094, -0.99608389, -1.03556357,
        -1.00683287, -1.0798134 , -0.97434276, -1.04549467, -1.02553742],
       [-1.01647261, -0.97664677, -1.00037538, -0.9978556 , -1.03852946,
        -1.00577403, -1.07370642, -0.97652622, -1.0420256 , -1.03733112],
       [-1.01900953, -0.97576795, -1.00095269, -1.00161934, -1.03070057,
        -1.01092772, -1.07390132, -0.97655172, -1.04837564, -1.03461782],
       [-1.01054053, -0.96549963, -0.99926148, -0.99418221, -1.03470491,
        -1.02129333, -1.06841217, -0.97744294, -1.03619331, -1.01850685]])

In [43]:
50*company_np+50

array([[-1.85653484,  2.07464926,  0.1259161 ,  0.19782811, -2.21455723,
        -0.57080879, -4.1153014 ,  1.38127155, -2.74901511, -1.949259  ],
       [-1.14525294,  1.35142994,  0.10445288,  0.19580555, -1.77817869,
        -0.34164339, -3.99067002,  1.28286192, -2.27473338, -1.27687097],
       [-0.82363071,  1.16766131, -0.01876898,  0.10722014, -1.92647287,
        -0.28870152, -3.68532098,  1.17368907, -2.10128006, -1.86655595],
       [-0.95047648,  1.21160226, -0.0476347 , -0.08096698, -1.5350287 ,
        -0.54638587, -3.69506579,  1.17241408, -2.41878201, -1.73089077],
       [-0.52702669,  1.7250186 ,  0.036926  ,  0.2908896 , -1.73524526,
        -1.06466652, -3.42060836,  1.12785285, -1.80966553, -0.92534254]])