Giyeon Shin shingiyeon

Introduction

Giyeon Shin ♂

💻 Work Experience

Role	Company	Period
Software Engineer	LG CNS	2022.01. ~
AI Researcher	CJ OliveNetworks	2021.07. ~ 2021.12.

✈️ Military Service

Software Development Support Service, Republic of Korea Airforce, 2019.07 ~ 2021.03
- Video
- Interview

🎓 Education

[*Drop-out] Master of Engineering in Computer Science, KAIST, 2018. 03 ~ 2019. 02
- GPA : All(Major) 3.6/4.3
Bachelor of Engineering in Electrical Engineering and Computer Science, GIST 2014. 03. ~ 2018. 02.
- GPA : All 3.7/4.5, Major 4.21/4.5

⚒ Tech Skill

Classification	Skills
Backend
ML/DL
DevOps
Frontend
Language - Favorite
ETC

🌏 Other Experience

📰 Paper

KAIST

Giyeon Shin, Kijong Han, Minho Lee, Kuntae Kim, Key-Sun Choi, Korean Co-reference Resolution End-to-End Learning using Bi-LSTM with Mention Features, HCLT, 2018.
상호참조해결은 자연언어 문서 내에서 등장하는 명사구 언급(mention)과 이에 선행하는 명사구 언급을 찾아 같은 개체인지 정의하는 문제이다. 특히, 지식베이스 확장에 있어 상호참조해결은 언급 후보에 대해 선행하는 개체의 언급이 있는지 판단해 지식트리플 획득에 도움을 준다. 영어권 상호참조해결에서는 F1 score 73%를 웃도는 좋은 성능을 내고 있으나, 평균 정밀도가 80%로 지식트리플 추출에 적용하기에는 무리가 있다. 따라서 본 논문에서는 한국어 문서에 대해 영어권 상호참조해결 모델에서 사용되었던 최신 모델인 Bi-LSTM 기반의 딥 러닝 기술을 구현하고 이에 더해 언급 후보 목록을 만들어 개체명 유형과 경계를 적용하였으며 품사형태를 붙인 토큰을 사용하였다. 실험 결과, 문자 임베딩(Character Embedding) 값을 사용한 경우 CoNLL F1-Score 63.25%를 기록하였고, 85.67%의 정밀도를 보였으며, 같은 모델에 문자 임베딩을 사용하지 않은 경우 CoNLL F1-Score 67.92%와 평균 정밀도 77.71%를 보였다.
Kijong Han, Seong-Ho Choi, Giyeon Shin, Byoung-Tak Zhang, Key-Sun Choi, Character Identification on Multiparty Dialogues using Multimodal Features, HCLT, 2018.
Younggyun Hahm, Giyeon Shin, Key-Sun Choi, Frame-semantics and Argument Disambiguation of Korean FrameNet using Bi-directional LSTM, HCLT, 2018.

GIST

Giyeon Shin, Hojung Nam, Protein Secondary Structure Prediction using Protein Sequence Information and Deep Learning Method, Thesis for Bachelor's Degree, GIST, 2017.
Verifying structure of proteins will be helpful in chemistry and biology field. Because it is important to know which features the proteins have in researching new drug development or body mechanisms. These features of proteins is especially determined in protein secondary structure level. However, since the number of protein data having the protein secondary structure label is small, it is very hard to clearly understand the features of the protein via the protein secondary structure. In this study, we predicted protein secondary structure with protein primary sequence. In protein primary sequence, the protein fragment cut into n-grams was embedded to predict the protein secondary structure. This embedded protein fragment existed as a mathematical vector (protein vector). We then made the new prediction models through the embedded protein fragments and deep learning method, as well compared the performance of the models. Deep learning methodologies such as convolutional neural network and recurrent neural network were used to extract the characteristic of the local and whole parts in protein during the prediction modeling process. Finally, we examined the effect of the embedded protein fragments on the prediction of protein secondary structure.

📝 Project

LG CNS SmartService Team

[LGE Intellytics 자재수요예측 운영: Data Analysist] (2022.09 ~)
[LGE Enterprise Member Platform Advancement SI Suggestion: 분석/설계자] (2022.08 ~ 2022.09)
LG전자의 전사회원플랫폼은 LG전자 앱부터, ThinQ, SmartWorld, SmartTV 등 다양한 서비스들의 회원 관리 시스템을 담당하는 플랫폼입니다. 허나, LG전자의 가전 제품의 매출이 급상승하고, 전자 서비스들을 이용하는 회원들이 급증함에 따라 노후화된 아키텍쳐 변경이 필수적이였고, 전사회원관리팀의 요구사항을 반영하기에도 시스템이 노후화 되었습니다. 따라서 해당 프로젝트에서 고객의 요구사항을 파악하고 이를 아키텍쳐 고도화에 포함되도록 분석 및 조사를 하는 역할을 맡았으며, 그 외에도 기존 시스템 유지보수 팀의 CSR 파악 및 공수 파악 등 다양한 데이터를 조사하는 작업을 맡았습니다.
[LGE SmartWorld Software Management: Part Leader] (2022-04 ~ 2022.08)
LG전자 SmartWorld는 기존 LG전자 핸드폰 사용자를 위한 스토어이며, LG전자 ThinQStore는 ThinQ에서 이용가능한 LG전자 제품의 부속품들을 구매할 수 있는 스토어입니다. 스토어의 원할한 운영을 위하여 고객으로부터 들어오는 요구사항을 받아 이를 파악하고 업무를 배분하는 Part Leader 성격의 역할을 맡았으며, 중점젖그오는 검색 엔진 관리 / 장애 확인 / 에러 로그 개발 / 서버 관리 / 배포 / 라이브러리 관리와 같은 역할을 맡았습니다.

CJ OliveNetworks AI Core Center

Kaggle: 미식 축구 분야 Object Tracking 연구
Kaggle Competition에서 NFL Helmet Assignment라는 task에 참여했습니다. 해당 Task는 NFL 미식 축구에서 주어지는 GPS Tracking Data와 NFL 경기 영상을 통해 영상에서 나타나는 Helmet을 Detect하고, 이를 GPS Data의 선수에게 Mapping하는 과정이였습니다.
이 문제는 두 가지 관점으로 해석이 가능합니다. 첫 번째는, Object Tracking을 통해 선수들의 Trajectory를 찾고 이 Cluster를 Mapping하는 관점, 두 번째는 Heterogeneous Graph로 해석하여 GPS Data Graph와 감지된 헬맷의 Graph를 연결해주는 방법이 있습니다.
허나 사용할 수 있는 데이터가 상당히 한정적이였기 때문에 이 두 가지 방법을 적용하기에는 무리가 있습니다.
그래서 관점을 전환하여 Object Tracking에서 graph 방법론을 사용하는 방향으로 전환했습니다. 그 때 사용하였던 모델링은 Graph Similarity Model for Multiple Object Tracking이라는 논문에 기술된 모델입니다. 주위 탐지된 Neighbor box를 통해 subgraph를 만들고 이 subgraph를 이용해 Object tracking에 활용하는 방식이였으며 이를 Task에 맞게 적절히 변형하여 은메달을 획득하였습니다.

Republic Of Korea AirForce Information System Management Team

공군 법률 딥러닝 검색 시스템 개발
공군 법률 한글 파일 Parser 개발로 hwp로 저장되어 있는 공군 규정들을 파싱하여 Json 형태로 저장하고 업데이트하였습니다. Rule-based 기반으로 공군 규정내에 있는 형태 목록을 Regular Expression로 저장하고 이를 파싱하였으며, 규정 내에 있는 Table 또한 Table Extractor 오픈 소스를 통해 따로 저장하였습니다.
추출된 공군 규정 내용에 Unsupervised Information Retrieval 기법인 Neural Vector Space Model을 적용하였습니다. 공군 규정을 항목별로 Document Vector를 저장하고 이 후 주어진 Query에 대하여 비슷한 공군 규정을 추추라는 공군 규정 검색 체계를 개발하였습니다. Unsupervised Learning 기법이기 때문에 규정 내에서 일정한 규칙을 토대로 단어를 뽑아 이를 Training Data의 Query로 이용하였습니다.
이 후, BERT를 이용한 Reranker를 개발하여 공군 규정 내에서도 어떠한 문장과 가장 유사한지 하이라이팅하는 작업까지 끝마쳤습니다.
공군 위탁교육생 웹 체계 개발
Spring과 Vue.js를 이용하여 공군 위탁교육생 웹 체계를 개발하였습니다. JPA 및 JWT를 통하여 DB Connection 및 로그인 로직을 개발하였습니다.
반 정도 개발되었던 업무에 투입되었으며, Pagination, JWT 로직 개발, 배포, 유지보수 등의 업무를 맡았습니다.

KAIST Semantic Web Research Center

비디오 이해를 위한 이벤트-상황 지식체계 학습 및 이벤트인식/관계추론 기술 개발, Rule-based Sentence Alignment for Movie Subtitle, 2018.03 ~ 2018.10
비디오 내용을 이해하기 위해서는 비디오에 등장하는 인물들의 대화를 이해해야 비디오의 상황들을 추출할 수 있습니다. 예시로, ConceptNet을 이요하여 발마사지가 피로에 도움이 된다는 사실을 이미 알고 있다면, 비디오의 인물이 왜 발마사지를 받았는지에 대해 추측할 수 있고 이해할 수 있을 것입니다. 하지만 대부분의 영화는 영어로 되어 있기 때문에 한국어에 대한 비디오 이해는 데이터 부족으로 인하여 어려운 Task입니다. 따라서 대본과 한/영 통합 자막을 이용해 해당 장면이 어떠한 한글 자막과 맞는 지에 대해 Alignment하는 작업을 진행하였습니다.
비디오에 등장하는 인물들의 대화를 이해하기 위해서는 대호 중 나타나는 인물에 대하여 실제로 어떤 인물을 가리키는 지에 대한 이해가 필요합니다. 비디오의 대사나 비디오의 화면에서 나타나는 정보를 통하여 이를 판단할 수 있습니다. 이를 구별하는 Character Identification Task에서 전에 개발하였던 Coreference Resolution Model을 통하여 실험에 필요한 Base Model을 구축하였습니다.
상식을 추출하는 데에 있어 위키피디아의 데이터를 이용하곤합니다. 이 때 Korean FrameNet을 통하여 Target Frame의 정보들을 파악하여 상식 정보를 저장하곤 합니다. Deep Learning 기법을 Korean FrameNet과 적용하여 상식을 추추라는 실험에서 Rule-Based 기반의 Korean FrameNet을 개바라여 시럼에 필요한 Base Model을 개발하였습니다.
WiseKB: 빅데이터 이해 기반 자가학습형 지식베이스 및 추론 기술 개발, 딥러닝 기반 개체 상호참조해결, 2018.03 ~ 2018.10
지식베이스의 지식트리플을 증강시키기 위해서 외부적인 방법으로는 Wikipedia나 나무위키와 같은 plain text에서 Distant Supervision을 이용해 지식트리플을 추출하는 방법이 있습니다. 그러나 plain text로만 이용할 경우, 기계가 글에 대한 전반적인 이해가 어렵기 때문에 추가적인 feature가 필요합니다. 이를 위해 Distant Supervision 단계 전에 먼저 subject와 object들의 후보인 mention들을 추출하는 Named Entity Recognition 단계를 거칩니다. 이럴 경우 지식 트리플 추출의 대상이 되는 멘션만을 타겟으로 단계를 진행할 수 있기 때문입니다. 그러나 wikilink를 갖고 있지 않을 경우 추출된 멘션이 어떤 개체를 나타내고 있는지 알 수 없습니다. (Dark Entity) 또한 대명사나 지시관형사를 가지는 명사구 또한 어떤 개체를 나타내고 있는지 알 수 없습니다. 따라서 이러한 멘션들이 어떠한 개체를 나타내는지 확인하고, 지시 대명사로 시작하는 명사구들에 대해 상호참조해결을 실시하여 지식베이스를 증강합니다. Kenton Lee의 Higher-order Coreference Resolution with Coarse-to-fine Inference 논문을 빌려 이를 개체 상호참조해결에 맞게 적절히 변환하였고, 모델에 경계 정보 추가, 엔티티의 정보 추가를 하였습니다.

GIST Computational System Biology Lab

[Drug-Target Interaction 이해를 위한 Feature 추출 및 개발], 딥러닝 기반 이차 단백질 구조 예측, 2017.03 ~ 2017.12
약물과 단백질의 긍/부정 상호작용을 알기 위해 다양한 인공지능 기법이 시도되고 있습니다. 인공지능 기법을 사용하기 위해선 약물과 단백질의 기존 상호작용 정보와 약물과 단백질의 구조 정보가 있어야 서로 유사성을 판단하여 새로운 약물-단백질 간 상호작용 정보를 확인할 수 있습니다.
단백질 구조는 단편적으로 일차 구조로 주어지게 되는데, 일반적으로 단백질의 이, 삼차 구조가 약물과의 결합에 있어 결정적인 역할을 맡게 됩니다.
이를 위해 단백질 일차구조를 통해 Prot2Vec을 통해 단백질 이차구조를 예측하는 역할을 맡았습니다.

🏅 Awards

Awards	Grade	Date	Note
CJ OliveNetworks 신입사원 OJT 발표회	최우수상(1등)	2021. 12.
Kaggle	Silver(50th)	2021. 11.	Deep Learning: Object Tracking
NIA 월드프렌즈 ICT 봉사 활동	활동 우수상	2017. 12.
2017 ICPC Asia Daejeon Regional Contest	57th	2020. 11.	Team Name : CoAlMot2017
2013 KOI	동상	2013. 07.
2013 KOI Regional	은상	2013. 07.

📜 Certificate

정보처리기사(Engineer Information Processing), HRD Korea 2019. 07. ~ Now

Activity

School Club

GIST MacMoo (Hiphop Dancing Club) 2014. 03. ~ 2017. 12.
GIST Ignition (Hiphop Music Club) 2014. 03. ~ 2015. 12.

Teaching

GISTxNIA ICT Volunteer (C++) 2017. 06. ~ 2017. 08.
GIST Computer Programming class TA 2016, 2017

Provide feedback

Saved searches

Use saved searches to filter your results more quickly