Interview

Team Member 🙋‍ 🙋‍♂️

Study Process

매주 아래의 과정을 반복

각자 맡을 분야를 랜덤하게 선정(ML, python, network, etc...)
모든 분야에 대한 답을 준비
본인이 맡은 분야에 대해서는 '면접에서 답변할 수 있는 형태'와 키워드를 정리.
2, 3번의 내용을 본인 이름의 폴더에 자신만의 표현으로 정리 (e.g., sungho/)
스터디에서 정리된 내용을 answer/*.md에 정리

Part1

Statistics/Math

고유값(eigen value)와 고유벡터(eigen vector)에 대해 설명해주세요. 그리고 왜 중요할까요?
샘플링(Sampling)과 리샘플링(Resampling)에 대해 설명해주세요. 리샘플링은 무슨 장점이 있을까요?
확률 모형과 확률 변수는 무엇일까요?
누적 분포 함수와 확률 밀도 함수는 무엇일까요? 수식과 함께 표현해주세요.
조건부 확률은 무엇일까요?
공분산과 상관계수는 무엇일까요? 수식과 함께 표현해주세요.
신뢰 구간의 정의는 무엇인가요?
p-value를 모르는 사람에게 설명한다면 어떻게 설명하실 건가요?
R square의 의미는 무엇인가요?
평균(mean)과 중앙값(median)중에 어떤 케이스에서 뭐를 써야할까요?
중심극한정리는 왜 유용한걸까요?
엔트로피(entropy)에 대해 설명해주세요. 가능하면 Information Gain도요.
어떨 때 모수적 방법론을 쓸 수 있고, 어떨 때 비모수적 방법론을 쓸 수 있나요?
“likelihood”와 “probability”의 차이는 무엇일까요?
통계에서 사용되는 bootstrap의 의미는 무엇인가요.
모수가 매우 적은 (수십개 이하) 케이스의 경우 어떤 방식으로 예측 모델을 수립할 수 있을까요?
베이지안과 프리퀀티스트 간의 입장차이를 설명해주실 수 있나요?
검정력(statistical power)은 무엇일까요?
missing value가 있을 경우 채워야 할까요? 그 이유는 무엇인가요?
아웃라이어의 판단하는 기준은 무엇인가요?
필요한 표본의 크기를 어떻게 계산합니까?
Bias를 통제하는 방법은 무엇입니까?
로그 함수는 어떤 경우 유용합니까? 사례를 들어 설명해주세요.

Deep Learning

딥러닝은 무엇인가요? 딥러닝과 머신러닝의 차이는?
Cost Function과 Activation Function은 무엇인가요?
Tensorflow, PyTorch 특징과 차이가 뭘까요?
Data Normalization은 무엇이고 왜 필요한가요?
알고있는 Activation Function에 대해 알려주세요. (Sigmoid, ReLU, LeakyReLU, Tanh 등)
오버피팅일 경우 어떻게 대처해야 할까요?
하이퍼 파라미터는 무엇인가요?
Weight Initialization 방법에 대해 말해주세요. 그리고 무엇을 많이 사용하나요?
볼츠만 머신은 무엇인가요?
TF, PyTorch 등을 사용할 때 디버깅 노하우는?
뉴럴넷의 가장 큰 단점은 무엇인가? 이를 위해 나온 One-Shot Learning은 무엇인가?
요즘 Sigmoid 보다 ReLU를 많이 쓰는데 그 이유는?
- Non-Linearity라는 말의 의미와 그 필요성은?
- ReLU로 어떻게 곡선 함수를 근사하나?
- ReLU의 문제점은?
- Bias는 왜 있는걸까?
Gradient Descent에 대해서 쉽게 설명한다면?
- 왜 꼭 Gradient를 써야 할까? 그 그래프에서 가로축과 세로축 각각은 무엇인가? 실제 상황에서는 그 그래프가 어떻게 그려질까?
- GD 중에 때때로 Loss가 증가하는 이유는?
- Back Propagation에 대해서 쉽게 설명 한다면?
Local Minima 문제에도 불구하고 딥러닝이 잘 되는 이유는?
- GD가 Local Minima 문제를 피하는 방법은?
- 찾은 해가 Global Minimum인지 아닌지 알 수 있는 방법은?
Training 세트와 Test 세트를 분리하는 이유는?
- Validation 세트가 따로 있는 이유는?
- Test 세트가 오염되었다는 말의 뜻은?
- Regularization이란 무엇인가?
Batch Normalization의 효과는?
- Dropout의 효과는?
- BN 적용해서 학습 이후 실제 사용시에 주의할 점은? 코드로는?
- GAN에서 Generator 쪽에도 BN을 적용해도 될까?
SGD, RMSprop, Adam에 대해서 아는대로 설명한다면?
- SGD에서 Stochastic의 의미는?
- 미니배치를 작게 할때의 장단점은?
- 모멘텀의 수식을 적어 본다면?
간단한 MNIST 분류기를 MLP+CPU 버전으로 numpy로 만든다면 몇줄일까?
- 어느 정도 돌아가는 녀석을 작성하기까지 몇시간 정도 걸릴까?
- Back Propagation은 몇줄인가?
- CNN으로 바꾼다면 얼마나 추가될까?

Machine Learning

알고 있는 metric에 대해 설명해주세요. (ex. RMSE, MAE, recall, precision ...)
정규화를 왜 해야할까요? 정규화의 방법은 무엇이 있나요?
Local Minima와 Global Minima에 대해 설명해주세요.
차원의 저주에 대해 설명해주세요.
dimension reduction기법으로 보통 어떤 것들이 있나요?
PCA는 차원 축소 기법이면서, 데이터 압축 기법이기도 하고, 노이즈 제거기법이기도 합니다. 왜 그런지 설명해주실 수 있나요?
LSA, LDA, SVD 등의 약자들이 어떤 뜻이고 서로 어떤 관계를 가지는지 설명할 수 있나요?
Markov Chain을 고등학생에게 설명하려면 어떤 방식이 제일 좋을까요?
텍스트 더미에서 주제를 추출해야 합니다. 어떤 방식으로 접근해 나가시겠나요?
SVM은 왜 반대로 차원을 확장시키는 방식으로 동작할까요? SVM은 왜 좋을까요?
다른 좋은 머신 러닝 대비, 오래된 기법인 나이브 베이즈(naive bayes)의 장점을 옹호해보세요.
회귀 / 분류시 알맞은 metric은 무엇일까?
Association Rule의 Support, Confidence, Lift에 대해 설명해주세요.
최적화 기법중 Newton’s Method와 Gradient Descent 방법에 대해 알고 있나요?
머신러닝(machine)적 접근방법과 통계(statistics)적 접근방법의 둘간에 차이에 대한 견해가 있나요?
인공신경망(deep learning이전의 전통적인)이 가지는 일반적인 문제점은 무엇일까요?
지금 나오고 있는 deep learning 계열의 혁신의 근간은 무엇이라고 생각하시나요?
ROC 커브에 대해 설명해주실 수 있으신가요?
여러분이 서버를 100대 가지고 있습니다. 이때 인공신경망보다 Random Forest를 써야하는 이유는 뭘까요?
K-means의 대표적 의미론적 단점은 무엇인가요? (계산량 많다는것 말고)
L1, L2 정규화에 대해 설명해주세요.
Cross Validation은 무엇이고 어떻게 해야하나요?
XGBoost을 아시나요? 왜 이 모델이 캐글에서 유명할까요?

Part2

Python

What is the difference between list and tuples in Python?
What are the key features of Python?
What type of language is python? Programming or scripting?
Python an interpreted language. Explain.
What is pep 8?
How is memory managed in Python?
What is namespace in Python?
What is PYTHONPATH?

Part3

Network

TCP/IP의 각 계층을 설명해주세요.
OSI 7계층와 TCP/IP 계층의 차이를 설명해주세요.
Frame, Packet, Segment, Datagram을 비교해주세요.
TCP와 UDP의 차이를 설명해주세요.
TCP와 UDP의 헤더를 비교해주세요.
TCP의 3-way-handshake와 4-way-handshake를 비교 설명해주세요.
TCP의 연결 설정 과정(3단계)과 연결 종료 과정(4단계)이 단계가 차이나는 이유가 무엇인가요?
만약 Server에서 FIN 플래그를 전송하기 전에 전송한 패킷이 Routing 지연이나 패킷 유실로 인한 재전송 등으로 인해 FIN 패킷보다 늦게 도착하는 상황이 발생하면 어떻게 될까요?

Operating System

프로세스와 스레드의 차이(Process vs Thread)를 알려주세요.
멀티 프로세스 대신 멀티 스레드를 사용하는 이유를 설명해주세요.
캐시의 지역성에 대해 설명해주세요.
Thread-safe에 대해 설명해주세요. (hint: critical section)
뮤텍스와 세마포어의 차이를 설명해주세요.
스케줄러가 무엇이고, 단기/중기/장기로 나누는 기준에 대해 설명해주세요.
CPU 스케줄러인 FCFS, SJF, SRTF, Priority Scheduling, RR에 대해 간략히 설명해주세요.
동기와 비동기의 차이를 설명해주세요.

Database

DBMS를 정의하세요.
RDBMS를 정의하고 장점에 대해 설명하세요.
key 정리
- Candidate Key
- Primary Key
- Alternate Key
- Super Key
- Foreign Key
SQL Join (join이란? join 종류)
PostgreSQL의 장점은 무엇일까요?
인덱스는 크게 Hash 인덱스와 B+Tree 인덱스가 있습니다. 이것은 무엇일까요?

Algorithm

시간, 공간 복잡도
Sort Algorithm
- Bubble Sort
- Selection Sort
- Insertion Sort
- Merge Sort
- Heap Sort
- Quick Sort
- Counting Sort
- Radix Sort

면접 질문지 및 노하우 정리 ref

면접 질문지 모음

Name		Name	Last commit message	Last commit date
Latest commit History 165 Commits
Bumsoo		Bumsoo
answers		answers
gunwoo		gunwoo
haewon		haewon
jaehyung		jaehyung
junhyuk		junhyuk
personality interview		personality interview
seokmin		seokmin
sungho		sungho
yohan		yohan
.DS_Store		.DS_Store
README.md		README.md

hanlyang0522/InterviewStudy

Folders and files

Latest commit

History

Repository files navigation

Interview

Team Member 🙋‍ 🙋‍♂️

Contents

Study Process

Part1

Part2

Part3

면접 질문지 및 노하우 정리 ref

About

Resources

Stars

Watchers

Forks

Languages