- 강좌명: 언어와 컴퓨터
- 강좌번호: 100.130 (001 & 002)
- 교수자: 박수지 (mam3b@snu.ac.kr, sut.i.palatalised@gmail.com)
- 교재: Jurafsky & Martin, Speech and Language Processing 3rd edition
언어와 컴퓨터(100.130)는 컴퓨터언어학(108.413A)의 선수과목으로, 심층학습(딥러닝, 인공신경망)을 사용한 자연언어처리 기법을 학습하기 위해 필요한 컴퓨터언어학의 기본 지식을 습득하는 것을 목표로 한다. 이 과목을 이수함으로써 학생들은 인공신경망 모형이 도입되기 전까지 자연언어처리 분야에서 전통적으로 어떤 기법을 사용하고 어떤 과제를 처리했는지를 이해하고 파이썬으로 구현할 수 있게 될 것이다. 이 강좌의 전반부에서는 파이썬의 기초와 정규표현식에 대해 배우며, 이를 통해 최초의 규칙 기반 챗봇인 ELIZA를 구현한다. 후반부에서는 기계학습과 벡터 의미론에서 대해 배우며, 이를 활용하여 주어진 트위터 데이터가 악성 트윗인지 아닌지를 자동으로 예측하는 모형을 개발한다.
이 강좌에서는 수강생을 대학 입학 후 수학을 따로 공부하지 않은 인문대학 1–2학년생으로 가정하고, 후반부 수업은 조건부확률, 로그함수, 지수함수 등 기초적인 내용을 복습하는 데서 시작할 것이다.