Skip to content
Branch: master
Find file History
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
..
Failed to load latest commit information.
codes
hw
slides
readme.MD

readme.MD

언어와 컴퓨터 (100.130)

서울대학교 언어학과, 2018학년도 2학기

  • 강의자: 박수지(mam3b at snu_ac_kr)
  • 목표: 이 과목은 컴퓨터언어학을 위한 기초 과정으로, 문자로 이루어진 텍스트 처리를 중심으로 인간의 언어를 컴퓨터에서 구현하는 과정을 배운다. 강좌는 크게 두 부분으로 이루어져 있다. 중간고사 이전에는 대량의 텍스트를 자동으로 처리할 수 있도록 Python 프로그램을 사용하는 방법을 익히며, 이후에는 자연언어 처리에 필요한 통계 모형에 관하여 학습한다.
  • 교재
    • Jurafsky and Martin. (forthcoming). Speech and Language Processing (3rd ed. draft) https://web.stanford.edu/~jurafsky/slp3/
    • 조엘 그루스 지음. 박은정·김한결·하성주 옮김. (2016). 《밑바닥부터 시작하는 데이터 과학: 데이터 분석을 위한 파이썬 프로그래밍과 수학·통계 기초》. 인사이트.
  • 기타 참고 자료

수업 일정 및 자료

제1강 (2018-09-03) 강의 소개

제2강 (2018-09-05) 시작하기 (슬라이드)

강좌의 목표, 파이썬 인터프리터, 산술 연산, 오류 메시지

코드

파이썬 인터프리터 사용하기

모바일

제3강 (2018-09-10) 기본 자료형: 수와 문자열 (슬라이드)

과제

제4강 (2018-09-12) 반복 가능한 자료형 (슬라이드)

객체, 리스트, 튜플, 범위, 딕셔너리

코드

도구

제5강 (2018-09-17) 조건문 (슬라이드)

복합문, if, else, elif 키워드

코드

과제

제6강 (2018-09-19) 반복문 (슬라이드)

복합문, while, for, break, pass 키워드

코드

과제

제7강 (2018-10-01) 모듈과 함수 (슬라이드)

코드

과제

제8강 (2018-10-08) 파일 처리 (슬라이드)

읽기

과제

제9강 (2018-10-10) 문자 인코딩 (슬라이드)

읽기

제10강 (2018-10-17) 한글 처리 모듈 (슬라이드)

try 문, 한글 음절 분해, 옛한글 자모 조합

읽기

코드

옛한글 지원 글꼴

과제

중간고사

제11강 (2018-10-29) 텍스트 처리 (슬라이드)

정규표현식, 코퍼스, 단어 토큰화, 단어 정제, 문장 분리

코드

기타

제12강 (2018-10-31) 정규표현식 실습 (슬라이드)

re 모듈, ELIZA

코드

읽기

도구

과제

제13강 (2018-11-07) 벡터, 통계, 데이터 시각화 (슬라이드)

밑바닥부터 시작하는 데이터 과학 3장–8장.

코드

과제

도구

제14강 (2018-11-12) n-그램 언어 모형 (1) (슬라이드)

제15강 (2018-11-14) n-그램 언어 모형 (2) (슬라이드)

코드

과제

제16강 (2018-11-19) 단순 베이즈 분류기와 감정분석 (1) (슬라이드)

제17–18강 (2018-11-21,26) 단순 베이즈 분류기와 감정분석 (2-3) (슬라이드)

코드

과제

제19강 (2018-11-28) scikit-learn과 NLTK를 사용한 기계학습 (슬라이드)

코드

읽기

도구

과제

제20강 (2018-12-03) 로지스틱 회귀분석 (슬라이드)

기말고사

You can’t perform that action at this time.