Korean_pronunciation_analysis 외국인의 한국어 발음 오류 패턴 비교 분석입니다. 외국인 학습자들의 한국어 발화 데이터셋을 이용하여 권역별(국가별) 발음 오류 패턴을 비교 분석하는 task 입니다. Chinese, English, Spanish 의 L1 외국인들의 한국어 발음 오류 패턴을 분석하였습니다. * 한국어 음소셋 * txt 파일로 제공된 데이터 데이터 정제 파일 이름으로부터 성별, 연령, 국적, 발화 난이도, 단락/문장/단어 를 추출하여 데이터프레임으로 변경 데이터 발화 샘플인 ref, 정답 음소 ans, 음소인식기를 돌린 결과 음소 rec 에 대한 분석으로 CSID 추출 correct, substitution, insertion, deletion 데이터 시각화 - PowerBI 이용 total_dataset.mp4 Chinese Chinese.mp4 Spanish Spanish.mp4 English English.mp4 발음 오류 패턴 분석 모국어 영향에 따른 음소 단위의 치환, 삭제, 삽입 오류 패턴 분석 1) English : deletion of N 2) English : substitution of GG to G 3) Spanish : insertion of M