### RISS 데이터 탐색

* './data/articles_essential.csv'에 대한 개략적인 메타데이터 분석
* 비어있는 데이터에 대한 수작업 구축 필요

In [2]:
# Step 1. 필요한 라이브러리 import
import pandas
import operator
import re

In [7]:
# Step 2. 데이터 개수 탐색
articles = pandas.read_csv('./data/articles_essential.csv', encoding='utf-8')
print('전체 데이터의 크기: {:d}\n'.format(len(articles)))

year_freq_dic = {}
for year in articles['year']:
    if year not in year_freq_dic.keys():
        year_freq_dic[year] = 1
    else:
        year_freq_dic[year] += 1

for y, f in sorted(year_freq_dic.items(), key=operator.itemgetter(0)):
    print('{:04d}년에 발표된 논문의 수 {:d}'.format(int(y), int(f)))

전체 데이터의 크기: 239

1999년에 발표된 논문의 수 7
2000년에 발표된 논문의 수 5
2001년에 발표된 논문의 수 7
2002년에 발표된 논문의 수 7
2003년에 발표된 논문의 수 9
2004년에 발표된 논문의 수 10
2005년에 발표된 논문의 수 12
2006년에 발표된 논문의 수 10
2007년에 발표된 논문의 수 13
2008년에 발표된 논문의 수 9
2009년에 발표된 논문의 수 14
2010년에 발표된 논문의 수 14
2011년에 발표된 논문의 수 13
2012년에 발표된 논문의 수 14
2013년에 발표된 논문의 수 13
2014년에 발표된 논문의 수 10
2015년에 발표된 논문의 수 14
2016년에 발표된 논문의 수 16
2017년에 발표된 논문의 수 12
2018년에 발표된 논문의 수 16
2019년에 발표된 논문의 수 14


In [8]:
# Step 2. 비어 있는 데이터 확인
# 키워드가 없는 데이터 개수
cnt = 0
print('*******키워드가 없는 논문입니다. 수작업으로 추가가 필요합니다*******')
for keyword, year, vol, no, title in zip(articles['keyword'], articles['year'], articles['vol'], articles['no'], articles['title']):
    if keyword == 'MV':
        cnt += 1
        print('{:04d}-vol{:02d}-no{:02d}\t{:s}'.format(int(year), int(vol), int(no), title))
print('키워드가 없는 논문의 수는 총 {:d}입니다'.format(cnt))

print('\n')

# 초록이 없는 데이터 개수
cnt = 0
print('*******초록이 없는 논문입니다. 수작업으로 추가가 필요합니다*******')
for abstract, year, vol, no, title in zip(articles['abstract'], articles['year'], articles['vol'], articles['no'], articles['title']):
    if abstract == 'MV':
        cnt += 1
        print('{:04d}-vol{:02d}-no{:02d}\t{:s}'.format(int(year), int(vol), int(no), title))
print('초록이 없는 논문의 수는 총 {:d}입니다'.format(cnt))

*******키워드가 없는 논문입니다. 수작업으로 추가가 필요합니다*******
2019-vol21-no21	예술치료사 자기효능감 척도 개발 및 타당화 연구
2019-vol21-no21	델파이 방법을 통한 국내 재활음악치료 발전방안 연구
2019-vol21-no21	음악치료사의 훈련과정에서 경험한 열등감 인식과 통찰에 대한 자문화기술지
2019-vol21-no21	호스피스ㆍ완화의료 환자를 대상으로 한 국내ㆍ외 음악치료 연구 메타분석
2019-vol21-no21	수퍼바이지가 지각하는 음악치료 전문성과 수퍼비전 교육요구에 대한 합의적 질적연구
2018-vol20-no20	『한국음악치료학회지』투고규정 외
2016-vol18-no18	Development of an Assessment Tool for Measuring Social Interactions of Preschool Children with Autism Spectrum Disorders in an Individual Music Therapy Setting
2015-vol17-no17	음악활동에서 나타나는 유아의 사회성 평가도구 개발을 위한 예비연구
2015-vol17-no17	수퍼비젼관계가 예술치료 수퍼바이지의 전문성 발달에 미치는 영향: 자기신념의 매개와 수퍼비젼 만족도의 조절 효과
2015-vol17-no17	음악치료 프로그램이 치매노인에게 미치는 효과에 대한 메타분석
2015-vol17-no17	Effects of Educational Music Therapy on Knowledge of Triggers and Coping Skills, Motivation, and Treatment Eagerness in Patients on a Detoxification Unit: A Three-Group Cluster-Randomized Effectiveness Study
2015-vol17-no17	음악치료 슈퍼바이지가 지각하는 피드백 수용도, 슈퍼바이저 스타일, 슈퍼바이지 발달수준, 슈퍼비전 작업동맹 간의 구조

In [10]:
# Step 3. 영어 논문의 개수
print('다음은 제목이 영문인 논문 리스트입니다. 작성 언어 확인이 필요합니다')
kor = re.compile('[ㄱ-ㅎ|ㅏ-ㅣ|가-힣]')
cnt = 0
for year, vol, no, title in zip(articles['year'], articles['vol'], articles['no'], articles['title']):
    if not kor.search(title):
        cnt += 1
        print('{:04d}-vol{:02d}-no{:02d}\t{:s}'.format(int(year), int(vol), int(no), title))
print('영문 제목인 논문의 수는 총 {:d}입니다'.format(cnt))

다음은 제목이 영문인 논문 리스트입니다. 작성 언어 확인이 필요합니다
2019-vol21-no21	A Twenty-year Historical Report: Music Therapy in Korea from 1996 to 2016
2019-vol21-no21	The Korean Journal of Music Therapy: Commemorating 20 years
2016-vol18-no18	Development of an Assessment Tool for Measuring Social Interactions of Preschool Children with Autism Spectrum Disorders in an Individual Music Therapy Setting
2016-vol18-no18	Development of an Assessment Tool for Measuring Social Interactions of Preschool Children with Autism Spectrum Disorders in an Individual Music Therapy Setting
2015-vol17-no17	Effects of Educational Music Therapy on Knowledge of Triggers and Coping Skills, Motivation, and Treatment Eagerness in Patients on a Detoxification Unit: A Three-Group Cluster-Randomized Effectiveness Study
2015-vol17-no17	Effects of Educational Music Therapy on Knowledge of Triggers and Coping Skills, Motivation, and Treatment Eagerness in Patients on a Detoxification Unit : A Three-Group Cluster-Randomized Effectiveness 

In [13]:
# Step 4. 중복값 확인
print('제목이 중복된 논문을 확인합니다')
title_unique = []
cnt = 0
for year, vol, no, title in zip(articles['year'], articles['vol'], articles['no'], articles['title']):
    if title in title_unique:
        cnt += 1
        print('{:04d}-vol{:02d}-no{:02d}\t{:s}'.format(int(year), int(vol), int(no), title))
    else:
        title_unique.append(title)
print('제목이 중복된 논문의 수는 총 {:d}입니다'.format(cnt))

제목이 중복된 논문을 확인합니다
2017-vol19-no19	타악기 연주활동이 재한 중국 유학생의 문화적응 스트레스 감소와 자아탄력성 증진에 미치는 효과
2016-vol18-no18	음악활동에서 관찰되는 유아 사회성 평가도구 개발을 위한 타당화 연구
2016-vol18-no18	Development of an Assessment Tool for Measuring Social Interactions of Preschool Children with Autism Spectrum Disorders in an Individual Music Therapy Setting
2015-vol17-no17	음악활동에서 나타나는 유아의 사회성 평가도구 개발을 위한 예비연구
2015-vol17-no17	음악치료 프로그램이 치매노인에게 미치는 효과에 대한 메타분석
2015-vol17-no17	음악치료 슈퍼바이지가 지각하는 피드백 수용도, 슈퍼바이저 스타일, 슈퍼바이지 발달수준, 슈퍼비전 작업동맹 간의 구조분석
2015-vol17-no17	국내 음악치료 전문 학술 연구에서 사용된 측정도구의 동향 분석
2013-vol15-no15	심상음악치료(GIM)의 치료단계에 대한 주관성연구
2013-vol15-no15	음악활동에서 관찰될 수 있는 유아의 언어의사소통 평가도구 개발을 위한 예비연구
2012-vol14-no14	음악치료 및 다른 심리 교육적 치료 프로그램에 대한 일 병원 정신과 입원 환자들의 인식 조사
2012-vol14-no14	주력임상대상에 따른 음악치료 목적과 중재방법 비교 연구
2012-vol14-no14	음악치료 집단 수퍼비전에서 수퍼바이지가 지각하는 애착유형, 자기효능감, 정서적 유대, 수치심, 평가불안 간의 관계
2012-vol14-no14	음정의 차이가 개인의 음정 재생의 정확도에 미치는 영향
2012-vol14-no14	Immediate Effects of Music Therapy on Fatigue in Hospitalized Patients on a Bone Marr

* 중복된 논문 제거 필요. 이때, 오타로 인해 중복된 논문으로 검출되지 않은 논문이 있으므로 주의
* 키워드와 초록 수작업 추가
* 영어 논문은 한글 텍스트 처리를 위해서 제거

In [3]:
# Step 2. 데이터 개수 탐색
articles = pandas.read_csv('./data/articles_essential_refined.csv', encoding='utf-8')
print('전체 데이터의 크기: {:d}\n'.format(len(articles)))

year_freq_dic = {}
for year in articles['year']:
    if year not in year_freq_dic.keys():
        year_freq_dic[year] = 1
    else:
        year_freq_dic[year] += 1

for y, f in sorted(year_freq_dic.items(), key=operator.itemgetter(0)):
    print('{:04d}년에 발표된 논문의 수 {:d}'.format(int(y), int(f)))

전체 데이터의 크기: 216

1999년에 발표된 논문의 수 4
2000년에 발표된 논문의 수 5
2001년에 발표된 논문의 수 7
2002년에 발표된 논문의 수 7
2003년에 발표된 논문의 수 8
2004년에 발표된 논문의 수 10
2005년에 발표된 논문의 수 12
2006년에 발표된 논문의 수 9
2007년에 발표된 논문의 수 13
2008년에 발표된 논문의 수 9
2009년에 발표된 논문의 수 14
2010년에 발표된 논문의 수 12
2011년에 발표된 논문의 수 13
2012년에 발표된 논문의 수 9
2013년에 발표된 논문의 수 11
2014년에 발표된 논문의 수 10
2015년에 발표된 논문의 수 8
2016년에 발표된 논문의 수 14
2017년에 발표된 논문의 수 11
2018년에 발표된 논문의 수 16
2019년에 발표된 논문의 수 14
