In [2]:
import pandas as pd
import os
import glob
import re
from collections import Counter

In [3]:
def createDirectory(directory): 
    """ 새로운 폴더를 생성하는 함수 """
    try: 
        if not os.path.exists(directory): 
            os.makedirs(directory) 
    except OSError: 
        print("Error: Failed to create the directory.")

In [4]:
def find_index(speak, w):
    """ 문자열 내 특정 문자열이 존재하는 모든 index를 찾는 함수 """
    idx = 0
    li = []
    while idx < len(speak):
        word_idx = speak.find(w, idx)
        if word_idx > -1:            
            li.append(word_idx)
            idx = word_idx + 1
        else:
            break
    return li

In [5]:
def append_context(speak, pos, w):
    """ 특정 문자열을 기준으로 앞 20글자까지 모아주는 함수 """
    word_length = len(w)
    li = []
    for p in pos:
        if p > 20:        
            li.append(speak[p - 20 : p + word_length])
        else:            
            li.append(speak[: p + word_length])
    
    return li

In [10]:
location = os.getcwd()

fname_list = os.listdir(os.path.join(location, "회의록_모음"))
file_list = glob.glob(os.path.join(location, "회의록_모음/*"))

# 원하는 폴더 이름 설정.
dir_name = "단어 포함 문맥 파악"
createDirectory(dir_name)
dir_high = os.path.join(location, dir_name)

# 현재 법률, 조례에 대해 다음과 같이 분석을 진행함. 원하는 항목 자유롭게 입력.
print("분석을 원하는 단어들을 띄어쓰기를 기준으로 입력하세요.")
word_list = list(map(str, input(">>> ").rstrip().split()))
for word in word_list:
    # 각 단어별 폴더 생성 위한 경로 설정
    each_word_loc = os.path.join(dir_high, word)
    createDirectory(each_word_loc)
    for i in range(len(fname_list)):
        df = pd.read_csv(file_list[i], encoding = 'euc-kr')

        speak = df['발언내용'].to_list()
        str_speak = ' '.join(speak)

        indices = find_index(str_speak, word)
        result = append_context(str_speak, indices, word)

        pd.DataFrame(result, columns = [fname_list[i][:-4]]).to_csv(os.path.join(each_word_loc, '%s_%s.csv' % (fname_list[i][:-4], word)), index = False, encoding = 'euc-kr')
        print('%s_%s.csv 완료' % (fname_list[i][:-4], word))

분석을 원하는 단어들을 띄어쓰기를 기준으로 입력하세요.
>>> 법률 조례
서울특별시의회 회의록 제277회[정례회] (2017.11.01 ~ 2017.12.20)_법률.csv 완료
서울특별시의회 회의록 제284회[정례회] (2018.11.01 ~ 2018.12.20)_법률.csv 완료
서울특별시의회 회의록 제290회[정례회] (2019.11.01 ~ 2019.12.20)_법률.csv 완료
서울특별시의회 회의록 제298회[정례회](2020.11.02 ~ 2020.12.22)_법률.csv 완료
서울특별시의회 회의록 제303회[정례회](2021.11.01 ~ 2021.12.27)_법률.csv 완료
서울특별시의회 회의록 제277회[정례회] (2017.11.01 ~ 2017.12.20)_조례.csv 완료
서울특별시의회 회의록 제284회[정례회] (2018.11.01 ~ 2018.12.20)_조례.csv 완료
서울특별시의회 회의록 제290회[정례회] (2019.11.01 ~ 2019.12.20)_조례.csv 완료
서울특별시의회 회의록 제298회[정례회](2020.11.02 ~ 2020.12.22)_조례.csv 완료
서울특별시의회 회의록 제303회[정례회](2021.11.01 ~ 2021.12.27)_조례.csv 완료
