In [1]:
import pandas as pd
from tqdm import tqdm
import nltk
from nltk.tokenize import RegexpTokenizer, word_tokenize
from konlpy.tag import Mecab
mecab = Mecab(dicpath=r"C:/mecab/mecab-ko-dic")

In [127]:
stop_word = "전 난 일 걸 뭐 줄 만 건 작업 분 위 개 끝 송 잼 이거 부 동 번 중 듯 차 때 게 내 말 나 수 거 점 것 등 측 의 급 후 간 단 시 곳 에 인 조"
stop_word = stop_word.split(' ')

In [128]:
df = pd.read_excel('./data/working_standard.xlsx')
df

Unnamed: 0,작업표준,단위작업,작업행동,체크정보
0,[선실생산_선실_목의장] 선행화기(Door),작업 준비,도어 포장 제거 (도어 데미지 주의),
1,[선실생산_선실_목의장] 선행화기(Door),작업 준비,운반전 설치 위치 점검,각종 의장품의 돌출부 확인하고 안전에 문제 없는지 점검
2,[선실생산_선실_목의장] 선행화기(Door),자재 정위치 이동,도어와 도어 프레임 분리 (도어 데미지 주의),
3,[선실생산_선실_목의장] 선행화기(Door),자재 정위치 이동,2인1조로 도어를 설치 위치로 운반 (도어 데미지 주의),
4,[선실생산_선실_목의장] 선행화기(Door),도어 화기 작업,도어 오프닝에 도어 프레임 삽입,"오프닝 곡직 여부 확인, 도어 프레임 수평 및 수직 확인"
...,...,...,...,...
7758,[기능_입출고_입출고] 내자재 입출고 작업,자재 하차,지게차 및 천정크레인 활용하여 자재 하차,"하차전 팔레트 위 자재 상태 확인, 고박 상태 확인"
7759,[기능_입출고_입출고] 내자재 입출고 작업,자재 적치,Bin에 자재 적치,20kg 초과 자재 취급시 2인 1조로 작업
7760,[기능_입출고_입출고] 내자재 입출고 작업,자재 선별,Pallet Car 활용하여 Lighting 선별 작업,Pallet Car로 자재 이동 시 후진 주행
7761,[기능_입출고_입출고] 내자재 입출고 작업,자재 선별,Pallet Car 활용하여 Lighting 선별 작업,20kg 초과 자재 취급시 2인 1조로 작업


In [129]:
df_act = df['작업행동']

## 영어 단어 추출

In [146]:
eng_results = []
for sentence in tqdm(df_act):
    sentence = str(sentence)
    result = []
#     tokenizer = RegexpTokenizer("[\w]+")
    tokenizer = RegexpTokenizer("[^가-힣0-9]+")
    tokens = tokenizer.tokenize(sentence)
    for token in tokens:
        token = token.upper().strip().strip("(").strip(")").strip("/").strip("±").strip("mm").strip("?").strip("-").strip(".").strip(",")
        if token not in stop_word and token != '':
            result.append(token)
    eng_results.append(result)

100%|████████████████████████████████████████████████████████████████████| 7763/7763 [00:00<00:00, 41878.09it/s]


In [147]:
len(eng_results)

7763

## 한글 형태소 추출

In [148]:
kor_results = []
for sentence in tqdm(df_act):
    sentence = str(sentence)
    result = []
    for noun in mecab.nouns(sentence):
        if noun not in stop_word:
            result.append(noun)
    targets.append(sentence)
    kor_results.append(result)

100%|████████████████████████████████████████████████████████████████████| 7763/7763 [00:00<00:00, 14963.38it/s]


In [149]:
len(kor_results)

7763

### 한글-영문 키워드 통합

In [150]:
keywords = []
for i in range(len(kor_results)):
    keywords.append(eng_results[i]+kor_results[i])    

In [151]:
keywords

[['도어', '포장', '제거', '도어', '데미지', '주의'],
 ['운반', '설치', '위치', '점검'],
 ['도어', '도어', '프레임', '분리', '도어', '데미지', '주의'],
 ['도어', '설치', '위치', '운반', '도어', '데미지', '주의'],
 ['도어', '오프닝', '프레임', '삽입'],
 ['도어', '프레임', '용접'],
 ['용접', '부위', '그라인더', '실시'],
 ['도어', '프레임', '도어', '설치'],
 ['작업장', '주변', '정리정돈', '실시'],
 ['유티', '탑재', '위치', '룸', '넘버', '마킹'],
 ['유티', '탑재', '지그', '사용', '정위치', '탑재'],
 ['유티', '포장', '제거'],
 ['유티', '정위치', '셋팅'],
 ['용접', '실시'],
 ['작업장', '주변', '정리정돈', '실시'],
 ['작업장', '정리', '방화수', '위치', '확인', '통행로', '확보'],
 ['코밍', '분류', '커팅'],
 ['TACK', '코밍', '용접'],
 ['코밍', '정식', '용접'],
 ['그라인더', '징크', '도포'],
 ['작업장', '주변', '정리정돈', '실시'],
 ['자재', '탑재', '운반'],
 ['자재', '분류', '커팅'],
 ['TACK', '찬넬', '용접'],
 ['찬넬', '정식', '용접'],
 ['그라인더', '징크', '도포'],
 ['작업장', '주변', '정리정돈', '실시'],
 ['DS', '도면', '구역', '확인'],
 ['DS', 'STEEL PLATE', '테이프', '부착'],
 ['작업장', '주변', '정리정돈', '실시'],
 ['자재', '분류', '운반', '근태', '판넬'],
 ['근태', '설치'],
 ['근태', '설치'],
 ['LIGHTING', '도면', '위치', '확인', '설치'],
 ['WALL PANEL', '설치'],
 ['SPLINE', 

### 데이터프레임에 통합

In [152]:
df['keyword'] = keywords

In [167]:
df['keyword'][:10]

0         [도어, 포장, 제거, 도어, 데미지, 주의]
1                  [운반, 설치, 위치, 점검]
2    [도어, 도어, 프레임, 분리, 도어, 데미지, 주의]
3     [도어, 설치, 위치, 운반, 도어, 데미지, 주의]
4                [도어, 오프닝, 프레임, 삽입]
5                     [도어, 프레임, 용접]
6                [용접, 부위, 그라인더, 실시]
7                 [도어, 프레임, 도어, 설치]
8               [작업장, 주변, 정리정돈, 실시]
9           [유티, 탑재, 위치, 룸, 넘버, 마킹]
Name: keyword, dtype: object

## 표준위험 매칭

In [202]:
risks = pd.read_excel("./data/표준 위험요인.xlsx")
risks

Unnamed: 0,id,위험요인,키워드,R_vector
0,위_1,위험요인1,"크레인, 슬링벨트",
1,위_2,위험요인2,"용접, 슬래그, 용접기",
2,위_3,위험요인3,지게차,
3,위_4,위험요인4,도어,
4,위_5,위험요인5,포장,
5,위_6,위험요인6,사다리,
6,위_7,위험요인7,"취부, 그라인더",
7,위_8,위험요인8,"캐리지, 취부, 사다리",
8,위_9,위험요인9,"작업대, 피스, 취부",


In [203]:
total_basket = []
for n, words in enumerate(df['keyword']):
    basket = []
    for word in words:    
        
        for p, risk in enumerate(risks['키워드']):
            risk = str(risk).split(",")   # 키워드 그룹도 하나씩 불러서 리스트로 변환
            compare = []     # 전처리된 키워드를 담을 리스트
            for a in risk:
                a = a.strip(" ")   # 혹시 있을 공란 제거후
                compare.append(a) 
    #            print(compare)

            if word in compare:
                if risks['id'][p] not in basket:
                    basket.append(risks['id'][p])
    #                 print(basket)
                else:
                    pass

    total_basket.append(basket)
            

In [206]:
len(total_basket)

7763

In [207]:
df["위험_id"] = total_basket

In [208]:
df

Unnamed: 0,작업표준,단위작업,작업행동,체크정보,keyword,위험_id
0,[선실생산_선실_목의장] 선행화기(Door),작업 준비,도어 포장 제거 (도어 데미지 주의),,"[도어, 포장, 제거, 도어, 데미지, 주의]","[위_4, 위_5]"
1,[선실생산_선실_목의장] 선행화기(Door),작업 준비,운반전 설치 위치 점검,각종 의장품의 돌출부 확인하고 안전에 문제 없는지 점검,"[운반, 설치, 위치, 점검]",[]
2,[선실생산_선실_목의장] 선행화기(Door),자재 정위치 이동,도어와 도어 프레임 분리 (도어 데미지 주의),,"[도어, 도어, 프레임, 분리, 도어, 데미지, 주의]",[위_4]
3,[선실생산_선실_목의장] 선행화기(Door),자재 정위치 이동,2인1조로 도어를 설치 위치로 운반 (도어 데미지 주의),,"[도어, 설치, 위치, 운반, 도어, 데미지, 주의]",[위_4]
4,[선실생산_선실_목의장] 선행화기(Door),도어 화기 작업,도어 오프닝에 도어 프레임 삽입,"오프닝 곡직 여부 확인, 도어 프레임 수평 및 수직 확인","[도어, 오프닝, 프레임, 삽입]",[위_4]
...,...,...,...,...,...,...
7758,[기능_입출고_입출고] 내자재 입출고 작업,자재 하차,지게차 및 천정크레인 활용하여 자재 하차,"하차전 팔레트 위 자재 상태 확인, 고박 상태 확인","[지게차, 천정, 크레인, 활용, 자재, 하차]","[위_3, 위_1]"
7759,[기능_입출고_입출고] 내자재 입출고 작업,자재 적치,Bin에 자재 적치,20kg 초과 자재 취급시 2인 1조로 작업,"[BIN, 자재, 적치]",[]
7760,[기능_입출고_입출고] 내자재 입출고 작업,자재 선별,Pallet Car 활용하여 Lighting 선별 작업,Pallet Car로 자재 이동 시 후진 주행,"[PALLET CAR, LIGHTING, 활용, 선별]",[]
7761,[기능_입출고_입출고] 내자재 입출고 작업,자재 선별,Pallet Car 활용하여 Lighting 선별 작업,20kg 초과 자재 취급시 2인 1조로 작업,"[PALLET CAR, LIGHTING, 활용, 선별]",[]


## 위험 벡터 매칭

In [234]:
vectors = pd.read_excel("./data/위험벡터.xlsx")
vectors.T

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14
키워드,크레인,슬링벨트,용접,슬래그,지게차,사다리,그라인더,캐리지,취부,피스,작업대,용접기,절단,도장,도어
위험지수,5,5,4,2,3,1,4,2,4,2,2,3.5,3,3,1


In [242]:
points = []
for words in df['keyword']:
    point = 0
    for word in words:

        if word in list(vectors['키워드']):
            point += float(vectors.loc[vectors['키워드'] == word, '위험지수'])
        else:
            point += 0
        
    points.append(point)

In [243]:
len(points)

7763

In [244]:
df['R_vector'] = points

In [245]:
df

Unnamed: 0,작업표준,단위작업,작업행동,체크정보,keyword,위험_id,R_vector
0,[선실생산_선실_목의장] 선행화기(Door),작업 준비,도어 포장 제거 (도어 데미지 주의),,"[도어, 포장, 제거, 도어, 데미지, 주의]","[위_4, 위_5]",2.0
1,[선실생산_선실_목의장] 선행화기(Door),작업 준비,운반전 설치 위치 점검,각종 의장품의 돌출부 확인하고 안전에 문제 없는지 점검,"[운반, 설치, 위치, 점검]",[],0.0
2,[선실생산_선실_목의장] 선행화기(Door),자재 정위치 이동,도어와 도어 프레임 분리 (도어 데미지 주의),,"[도어, 도어, 프레임, 분리, 도어, 데미지, 주의]",[위_4],3.0
3,[선실생산_선실_목의장] 선행화기(Door),자재 정위치 이동,2인1조로 도어를 설치 위치로 운반 (도어 데미지 주의),,"[도어, 설치, 위치, 운반, 도어, 데미지, 주의]",[위_4],2.0
4,[선실생산_선실_목의장] 선행화기(Door),도어 화기 작업,도어 오프닝에 도어 프레임 삽입,"오프닝 곡직 여부 확인, 도어 프레임 수평 및 수직 확인","[도어, 오프닝, 프레임, 삽입]",[위_4],1.0
...,...,...,...,...,...,...,...
7758,[기능_입출고_입출고] 내자재 입출고 작업,자재 하차,지게차 및 천정크레인 활용하여 자재 하차,"하차전 팔레트 위 자재 상태 확인, 고박 상태 확인","[지게차, 천정, 크레인, 활용, 자재, 하차]","[위_3, 위_1]",8.0
7759,[기능_입출고_입출고] 내자재 입출고 작업,자재 적치,Bin에 자재 적치,20kg 초과 자재 취급시 2인 1조로 작업,"[BIN, 자재, 적치]",[],0.0
7760,[기능_입출고_입출고] 내자재 입출고 작업,자재 선별,Pallet Car 활용하여 Lighting 선별 작업,Pallet Car로 자재 이동 시 후진 주행,"[PALLET CAR, LIGHTING, 활용, 선별]",[],0.0
7761,[기능_입출고_입출고] 내자재 입출고 작업,자재 선별,Pallet Car 활용하여 Lighting 선별 작업,20kg 초과 자재 취급시 2인 1조로 작업,"[PALLET CAR, LIGHTING, 활용, 선별]",[],0.0
