In [2]:
import os
import json
import numpy as np

data_dir = 'G:/signData'

train_dir = os.path.join(data_dir,'train')
val_dir = os.path.join(data_dir,'valid')

output_dir = os.path.join(data_dir,'nptxt')
val_output_dir = os.path.join(data_dir,"nptxt_val")

train_landmark_dir = os.path.join(train_dir,'label','landmark')
train_morpheme_dir = os.path.join(train_dir,'label','morpheme')

val_landmark_dir = os.path.join(val_dir,'landmark')
val_morpheme_dir = os.path.join(val_dir,'morpheme')

In [11]:
def weight_calc(F, a, b, x):
    fps=30
    a_frame = a * fps  # a를 프레임 단위로 변환
    b_frame = b * fps  # b를 프레임 단위로 변환
    x_frame = x * fps  # x(영상의 길이)를 프레임 단위로 변환
    if F < a_frame:
        return 0
    elif a_frame <= F < a_frame + 2 * fps:
        return (F - a_frame) / (2 * fps)
    elif a_frame + 2 * fps <= F < b_frame:
        return 1
    elif b_frame <= F <= x_frame:
        return 1 - ((F - b_frame) / (x_frame - b_frame)) * 0.5
    else:
        return 0.5
	

In [24]:
print(weight_calc(113,1.743,3.103,4.867))

0.811885865457294


In [4]:
#train data
start_person="01"
start_word="0001"
#사람별 데이터(01~16)
for person in os.listdir(train_landmark_dir):
    #중간부터 다시 데이터 변환시 체크포인트
    if int(person) < int(start_person):
        continue
        
    #변환 데이터 저장시 사람 폴더 생성(01~16)
    person_output_path = os.path.join(output_dir, str(int(person)))
    os.makedirs(person_output_path, exist_ok=True)
    
    #각 단어별 좌표값 및 단어 뜻 순회. 
    for word_coords,word_morpheme in zip(os.listdir(os.path.join(train_landmark_dir, person)),os.listdir(os.path.join(train_morpheme_dir, person))):
        #중간부터 다시 데이터 변환시 체크 포인트
        if int(word_coords[11:15]) <int(start_word):
            continue
        #정면카메라 외 다른 방향 카메라도 3d좌표값은 동일하여 한개의 방향에서만 데이터 추출
        #단어 별 뜻, 단어의 할당 넘버,영상 길이와 영상 내 수어 구간 추출
        if "F" in word_morpheme:
            file_path = os.path.join(train_morpheme_dir, person, word_morpheme)
            morpheme_file_path = os.path.join(train_morpheme_dir, person, word_morpheme)
            with open(morpheme_file_path, 'r', encoding="UTF8") as morpheme_file:
                data = json.load(morpheme_file)
                try:
                    name = data['data'][0]['attributes'][0]['name']
                    num = data['metaData']['name'][11:15]
                    start_sign = data["data"][0]["start"]
                    end_sign = data["data"][0]["end"]
                    duration = data["metaData"]["duration"]
                #결측치 오류 검출   
                except IndexError as e:
                    name=False
                    print(f"Error reading {morpheme_file_path}: {e}")
                    continue
        #각 단어 별 좌표 순회시, 단어 뜻이 결측치인 데이터는 제외
        if "F" in word_coords and name is not False:
            wordCoordL = np.empty((0, 4, 5, 3))  
            wordCoordR = np.empty((0, 4, 5, 3))
            wordCoordP = np.empty((0, 3, 10))
            wordWeight = []
            #단어 영상의 각 프레임별 좌표값 추출            
            for frame in os.listdir(os.path.join(train_landmark_dir, person, word_coords)):
                
                file_path = os.path.join(train_landmark_dir, person, word_coords, frame)
                frame_num=int(frame[25:38])
                with open(file_path, 'r') as json_file:
                    data = json.load(json_file)
                    lh_points = data['people']['hand_left_keypoints_3d']
                    rh_points = data['people']['hand_right_keypoints_3d']
                    p_points = data['people']['pose_keypoints_3d']
                    #포즈 좌표값 추출
                    #1920x1080영상을 메디어파이프의 특성상 영상의 중심을 기준으로 1080x1080으로 잘라서 기존 죄표를 픽셀 값으로 변환 후 
                    # 다시 미디어 파이프와 같은 스케일인 0~1사이 값으로 정규화
                    #z좌표는 미디어파이프의 기준이 되는 랜드마크의 좌표 활용하여 계산
                    
                    preFrameCoordP = np.array([[(960 * p_points[i] + 960 - 420) / (1500 - 420), 
                                                (1080 * p_points[i + 1] + 540) / 1080,
                                                (p_points[32 + 2] - p_points[i + 2]) / 10]
                                               for i in range(0, len(p_points), 4)], dtype=np.float32)

                    preFrameCoordL = np.array([[(960 * lh_points[i] + 960 - 420) / (1500 - 420),
                                                (1080 * lh_points[i + 1] + 540) / 1080,
                                                (lh_points[2] - lh_points[i + 2]) / 10]
                                               for i in range(4, len(lh_points), 4)], dtype=np.float32)

                    preFrameCoordR = np.array([[(960 * rh_points[i] + 960 - 420) / (1500 - 420),
                                                (1080 * rh_points[i + 1] + 540) / 1080,
                                                (rh_points[2] - rh_points[i + 2]) / 10]
                                               for i in range(4, len(rh_points), 4)], dtype=np.float32)
                    
                    #포즈 좌표에서 하반신 랜드마크 제외
                    preFrameCoordP = preFrameCoordP[[i for i in range(19) if (0 <= i <= 7) or (17 <= i <= 18)]]
                    
                    #랜드마크 값들을 모델 트레이닝에 적합한 모양으로 재배열.
                    frameCoordL=preFrameCoordL.reshape(5,4,3).transpose(1,0,2)[::-1]
                    frameCoordR=preFrameCoordR.reshape(5,4,3).transpose(1,0,2)[::-1]
                    frameCoordP=preFrameCoordP.T
                    #한 단어의 프레임 별 좌표를 하나의 넘파이 배열로 저장
                    wordCoordL = np.append(wordCoordL, [frameCoordL], axis=0)
                    wordCoordR = np.append(wordCoordR, [frameCoordR], axis=0)
                    wordCoordP = np.append(wordCoordP, [frameCoordP], axis=0)
                    wordWeight.append(weight_calc(frame_num,start_sign,end_sign,duration))
                    
            label=[name,start_sign,end_sign,duration]
            word_output_path = os.path.join(person_output_path, f'{num}.npz')
            np.savez(word_output_path, wordCoordL=wordCoordL, wordCoordR=wordCoordR, wordCoordP=wordCoordP, label=label, weight=wordWeight)
            print(f"Saved {word_output_path}")
            count+=1
        else:
            continue


FileNotFoundError: [Errno 2] No such file or directory: 'G:/signData/train/label/landmark'

In [5]:
#val data
start_person="01"
start_word="0001"
#사람별 데이터(01~16)
for person in os.listdir(val_landmark_dir):  # train_landmark_dir -> val_landmark_dir
    #중간부터 다시 데이터 변환시 체크포인트
    if int(person) < int(start_person):
        continue
        
    #변환 데이터 저장시 사람 폴더 생성(01~16)
    person_output_path = os.path.join(output_dir, str(int(person)))
    os.makedirs(person_output_path, exist_ok=True)
    
    #각 단어별 좌표값 및 단어 뜻 순회. 
    for word_coords,word_morpheme in zip(os.listdir(os.path.join(val_landmark_dir, person)),os.listdir(os.path.join(val_morpheme_dir, person))):  # train_landmark_dir -> val_landmark_dir, train_morpheme_dir -> val_morpheme_dir
        #중간부터 다시 데이터 변환시 체크 포인트
        if int(word_coords[11:15]) < int(start_word):
            continue
        #정면카메라 외 다른 방향 카메라도 3d좌표값은 동일하여 한개의 방향에서만 데이터 추출
        #단어 별 뜻, 단어의 할당 넘버,영상 길이와 영상 내 수어 구간 추출
        if "F" in word_morpheme:
            file_path = os.path.join(val_morpheme_dir, person, word_morpheme)  # train_morpheme_dir -> val_morpheme_dir
            morpheme_file_path = os.path.join(val_morpheme_dir, person, word_morpheme)  # train_morpheme_dir -> val_morpheme_dir
            with open(morpheme_file_path, 'r', encoding="UTF8") as morpheme_file:
                data = json.load(morpheme_file)
                try:
                    name = data['data'][0]['attributes'][0]['name']
                    num = data['metaData']['name'][11:15]
                    start_sign = data["data"][0]["start"]
                    end_sign = data["data"][0]["end"]
                    duration = data["metaData"]["duration"]
                #결측치 오류 검출   
                except IndexError as e:
                    name = False
                    print(f"Error reading {morpheme_file_path}: {e}")
                    continue
        #각 단어 별 좌표 순회시, 단어 뜻이 결측치인 데이터는 제외
        if "F" in word_coords and name is not False:
            wordCoordL = np.empty((0, 4, 5, 3))  
            wordCoordR = np.empty((0, 4, 5, 3))
            wordCoordP = np.empty((0, 3, 10))
            wordWeight = []
            #단어 영상의 각 프레임별 좌표값 추출            
            for frame in os.listdir(os.path.join(val_landmark_dir, person, word_coords)):  # train_landmark_dir -> val_landmark_dir
                file_path = os.path.join(val_landmark_dir, person, word_coords, frame)  # train_landmark_dir -> val_landmark_dir
                frame_num = int(frame[25:38])
                with open(file_path, 'r') as json_file:
                    data = json.load(json_file)
                    lh_points = data['people']['hand_left_keypoints_3d']
                    rh_points = data['people']['hand_right_keypoints_3d']
                    p_points = data['people']['pose_keypoints_3d']
                    #포즈 좌표값 추출 및 정규화 코드 동일
                    preFrameCoordP = np.array([[(960 * p_points[i] + 960 - 420) / (1500 - 420), 
                                                (1080 * p_points[i + 1] + 540) / 1080,
                                                (p_points[32 + 2] - p_points[i + 2]) / 10]
                                               for i in range(0, len(p_points), 4)], dtype=np.float32)

                    preFrameCoordL = np.array([[(960 * lh_points[i] + 960 - 420) / (1500 - 420),
                                                (1080 * lh_points[i + 1] + 540) / 1080,
                                                (lh_points[2] - lh_points[i + 2]) / 10]
                                               for i in range(4, len(lh_points), 4)], dtype=np.float32)

                    preFrameCoordR = np.array([[(960 * rh_points[i] + 960 - 420) / (1500 - 420),
                                                (1080 * rh_points[i + 1] + 540) / 1080,
                                                (rh_points[2] - rh_points[i + 2]) / 10]
                                               for i in range(4, len(rh_points), 4)], dtype=np.float32)
                    
                    #포즈 좌표에서 하반신 랜드마크 제외
                    preFrameCoordP = preFrameCoordP[[i for i in range(19) if (0 <= i <= 7) or (17 <= i <= 18)]]
                    
                    #랜드마크 값들을 모델 트레이닝에 적합한 모양으로 재배열.
                    frameCoordL = preFrameCoordL.reshape(5, 4, 3).transpose(1, 0, 2)[::-1]
                    frameCoordR = preFrameCoordR.reshape(5, 4, 3).transpose(1, 0, 2)[::-1]
                    frameCoordP = preFrameCoordP.T
                    #한 단어의 프레임 별 좌표를 하나의 넘파이 배열로 저장
                    wordCoordL = np.append(wordCoordL, [frameCoordL], axis=0)
                    wordCoordR = np.append(wordCoordR, [frameCoordR], axis=0)
                    wordCoordP = np.append(wordCoordP, [frameCoordP], axis=0)
                    wordWeight.append(weight_calc(frame_num, start_sign, end_sign, duration))
                    
            label = [name, start_sign, end_sign, duration]
            word_output_path = os.path.join(person_output_path, f'{num}.npz')
            np.savez(word_output_path, wordCoordL=wordCoordL, wordCoordR=wordCoordR, wordCoordP=wordCoordP, label=label, weight=wordWeight)
            print(f"Saved {word_output_path}")
            count += 1
        else:
            continue

2007
Saved G:/signData\nptxt_val\18\1.npz
2008
Saved G:/signData\nptxt_val\18\2.npz
2009
Saved G:/signData\nptxt_val\18\3.npz
2010
Saved G:/signData\nptxt_val\18\4.npz
2011
Saved G:/signData\nptxt_val\18\5.npz
2012
Saved G:/signData\nptxt_val\18\6.npz
2013


KeyboardInterrupt: 

In [None]:
def load_data(person,word):
    path=f"{output_dir}/{person}/{word}.npz"
    data = np.load(path)
    wordCoordL = data['wordCoordL']
    wordCoordR = data['wordCoordR']
    wordCoordP = data['wordCoordP']
    label = data['label']
    weight = data['weight']
    return wordCoordL, wordCoordR, wordCoordP, label, weight


def load_word(person, start, num):
    words = []
    for WNum in range(start, start + num):
        wordCoordL, wordCoordR, wordCoordP, label = load_data(person, WNum)
        words.append([wordCoordL, wordCoordR, wordCoordP, label])
    return words


In [7]:
person_blacklist=[]
word_dict={}
num=1
for person in os.listdir(train_morpheme_dir):
    for word_morpheme in os.listdir(os.path.join(train_morpheme_dir, person)):
        if "F" in word_morpheme:
            file_path = os.path.join(train_morpheme_dir, person, word_morpheme)
            morpheme_file_path = os.path.join(train_morpheme_dir, person, word_morpheme)
            with open(morpheme_file_path, 'r', encoding="UTF8") as morpheme_file:
                data = json.load(morpheme_file)
                try:
                    name = data['data'][0]['attributes'][0]['name']
                    name = name.replace("\n", "")
                    if name in word_dict:
                        continue
                    else:
                        word_dict[name]=num
                except IndexError as e:
                    person_blacklist.append({person: data['metaData']['name'][7:15]})
                    name=False
                    # word_list.append({data['metaData']['name'][7:15]:None})
                    print(f"Error reading {morpheme_file_path}: {e}")
                    continue
            num+=1   
    with open('wordtonum.json', 'w') as json_file:
        json.dump(word_dict, json_file)

Error reading G:/signData/train/label/morpheme\02\NIA_SL_WORD1056_REAL25_F_morpheme.json: list index out of range
Error reading G:/signData/train/label/morpheme\02\NIA_SL_WORD2742_REAL02_F_morpheme.json: list index out of range
Error reading G:/signData/train/label/morpheme\04\NIA_SL_WORD0796_REAL04_F_morpheme.json: list index out of range
Error reading G:/signData/train/label/morpheme\09\NIA_SL_WORD1082_REAL09_F_morpheme.json: list index out of range
Error reading G:/signData/train/label/morpheme\09\NIA_SL_WORD1612_REAL09_F_morpheme.json: list index out of range
Error reading G:/signData/train/label/morpheme\09\NIA_SL_WORD1613_REAL09_F_morpheme.json: list index out of range
Error reading G:/signData/train/label/morpheme\09\NIA_SL_WORD1614_REAL09_F_morpheme.json: list index out of range
Error reading G:/signData/train/label/morpheme\09\NIA_SL_WORD1615_REAL09_F_morpheme.json: list index out of range
Error reading G:/signData/train/label/morpheme\13\NIA_SL_WORD0528_REAL13_F_morpheme.json

In [8]:
with open('wordtonum.json', 'r', encoding="UTF8") as json_file:
    data = json.load(json_file)
    print(data)
    

{'고민': 1, '뻔뻔': 2, '수어': 3, '남아': 4, '눈': 5, '독신': 6, '음료수': 7, '발가락': 8, '슬프다': 9, '자극': 10, '안타깝다': 11, '어색하다': 12, '여아': 13, '외국인': 14, '영아': 15, '신사': 16, '뉴질랜드': 17, '나사렛대학교': 18, '알아서': 19, '장애인': 20, '열아홉번째': 21, '침착': 22, '성실': 23, '학교연혁': 24, '싫어하다': 25, '급하다': 26, '필기시험': 27, '병문안': 28, '검사': 29, '결승전': 30, '낚시터': 31, '낚시대': 32, '당뇨병': 33, '독서': 34, '매표소': 35, '면역': 36, '감기': 37, '배드민턴': 38, '변비': 39, '병명': 40, '보건소': 41, '불면증': 42, '불행': 43, '붕대': 44, '사위': 45, '설사': 46, '성병': 47, '방충': 48, '소화제': 49, '손녀': 50, '손자': 51, '수면제': 52, '수집가': 53, '여행지': 54, '예식장': 55, '올림픽경기': 56, '회복': 57, '첫번째': 58, '운동경기': 59, '입원': 60, '재혼': 61, '진단서': 62, '축구장': 63, '치료': 64, '치료법': 65, '친아들': 66, '퇴원': 67, '한약': 68, '한약방': 69, '빈혈': 70, '화상': 71, '가래떡': 72, '고깃국': 73, '고추': 74, '고추가루': 75, '사골': 76, '배추국': 77, '꽈베기': 78, '벌꿀': 79, '꿀물': 80, '냄비': 81, '찬물': 82, '다과': 83, '지방경찰청장': 84, '된장찌게': 85, '돼지고기': 86, '두부': 87, '딸기': 88, '떡국': 89, '라면': 90, '막걸리': 91, '무': 92, '밥그릇': 93, '밥솥': 94, '보

In [25]:
with open('wordtonum.json', 'r', encoding="UTF8") as json_file:
    data = json.load(json_file)
    print(data['신부'])
    

2142
