In [23]:
from bs4 import BeautifulSoup
import pandas as pd
from tqdm import tqdm

## Static Variables

In [39]:
# Config
LANGUAGE = "hu" # "gr", "m", "s", "a", "uz", "cz", "th"
VOCABULARY = "vo"
SENTENCE = "es"

# File path
DATA_DIR = "./data"
VOCABULARY_EXCEL_PATH = f"{DATA_DIR}/중급헝가리어 어휘 (600).xlsx"
SENTENCE_EXCEL_PATH = f"{DATA_DIR}/중급헝가리어 문장 (700).xlsx"

## LOAD TEMPLATE 

In [6]:
# load html via bs4
with open(f"{DATA_DIR}/template.html") as fp:
    template = BeautifulSoup(fp, 'html.parser')

## FIND TAGS

In [36]:
template.find("div", {"class": "child-div page-header-text"})

<div class="child-div page-header-text">1주차.단어</div>

In [37]:
template.find("span", {"id": "text1", "class": "block-text-span"})

<span class="block-text-span" id="text1">헝가리어 텍스트 입력</span>

In [39]:
template.find("span", {"id": "text2", "class": "block-text-span", "style": "display: none"})

<span class="block-text-span" id="text2" style="display: none">한국어 텍스트 입력</span>

In [8]:
template.find("audio", {"id": "audio1"}).find("source")["src"]

'audio/gr-es-01-001.mp3'

In [9]:
template.find("audio", {"id": "audio2"}).find("source")["src"]

'audio/gr-es-01-001.mp3'

## CONVERT

In [16]:
n_week = 2
contents_idx = 44
audio_file_name = f"audio/{LANGUAGE}-{VOCABULARY}-{n_week:02}-{contents_idx:03}.mp3"

In [30]:
# access by tag and replace with new text
template.find("div", {"class": "child-div page-header-text"}).string.replace_with(f"{n_week}주차.단어")

'1주차.단어'

In [None]:
template.find("audio", {"id": "audio1"}).find("source")["src"] = audio_file_name
template.find("audio", {"id": "audio2"}).find("source")["src"] = audio_file_name

## READ Excel

In [50]:
for n_week in tqdm(range(1, 15)):
    # Convert vocabulary
    vocabulary_df = pd.read_excel(
        VOCABULARY_EXCEL_PATH,
        sheet_name=f"단어-{n_week}주차",
        header=None,
        names=[LANGUAGE, "kr"]
    )
    
    for voca_idx, voca in vocabulary_df.iterrows():
        print(voca_idx, voca[LANGUAGE], voca["kr"])
        with open(f"{DATA_DIR}/template.html") as fp:
            template = BeautifulSoup(fp, 'html.parser')
        template.find("div", {"class": "child-div page-header-text"}).string.replace_with(f"{n_week}주차.단어")
        template.find("span", {"id": "text1", "class": "block-text-span"}).string.replace_with(voca[LANGUAGE])
        template.find("span", {"id": "text2", "class": "block-text-span", "style": "display: none"}).string.replace_with(voca["kr"])
        audio_file_name = f"audio/{LANGUAGE}-{VOCABULARY}-{n_week:02}-{voca_idx:03}.mp3"
        template.find("audio", {"id": "audio1"}).find("source")["src"] = audio_file_name
        template.find("audio", {"id": "audio2"}).find("source")["src"] = audio_file_name
        # TODO: templace 저장 필요
        
    # Convert sentence
    sentence_df = pd.read_excel(
        SENTENCE_EXCEL_PATH,
        sheet_name=f"예문-{n_week}주차",
        header=None,
        names=[LANGUAGE, "kr"]
    )
    
    # TODO: 문장도 마찬가지로

 14%|█▍        | 2/14 [00:00<00:01,  8.34it/s]

0 fiútestvér 남자형제
1 ikrek 쌍둥이
2 lánytestvér 여자형제, 자매
3 elmegy 가다
4 korán 일찍
5 késve 늦게
6 elköszön 작별 인사하다
7 találkozó 만남
8 szervez 조직하다
9 kamasz 사춘기, 청소년
10 tinédzser 십대
11 középkorú 중년의
12 izmos 근육질의
13 keményfejű 완고한
14 sovány 호리호리한, 마른
15 túlsúlyos 과체중인
16 anyajegy (몽고반)점
17 hajtincs 머리카락 가닥
18 szeplő 주근깨
19 tetoválás 문신
20 egyenes haj 직모
21 befont haj 땋은 머리
22 frufru 앞머리
23 göndör haj 곱슬머리
24 hullámos haj 웨이브진 머리
25 copf 말총 머리, 포니테일
26 raszta haj 레게 머리
27 barátságos 친근한, 친절한
28 bájos 매력적인
29 becsületes 정직한
30 élénk 생기발랄한
31 érzékeny 민감함
32 félénk 수줍음 많은
33 goromba 무례한
34 hallgatag 말이 없는, 조용한
35 hiú 허영심 많은
36 megbízható 믿을 수 있는, 신뢰할 수 있는
37 modortalan 예의 없는
38 szelíd 온순한
39 szószátyár 수다스러운
40 tisztességtelen 정직하지 못한, 부정직한
41 vicces 재미있는
42 zárkózott 내성적인
43 zsugori 인색한
0 ébresztőóra 알람시계
1 késés 지각
2 szakkör 동아리, 서클
3 elfoglaltság 바쁜 일정
4 megmosakodik 씻다
5 elvisz 데리고 가다
6 gördeszka 스케이트보드
7 gördeszkázik 스케이트보드를 타다
8 beállít 설정하다/맞추다
9 elhagy 떠나다
10 felébred 깨어나다
11 fésülködik 머리를 빗

 21%|██▏       | 3/14 [00:00<00:01,  8.97it/s]

0 részmunkaidős állás 파트타임 일자리
1 másodállás 부업
2 mellékállás 겸직
3 téli szünet 겨울 방학
4 nyári szünet 여름 방학
5 helyzet 상태, 상황
6 jelentkezés 지원, 신청
7 hirdetés 광고
8 siker 성공
9 gondolkodik vmin ~에 대해 생각하다
10 támogat 지원하다, 후원하다
11 bead 제출하다
12 gondol vmire ~에 대해 의견을 가지다
13 (meg)próbálkozik 시도하다
14 hozzászokik 익숙해지다, 습관 들이다
15 meglát 보다, 알아차리다
16 fárasztó 피곤한, 지치는
17 érdemes ~할 가치가 있는
18 megfelelő 적절한
19 diákmunka 학생 아르바이트
20 szerződés 계약
21 órabér 시급
22 munkaidő 근무 시간
23 pihenőidő 휴식 시간
24 feladat 과제, 업무
25 álláshirdetés 구인/채용 광고
26 jelentkezési lap 지원서, 신청서
27 állásinterjú 면접
28 fizetés 급여
29 munkahely 근무지, 직장
30 munkatárs 동료
31 váltott műszak 교대 근무
32 éjszakai műszak 야간 근무
33 hétvégi műszak 주말 근무
34 munkaadó 고용주
35 munkaszerződés 근로 계약(서), 고용 계약(서)
36 személyi jövedelemadó (szja) 개인 소득세
37 benzinkutas 주요소 직원
38 bolti eladó 매장 판매 직원
39 segédmunkás 보조 작업원
40 pénztáros 계산원
41 takarító 청소부
42 tejesember 우유 배달원
43 konyhai kisegítő 주방 보조원
44 kávézói dolgozó 카페 직원
45 bébiszitter 베이비시터
46 szórólapoz

 36%|███▌      | 5/14 [00:00<00:00,  9.96it/s]

0 tankönyv 교과서
1 fejezet 장
2 lépés 단계
3 alkalmazás 응용, 애플리케이션
4 nyelvtan 문법
5 kérdés 질문
6 vásárlás 구매
7 megsérül 부상을 당하다
8 megkérdez 물어보다
9 odafigyel 주의를 기울이다
10 megért 이해하다
11 kipróbál 시도하다
12 sűrű 빽빽한
13 egyébként 그런데
14 mindenesetre 어쨌든
15 nyugodtan 진정으로, 평온하게
16 gondnok 관리인
17 helyettesítő tanár 대체 교사
18 osztályfőnök 담임 교사
19 tanuló 학생
20 csoportmunka 그룹 작업
21 felelés 대답
22 fogalmazás 작문
23 gyakorló feladat 연습 문제
24 jegy 성적, 표
25 tollbamondás 받아쓰기
26 faliújság 게시판
27 szemeteskosár 쓰레기통
28 szivacs 스폰지
29 tanári asztal 교사 책상
30 átmegy a vizsgán 시험에 통과하다
31 dolgozatot ír 레포트를 쓰다
32 megbukik 낙제하다
33 osztályoz 등급을 매기다
34 betegszoba 병실
35 folyosó 복도
36 iskolai ebédlő 학교 식당
37 osztályterem 교실
38 sportpálya 운동장
39 tanári szoba 교무실
40 cellux 테이프
41 ceruzahegyező 연필깎이
42 filctoll 마커
43 hátizsák 배낭
44 iskolai egyenruha 학교 교복
45 iskolatáska 학교 가방
46 tolltartó 필통
47 szövegkiemelő 형광펜
0 cserediák 교환학생
1 csereutazás 교환 프로그램
2 családtag 가족 구성원
3 kapcsolat 관계
4 barátság 우정
5 megszokik 익숙해지다
6 remél

 50%|█████     | 7/14 [00:00<00:00, 10.43it/s]

felszerelés 장비
1 rendelkezés 지시, 처분
2 tevékenység 활동
3 klub 클럽
4 segítőkész 도와주기 좋아하는
5 üdvözöl 인사하다
6 ellátogat 방문하다
7 kínál 제공하다
8 elér 달성하다
9 kíváncsi 호기심이 있는
10 izgalmas 흥미진진한
11 sokrétű 다양한
12 nemzetközi 국제적인
13 művészeti 예술의
14 sportolási 운동 관련
15 évente 매년
16 valamin kívüli ~을 제외한
17 croissant 크루아상
18 csokis 초콜릿의
19 lekváros 잼의
20 pudingos 푸딩
21 sima 간단한, 단순한
22 gabonapehely 시리얼
23 gyümölcssaláta 과일 샐러드
24 keksz 비스킷
25 müzli 뮤즐리
26 pirítós 토스트
27 baconszalonna 베이컨
28 főtt tojás 삶은 계란
29 tojásrántotta 스크램블 에그
30 tükörtojás 푸라이드 에그
31 birkózás 씨름, 레슬링
32 döntetlent játszik 무승부를 기록하다
33 figyelmeztet 경고하다
34 gólt lő 골을 넣다
35 pontot szerez 점수를 얻다
36 hibázik 실수하다
37 szabálytalankodik 반칙하다
38 kivéd 막다
39 labdát vezet 공을 몰다
40 nyer 이기다
41 sípol 호루라기를 불다
42 veszít 지다
0 láz 열
1 vizsgálat (병원) 검사
2 egészségbiztosítás 건강보험
3 recepciós 접수대
4 bejelentkezési lap 접수 양식
5 orvos asszisztense 간호보조사
6 vizsgáló 검사실
7 panasz 아픔, 병고, 병
8 tünet 증상
9 torok 목
10 költség 비용
11 tűnik ~처럼 보이다
12 megfázik 감기

 64%|██████▍   | 9/14 [00:00<00:00, 10.11it/s]

13 távolsági 장거리의
14 helyközi 지역간의
15 esetleg 혹시
16 egyenesen 바로
17 nyári szabadság 여름 휴가
18 szervezett utazás 패키지여행
19 kemping 캠핑
20 lakókocsi 캠핑카
21 sátor 텐트
22 szállás reggelivel 조식 포함 숙박
23 becsomagol a bőröndbe 짐을 가방에 싸다
24 elindul 출발하다
25 helyet foglal 자리를 잡다, 예약하다
26 visszajön 돌아오다
27 árlista 가격표
28 csoportos jegy 단체 티켓
29 egy útra szóló jegy 편도 티켓
30 érkezési idő 도착 시간
31 foglalási űrlap 예약 양식
32 indulási idő 출발 시간
33 különleges ajánlat 특별 제안
34 menetrend 시간표
35 menettérti jegy / retúrjegy 왕복 티켓
36 szolgáltatások 서비스
37 útiterv 여행 계획
38 biciklitúra 자전거 여행
39 gyalogtúra 도보 여행
40 tanulmányi út 연구, 조사, 답사 여행
41 turistainformáció 관광정보
42 peron 승강장
43 ülés 좌석
44 váróterem 대합실
45 vasúti vágány 철도 궤도
46 visszatérítés 환불
47 beszállókártya 탑승권
48 csomagszállító szalag 수하물 컨베이어
49 kézikocsi 수화물 카트
50 vámmentes áru 면세품
51 check-in pultos 체크인 카운터 직원
52 légikísérő 승무원
0 előkészít 준비하다
1 visszajön 돌아오다
2 átjön 건너다
3 megtesz 하다
4 kirakat 진열창
5 próbafülke 탈의실
6 pult 카운터
7 alsónadrág 팬츠
8 fehér

 79%|███████▊  | 11/14 [00:01<00:00, 10.49it/s]

9 feltétel 조건
10 fordítás 번역
11 szán 충당하다, 책정하다
12 igényel 요구하다
13 visszakap 돌려받다
14 izgul 걱정하다
15 bérleti 임대의
16 összegű 총액의
17 biztonsági 안전의
18 változó 변동하는
19 hónapnyi 한 달치의
20 különleges 특별한
21 izgatott 흥분한
22 közelben 근처에
23 havi 월간의
24 feltüntetve 명시된
25 alaposan 철저히
26 beköltözik 입주하다
27 belép 들어가다
28 csönget 초인종을 누르다
29 elmegy otthonról 집을 떠나다
30 kiköltözik 이사하다
31 kopogtat az ajtón 문을 두드리다
32 külváros 교외
33 városközpont 도심
34 alagsor 지하실
35 házfelügyelő 관리인
36 kaputelefon 인터폰
37 postaláda 우편함
38 szemetesvödör 쓰레기통
39 kád 욕조
40 mosdókagyló 세면대
41 papucs 슬리퍼
42 hajszárító 헤어드라이기
0 hálaadás napja 추수감사절
1 holdnaptár 음력
2 családi összejövetel 가족모임
3 szertartás 제사
4 ős 조상
5 tisztelet 존경
6 holdújév 음력 설날
7 szokás 관습
8 rizstészta 떡국
9 jólét 안녕, 번영, 복
10 írásrendszer 문자체계
11 megszületés 탄생
12 büszke 자랑스러운
13 esemény 행사
14 történet 이야기
15 jelentőség 중요성
16 meghajlik 고개를 숙이다, 절하다
17 szeletel 썰다
18 szimbolizál 상징하다
19 nyugszik 안식을 취하다
20 megoszt 공유하다
21 megemlékező 기념하는
22 elhunyt 고인, 작고

100%|██████████| 14/14 [00:01<00:00, 10.12it/s]

0 kínai kel 배추
1 hozzávaló 재료
2 gyömbér 생강
3 tengeri alga 해초
4 paszta 고추장, 양념
5 íz 맛
6 cserépedény 항아리, 도자기 그릇
7 háztartás 살림, 가계
8 aroma 향
9 ízesít 맛을 내다
10 összekever 섞다
11 ken 바르다
12 ér 숙성되다
13 érlel 숙성시키다
14 tárol 보관하다
15 fogyaszt 소비하다
16 felszolgál 서빙하다
17 jellegzetes 특징적인
18 minőségű 품질의
19 csípős 매운
20 intenzív 강렬한
21 tanulságos 교훈적인, 유익한
22 egyenként 개별적으로
23 manapság 요즘
24 fokhagyma 마늘
25 hagyma 양파
26 csípős paprika 매운 고추
27 halas szósz 젓갈, 생선 소스
28 retek 무
29 póréhagyma 대파
30 erjesztés 발효
31 marhahús 소고기
32 szójaszósz 간장
33 szezámmag 참깨
34 szezámolaj 참기름
35 fekete bors 후추
36 sárgarépa 당근
37 gomba 버섯
38 grillez 그릴에 굽다
39 spenót 시금치
40 párol 찌다
41 párolás 찜
42 grillezés 그릴 요리





In [49]:
for a in vocabulary_df.iterrows():
    print(a[1])

hu    kínai kel
kr           배추
Name: 0, dtype: object
hu    hozzávaló
kr           재료
Name: 1, dtype: object
hu    gyömbér
kr         생강
Name: 2, dtype: object
hu    tengeri alga
kr              해초
Name: 3, dtype: object
hu     paszta
kr    고추장, 양념
Name: 4, dtype: object
hu    íz
kr     맛
Name: 5, dtype: object
hu    cserépedény
kr    항아리, 도자기 그릇
Name: 6, dtype: object
hu    háztartás
kr       살림, 가계
Name: 7, dtype: object
hu    aroma
kr        향
Name: 8, dtype: object
hu    ízesít
kr     맛을 내다
Name: 9, dtype: object
hu    összekever
kr            섞다
Name: 10, dtype: object
hu    ken
kr    바르다
Name: 11, dtype: object
hu      ér
kr    숙성되다
Name: 12, dtype: object
hu    érlel
kr    숙성시키다
Name: 13, dtype: object
hu    tárol
kr     보관하다
Name: 14, dtype: object
hu    fogyaszt
kr        소비하다
Name: 15, dtype: object
hu    felszolgál
kr          서빙하다
Name: 16, dtype: object
hu    jellegzetes
kr           특징적인
Name: 17, dtype: object
hu    minőségű
kr         품질의
Name: 18, dtype: object
hu    

In [47]:
a

(0,
 hu    kínai kel
 kr           배추
 Name: 0, dtype: object)

In [18]:
sentence_df

Unnamed: 0,Az ébresztőóra hat órakor csörög.,알람시계는 여섯 시에 울린다.
0,"Minden nap rohanok, mert mindig késésben vagyok.",(난) 매일 지각 때문에 뛰어간다.
1,A szakkör után a barátaimmal találkozom.,(난) 동아리 활동 후에 친구들을 만난다.
2,Más elfoglaltság miatt nem tudok menni a buliba.,(난) 바빠서 파티에 갈 수 없다.
3,"Reggelente mindig megmosakodik, mielőtt iskolá...",(그는/그녀는) 학교에 가기 전에 매일 아침 세수를 한다.
4,Az apám elvisz minket az iskolába kocsival.,아버지가 차로 우리를 학교에 데려다 주신다.
5,A gördeszka a szobám sarkában van.,스케이트보드는 내 방 구석에 있다.
6,Délutánonként a parkban gördeszkázik.,(그는/그녀는) 오후마다 공원에서 스케이트보드를 탄다.
7,A tévé hangerejét beállította a maximumra.,(그는/그녀는) TV 볼륨을 최대로 설정했다.
8,"Ne felejtsd el lekapcsolni a villanyt, amikor ...",(네가) 나갈 때 불 끄는 걸 잊지 말아라!
9,"Amikor felébred, mindig kávét iszik.",(그는/그녀는) 일어나자마자 항상 커피를 마신다.
