# Converter Law To HTML

In [1]:
def convert_law_to_html(law_text):
    """
    주어진 법 조항 텍스트를 원하는 HTML 포맷으로 변환합니다.

    Args:
        law_text (str): 변환할 법 조항 텍스트입니다.

    Returns:
        str: 변환된 HTML 포맷의 텍스트입니다.
    """
    lines = law_text.strip().split('\n')
    article_number_line = lines[0]
    article_number = article_number_line.split('(')[0].strip()
    article_title = article_number_line.split('(')[1].split(')')[0].strip()

    html_output = f"""
    <div class="law-article">
        <h3>{article_number} ({article_title})</h3>
        <ul>
    """

    sub_list_active = False
    sub_list_counter = 1

    for line in lines[1:]:
        line = line.strip()
        if not line:
            continue

        if line.startswith(str(sub_list_counter) + "."):
            if not sub_list_active:
                html_output += "<ol>\n"
                sub_list_active = True
            content = line[len(str(sub_list_counter)) + 1:].strip()
            if "부속품을 포함한다" in content:
                content = content.replace("부속품을 포함한다", '<span class="keyword highlight">부속품을 포함한다</span>')
            html_output += f"<li>{content}</li>\n"
            sub_list_counter += 1
        elif line.startswith("[본조신설"):
            if sub_list_active:
                html_output += "</ol>\n"
                sub_list_active = False
            html_output += f"<li class=\"annotation\">{line}</li>\n"
        elif line.startswith("다만,"):
            if sub_list_active:
                html_output += "</ol>\n"
                sub_list_active = False
            html_output += f"<li class=\"proviso\">{line}</li>\n"
        elif line.startswith("이하 이 조에서 같다"):
            html_output += f"<li><span class=\"keyword highlight\">{line}</span></li>\n"
        elif line.startswith("①") or line.startswith("②") or line.startswith("③") or \
             line.startswith("④") or line.startswith("⑤") or line.startswith("⑥") or \
             line.startswith("⑦") or line.startswith("⑧") or line.startswith("⑨"):
            if sub_list_active:
                html_output += "</ol>\n"
                sub_list_active = False
                sub_list_counter = 1
            content = line[3:].strip()
            if "부속품을 포함한다" in content:
                content = content.replace("부속품을 포함한다", '<span class="keyword highlight">부속품을 포함한다</span>')
            html_output += f"<li>{content}</li>\n"
            sub_list_counter = 1 # Reset sublist counter for new top-level item
        else:
            if sub_list_active:
                html_output += "</ol>\n"
                sub_list_active = False
                sub_list_counter = 1
            html_output += f"<li>{line}</li>\n"

    if sub_list_active:
        html_output += "</ol>\n"

    html_output += """
        </ul>
    </div>
    """
    return html_output

# 원문 내용
original_text = """
제49조(폐색에 의한 열차 운행) ①폐색에 의한 방법으로 열차를 운행하는 경우에는 본선을 폐색구간으로 분할하여야 한다. 다만, 정거장내의 본선은 이를 폐색구간으로 하지 아니할 수 있다.

②하나의 폐색구간에는 둘 이상의 열차를 동시에 운행할 수 없다. 다만, 다음 각 호에 해당하는 경우에는 그렇지 않다. <개정 2021. 10. 26.>

1. 제36조제2항 및 제3항에 따라 열차를 진입시키려는 경우

2. 고장열차가 있는 폐색구간에 구원열차를 운전하는 경우

3. 선로가 불통된 구간에 공사열차를 운전하는 경우

4. 폐색구간에서 뒤의 보조기관차를 열차로부터 떼었을 경우

5. 열차가 정차되어 있는 폐색구간으로 다른 열차를 유도하는 경우

6. 폐색에 의한 방법으로 운전을 하고 있는 열차를 열차제어장치로 운전하거나 시계운전이 가능한 노선에서 열차를 서행하여 운전하는 경우

7. 그 밖에 특별한 사유가 있는 경우
"""

# 원하는 포맷으로 변환
output_html = convert_law_to_html(original_text)

# 결과 출력
print(output_html)


    <div class="law-article">
        <h3>제49조 (폐색에 의한 열차 운행)</h3>
        <ul>
    <li>의 폐색구간에는 둘 이상의 열차를 동시에 운행할 수 없다. 다만, 다음 각 호에 해당하는 경우에는 그렇지 않다. <개정 2021. 10. 26.></li>
<ol>
<li>제36조제2항 및 제3항에 따라 열차를 진입시키려는 경우</li>
<li>고장열차가 있는 폐색구간에 구원열차를 운전하는 경우</li>
<li>선로가 불통된 구간에 공사열차를 운전하는 경우</li>
<li>폐색구간에서 뒤의 보조기관차를 열차로부터 떼었을 경우</li>
<li>열차가 정차되어 있는 폐색구간으로 다른 열차를 유도하는 경우</li>
<li>폐색에 의한 방법으로 운전을 하고 있는 열차를 열차제어장치로 운전하거나 시계운전이 가능한 노선에서 열차를 서행하여 운전하는 경우</li>
<li>그 밖에 특별한 사유가 있는 경우</li>
</ol>

        </ul>
    </div>
    
