In [51]:
import pandas as pd
df = pd.read_csv("法令名等一覧test.csv", encoding="ANSI")

In [52]:
print(df.head())

   ＩＤ                       法令名          条項  法令名.1  法令番号  法令番号_漢数字  法令名_eGov  \
0  10  臓器の移植に関する法律（平成９年法律第104号）  第６条（臓器の摘出）    NaN   NaN       NaN       NaN   
1  11  臓器の移植に関する法律（平成９年法律第104号）      第６条第４項    NaN   NaN       NaN       NaN   
2  12  臓器の移植に関する法律（平成９年法律第104号）      附則第11条    NaN   NaN       NaN       NaN   

   法令番号_eGov  法令名の整合  条番号_漢数字  条番号_数字  条番号_eGov  条見出し  条見出し_eGov  条見出しの整合  
0        NaN     NaN      NaN     NaN       NaN   NaN        NaN      NaN  
1        NaN     NaN      NaN     NaN       NaN   NaN        NaN      NaN  
2        NaN     NaN      NaN     NaN       NaN   NaN        NaN      NaN  


In [53]:
#dfに列を追加する。要素カラだが、文字列とする。
df['項'] = pd.Series(dtype='string')
df['号'] = pd.Series(dtype='string')
df['本則附則の別'] = pd.Series(dtype='string')


#法令名という列の見出しを法令名および法令番号に変更する。
df.rename(columns={'法令名': '法令名および法令番号'}, inplace=True)
#法令名.1という列の見出しを法令名に変更する。
df.rename(columns={'法令名.1': '法令名'}, inplace=True)
display(df.head())


Unnamed: 0,ＩＤ,法令名および法令番号,条項,法令名,法令番号,法令番号_漢数字,法令名_eGov,法令番号_eGov,法令名の整合,条番号_漢数字,条番号_数字,条番号_eGov,条見出し,条見出し_eGov,条見出しの整合,項,号,本則附則の別
0,10,臓器の移植に関する法律（平成９年法律第104号）,第６条（臓器の摘出）,,,,,,,,,,,,,,,
1,11,臓器の移植に関する法律（平成９年法律第104号）,第６条第４項,,,,,,,,,,,,,,,
2,12,臓器の移植に関する法律（平成９年法律第104号）,附則第11条,,,,,,,,,,,,,,,


In [54]:
#法令名および法令番号の要素を設定する。
df['法令名'] = df['法令名および法令番号'].str.split('（').str[0]
df['法令番号'] = df['法令名および法令番号'].str.split('（').str[1].str.replace('）', '')

#本則附則の別は、条項列の冒頭に「附則」が含まれる場合は「附則」、それ以外の場合は「本則」とする。
df['本則附則の別'] = df['条項'].str.startswith('附則').replace({True: '附則', False: '本則'})

#条番号の列を設定する。条番号は、条項列の「附則第」または「第」から「条」までの文字列を抽出する。
df['条番号_漢数字'] = df['条項'].str.extract(r'(第[0-9０-９]+条(?:の[０-９]+)?)')[0]

#条番号_数字の列を設定する。条番号_数字は、条番号から「の」を「_」に変換し、「第」と「条」を除き、全角を半角に変換した文字列を抽出する。
df['条番号_数字'] = df['条番号_漢数字'].str.replace('第', '').str.replace('条', '').str.replace('の', '_')
#「条番号_数字」の列の要素に、str.maketrans('０１２３４５６７８９', '0123456789')を適用して全角数字を半角数字に変換する
df['条番号_数字'] = df['条番号_数字'].str.translate(str.maketrans('０１２３４５６７８９', '0123456789'))


#条番号_数字の列を設定し終わったので、条番号の列の要素に、convert_arabic_to_egovlawno.pyで定義されたarabic_to_kanji関数を適用して、数字を漢数字に変換する。
from convert_arabic_to_egovlawno import convert_arabic_to_kanji_in_string
df['条番号_漢数字'] = df['条番号_漢数字'].apply(lambda x: convert_arabic_to_kanji_in_string(str(x)) if pd.notnull(x) else x)

#項列と号列にそれぞれの数値を半角で設定する
df['項'] = df['条項'].astype(str).str.extract(r'(第[0-9０-９]+項)')[0].str.replace('第', '').str.replace('項', '').str.translate(str.maketrans('０１２３４５６７８９', '0123456789'))
df['号'] = df['条項'].astype(str).str.extract(r'(第[0-9０-９]+号)')[0].str.replace('第', '').str.replace('号', '').str.translate(str.maketrans('０１２３４５６７８９', '0123456789'))

#法令番号_漢数字列に、法令番号を漢数字に変換した値を設定する。
df['法令番号_漢数字'] = df['法令番号'].apply(lambda x: convert_arabic_to_kanji_in_string(str(x)) if pd.notnull(x) else x)

#条見出し列に、条項の全角かっこで囲まれた部分を抽出する。
df['条見出し'] = df['条項'].str.extract(r'(（.*?）)')[0]

display(df)


Unnamed: 0,ＩＤ,法令名および法令番号,条項,法令名,法令番号,法令番号_漢数字,法令名_eGov,法令番号_eGov,法令名の整合,条番号_漢数字,条番号_数字,条番号_eGov,条見出し,条見出し_eGov,条見出しの整合,項,号,本則附則の別
0,10,臓器の移植に関する法律（平成９年法律第104号）,第６条（臓器の摘出）,臓器の移植に関する法律,平成９年法律第104号,平成九年法律第百四号,,,,第六条,6,,（臓器の摘出）,,,,,本則
1,11,臓器の移植に関する法律（平成９年法律第104号）,第６条第４項,臓器の移植に関する法律,平成９年法律第104号,平成九年法律第百四号,,,,第六条,6,,,,,4.0,,本則
2,12,臓器の移植に関する法律（平成９年法律第104号）,附則第11条,臓器の移植に関する法律,平成９年法律第104号,平成九年法律第百四号,,,,第十一条,11,,,,,,,附則


In [55]:
#法令名_eGovと法令番号_eGovの列を設定
#一度読み込んだretrieve_law_no_or_name.pyをリロード
import importlib
importlib.reload(importlib.import_module('retrieve_law_no_or_name'))
from retrieve_law_no_or_name import RetrieveLaw
retriever = RetrieveLaw()
df['法令名_eGov'] = df['法令番号_漢数字'].apply(lambda x: retriever.get_law_name_or_no("LawNo",str(x)) if pd.notnull(x) else x)
df['法令番号_eGov'] = df['法令名'].apply(lambda x: retriever.get_law_name_or_no("LawName",str(x)) if pd.notnull(x) else x)

In [56]:
#「法令名」列と「法令名_eGov」列の名前が同じ、かつ、「法令番号_漢数字」列と「法令番号_eGov」列の名前が同じ場合は、「法令名の整合」列にTrue、そうでなければFalseを設定する。
df['法令名の整合'] = (df['法令名'] == df['法令名_eGov']) & (df['法令番号_漢数字'] == df['法令番号_eGov'])

display(df)

Unnamed: 0,ＩＤ,法令名および法令番号,条項,法令名,法令番号,法令番号_漢数字,法令名_eGov,法令番号_eGov,法令名の整合,条番号_漢数字,条番号_数字,条番号_eGov,条見出し,条見出し_eGov,条見出しの整合,項,号,本則附則の別
0,10,臓器の移植に関する法律（平成９年法律第104号）,第６条（臓器の摘出）,臓器の移植に関する法律,平成９年法律第104号,平成九年法律第百四号,臓器の移植に関する法律,平成九年法律第百四号,True,第六条,6,,（臓器の摘出）,,,,,本則
1,11,臓器の移植に関する法律（平成９年法律第104号）,第６条第４項,臓器の移植に関する法律,平成９年法律第104号,平成九年法律第百四号,臓器の移植に関する法律,平成九年法律第百四号,True,第六条,6,,,,,4.0,,本則
2,12,臓器の移植に関する法律（平成９年法律第104号）,附則第11条,臓器の移植に関する法律,平成９年法律第104号,平成九年法律第百四号,臓器の移植に関する法律,平成九年法律第百四号,True,第十一条,11,,,,,,,附則


In [90]:
#条見出しの列の要素に対応する条番号を、条番号_eGov列に設定する。そのためには、RetrieveArticle()を、法令番号_漢数字列の要素を引数にインスタンス化し、RetrieveArticleNoOrCaption().get_article_no()に条見出しを引数にして適用する。
from retrieve_article_no_or_caption import RetrieveArticle as Ret
from retrieve_article_no_or_caption import RetrieveSupplyArticle as RetSup
def exists_article_caption_and_get_no(law_no, article_caption):
    try:
        return Ret(law_no).get_article_no(article_caption)
    except Exception:
        return None

def exists_article_no_and_get_caption(law_no, article_no):
    try:
        return Ret(law_no).get_article_caption(article_no)
    except Exception:
        return None
    
def exists_article_caption_and_get_no_spp(law_no, article_caption):
    retsup = RetSup(law_no)
    retsup.amend_data()
    try:
        return retsup.get_article_no(article_caption)
    except Exception:
        return None

def exists_article_no_and_get_caption_spp(law_no, article_no):
    retsup = RetSup(law_no)
    retsup.amend_data()
    try:
        return retsup.get_article_caption(article_no)
    except Exception:
        return None
    
#df['本則附則の別']が「附則」の場合は、RetrieveSupplyArticleを使用し、「本則」の場合はRetrieveArticleを使用する。
df['条番号_eGov'] = df.apply(lambda row: exists_article_caption_and_get_no_spp(row['法令番号_漢数字'], row['条見出し']) if row['本則附則の別'] == '附則' else exists_article_caption_and_get_no(row['法令番号_漢数字'], row['条見出し']) , axis=1)
df['条見出し_eGov'] = df.apply(lambda row: exists_article_no_and_get_caption_spp(row['法令番号_漢数字'], row['条番号_漢数字']) if row['本則附則の別'] == '附則' else exists_article_no_and_get_caption(row['法令番号_漢数字'], row['条番号_漢数字']) , axis=1)

#「条番号_漢字」列と「条番号_数字_eGov」列の名前が同じ、かつ、「条見出し」列と「条見出し_eGov」列の名前が同じ場合は、「条見出しの整合」列にTrue、そうでなければFalseを設定する。なお、「条項」がNaNの場合には、Trueとする
df['条見出しの整合'] = (df['条見出し'] == df['条見出し_eGov']) & (df['条番号_漢数字'] == df['条番号_eGov']) | df['条項'].isna()
display(df)


ImportError: cannot import name 'RetrieveSupplyArticle' from 'retrieve_article_no_or_caption' (c:\sasase\eGovAPI\retrieve_article_no_or_caption.py)

In [28]:
def retrieve_url(law_no, article_no, paragraph_no, item_no):
    """
    e-Gov法令APIから、法令番号と条文番号を指定して、条文の内容を取得する。
    :param law_no: 法令番号
    :param article_no: 条文番号
    :param paragraph_no: 段落番号
    :param item_no: 項目番号
    :return: 条文の内容
    """
    
    if pd.isna(item_no) == False: #号チェック
        target = "item"
        if pd.isna(article_no) and pd.isna(paragraph_no):
            #なしなしあり
            url = f"https://laws.e-gov.go.jp/api/1/articles;lawNum={law_no}"
        elif pd.isna(article_no) and pd.isna(paragraph_no)==False:
            #なしありあり
            url = f"https://laws.e-gov.go.jp/api/1/articles;lawNum={law_no};paragraph={paragraph_no}"
        elif pd.isna(article_no)==False and pd.isna(paragraph_no):
            #ありなしあり
            url = f"https://laws.e-gov.go.jp/api/1/articles;lawNum={law_no};article={article_no}"
        elif pd.isna(article_no)==False and pd.isna(paragraph_no)==False:
            #ありありあり
            url = f"https://laws.e-gov.go.jp/api/1/articles;lawNum={law_no};article={article_no};paragraph={paragraph_no}"
            
    elif pd.isna(paragraph_no) == False: #項チェック
        target = "paragraph"
        if pd.isna(article_no):
        #なしありなし
            url = f"https://laws.e-gov.go.jp/api/1/articles;lawNum={law_no};paragraph={paragraph_no}"
        else:
        #ありありなし
            url = f"https://laws.e-gov.go.jp/api/1/articles;lawNum={law_no};article={article_no};paragraph={paragraph_no}"
            
    else:
        #無意味または不要
        target = None
        url = None
        
    return target, url        
        
        
        
        
    
    # elif pd.isna(article_no) and pd.isna(paragraph_no)==False and pd.isna(item_no)==False:
    #     #なしありあり
    #     url = f"https://laws.e-gov.go.jp/api/1/articles;lawNum={law_no};paragraph={paragraph_no}"      
          
    # elif pd.isna(article_no) and pd.isna(paragraph_no)==False and pd.isna(item_no):
    #     #なしありなし
    #     url = f"https://laws.e-gov.go.jp/api/1/articles;lawNum={law_no};paragraph={ParagraphNo}"   
        
    # elif pd.isna(article_no) == False and pd.isna(paragraph_no) and pd.isna(item_no):
    #     #ありなしなし
    # elif pd.isna(article_no) == False and pd.isna(paragraph_no) == False and pd.isna(item_no):
    #     #ありありなし
    # elif pd.isna(article_no) == False and pd.isna(paragraph_no) == False and pd.isna(item_no)== False:
    #     #ありありあり
    # elif pd.isna(article_no) == False and pd.isna(paragraph_no) == False and pd.isna(item_no):
        
        

In [33]:
def exists_item( url, item_no):
    #号取得の例
    import requests

    response = requests.get(url,verify = True)
    data = response.text

    import xml.etree.ElementTree as ET
    # パース
    root = ET.fromstring(data)

    # Item Num="item_no" を探す
    item = root.find(f".//Item[@Num='{item_no}']")

    # 下位要素を含む XML 文字列として取得
    if item is not None:
        return True
    else:
        return False

def exists_paragraph(url):
    
    import requests
    response = requests.get(url,verify = True)
    data = response.text
    
    import xml.etree.ElementTree as ET
    # XMLをパース
    root = ET.fromstring(data)

    # <Code> 要素の値を取得して判断
    code_element = root.find(".//Code")

    # 真偽値を返すロジック
    if code_element is not None and code_element.text == "0":
        return True
    elif code_element is not None and code_element.text == "1":
        return False
    else:
        # 意図しないコード値や欠損への対応
        return None
    
def check_item_or_paragraph(law_no, article_no, paragraph_no, item_no):
    target, url = retrieve_url(law_no, article_no, paragraph_no, item_no)
    if target == "item":  # 号チェック
        return exists_item(url, item_no)
    elif target == "paragraph":  # 項チェック
        return exists_paragraph(url)
    else:
        # 無意味または不要
        return  None

    
    
    
    

In [34]:
#条項チェックという列を追加、値はbool型で一律NaN
df['条項チェック'] = pd.Series(dtype='float')

#条項チェック列に、法令番号、条番号、項番号、号番号を引数にしてcheck_item_or_paragraph()を適用する。
df['条項チェック'] = df.apply(
    lambda row: check_item_or_paragraph(
        row['法令番号_漢数字'],
        row['条番号_数字'],
        row['項'],
        row['号']
    ),
    axis=1
)
display(df)


Unnamed: 0,ＩＤ,法令名および法令番号,条項,法令名,法令番号,法令番号_漢数字,法令名_eGov,法令番号_eGov,法令名の整合,条番号_漢数字,条番号_数字,条番号_eGov,条見出し,条見出し_eGov,条見出しの整合,項,号,本則附則の別,条番号_数字_eGov,条項チェック
0,1,警備業法（昭和47年法律第117号）,,警備業法,昭和47年法律第117号,昭和四十七年法律第百十七号,警備業法,昭和四十七年法律第百十七号,True,,,,,,True,,,,,
1,2,建築基準法施行令（昭和25年政令第338号）,第１条（用語の定義）第３号,建築基準法施行令,昭和25年政令第338号,昭和二十五年政令第三百三十八号,建築基準法施行令,昭和二十五年政令第三百三十八号,True,第一条,1,,（用語の定義）,（用語の定義）,True,,3.0,本則,第一条,True
2,3,災害救助法（昭和22年法律第118号）,,災害救助法,昭和22年法律第118号,昭和二十二年法律第百十八号,災害救助法,昭和二十二年法律第百十八号,True,,,,,,True,,,,,
3,4,災害対策基本法（昭和36年法律第223号）,,災害対策基本法,昭和36年法律第223号,昭和三十六年法律第二百二十三号,災害対策基本法,昭和三十六年法律第二百二十三号,True,,,,,,True,,,,,
4,5,自動車損害賠償保障法（昭和30年法律第97号）,第２条（定義）,自動車損害賠償保障法,昭和30年法律第97号,昭和三十年法律第九十七号,自動車損害賠償保障法,昭和三十年法律第九十七号,True,第二条,2,,（定義）,（定義）,True,,,本則,第二条,
5,6,自動車損害賠償保障法（昭和30年法律第97号）,第２条第３項,自動車損害賠償保障法,昭和30年法律第97号,昭和三十年法律第九十七号,自動車損害賠償保障法,昭和三十年法律第九十七号,True,第二条,2,,,（定義）,False,3.0,,本則,,True
6,7,自動車損害賠償保障法（昭和30年法律第97号）,第２条第４項,自動車損害賠償保障法,昭和30年法律第97号,昭和三十年法律第九十七号,自動車損害賠償保障法,昭和三十年法律第九十七号,True,第二条,2,,,（定義）,False,4.0,,本則,,True
7,8,自動車損害賠償保障法（昭和30年法律第97号）,第３条（自動車損害賠償責任）,自動車損害賠償保障法,昭和30年法律第97号,昭和三十年法律第九十七号,自動車損害賠償保障法,昭和三十年法律第九十七号,True,第三条,3,,（自動車損害賠償責任）,（自動車損害賠償責任）,True,,,本則,第三条,
8,9,消防法（昭和23年法律第186号）,,消防法,昭和23年法律第186号,昭和二十三年法律第百八十六号,消防法,昭和二十三年法律第百八十六号,True,,,,,,True,,,,,
9,10,臓器の移植に関する法律（平成９年法律第104号）,第６条（臓器の摘出）,臓器の移植に関する法律,平成９年法律第104号,平成九年法律第百四号,臓器の移植に関する法律,平成九年法律第百四号,True,第六条,6,,（臓器の摘出）,（臓器の摘出）,True,,,本則,第六条,


In [30]:
#19	20	道路交通法（昭和35年法律第105号）	第65条第１項	道路交通法	昭和35年法律第105号	昭和三十五年法律第百五号	道路交通法	昭和三十五年法律第百五号	True	第六十五条	65	NaN	NaN	（酒気帯び運転等の禁止）	False	1	NaN	本則	None	False

target, url, checked = check_item_or_paragraph("昭和三十五年法律第百五号", '65', '1', None)

print(url)

import requests
response = requests.get(url,verify = True)
data = response.text

print(data)

import xml.etree.ElementTree as ET
# XMLをパース
root = ET.fromstring(data)

print(root)

# <Code> 要素の値を取得して判断
code_element = root.find(".//Code")

print(code_element.text)


https://laws.e-gov.go.jp/api/1/articles;lawNum=昭和三十五年法律第百五号;article=65;paragraph=1
<?xml version="1.0" encoding="UTF-8"?>
<DataRoot>
  <Result>
    <Code>0</Code>
    <Message/>
  </Result>
  <ApplData>
    <LawId/>
    <LawNum>昭和三十五年法律第百五号</LawNum>
    <Article>65</Article>
    <Paragraph>1</Paragraph>
    <AppdxTable/>
    <LawContents>
      <Paragraph Num="1">
        <ParagraphNum/>
        <ParagraphSentence>
          <Sentence Num="1" WritingMode="vertical">何人も、酒気を帯びて車両等を運転してはならない。</Sentence>
        </ParagraphSentence>
      </Paragraph>
    </LawContents>
  </ApplData>
</DataRoot>

<Element 'DataRoot' at 0x000001533FAF8220>
0


In [37]:
#平成九年法律第百四号	の条文を取得
law_no = "平成九年法律第百四号"

url = f"https://laws.e-gov.go.jp/api/1/lawdata/{law_no}"

response = requests.get(url, verify=True)
data = response.text
print(data)

#dataをテキストファイルに出力。ファイル名は"臓器移植に関する法律"
with open("臓器移植に関する法律.txt", "w", encoding="utf-8") as file:
    file.write(data)

<?xml version="1.0" encoding="UTF-8"?>
<DataRoot>
  <Result>
    <Code>0</Code>
    <Message/>
  </Result>
  <ApplData>
    <LawId/>
    <LawNum>平成九年法律第百四号</LawNum>
    <LawFullText>
      <Law Era="Heisei" Lang="ja" LawType="Act" Num="104" Year="09" PromulgateMonth="07" PromulgateDay="16">
        <LawNum>平成九年法律第百四号</LawNum>
        <LawBody>
          <LawTitle Kana="ぞうきのいしょくにかんするほうりつ" Abbrev="臓器移植法" AbbrevKana="ぞ">臓器の移植に関する法律</LawTitle>
          <MainProvision>
            <Article Num="1">
              <ArticleCaption>（目的）</ArticleCaption>
              <ArticleTitle>第一条</ArticleTitle>
              <Paragraph Num="1">
                <ParagraphNum/>
                <ParagraphSentence>
                  <Sentence Num="1" WritingMode="vertical">この法律は、臓器の移植についての基本的理念を定めるとともに、臓器の機能に障害がある者に対し臓器の機能の回復又は付与を目的として行われる臓器の移植術（以下単に「移植術」という。）に使用されるための臓器を死体から摘出すること、臓器売買等を禁止すること等につき必要な事項を規定することにより、移植医療の適正な実施に資することを目的とする。</Sentence>
                </ParagraphSentence>
              </Paragraph

In [50]:
#data のテキストの内容から、<SupplProvision Extract>で囲まれた部分を抽出する。
import re

pattern = r'<SupplProvision(?:\s[^>]*)>(.*?)</SupplProvision>'
matches = re.findall(pattern, data, re.DOTALL)
# 抽出された部分を表示
for match in matches:
    print(match.strip())
    
          

<SupplProvisionLabel>附　則</SupplProvisionLabel>
            <Article Num="1">
              <ArticleCaption>（施行期日）</ArticleCaption>
              <ArticleTitle>第一条</ArticleTitle>
              <Paragraph Num="1">
                <ParagraphNum/>
                <ParagraphSentence>
                  <Sentence Num="1" WritingMode="vertical">この法律は、公布の日から起算して三月を経過した日から施行する。</Sentence>
                </ParagraphSentence>
              </Paragraph>
            </Article>
            <Article Num="2">
              <ArticleCaption>（検討等）</ArticleCaption>
              <ArticleTitle>第二条</ArticleTitle>
              <Paragraph Num="1">
                <ParagraphNum/>
                <ParagraphSentence>
                  <Sentence Num="1" WritingMode="vertical">この法律による臓器の移植については、この法律の施行後三年を目途として、この法律の施行の状況を勘案し、その全般について検討が加えられ、その結果に基づいて必要な措置が講ぜられるべきものとする。</Sentence>
                </ParagraphSentence>
              </Paragraph>
              <Paragraph Num="2">
                <ParagraphNum>２</Par