To redistribute cleaned data of the Ministry of Health, Labour and Welfare
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
20170510.csv
README.md

README.md

なにこれ

厚生労働省が2017年5月10日に公表した,労働基準関係法令違反に係る公表事案のデータをクリーニングしてCSVにしたものです

なぜこんなことをしたの?

はてブでCSVにしろというコメントがたくさんあったことと,同省が2017年3月30日に公開した文書によれば,公開後1年で消すとなっていたので,貴重なデータが失われることに危機感を覚え,とりあえずやってみました.今後の公表についても継続的にクリーニングをするかは未定です

こんなことして大丈夫なの?

同省は,同Webサイトのコンテンツの利用について利用規約を定めています.本加工・及び再公開は当該規約に則ったものです

出典

労働基準関係法令違反に係る公表事案(厚生労働省)http://www.mhlw.go.jp/kinkyu/dl/170510-01.pdf を加工して作成しました

加工内容

  • 全角のアラビア数字を半角に統制した
  • 和暦を西暦に統制した
  • 年月日は yyyy-mm-ddで統制した
  • 事案ID列,担当労働局列,最終更新日列及び出典 列を追加した
    • 事案IDは最初を1とし,元データの並び順に対し上から1ずつインクリメントする非負整数
    • 出典は元データのURL
  • 企業・事業場名称列を法人名称カナ略語列と企業・事業場名称列に分割した
  • 所在地列を所在都道府県列と所在市区郡町村列に分割した
  • 違反法条 列においては | をデリミタにした
  • 違反法条列は違反法条1違反条項1列に分割し,1列1法条・条項となるように違反法条5違反条項5列まで作成した
    • 2017年5月10日に公表された事案では1次案につき最大3法条が紐付いていたが,今後の拡張を考え5法条まで対応可能とした
  • その他参考事項 列は送検年月日列,不起訴(嫌疑不十分)年月日列,不起訴年月日 列に分割した
  • 表記n,nnn万円nnnn万円 に修正した
  • 労基法労働基準法に,安衛法労働安全衛生法に,安衛則労働安全衛生規則にそれぞれ修正した
  • 労働安全衛生施行令労働安全衛生法施行令に修正した
  • 労働安全衛生規則41条労働安全衛生規則第41条に,労働基準法62条労働基準法第62条にそれぞれ修正した
  • 川崎市高津区神奈川県川崎市高津区に,神戸市兵庫兵庫県神戸市兵庫区にそれぞれ修正した
  • (株)大昌◆工所 (株)大昌鉄工所 に修正した
    • ◆は金へんに矢
  • 労働安全衛生第21条というデータがあるが,労働安全衛生法と労働安全衛生則のどちらかが不明だったためそのままにしてある  

利用規約について

本データの利用規約は,厚生労働省の利用規約と同一のものとします. 本データの利用にあたり,lumelyに確認等は一切不要です.

注意・免責事項

  • 本データの加工は細心の注意をもって行いましたが,過失による加工ミスにより,元データと異なる箇所が存在する可能性があります.その場合,ただちに修正しますので,ご連絡頂ければ幸いです
  • 本加工データを用いて行う一切の行為に対し,lumelyは何ら責任を負うものではありません
  • 加工ミスを発見した場合,予告なく変更,移転,削除などを行うことがあります
  • 予告なくさらに正規化などのより機械処理が容易な形式に変更することがあります

やれたらいいね

  • LODにしてアプリ込みでLODチャレンジに出す
  • 法人番号列の追加
  • 遊び倒す