Korean politics data for research and development.
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
bills
parties
LICENSE.md
README.md
assembly.csv Append person_id to assembly.csv, pledges.csv Mar 31, 2014
candidacies.csv Add candidacy, pledge data Sep 11, 2013
cosponsorship.csv
migrations.csv
pledges.csv Append person_id to assembly.csv, pledges.csv Mar 31, 2014

README.md

Data for Political R&D

이 저장소에 있는 데이터는 중앙선거관리위원회국회 의안정보시스템에서 데이터를 수집하여 후처리한 것입니다. (일부 열려라국회에서 수집) 개발 및 연구의 편의를 위해 공개하니 널리 이용해주시기 바라며 문의사항, 제안사항 또는 오류가 있는 경우 이슈제기를 해주시기 바랍니다.

데이터 수집에 이용된 코드는 이 곳에서 보실 수 있습니다.

Overview

Filename Description Source Created date
assembly.csv 19대 국회의원 데이터 국회 의안정보시스템 2014-03-30
bills/names.csv 1-19대 의안명 국회 의안정보시스템 2013-08-20
candidacies.csv 1-19대 국회의원 선거 후보자 데이터 중앙선거관리위원회 2013-04-24
cosponsorship.csv 19대 국회의 대표/공동발의 횟수 데이터 국회 의안정보시스템 2013-07-29
migrations.csv 19대 국회의원의 정당 이동 데이터 열려라국회 2012-09-09
pledges.csv 19대 국회의원 선거 후보 공약 데이터 중앙선거관리위원회 2013-04-24
parties/logos/ 정당 로고 Wikipedia 2013-05-05

Description

공통변수

  • person_id: 인물 고유번호. 성명 및 생년이 같은 경우 동일 인물로 판단하고 생년 + 랜덤 숫자로 생성. 이 고유번호로 대한민국 정치의 모든 것의 인물페이지로 접근 가능. (i.e., http://pokr.kr/person/[person_id])
  • name: 인물의 한글 성명. 동명이인이 있을 수 있음.

assembly.csv

  • 17 columns, 298 rows
  • 변수설명

    person_idnamename_cnname_enbirthpartydistrictcommitteewhen_electedoff_phonehomepageemailaidespr_secrssc_secrshobbyphoto
    19601167강기윤姜起潤KANG Gi Yun1960-06-04새누리당경남 창원시성산구안전행정위원회19대02-784-1322http://www.강기윤.krggotop@assembly.go.kr강종길, 김태훈박병규, 이순우박응서, 안현성, 이유진9770703
    1964154강기정姜琪正KANG Gi Jung1964-12-03새정치민주연합광주 북구갑정무위원회17대, 18대, 19대02-788-2666http://kj21.orgokang@assembly.go.kr장성훈, 정성학김진열, 나원주이열, 홍돈석, 정희은등산/축구9770275
    19421164강길부姜吉夫KANG Ghil Boo1942-06-05새누리당울산 울주군기획재정위원회17대, 18대, 19대02-788-2708http://www.uljukang.orgshinmut@assembly.go.kr정재원, 최성수강원도, 차상윤송경희, 박종석, 장경희9770276
    • name_cn: 한자 이름.
    • name_en: 영문 이름.
    • birth: 생년월일(YY-mm-dd).
    • party: 데이터 수집일 기준 소속 정당.
    • district: 선출 지역구.
    • committee: 소속 위원회명.
    • when_elected: 역대 국회의원 선거 당선 대수.
    • off_phone: 사무실 전화번호.
    • homepage: 홈페이지.
    • email: 이메일.
    • aides: 보좌관.
    • pr_secrs: 비서관.
    • sc_secrs: 비서.
    • hobby: 취미.
    • photo_id: 사진 고유번호. (i.e., http://www.assembly.go.kr/photo/[photo_id].jpg)
  • 특이사항

    • 이 데이터셋의 최신 및 상세한 버젼은 이 곳에 있음. (매일 새로 업데이트)
    • 동명이인 없음.

bills/names.csv

  • 2 columns, 48191 rows
  • 변수설명

    bill_idbill_name
    010002국민생명보험과우편연금특별회계법안
    010003반민족행위처벌법안
    010004지방자치조직법안
    • bill_id: 국회에서 제공하는 공식 의안 고유번호. 이 고유번호로 대한민국 정치의 모든 것의 의안페이지로 접근 가능. (i.e., http://pokr.kr/bill/[bill_id])
    • bill_name: 의안명.
  • 특이사항
    • 의안 고유번호는 17대 국회까지 6자리 숫자, 18대부터 7자리 숫자임.
    • 인사청문요청안 등 특별 문서의 의안 고유번호는 'ZZ'로 시작.

candidacies.csv

  • 8 columns, 19184 rows (on 12913 unique person_id)
  • 변수설명

    candidacy_idperson_idnamebirthdaypartyassembly_idis_electeddistrict
    991419581139이태희19581209한나라당(2012)19f{비례대표}
    991519581139이태희19581209무소속15f"{서울특별시,광진구,갑}"
    1918619551154김창근19550507통합진보당19f"{대전광역시,대덕구}"
    • candidacy_id: 후보등록 고유번호. 한 인물이 복수출마한 경우 두 개 이상의 값을 가짐.
    • birthday: 출마 당시 후보자가 기재한 생년월일(YYmmdd). 예전 국회(1-10대)의 경우 데이터가 부정확한 경우가 있다고 보고됨.
    • party: 출마 당시 후보자의 소속 정당.
    • assembly_id: 출마 국회의원 선거 대수.
    • is_elected: 해당 선거의 당선 여부.
    • district: 출마 당시 지역구 데이터. 각 지역명은 쉼표로 분리
  • 특이사항

    • 2013년 상반기 재보궐선거 (4월 24일) 데이터 포함.
    • 동명의 정당 '한나라당'은 '한나라당'과 '한나라당 (2012)'로 구분하여 표기.
    • 동명의 정당 '청년당'은 분리하여 표기되지 않음.

cosponsorship.csv

  • 7 columns, 304 rows
  • 변수설명

    person_idnamegenderpartyassembly_idsponsorshipcosponsorship
    1950197배기운m민주통합당19361484
    194828박인숙f새누리당1962878
    19521138김성곤m민주통합당1931835
    • gender: 의원의 성별.
    • party: 출마 당시 후보자의 소속 정당.
    • assembly_id: 국회의원 선거 대수. 이 데이터셋에서는 전체가 19.
    • sponsorship: 19대 국회에서 의안을 대표발의한 횟수.
    • cosponsorship19대 국회에서 의안을 찬성발의하거나 공동발의한 횟수.
  • 특이사항

migration.csv

  • 5 columns, 786 rows
  • 변수설명

    person_idnamepartystart_dateend_date
    19461137주영순새누리당2012-04
    19601167강기윤새누리당2012-04
    19521135한기호한나라당2012-022010-07
  • 특이사항

    • start_date 또는 end_date가 null인 경우가 있음.

pledges.csv

  • 4 columns, 1221 rows (on 246 unique candidate_id)
  • 변수설명

    person_idcandidacy_idnamepledge
    194611117643강창희안영동 스포츠과학단지 조성
    194611117643강창희중앙로 문화예술 지구 명소화
    194611117643강창희도청이전부지 대전시로 소유 이전 및 부지활용
    • candidacy_id: 후보등록 고유번호. 한 인물이 복수출마한 경우 두 개 이상의 값을 가짐.
  • 특이사항

    • 2013년 상반기 재보궐선거 (4월 24일) 데이터 포함.
    • 인당 약 5개의 대표 공약이 있음.

parties/logos/

  • 파일명은 정당 고유번호(party_id)로 되어 있으며 이는 parties/parties.csv에서 확인할 수 있음.

Showcase

이 데이터셋을 이용해 다양한 서비스가 만들어졌습니다. (당신의 서비스 또는 연구도 자랑해주세요!)

License

이 저장소에 공개된 데이터는 크리에이티브 커먼즈 저작자표시 3.0 Unported 라이선스에 따라 이용하실 수 있습니다. (즉, 팀포퐁이 데이터의 저작자임을 명시하기만 하면 수정, 배포를 마음껏 하실 수 있습니다.)

위 데이터를 사용하여 논문을 작성할 경우, 아래 학회 발표자료를 인용해주시기 바랍니다.

크리에이티브 커먼즈 라이선스