국회 공공데이터 분석 관련 코드
congress_data_bill_tagging_summary_with_rag_llama2.py
0_congress_data_bill_crawling.py
1_congress_data_bill_tagging_llama2.py
- LLM 모델: LLaMA2 70B
- PDF, 링크 등 외부 데이터 소스 활용 가능
- 태그 매핑 정보
Key | Category | Subcategory |
---|---|---|
0 | 기타 | 기타 |
1 | 경제 및 금융 | 경제 및 공공 재정 |
2 | 경제 및 금융 | 상업 |
3 | 경제 및 금융 | 금융 및 금융 부문 |
4 | 경제 및 금융 | 외국 무역 및 국제 금융 |
5 | 경제 및 금융 | 세금 |
6 | 사회 및 문화 | 예술, 문화, 종교 |
7 | 사회 및 문화 | 사회 복지 |
8 | 사회 및 문화 | 가족 |
9 | 사회 및 문화 | 교육 |
10 | 사회 및 문화 | 사회과학 및 역사 |
11 | 건강 및 환경 | 건강 |
12 | 건강 및 환경 | 환경 보호 |
13 | 건강 및 환경 | 주택 및 지역사회 개발 |
14 | 건강 및 환경 | 공공 토지 및 천연 자원 |
15 | 건강 및 환경 | 수자원 개발 |
16 | 과학 및 기술 | 과학, 기술, 커뮤니케이션 |
17 | 과학 및 기술 | 에너지 |
18 | 과학 및 기술 | 비상 관리 |
19 | 과학 및 기술 | 수자원 개발 |
20 | 과학 및 기술 | 교통 및 공공 사업 |
21 | 안보 및 법 집행 | 국방 및 국가 안보 |
22 | 안보 및 법 집행 | 범죄 및 법 집행 |
23 | 안보 및 법 집행 | 이민 |
24 | 안보 및 법 집행 | 노동 및 고용 |
25 | 안보 및 법 집행 | 민간권 및 자유, 소수자 문제 |
26 | 자연 및 생태 | 농업 및 식품 |
27 | 자연 및 생태 | 동물 |
28 | 자연 및 생태 | 스포츠 및 레크리에이션 |
29 | 자연 및 생태 | 공공 토지 및 천연 자원 |
30 | 자연 및 생태 | 환경 보호 |
2_congress_data_bill_summary_llama2.py
- LLM 모델: LLaMA2 70B
- PDF, 링크 등 외부 데이터 소스 활용 가능
3_congress_data_postprocessing.py
- 에러 데이터 관련 후처리 및 추가 데이터 병합 작업 목적 파일
4_congress_data_bill_news_sentiment_classifier.py
- AI 모델: Hyeonseo/ko-finance_news_classifier
- 금융 뉴스 문장 감성 분석 데이터셋을 기반으로 파인튜닝된 뉴스 감성 분류 모델
- 의안 관련 뉴스 감성(긍정/중립/부정) 확률값 제공