In [1]:
import pandas as pd
import numpy as np
from datetime import datetime, timedelta
import time

import requests
from bs4 import BeautifulSoup
from urllib.parse import urlparse, parse_qs, urlencode
import json
import lxml
import streamlit as st

import matplotlib.pyplot as plt

import os
import sys
from pathlib import Path

import bcrypt

from google.cloud import bigquery
from google.oauth2 import service_account
import gspread
from gspread_dataframe import set_with_dataframe


import warnings

In [2]:
KEY_PATH = ".config/"
servicekey_path = KEY_PATH + "serviceKey.json" ## 빅쿼리 외 다른 API 활용 위해
bigquerykey_path = KEY_PATH + "mido-project-426906-31b49963ac97.json"
sheetskey_path = KEY_PATH + "mido-project-426906-41a4b6d0e3db.json"
midopluskey_path = KEY_PATH + "midoplus.json"

warnings.filterwarnings("ignore")


In [3]:
def get_service_key(servicekey_path):

    with open(servicekey_path) as f:
        data = json.load(f)
    return data

In [4]:
get_service_key(midopluskey_path)

{'type': 'service_account',
 'project_id': 'midoplus',
 'private_key_id': '49d0390fd99cc31707ad95444c725e9bbb34e344',
 'private_key': '-----BEGIN PRIVATE KEY-----\nMIIEvQIBADANBgkqhkiG9w0BAQEFAASCBKcwggSjAgEAAoIBAQDYZ9wpK9qjZP5J\nghzBfr73BWo8JeHMyMazhXrgTUIsU9Q2fer9+0Cn3ODVnjGReTKU7hyKfx2sLWE/\nhy22RZJUF3EnkecYhi8UEB34jzIu5frK5miM2HIzL88PMhb0+uMD+rQ5uqIuz6zD\nlY2Gb6PxP6IGCKtILISbm0aJoVdb8ybaeCKYpMK/5JAzIz8C2+xeyHzwhQCYqLCP\nGVs+OUWRD47bqGZZOPdxBbfquOEBM6oncHoMnBi4fPofFKste+mLxUJP//E20ryL\nYN41OMtOXCM05UEEnlTtDGFBpEKNwl6sjPCnll6j4/9yNWGxWq8TbbKxLWjjuLsw\n9t4Ev9YFAgMBAAECggEAVyMy9m0PI53l+olmtM8pa+QFS+ThEAmEYQMNYEYbsCet\nGqgHOG+0MCNzcPC6+t23bVqXqXjX5N18/AydbniDHFM4H/vS9wAI8uYue0iFp3a5\nTnwKezQof83vbSn5LnnbcV3AtkIdTgYXhcWxcAGCHQFHZ3CUL4Klfta+R2rs9zuq\nRIdB29tZ0eiPXawuLB01Q6Yc3D68ekfJ8JL3M1Ja4qtqqaWfZZsP1lzAu2FbhdKF\nH7B3o2vyUphQu2eBspdIXS7Ervy+iwEZJgiOkof6cuFw5b3p71haqk1hk2+BL7of\n3E2bROg8axB8nSgt8kOEkknjunRMILPsNY/12FshnQKBgQD9kx5ufecJjAEbUutJ\ndxSHsM2F7Kp1MqE3j5an/YvO1HN5NfqHjbpI/lfA8rNm

In [5]:
# BigQuery 클라이언트 생성 함수
def create_bigquery_client(key_path):
    credentials = service_account.Credentials.from_service_account_file(key_path)
    client = bigquery.Client(credentials=credentials, project=credentials.project_id)
    return client


In [6]:
create_bigquery_client(midopluskey_path)

<google.cloud.bigquery.client.Client at 0x24687aca0d0>

In [7]:
def save_dataframe_to_bigquery(df, dataset_id, table_id, key_path):
    # BigQuery 클라이언트 객체 생성
    client = create_bigquery_client(key_path)

    # 테이블 레퍼런스 생성
    table_ref = client.dataset(dataset_id).table(table_id)

    # 데이터프레임을 BigQuery 테이블에 적재
    job_config = bigquery.LoadJobConfig()
    job_config.write_disposition = "WRITE_TRUNCATE"  # 기존 테이블 내용 삭제 후 삽입

    job = client.load_table_from_dataframe(df, table_ref, job_config=job_config)
    job.result()  # 작업 완료 대기

    print(f"Data inserted into table {table_id} successfully.")

In [8]:
def get_dataframe_from_bigquery(dataset_id, table_id, key_path):
    # BigQuery 클라이언트 생성
    client = create_bigquery_client(key_path)

    # 테이블 레퍼런스 생성
    table_ref = client.dataset(dataset_id).table(table_id)

    # 테이블 데이터를 DataFrame으로 변환
    df = client.list_rows(table_ref).to_dataframe()

    return df

In [9]:
# 비밀번호 생성 및 해싱 함수
def generate_hashed_password(phone_number):
    
    # 전화번호의 뒷자리 4자리로 비밀번호 생성
    password = phone_number[-4:]
    
    # # 비밀번호 해싱
    # password = bcrypt.hashpw(password.encode('utf-8'), bcrypt.gensalt())
    return password

### 빅쿼리

In [10]:
shopping_df = get_dataframe_from_bigquery('DATA_WAREHOUSE', 'g2b_data', midopluskey_path)
shopping_df_fin = shopping_df.drop('collection_Date',axis=1)

shopping_prod_df = get_dataframe_from_bigquery('DATA_MARTS', 'g2b_prod_data', midopluskey_path)
shopping_prod_df_fin = shopping_prod_df.fillna('')

news_df = get_dataframe_from_bigquery('DATA_MARTS', 'news_data', midopluskey_path)
news_df_fin = news_df.drop('collection_Date',axis=1)

### 구글 스프레드 시트

In [11]:
# Google Sheets 클라이언트 생성
sheets_scope = ["https://spreadsheets.google.com/feeds", "https://www.googleapis.com/auth/spreadsheets",
                "https://www.googleapis.com/auth/drive.file", "https://www.googleapis.com/auth/drive"]

sheets_creds = service_account.Credentials.from_service_account_file(midopluskey_path, scopes=sheets_scope)
gc = gspread.authorize(sheets_creds)

#### 지자체 교육청 예산 현황

In [39]:
# 스프레드시트 ID (URL에서 확인 가능)
business_sheet_id = '166xdkZYI-SDNwdEiI6-Kt-p1wsTwFTAYAVfuCiFly0E' ## 미도플러스 사업현황 

In [40]:
# 기존 스프레드시트 및 워크시트 열기
WORKSHEET_NAME = '지자체'
spreadsheet_business = gc.open_by_key(business_sheet_id)
worksheet_business = spreadsheet_business.worksheet(WORKSHEET_NAME)

# 구글 시트에서 데이터 읽기
data = worksheet_business.get_all_records()
pd.DataFrame(data)

Unnamed: 0,지역명,자치단체명,세부사업명,삭제,예산현액,국비,시도비,시군구비,기타,지출액,편성액
0,강원특별자치도,강릉시,강릉스케이트장 인조잔디 설치,FALSE,,,,,,,
1,강원특별자치도,강릉시,"강릉 종합스포츠 타운 건립 (축구장, 야구장, 파크골프장, 테니스장)",FALSE,,,,,,,
2,강원특별자치도,동해시,하수종말 처리장 실외 테니스장 신규조성,FALSE,,,,,,,
3,강원특별자치도,동해시,해오룸 스포츠타운 테니스장 6면,FALSE,,,,,,,
4,강원특별자치도,동해시,"동해시 야구장, 테니스장",FALSE,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...
749,충청북도,충주시,노인게이트볼장 편의시설설치,FALSE,5000000,0,0,5000000,0,4849000,5000000
750,충청북도,충주시,유소년 축구장 조성,FALSE,12500000,0,0,12500000,0,12408000,12500000
751,충청북도,충주시,북부생활체육공원 조성,FALSE,16971000,0,0,16971000,0,16971000,0
752,충청북도,충주시,전천후 론볼장 등 체육시설 조성(전환사업),FALSE,1164586550,0,0,1164586550,0,38973180,0


In [19]:
# 기존 스프레드시트 및 워크시트 열기
WORKSHEET_NAME = '교육청'
spreadsheet_edu = gc.open_by_key(business_sheet_id)
worksheet_edu = spreadsheet_edu.worksheet(WORKSHEET_NAME)

# 구글 시트에서 데이터 읽기
data = worksheet_edu.get_all_records()
pd.DataFrame(data)

Unnamed: 0,시도,시군구,구분,과업명,삭제,금액,면적,예산집행
0,경기도,고양교육지원청,공립,흥동초등학교 친환경 운동장 조성 사업,FALSE,,,
1,경기도,김포교육지원청,공립,신양중학교 친환경 운동장 조성 사업,FALSE,,,
2,경기도,부천교육지원청,공립,부천중원초등학교 친환경 운동장 조성 사업,FALSE,,,
3,경기도,성남교육지원청,공립,돌마초등학교 운동장 조성,FALSE,259000000,4000,교육청
4,경기도,수원교육지원청,공립,수성중학교 친환경 운동장 조성 사업,FALSE,,,
...,...,...,...,...,...,...,...,...
165,전북특별자치도,전북특별자치도교육청,사립,익산고등학교 인조잔디 조성,FALSE,1050001000,7417,교육청
166,제주특별자치도,제주특별자치도교육청,공립,세화고등학교 인조잔디 설치,FALSE,344400000,5600,
167,제주특별자치도,제주특별자치도교육청,공립,학교 운동장 정비 - 공립 3개교,FALSE,1800000000,,학교
168,제주특별자치도,제주특별자치도교육청,사립,학교 운동장 정비 - 사립 1개교,FALSE,600000000,,학교


In [20]:
# # 새로운 시트 생성
# budget_df = pd.DataFrame(data)
# new_sheet_name = '지자체백업'
# new_sheet = spreadsheet_business.add_worksheet(title=new_sheet_name, rows=len(budget_df), cols=len(budget_df.columns))

# set_with_dataframe(new_sheet, budget_df)

In [None]:
# # 데이터프레임을 기존 워크시트에 업로드
# budget_df = pd.DataFrame(data)
# set_with_dataframe(worksheet, budget_df)

#### 종합쇼핑몰 납품 상세

In [21]:
# 스프레드시트 ID (URL에서 확인 가능)
shopping_sheet_id = '16vld1WTJwsrWPD_kFcUX1LJb-9WAtY2gnPFG5nGEqZ0' ## 미도플러스 종합쇼핑몰 현황
spreadsheet_shopping = gc.open_by_key(shopping_sheet_id)

In [22]:
# 기존 스프레드시트 및 워크시트 열기
WORKSHEET_NAME = '납품현황'
worksheet_shopping = spreadsheet_shopping.worksheet(WORKSHEET_NAME)

# 기존 데이터 지우기
worksheet_shopping.clear()

# 데이터 프레임을 스프레드 시트에 덮어쓰기
worksheet_shopping.update([shopping_df_fin.columns.values.tolist()] + shopping_df_fin.values.tolist())

{'spreadsheetId': '16vld1WTJwsrWPD_kFcUX1LJb-9WAtY2gnPFG5nGEqZ0',
 'updatedRange': "'납품현황'!A1:AL14305",
 'updatedRows': 14305,
 'updatedColumns': 38,
 'updatedCells': 543590}

#### 종합쇼핑몰 품목 정보

In [23]:
# 스프레드시트 ID (URL에서 확인 가능)
shopping_sheet_id = '16vld1WTJwsrWPD_kFcUX1LJb-9WAtY2gnPFG5nGEqZ0' ## 미도플러스 종합쇼핑몰 현황
spreadsheet_shopping = gc.open_by_key(shopping_sheet_id)

In [24]:
# 기존 스프레드시트 및 워크시트 열기
WORKSHEET_NAME = '품목정보'
worksheet_shopping_prod = spreadsheet_shopping.worksheet(WORKSHEET_NAME)

# 기존 데이터 지우기
worksheet_shopping_prod.clear()

# 데이터 프레임을 스프레드 시트에 덮어쓰기
worksheet_shopping_prod.update([shopping_prod_df_fin.columns.values.tolist()] + shopping_prod_df_fin.values.tolist())

{'spreadsheetId': '16vld1WTJwsrWPD_kFcUX1LJb-9WAtY2gnPFG5nGEqZ0',
 'updatedRange': "'품목정보'!A1:AH613",
 'updatedRows': 613,
 'updatedColumns': 34,
 'updatedCells': 20842}

In [25]:
# # 데이터프레임을 기존 워크시트에 업로드
# budget_df = pd.DataFrame(data)
# set_with_dataframe(worksheet, budget_df)

#### 뉴스스크랩

In [51]:
# 스프레드시트 ID (URL에서 확인 가능)
news_sheet_id = '1BnbDPv79Y44RpbMmZA2wFiFlM3mNN5xPtyOXFW0ABBk' ## midoplus news
spreadsheet_news = gc.open_by_key(news_sheet_id)

In [52]:
# 기존 스프레드시트 및 워크시트 열기
WORKSHEET_NAME = 'news'
worksheet_news = spreadsheet_news.worksheet(WORKSHEET_NAME)

# 기존 데이터 지우기
worksheet_news.clear()

# 데이터 프레임을 스프레드 시트에 덮어쓰기
worksheet_news.update([news_df_fin.columns.values.tolist()] + news_df_fin.values.tolist())

{'spreadsheetId': '1BnbDPv79Y44RpbMmZA2wFiFlM3mNN5xPtyOXFW0ABBk',
 'updatedRange': 'news!A1:D204',
 'updatedRows': 204,
 'updatedColumns': 4,
 'updatedCells': 816}

#### 생산일지

In [153]:
# 스프레드시트 ID (URL에서 확인 가능)
production_sheet_id = '1dl6GyEkzarfgcKSmT9hwYzR63MhcGDox0z-gCa0_7OI' ## midoplus production_report, ## 생산일지통합
spreadsheet_production = gc.open_by_key(production_sheet_id)

In [154]:
# 기존 스프레드시트 및 워크시트 열기
WORKSHEET_NAME = 'production_report'
worksheet_production = spreadsheet_production.worksheet(WORKSHEET_NAME)

# 구글 시트에서 데이터 읽기
data = worksheet_production.get_all_records()
production_df = pd.DataFrame(data)
production_df

Unnamed: 0,납품요구번호,계약코드,생산일자,납품요구접수일자,납품기한일자,납품요구건명,구장명,오더량,ITEM,SPI,...,제직폭,본수,입고폭,YARN,COLOR,도전사,R/NO,제직량,입고량,비고
0,2419398300,241939830001,2019. 10. 25,2019. 10. 8,2019. 12. 7,승촌게이트볼장 기능보강 공사 관급자재(인조잔디),승촌게이트 실내,382,MD35,4.95,...,414,434,400,MONO7800.3500 GBR,VGF,O,1,17.4,15.5,
1,2419398300,241939830001,2019. 10. 25,2019. 10. 8,2019. 12. 7,승촌게이트볼장 기능보강 공사 관급자재(인조잔디),승촌게이트 실내,382,MD35,4.95,...,414,434,400,MONO7800.3500 GBR,VGF L,,101-1,44,40,
2,2419398300,241939830001,2019. 10. 26,2019. 10. 8,2019. 12. 7,승촌게이트볼장 기능보강 공사 관급자재(인조잔디),승촌게이트 실외,374,MD35,4.95,...,414,434,400,MONO7800.3500 GBR,VGF L,,101-2,44,40,완료
3,2419398300,241939830001,2019. 10. 26,2019. 10. 8,2019. 12. 7,승촌게이트볼장 기능보강 공사 관급자재(인조잔디),승촌게이트 실외,374,MD35,4.95,...,414,434,400,MONO7800.3500 GBR,VGF L,O,101-1,44,10,
4,2419398300,241939830001,2019. 10. 26,2019. 10. 8,2019. 12. 7,승촌게이트볼장 기능보강 공사 관급자재(인조잔디),승촌게이트 실외,374,MD35,4.95,...,414,434,400,MONO7800.3500 GBR,VGF L,,101-2,44,10,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
8374,2123371712,212337171201,2023. 12. 5,2023. 11. 14,2024. 1. 31,부산동성고 인조잔디(MD35) 구입(운동장 환경개선공사),부산동성고트랙,577,MD35,3,...,414,434,400,13500,BROWN,,2,,,
8375,2123371712,212337171201,2023. 12. 5,2023. 11. 14,2024. 1. 31,부산동성고 인조잔디(MD35) 구입(운동장 환경개선공사),부산동성고트랙,577,MD35,3,...,414,434,400,13500,BROWN,,3,,,
8376,2123371712,212337171201,2023. 12. 6,2023. 11. 14,2024. 1. 31,부산동성고 인조잔디(MD35) 구입(운동장 환경개선공사),부산동성고트랙,577,MD35,5,...,414,434,400,7800,BROWN,,101,,,제직완료
8377,1223635895,122363589501,2023. 12. 7,2023. 11. 28,2024. 1. 27,월산4리 야외체육시설 조성공사 관급자재 구입,월산4리,110,MD35,5,...,414,434,400,7800,VGF,,1,,,제직완료


In [155]:
# 전처리
production_df['계약코드'] = np.where(production_df['계약코드']=='',production_df['납품요구번호'],production_df['계약코드'])
production_df_fin = production_df.drop_duplicates(['납품요구번호','계약코드','납품요구건명','구장명']).reset_index(drop=True)

production_df_fin['납품요구건명'] = production_df_fin['납품요구건명'].apply(lambda x: ' '.join(x.split('\n')[1].strip().split(' ')[1:]) if '\n' in x else x)

In [214]:
production_df_final = production_df_fin[['납품요구번호', '계약코드', '납품요구접수일자', '납품기한일자', '납품요구건명', '구장명']]

#### 계약내용

In [215]:
production_df_final['납품요구접수일자'] = production_df_final['납품요구접수일자'].str.replace(' ','')
production_df_final['납품기한일자'] = production_df_final['납품기한일자'].str.replace(' ','')

In [216]:
# 날짜 형식 변환
production_df_final['납품기한일자'] = pd.to_datetime(production_df_final['납품기한일자'], format='%Y.%m.%d')

# 현재 날짜 기준으로 진행상황 컬럼 추가
current_date = datetime.now()
production_df_final['진행상황'] = production_df_final['납품기한일자'].apply(lambda x: '완료' if x < current_date else '진행중')
production_df_final['납품기한일자'] = production_df_final['납품기한일자'].astype(str)

In [217]:
# 스프레드시트 ID (URL에서 확인 가능)
contracts_sheet_id = '1YEl1Sw_uKw8URp8_nOfmgxBQWJtuiVJcH9ZYMHszGH0' ## midoplus contracts
spreadsheet_contracts = gc.open_by_key(contracts_sheet_id)

In [218]:
# 기존 스프레드시트 및 워크시트 열기
WORKSHEET_NAME = 'contracts'
worksheet_contracts = spreadsheet_contracts.worksheet(WORKSHEET_NAME)

# 기존 데이터 지우기
worksheet_contracts.clear()

# 데이터 프레임을 스프레드 시트에 덮어쓰기
worksheet_contracts.update([production_df_final.columns.values.tolist()] + production_df_final.values.tolist())

{'spreadsheetId': '1YEl1Sw_uKw8URp8_nOfmgxBQWJtuiVJcH9ZYMHszGH0',
 'updatedRange': 'contracts!A1:G834',
 'updatedRows': 834,
 'updatedColumns': 7,
 'updatedCells': 5838}