In [4]:
import pandas as pd
from tabulate import tabulate  # tabulate 라이브러리 활용

class IndustryDataAnalyzer:
    def __init__(self, file_paths):
        """생성자: 파일 경로를 받아 데이터 로드"""
        self.file_paths = file_paths
        self.data_frames = {}
        self.all_companies = {}
        self.load_data()

    def load_data(self):
        """엑셀 파일 데이터를 로드"""
        for category, path in self.file_paths.items():
            try:
                df = pd.read_excel(path, engine="openpyxl")
                self.data_frames[category] = df
                # 모든 기업 이름을 저장 (중복 제거)
                if not df.empty:
                    self.all_companies.update({company: category for company in df.iloc[:, 0].dropna()})
            except Exception as e:
                print(f"{category} 파일을 불러오는 중 오류 발생: {e}")

    def display_all_companies(self):
        """모든 기업 이름을 산업군별로 보기 좋게 나열"""
        print("\n[전체 기업 목록]")
        industries = {}
        for company, category in self.all_companies.items():
            if category not in industries:
                industries[category] = []
            industries[category].append(company)

        for category, companies in industries.items():
            print(f"\n[{category}]")
            for company in companies:
                print(f"  - {company}")

    def display_company_data(self, company_name):
        """특정 기업의 데이터를 출력"""
        if company_name in self.all_companies:
            category = self.all_companies[company_name]
            df = self.data_frames[category]
            company_data = df[df.iloc[:, 0] == company_name]
            print(f"\n[{category}] {company_name} 데이터")
            print(tabulate(company_data, headers='keys', tablefmt='grid'))  # 데이터 출력
        else:
            print("\n입력한 기업 이름이 데이터에 없습니다. 다시 확인해주세요.")

    def display_category_data(self, category):
        """선택한 카테고리 데이터를 보기 좋게 표시"""
        if category in self.data_frames:
            df = self.data_frames[category]
            print(f"\n[{category}] 데이터")
            print(tabulate(df, headers='keys', tablefmt='grid'))  # tabulate로 출력
        else:
            print("\n잘못된 입력입니다. 다시 시도해주세요.")

    def compare_companies(self, category):
        """선택한 산업군의 두 회사를 비교하고 몇 대 몇인지 표시"""
        if category in self.data_frames:
            df = self.data_frames[category]
            print("\n기업 목록:")
            companies = df.iloc[:, 0].dropna().tolist()
            for company in companies:
                print(f"  - {company}")

            company1 = input("\n첫 번째 기업 이름을 입력하세요: ").strip()
            company2 = input("두 번째 기업 이름을 입력하세요: ").strip()

            if company1 in companies and company2 in companies:
                c1_data = df[df.iloc[:, 0] == company1].iloc[0]
                c2_data = df[df.iloc[:, 0] == company2].iloc[0]
                print(f"\n[{category}] {company1}과 {company2} 비교")

                c1_count, c2_count = 0, 0  # 두 기업의 우위를 비교하기 위한 카운터
                for col in df.columns[1:]:
                    c1_value = c1_data[col]
                    c2_value = c2_data[col]
                    if c1_value > c2_value:
                        comparison = f"{company1}({c1_value}) > {company2}({c2_value})"
                        c1_count += 1
                    elif c1_value < c2_value:
                        comparison = f"{company1}({c1_value}) < {company2}({c2_value})"
                        c2_count += 1
                    else:
                        comparison = f"{company1}({c1_value}) = {company2}({c2_value})"
                    print(f"- {col}: {comparison}")

                # 결과 출력
                print(f"\n[{category}] 결과: {company1} {c1_count} 대 {company2} {c2_count}")
            else:
                print("\n기업 이름 중 하나 이상이 데이터에 없습니다. 다시 확인해주세요.")
        else:
            print("\n잘못된 입력입니다. 다시 시도해주세요.")

    def run(self):
        """메인 프로그램 실행"""
        print("산업 데이터 분석 프로그램에 오신 것을 환영합니다!")
        while True:
            print("\n메뉴:")
            print("1. 전체 기업 목록 및 데이터 검색")
            print("2. 산업군 선택 및 데이터 보기")
            print("3. 특정 기업 비교")
            print("4. 프로그램 종료")
            choice = input("번호를 입력하세요: ").strip()

            if choice == "1":
                self.display_all_companies()
                company_name = input("\n데이터를 확인할 기업 이름을 입력하세요: ").strip()
                self.display_company_data(company_name)

            elif choice == "2":
                print("\n산업군 목록: IT 및 소프트웨어, 제조업, 에너지 및 환경, 금융 및 컨설팅, 물류 및 유통")
                category = input("산업군을 입력하세요: ").strip()
                if category in self.data_frames:
                    self.display_category_data(category)
                else:
                    print("\n잘못된 입력입니다. 다시 시도해주세요.")

            elif choice == "3":
                print("\n산업군 목록: IT 및 소프트웨어, 제조업, 에너지 및 환경, 금융 및 컨설팅, 물류 및 유통")
                category = input("비교할 기업의 산업군을 입력하세요: ").strip()
                if category in self.data_frames:
                    self.compare_companies(category)
                else:
                    print("\n잘못된 입력입니다. 다시 시도해주세요.")

            elif choice == "4":
                print("\n프로그램을 종료합니다. 이용해 주셔서 감사합니다!")
                break

            else:
                print("\n잘못된 입력입니다. 다시 시도해주세요.")


# 파일 경로 설정
file_paths = {
    "IT 및 소프트웨어": "IT 및 소프트웨어.xlsx",
    "제조업": "제조업.xlsx",
    "에너지 및 환경": "에너지 및 환경.xlsx",
    "금융 및 컨설팅": "금융 및 컨설팅.xlsx",
    "물류 및 유통": "물류 및 유통.xlsx",
}

# 클래스 인스턴스 생성 및 실행
analyzer = IndustryDataAnalyzer(file_paths)
analyzer.run()



산업 데이터 분석 프로그램에 오신 것을 환영합니다!

메뉴:
1. 전체 기업 목록 및 데이터 검색
2. 산업군 선택 및 데이터 보기
3. 특정 기업 비교
4. 프로그램 종료
번호를 입력하세요: 3

산업군 목록: IT 및 소프트웨어, 제조업, 에너지 및 환경, 금융 및 컨설팅, 물류 및 유통
비교할 기업의 산업군을 입력하세요: 에너지 및 환경

기업 목록:
  - 한국전력공사
  - 한화솔루션
  - 그리드위즈
  - 두산중공업
  - GS칼텍스

첫 번째 기업 이름을 입력하세요: 한국전력공사
두 번째 기업 이름을 입력하세요: 두산중공업

[에너지 및 환경] 한국전력공사과 두산중공업 비교
- 올해 입사자 초봉: 한국전력공사(4,145만 원) > 두산중공업(3,985만 원)
- 복리후생: 한국전력공사(54점) < 두산중공업(58점)
- 고용안정성: 한국전력공사(60점) < 두산중공업(68점)
- 조직문화: 한국전력공사(47점) < 두산중공업(50점)
- 커리어성장: 한국전력공사(76점) < 두산중공업(80점)

[에너지 및 환경] 결과: 한국전력공사 1 대 두산중공업 4

메뉴:
1. 전체 기업 목록 및 데이터 검색
2. 산업군 선택 및 데이터 보기
3. 특정 기업 비교
4. 프로그램 종료


KeyboardInterrupt: Interrupted by user

In [None]:
import pandas as pd
from tabulate import tabulate
from google.colab import files  # Colab 파일 업로드 지원

class IndustryDataAnalyzer:
    def __init__(self):
        """생성자: 데이터 관리"""
        self.data_frames = {}
        self.selected_category = None

    def upload_files(self):
        """사용자가 파일을 업로드하고 데이터 로드"""
        print("업로드할 파일을 선택하세요.")
        uploaded = files.upload()  # 파일 업로드
        for file_name in uploaded.keys():
            category = file_name.split(".")[0]  # 파일 이름에서 확장자를 제외한 부분을 카테고리로 사용
            try:
                df = pd.read_excel(file_name, engine="openpyxl")  # 엑셀 파일 읽기
                self.data_frames[category] = df
                print(f"{file_name} 파일이 성공적으로 업로드되었습니다. 카테고리: {category}")
            except Exception as e:
                print(f"{file_name} 파일을 읽는 중 오류 발생: {e}")

    def display_all_data(self):
        """모든 데이터를 미리보기로 표시"""
        for category, df in self.data_frames.items():
            if not df.empty:
                print(f"\n[{category}] 데이터 (미리보기):")
                print(tabulate(df.head(), headers="keys", tablefmt="grid"))
            else:
                print(f"\n[{category}] 데이터가 비어있습니다.")

    def display_category_data(self, category):
        """선택한 카테고리 데이터를 보기 좋게 표시"""
        if category in self.data_frames:
            df = self.data_frames[category]
            print(f"\n[{category}] 데이터\n")
            print(tabulate(df, headers="keys", tablefmt="grid"))
        else:
            print("\n잘못된 입력입니다. 다시 시도해주세요.")

    def compare_companies(self, category, company1, company2):
        """두 회사를 비교"""
        if category in self.data_frames:
            df = self.data_frames[category]
            if company1 in df.iloc[:, 0].values and company2 in df.iloc[:, 0].values:
                c1_data = df[df.iloc[:, 0] == company1].iloc[0]
                c2_data = df[df.iloc[:, 0] == company2].iloc[0]
                print(f"\n[{category}] {company1}과 {company2} 비교")
                for col in df.columns[1:]:
                    c1_value = c1_data[col]
                    c2_value = c2_data[col]
                    if c1_value == c2_value:
                        print(f"- {col}: {company1}과 {company2}이(가) 같음")
                    else:
                        comparison = "더 큼" if c1_value > c2_value else "더 작음"
                        print(f"- {col}: {company1}({c1_value}) vs {company2}({c2_value}) -> {company1}이(가) {comparison}")
            else:
                print("\n기업 이름 중 하나 이상이 데이터에 없습니다. 다시 확인해주세요.")
        else:
            print("\n잘못된 입력입니다. 다시 시도해주세요.")

    def run(self):
        """메인 프로그램 실행"""
        print("산업 데이터 분석 프로그램에 오신 것을 환영합니다!")
        self.upload_files()

        while True:
            print("\n메뉴:")
            print("1. 산업군 선택 및 데이터 보기")
            print("2. 특정 기업 비교")
            print("3. 프로그램 종료")
            choice = input("번호를 입력하세요: ").strip()

            if choice == "1":
                print("\n산업군 목록:", ", ".join(self.data_frames.keys()))
                category = input("산업군을 입력하세요: ").strip()
                if category in self.data_frames:
                    self.selected_category = category
                    self.display_category_data(category)
                else:
                    print("\n잘못된 입력입니다. 다시 시도해주세요.")

            elif choice == "2":
                if not self.selected_category:
                    print("\n먼저 산업군을 선택해주세요.")
                else:
                    company1 = input("첫 번째 기업 이름을 입력하세요: ").strip()
                    company2 = input("두 번째 기업 이름을 입력하세요: ").strip()
                    self.compare_companies(self.selected_category, company1, company2)

            elif choice == "3":
                print("\n프로그램을 종료합니다. 이용해 주셔서 감사합니다!")
                break

            else:
                print("\n잘못된 입력입니다. 다시 시도해주세요.")


# 프로그램 실행
analyzer = IndustryDataAnalyzer()
analyzer.run()
