In [None]:
import sys
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
import pandas as pd
from bs4 import BeautifulSoup
import json
import requests
import random
import time
import datetime
from tqdm import tqdm
from PyQt5.QtWidgets import QApplication, QMainWindow, QLabel, QLineEdit, QPushButton, QTextEdit, QMessageBox, QMenu, QAction,QFileDialog
from PyQt5.QtWidgets import *
from PyQt5.QtCore import QDate, Qt
from PyQt5.QtGui import QIcon  # QIcon 추가

class NaverRealEstateCrawler(QMainWindow):
    #이 코드는 클래스의 생성자를 정의하고, 부모 클래스의 생성자를 호출한 후에 UI 초기화 작업을 수행
    #클래스의 생성자를 정의. 여기서 __init__() 메서드는 클래스의 생성자(Constructor) 역할
    #self는 클래스의 인스턴스를 가리키는 첫 번째 매개변수
    def __init__(self):
        #super() 함수를 사용하여 부모 클래스의 __init__() 메서드를 호출
        #이 메서드는 사용자 인터페이스(UI)를 초기화하는 역할
        super().__init__()
        self.initUI()
        # 사용자가 선택한 옵션을 저장하는 변수
        self.selected_options = []
        
    def initUI(self):
        self.setWindowTitle("네이버 부동산 크롤링 프로그램")
        self.setGeometry(100, 100, 500, 500)
    
        # 창 아이콘 설정
        self.setWindowIcon(QIcon('./image/eco01.png'))
    
        # 메뉴바 생성
        menubar = self.menuBar()
        # 네이티브 메뉴 바를 사용하지 않도록 설정
        menubar.setNativeMenuBar(False)
    
        # "File" 그룹 생성하고, 그 안에 sub그룹 생성
        menu_file = menubar.addMenu('&File')
        # "Edit" 그룹 생성
        menu_edit = menubar.addMenu('&Edit')
    
        # "File" 그룹에 항목 추가
        file_new = QMenu('New', self)
    
        file_new_txt1 = QAction("테스트파일1", self)
        file_new_txt2 = QAction("테스트파일2", self)
    
        file_new.addAction(file_new_txt1)
        file_new.addAction(file_new_txt2)
    
        exitAction = QAction(QIcon('./image/eco02.png'), 'Exit', self)
        exitAction.setShortcut('Ctrl+Q')
        exitAction.setStatusTip('종료~~~~~')
        exitAction.triggered.connect(QApplication.instance().quit)
    
        menu_file.addMenu(file_new)
        menu_file.addAction(exitAction)
    
        # 수직 박스 레이아웃 생성
        vbox = QVBoxLayout()
    
        # 거래유형 그룹박스 생성
        self.deal_type_groupbox = self.createDealTypeGroup()
        vbox.addWidget(self.deal_type_groupbox)
    
        # 매물유형 그룹박스 생성
        self.property_type_groupbox = self.createPropertyTypeGroup()
        vbox.addWidget(self.property_type_groupbox)
    
        # 입력 박스 그룹박스 생성
        input_groupbox = QGroupBox("입력")
        input_layout = QFormLayout()
        self.city_entry = QLineEdit()
        self.dong_entry = QLineEdit()
        self.min_num_entry = QLineEdit()
        self.max_num_entry = QLineEdit()
        input_layout.addRow("시/구:", self.city_entry)
        input_layout.addRow("동:", self.dong_entry)
        input_layout.addRow("최소금액(만원단위):", self.min_num_entry)
        input_layout.addRow("최대금액(만원단위):", self.max_num_entry)
        input_groupbox.setLayout(input_layout)
        vbox.addWidget(input_groupbox)
    
        # 크롤링 및 추출 버튼
        self.crawl_button = QPushButton("크롤링 및 엑셀추출", self)
        self.crawl_button.clicked.connect(self.crawl_and_export)
        vbox.addWidget(self.crawl_button)
    
        # 중앙 위젯 설정
        central_widget = QWidget()
        central_widget.setLayout(vbox)
        self.setCentralWidget(central_widget)


    def createDealTypeGroup(self):
        groupbox = QGroupBox('거래유형')
        groupbox.setFlat(True)
    
        self.radio1 = QRadioButton('매매', self)
        self.radio1.setChecked(True)
        self.radio2 = QRadioButton('전세', self)
        self.radio3 = QRadioButton('월세', self)
        self.radio4 = QRadioButton('단기임대', self)
    
        vbox = QVBoxLayout()
        vbox.addWidget(self.radio1)
        vbox.addWidget(self.radio2)
        vbox.addWidget(self.radio3)
        vbox.addWidget(self.radio4)
        vbox.addStretch(1)
        groupbox.setLayout(vbox)
    
        return groupbox

        #거래유형 10) QGroupBox
    def createPropertyTypeGroup(self):
        groupbox = QGroupBox('매물유형(중복체크 가능)')
        groupbox.setFlat(True)
    
        self.checkbox1 = QCheckBox('아파트', self)
        self.checkbox1.setChecked(True)
        self.checkbox1.stateChanged.connect(self.updateSelectedOptions)
    
        self.checkbox2 = QCheckBox('오피스텔', self)
        self.checkbox2.stateChanged.connect(self.updateSelectedOptions)
    
        self.checkbox3 = QCheckBox('빌라', self)
        self.checkbox3.stateChanged.connect(self.updateSelectedOptions)
    
        self.checkbox4 = QCheckBox('아파트분양권', self)
        self.checkbox4.stateChanged.connect(self.updateSelectedOptions)

        self.checkbox5 = QCheckBox('오피스텔분양권', self)
        self.checkbox5.stateChanged.connect(self.updateSelectedOptions)

        self.checkbox6 = QCheckBox('재건축', self)
        self.checkbox6.stateChanged.connect(self.updateSelectedOptions)
    
        self.checkbox7 = QCheckBox('전원주택', self)
        self.checkbox7.stateChanged.connect(self.updateSelectedOptions)
    
        self.checkbox8 = QCheckBox('단독/다가구', self)
        self.checkbox8.stateChanged.connect(self.updateSelectedOptions)

        self.checkbox9 = QCheckBox('상가주택', self)
        self.checkbox9.stateChanged.connect(self.updateSelectedOptions)
    
        self.checkbox10 = QCheckBox('한옥주택', self)
        self.checkbox10.stateChanged.connect(self.updateSelectedOptions)
    
        self.checkbox11 = QCheckBox('재개발', self)
        self.checkbox11.stateChanged.connect(self.updateSelectedOptions)

        self.checkbox12 = QCheckBox('원룸', self)
        self.checkbox12.stateChanged.connect(self.updateSelectedOptions)

        self.checkbox13 = QCheckBox('고시원', self)
        self.checkbox13.stateChanged.connect(self.updateSelectedOptions)
    
        self.checkbox14 = QCheckBox('상가', self)
        self.checkbox14.stateChanged.connect(self.updateSelectedOptions)
    
        self.checkbox15 = QCheckBox('사무실', self)
        self.checkbox15.stateChanged.connect(self.updateSelectedOptions)

        self.checkbox16 = QCheckBox('공장/창고', self)
        self.checkbox16.stateChanged.connect(self.updateSelectedOptions)

        self.checkbox17 = QCheckBox('건물', self)
        self.checkbox17.stateChanged.connect(self.updateSelectedOptions)
    
        self.checkbox18 = QCheckBox('토지', self)
        self.checkbox18.stateChanged.connect(self.updateSelectedOptions)
    
        self.checkbox19 = QCheckBox('지식산업센터', self)
        self.checkbox19.stateChanged.connect(self.updateSelectedOptions)

        #2줄 배치
        vbox1 = QVBoxLayout()
        vbox1.addWidget(self.checkbox1)
        vbox1.addWidget(self.checkbox2)
        vbox1.addWidget(self.checkbox3)
        vbox1.addWidget(self.checkbox4)
        vbox1.addWidget(self.checkbox5)
        vbox1.addWidget(self.checkbox6)
        vbox1.addWidget(self.checkbox7)
        vbox1.addWidget(self.checkbox8)
        vbox1.addWidget(self.checkbox9)
        vbox1.addWidget(self.checkbox10)
    
        vbox2 = QVBoxLayout()
        vbox2.addWidget(self.checkbox11)
        vbox2.addWidget(self.checkbox12)
        vbox2.addWidget(self.checkbox13)
        vbox2.addWidget(self.checkbox14)
        vbox2.addWidget(self.checkbox15)
        vbox2.addWidget(self.checkbox16)
        vbox2.addWidget(self.checkbox17)
        vbox2.addWidget(self.checkbox18)
        vbox2.addWidget(self.checkbox19)
    
        hbox = QHBoxLayout()
        hbox.addLayout(vbox1)
        hbox.addLayout(vbox2)
    
        groupbox.setLayout(hbox)
    
        return groupbox

    def updateSelectedOptions(self, state):
        selected_options = []
        if self.checkbox1.isChecked():
            selected_options.append('A1')
        if self.checkbox2.isChecked():
            selected_options.append('B1')
        if self.checkbox3.isChecked():
            selected_options.append('B2')
        if self.checkbox4.isChecked():
            selected_options.append('B3')
        self.selected_options = selected_options
        
    def crawl_and_export(self):
        #GUI에서 입력된 도시와 동 저장
        city = self.city_entry.text()
        dong = self.dong_entry.text()
        
        #min, max값 기입
        min_num = self.min_num_entry.text()
        max_num = self.max_num_entry.text()

        #입력된 city와 dong이 없는 경우 에러 메시지를 표시하고 함수를 종료
        if not city or not dong:
            QMessageBox.critical(self, "Error", "시와 동을 입력하세요.")
            return

        # 선택된 옵션을 가져옴
        selected_options = []
    
        if self.checkbox1.isChecked():
            selected_options.append('A1')
        if self.checkbox2.isChecked():
            selected_options.append('B1')
        if self.checkbox3.isChecked():
            selected_options.append('B2')
        if self.checkbox4.isChecked():
            selected_options.append('B3')
        if len(selected_options) == 1:
            selected_options =selected_options[0]
        elif len(selected_options) > 1 :
            selected_options = ':'.join(selected_options)
        # 선택된 옵션이 없는 경우에 대한 처리 추가
        if not selected_options:
            QMessageBox.warning(self, "Warning", "거래 유형을 선택하세요.")
            return

        # 사용자가 선택한 옵션을 가져와서 ':'로 구분하여 문자열로 변환
        selected_options_str = ":".join(self.selected_options)
        # 선택된 옵션을 가져옴
        #selected_options_str = self.selected_options_str

        def chrome_div():
            options = Options()
            options.add_argument('--start-maximized')
            # options.add_argument('--headless=new')
            options.add_experimental_option('detach',True)
            div = webdriver.Chrome(options=options)
            return div
            
        #크롬 드라이버를 사용하여 네이버 부동산 사이트로 이동
        driver = chrome_div()
        driver.get(f"https://m.land.naver.com")
        driver.implicitly_wait(1)

        #도시와 동을 입력하여 부동산 정보 검색
        driver.find_element(By.CSS_SELECTOR,'#header > div > div.FlexibleLayout-module_row__P4p6X > div > div > div:nth-child(1) > header > div > div > a.HeaderButton-module_article__KwTay._innerLink').click()
        driver.find_element(By.CSS_SELECTOR,'#query').send_keys(city + " " + dong)
        driver.find_element(By.CSS_SELECTOR,'#landSearchBtn').click()
        time.sleep(1)

        #https://m.land.naver.com/map/37.4477385:127.1394971:14:4113100000/APT/A1?spcMin=66&spcMax=132&dprcMin=50000&dprcMax=60000&#mapList


        # 현재 URL에 선택된 옵션들을 추가하여 새로운 url1 생성
        url1 = driver.current_url.replace("A1:B1:B2", "")
        driver.get(url1 + selected_options+f'?dprcMin={min_num}&dprcMax={max_num}&')
        time.sleep(1)
            

        # search_url = f"https://m.land.naver.com/map/37.430523:127.13721:12:4113300000/{selected_options_str}"
        # print("Final URL:", search_url)

        #검색 결과 페이지에서 검색된 부동산의 개수를 가져와 path2 변수에 저장
        path2 = driver.find_element(By.XPATH,'//*[@id="_countContainer"]/a[1]/em').text
        #path를 '/' 기준으로 분리하여 splitt에 저장하고, 분리된 URL의 일부를 가져와 path3 변수에 저장
        splitt = url1.split('/')
        path3 = splitt[4]
        dealtype = splitt[6]
        
        #path3를 ':' 기준으로 분리하여 split_values에 저장
        split_values = path3.split(':')
        latitude = float(split_values[0])
        longitude = float(split_values[1])
        zoom_level = split_values[2]
        property_id = split_values[3]

        #path3를 ':' 기준으로 분리하여 dealtype_values에 저장
        #dealtype_values = dealtype.split(':')
        
        
        h = {"Accept-Encoding": "gzip, deflate, br",
        "authorization": "Bearer eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IlJFQUxFU1RBVEUiLCJpYXQiOjE2NTk5MzcxNTIsImV4cCI6MTY1OTk0Nzk1Mn0.PD7SqZO7z8f97uGQpfSKYMPbrLy6YtRl9XYHWaHiVVE",
        "Host": "m.land.naver.com",
        "Referer": "",
        "sec-ch-ua": "\".Not\/A)Brand\";v=\"99\", \"Google Chrome\";v=\"103\", \"Chromium\";v=\"103\"",
        "sec-ch-ua-mobile": "?0",
        "sec-ch-ua-platform": "Windows",
        "Sec-Fetch-Dest": "empty",
        "Sec-Fetch-Mode": "cors",
        "Sec-Fetch-Site": "same-origin",
        "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36"}
        random_time = random.uniform(0.5, 1.5)

        # 검색된 부동산 데이터를 수집하여 DataFrame에 저장하는 코드
        dr=[]
        try:
            for i in tqdm(range(1, int((int(path2)+1)/20)+2)):
                data = {"시": [city], "동": [dong], "최소매매가":[min_num], "최대매매가":[max_num] }
                url3= 'https://m.land.naver.com/cluster/ajax/articleList?itemId=&mapKey=&lgeo=&showR0=&rletTpCd=APT%3AABYG%3AJGC&tradTpCd='+selected_options+'&z=14&dprcMin='+min_num+'&dprcMax='+max_num+'&totCnt=47&totCnt='+str(path2)+'&cortarNo='+str(property_id)+'&sort=rank&page=1'
                res = requests.get(url3, headers=h)
                soup = BeautifulSoup(res.text, 'html.parser')
                temp = json.loads(soup.text)
                dr.append(temp)
                
                # 랜덤한 시간 간격으로 대기
                random_time = random.uniform(0.5, 1.5)
                time.sleep(random_time)
                df = pd.DataFrame(data)
        except Exception as e:
            QMessageBox.warning(self, "Warning", f"크롤링 중 오류가 발생했습니다. 지금까지 수집된 데이터까지만 저장합니다.\n에러 메시지: {str(e)}")

        a = pd.DataFrame(dr)
        data =[]
        for i in range(len(a)):
            for j in range(len(a['body'][i])):
                path = (a['body'][i][j])
                data.append(path)
        df = pd.DataFrame(data)

        # 현재 시간
        #current_time = datetime.datetime.now()
        current_date = datetime.datetime.now().strftime("%y%m%d")

        # 파일명 생성
        file_name = f"{current_date}_{city} {dong} 크롤링.xlsx"

        # 엑셀 파일로 저장
        file_path, _ = QFileDialog.getSaveFileName(self, 'Save File', file_name, 'Excel files (*.xlsx);;All Files (*)')
        if file_path:
            df.to_excel(file_path, index=False)
            QMessageBox.information(self, "Success", "크롤링 결과가 엑셀 파일로 저장되었습니다.")

        driver.quit()

#__name__'은 현재 모듈의 이름이 저장되는 내장 변수
#만약 'moduleA.py'라는 코드를 import해서 예제 코드를 수행하면 __name__ 은 'moduleA
if __name__ == '__main__':
    #이는 PyQt5 애플리케이션의 시작을 나타냄
    app = QApplication(sys.argv)
    #클래스의 인스턴스를 생성. PyQt5에서 정의한 사용자 인터페이스를 나타냄
    ex = NaverRealEstateCrawler()
    #메서드를 호출하여 이벤트 루프를 시작
    ex.show()
    #sys.exit()는 애플리케이션의 종료 코드를 반환
    sys.exit(app.exec_())
