-
Notifications
You must be signed in to change notification settings - Fork 2
Ataraxia1001/Login_project
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
3조 Log人, 팀 프로젝트1 * 주제 - 로그데이터 분석을 통한 '숙박업 비지니스 창출' 지원용 인사이트 생산 및 표출 * 상세내용 - 관광 및 교통 로그 데이터를 수집 - 로그데이터 외 추가적으로 숙박업 후기 정보(웹크롤링)를 로그데이터와 결합 - 통계 및 기계학습? 분석을 통해 '숙박업 비지니스 창출' 관련 인사이트 도출 - 프로젝트 소개 페이지 및 인사이트 표출(개발코드 및 분석그림) 웹 페이지 개발 * 역할분담 (상시 업데이트) - 분석기획: 전 인원 - 웹크롤링: 김만기(네이버 지도), 신호철(야놀자 호텔), 김성진(야놀자 모텔) - DB 구축: 김만기 - 데이터분석: 정지용, 이가연, 신호철, 김성진, 김만기 - 웹개발: 김성동 * 진행기획 (`23.05.03 ~ 05.26) 1. 웹크롤링으로 숙박업소 리뷰, 가격등 경쟁자들을 분석하고 비지니스 전략 수립 2. 웹크롤링은 최대 19일까지 마치고 마지막주에는 데이터분석 및 웹개발, 발표물 제작등을 지원 3. 최종적으로 분석한 결과물을 웹에 구현하여 사용자들이 결과물을 보고 사용할수있도록 함 4. 22일부터 전원이 각자 맡은 부분의 파워포인트 발표물을 함께 제작 * 분석 및 개발 내용 - 공공 데이터 수집 (김성동, 정지용) - 공공데이터 포털을 이용해 '교통 및 관광 로그' 데이터 수집 - 웹 크롤링 - 네이버 지도 (김만기) - 서울시 숙박업 인허가 정보리스트 수집 (6664개 업소 정보 포함) - 업소 리스트를 네이버지도에서 검색후 숙박업 정보(별점, 후기 등) 수집 - 야놀자 (신호철, 김성진) - 야놀자 홈페이지에서 서울의 '모텔/호텔' 숙박업 정보(별점, 후기 등) 수집 - DB 구축 (김만기) - AWS 서버에 PostgreSQL 설치(완료, 김경훈님 도움) - 숙박, 교통, 관광 데이터 전처리 및 db 추가 - db 모델링 - 데이터 분석 - 관광지, 관광객 특징 분석 (정지용) - (방법) 관광객 로그 데이터의 통계 분석 및 특징 시각화 - (내용1) 관광객 지출, 방문, 검색 데이터 분석, 시각화 - (내용2) 관광객 검색과 방문 간의 상관관계 분석 - 숙박업소 속성과 관광지 관련성 분석(이가연, 정지용) - (방법) 관광객 로그 데이터와 교통,숙박업소 정보 결합 및 군집 분석 - (내용1) 숙박업체 - (교통) - 관광지 데이터간 연결링크 개발 작업 (이가연) - 숙박업소 데이터에 주변 교통편, 관광지 속성 삽입 - (내용2) 관광지, 교통, 호텔위치 정보를 이용한 군집분석 (정지용) - (내용3) 관광객이 중요시하는 주변 숙박업소 속성 분석(검색 기록로그 사용) (김만기) - 크롤링 데이터(숙박업소 후기정보) 분석 - (방법) 워드클라우드, 통계분석 - (내용1) 야놀자 인기태그 및 별점별 후기 워드클라우드 (김성진) - (내용2) 야놀자 호텔 유형별 속성 통계 분석 (신호철) - (내용3) 네이버 지도의 "이런점이 좋아요" 워드클라우드, 빈도분석 (김만기) - (내용4) 네이버 지도의 별점별 "이럼점이 좋아요" 통계적 차이분석 (김만기) - 웹 개발 - 프로젝트 수행내용 웹 표출을 위한 웹 페이지 개발 (김성동) - 웹페이지 구성요소 설정 - 홈, 프로젝트 소개, 프로젝트 코드 및 시각화 구축 코드 작성 * 데이터 정보 - 교통 정보 - 역별 시간대별 버스 승하차 정보 - http://data.seoul.go.kr/dataList/OA-12913/S/1/datasetView.do - 지하철 호선별 시간대별 승하차 - http://data.seoul.go.kr/dataList/OA-12921/F/1/datasetView.do - 지하철 위치정보 - https://www.data.go.kr/data/15099316/fileData.do?recommendDataYn=Y - 서울시 역사마스터 정보 - https://data.seoul.go.kr/dataList/OA-21232/S/1/datasetView.do - 숙박업 관련정보 (크롤링) - 서울시 숙박업 인허가 정보리스트 수집 - https://data.seoul.go.kr/dataList/OA-16044/S/1/datasetView.do - 네이버 지도 - https://map.naver.com/v5) - 야놀자 홈페이지 - https://www.yanolja.com/) - 관광 정보 - 한국관광 데이터랩 - https://datalab.visitkorea.or.kr/datalab/portal/main/getMainForm.do - 지역별 방문자수 - https://datalab.visitkorea.or.kr/datalab/portal/bda/getMetcoAna.do - 지역별 지출액 - https://datalab.visitkorea.or.kr/datalab/portal/bda/getByLocgoCnsmAmt.do - 지역별 검색건수 - https://datalab.visitkorea.or.kr/datalab/portal/bda/getDomInqCnt.do - 지역별 유입,유출 방문객 - https://datalab.visitkorea.or.kr/datalab/portal/loc/getAreaDataForm.do# - 관광지 목록(위치) - https://datalab.visitkorea.or.kr/datalab/portal/loc/getTourLocalDataForm.do - 호텔매출 관련 정보 - 통계청 https://kostat.go.kr/ansk/ 검색어: 호텔매출
About
더조은 3조 비즈니스 인사이트 로그데이터 분석
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published