Skip to content

가짜연구소에서 데이터엔지니어링 스터디를 운영했습니다. 스터디 결과물로 GCP를 이용해 ETL 파이프라인을 구축하는 방법을 담아봤습니다.

Notifications You must be signed in to change notification settings

ddongmiin/etl-pipeline-with-gcp

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 

Repository files navigation

etl-pipeline-with-gcp

  • GCP를 이용해 ETL 파이프라인을 구축해보는 프로젝트입니다.

콘텐츠

  1. GCP VM 인스턴스 생성하기 링크
  2. ubuntu에서 jupyterlab 서버 구축하기 링크
  3. 도커 / Airflow 설치하기 링크
  4. Mysql 원격 접속 및 DB연동 링크
  5. 최종과제 - 서울시 지하철호선별 역별 승하차 인원 정보 적재하기 링크

폴더 트리

  • 아래 내용은 폴더 트리입니다. 자세한 내용은 콘텐츠의 링크를 참고 부탁드립니다.
.
├── README.md
└── dev
    ├── Airflow-ETL
    │   ├── DAG.py
    │   └── table_scheme.sql
    ├── Airflow-install
    │   ├── airflow_install.sh
    │   ├── docker_compose_install.sh
    │   ├── docker_install.sh
    │   └── sample_dag.py
    ├── MySQL-install
    │   ├── modify_ipaddress.sh
    │   ├── modify_permission.sql
    │   ├── mysql_install.sh
    │   └── mysql_python_connect.py
    ├── README.md
    └── jupyter-server
        ├── conda_command_check.sh
        ├── conda_install.sh
        ├── jupyter_install.sh
        ├── jupyterlab_background_exe.sh
        ├── jupyterlab_ipykernal_install.sh
        ├── modify_jupyter_config.sh
        └── password_setting.py

About

가짜연구소에서 데이터엔지니어링 스터디를 운영했습니다. 스터디 결과물로 GCP를 이용해 ETL 파이프라인을 구축하는 방법을 담아봤습니다.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published