Skip to content
@de-final-2-2team

Opensource Trends

오픈소스 트렌드 분석

오픈 소스에 대한 릴리즈, 이슈, 관련 질문, 관심도 등을 파악할 수 있도록 시각화 하여 대시 보드를 제공합니다.

#️⃣ 주제 선정 이유

정보통신산업진흥원의 '2021 오픈소스SW(OSS) 실태조사 보고서’ 따르면, 국내 기업의 오픈 소스 활용 비율은 61.5%로 많은 것을 확인할 수 있습니다.
Microsoft가 Github를, IBM이 Red Hat을 인수하는 등 오픈 소스가 더욱 중요해지고 있습니다.

오픈 소스를 도입하려면, 새로운 오픈 소스가 무엇이 있는지 기존에 도입한 오픈 소스의 이슈 혹은 버그 수정 여부 등을 지속적으로 확인해야 합니다.
따라서, 이번 프로젝트에는 오픈 소스 트랜드 및 상세 정보를 파악할 수 있는 대시보드를 제공하는 것을 주제로 선정하였습니다.

기대효과

  1. repository top 10
    • star 수를 기준으로 현재 가장 관심 있어하는 repository를 확인할 수 있습니다.
  2. repository 상세 내용
    • release, commit, issue 등 repository 상세 내용을 확인할 수 있습니다.
  3. google trend 관련 키워드
    • repository와 연관된 키워드를 확인할 수 있습니다.
  4. 관련 stack overflow 최신 질문 목록
    • repository와 관련된 stack overflow 질문 목록을 확인할 수 있습니다.

👪 팀원 및 역할 분담

이름 구분 역할
김상희
@ksh1357
Airflow web crawling을 통한 데이터 수집 DAG 개발
• Github 데이터 수집 DAG 개발
• 데이터 정합성 확인 DAG 개발
Preset • 대시보드 및 차트 생성
남윤아
@namuna309
Airflow • Plugin 개발(Slack, AWS S3 read and write 등)
• StackOverflow 데이터 수집 DAG 개발
• EMR Data Process 자동화 DAG 개발
Spark • Raw Data 정제 및 S3 적재 모듈 생성
AWS • AWS EC2, EMR 관리
• EC2 관리를 위한 CloudWatch 경보, EventBridge 규칙, Lambda 함수 개발
김혜민
@HyeM207
Airflow • Docker-Compose 환경 구축
• Github 데이터 수집 DAG 수정 및 GoogleTrend 데이터 수집 DAG 개발
• Plugin 개발 (Slack, Pytrend 호출 등)
• Airflow Monitoring 환경 구축 (Grafana)
Snowflake 데이터 마트 구축 (S3ToSnowflake)
Flask Redis 연결 Flask REST-API개발

#️⃣ 기술 스택

기술 스택 Develop 환경 Production 환경
Apache Spark (Python) 로컬 (Docker) Amazon EMR (m5.xlarge)
Apache Airflow & monitoring (Python) 로컬 (Docker Compose) Amazon EC2 (t3.2xlarge)
Data Warehouse Snowflake Snowflake
Data Lake Amazon S3 Amazon S3
AWS Monitoring - Amazon CloudWatch
Dashboard Preset Preset
SCM (Software Configuration Management) Github Github
기타 - Amazon SecretManager, Amazon Lambda

#️⃣ 아키텍처

image

#️⃣ 시각화 (Preset)

  1. 오픈 소스 트랜드 image

  2. Repository 상세 image

📂결과물

Pinned Loading

  1. opensource-trends-airflow opensource-trends-airflow Public

    [Airflow] 오픈소스 트렌드 분석 Airflow 환경 구축 및 DAG

    Python 1

  2. opensource-trends-spark opensource-trends-spark Public

    Python

Repositories

Showing 3 of 3 repositories
  • opensource-trends-airflow Public

    [Airflow] 오픈소스 트렌드 분석 Airflow 환경 구축 및 DAG

    de-final-2-2team/opensource-trends-airflow’s past year of commit activity
    Python 0 1 4 0 Updated Dec 11, 2023
  • de-final-2-2team/opensource-trends-spark’s past year of commit activity
    Python 0 0 0 0 Updated Sep 4, 2023
  • .github Public
    de-final-2-2team/.github’s past year of commit activity
    0 0 0 0 Updated Sep 4, 2023

Top languages

Loading…

Most used topics

Loading…