Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Data 환경 구축하기] 데이터 수집 환경_ 대용량 데이터 수집 #9

Closed
2 of 4 tasks
hyeming-king opened this issue Oct 19, 2022 · 1 comment
Closed
2 of 4 tasks
Labels
📬 API 서버 api 통신 💛 data 데이터 조사, 수집 등

Comments

@hyeming-king
Copy link
Member

hyeming-king commented Oct 19, 2022

대용량 api 원하는 데이터 뽑아올때

  • 하루 단위 데이터 뽑는 데 걸리는 시간 확인 (주말/평일)
  • 하루 단위 데이터 용량 확인 (주말/ 평일)

고민해볼 사항 + 방법 찾아보기

  • 파이썬 스크립트를 배치파일로 날짜 돌려가면서(자동으로 다음날짜 뽑기) 작동시킬 수는 없는지
  • 가능하다면 방법 더 찾아보기
  • 각각 다운받은 하루 데이터를 어디에서 모으고 합칠 수 있을지
    • AWS의 DB 환경으로 하루하루 데이터를 넣고 -> spark로 데이터베이스 연결해서 합치는 것이 좋을지
  • ⭐️ AWS S3이 배치 관련인 것 같음! 더 찾아봐야할 것 같음

등등
대용량 데이터를 처리하는 방법에 대해 고민해보아요 🙏🏻

@hhyojjin hhyojjin added 💛 data 데이터 조사, 수집 등 📬 API 서버 api 통신 labels Oct 24, 2022
@hhyojjin hhyojjin added this to the Data 수집하기 milestone Oct 24, 2022
@hoinnovation hoinnovation changed the title [Api 데이터] - 대용량 데이터 수집 [Data 환경 구축하기] 데이터 수집 환경_ 대용량 데이터 수집 Oct 29, 2022
@hyeming-king
Copy link
Member Author

해당 내용으로 진행하지 않는 것으로 결정, 이슈 닫습니다.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
📬 API 서버 api 통신 💛 data 데이터 조사, 수집 등
Projects
Development

No branches or pull requests

3 participants