-
Notifications
You must be signed in to change notification settings - Fork 10
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Parallax 설치 관련 문의 #22
Comments
설치에 사용하신 bazel 버전이 무엇인가요? 기존 bazel build rule이 사용하신 bazel 버전에서는 deprecate되어 생긴 문제라고 보입니다. bazel 버전을 조금 낮추어야 될 것 같습니다. |
0.20을 사용했습니다. 현재 쓰시는 버전을 말씀해주시면 그 버전으로 낮추겠습니다. |
저는 0.18.1을 이용했습니다. |
해당 이슈 참고 부탁드립니다. |
Parallax repo 안의 TensorFlow와 원 버전(https://github.com/tensorflow/tensorflow)은 몇몇 코드를 제외하면 다르지 않아, 문제가 생길 경우 대부분 원 버전에서도 같은 문제가 생기는 경우입니다. 따라서 google이 답을 알고 있을 가능성이 높습니다 :) |
혹시 TensorFlow configure 시에 MPI Y/N에서 Y를 하셨나요? |
학생들끼리 Setup 문제 생기고 해결한 것을 적극적으로 공유해 주면 좋겠습니다. |
네 과제 스펙을 보고 configure에서 mpi option은 켜야한다고 생각했었네요. 빠른 답변 감사합니다 다시 시도해보겠습니다. |
configure 시에 MPI option을 켠 것과 별개로, 빌드 시 저런 에러는 나지 않아야 하는데,
이것이 의미하는 바가 TensorFlow r1.11 버전을 (https://github.com/tensorflow/tensorflow/tree/r1.11) 이용하면 에러가 나지 않고, https://github.com/snuspl/tensorflow/tree/r1.11 이 버전을 이용하면 에러가 난다는 말씀이신가요? |
조금 찾아보니 |
@gyeongin 몬트리올에서 바쁠텐데 빠른 답변 고마워요. |
참고로 저는 기본으로 주어진
위 dependency와 bazel 이외에 아무것도 설치하지 않아도 TensorFlow 설치에 문제가 없었습니다. |
흠 위와 동일한 문제가 계속 발생하네요. |
네 꼬인게 있을 수 있을 것 같습니다. |
에러 발생때마다 build도 20분 가량 소요하면서 진행해야해서 시간을 너무 많이 잡아먹는데, |
위에 devce_tracer.cc 에서 발생한 에러는 코드 문제였던것 같습니다. 다시 pull해서 1.11에서 실행해봐주실 수 있을까요? |
이 문제인듯 합니다. bazelbuild/continuous-integration#305 |
수업시간 물어 보았을때 대부분의 학생들이 환경 셋업을 다 해서, 특별한 문제인 것 같습니다. 모든 학생들에게 문제가 다 있는 것은 아닙니다. |
아마 package 버전이 중요한 문제일것 같은데요. 혹시 wheel 파일 생성엔 성공하셨나요? 가끔 빌드에 fail하고 wheel 파일은 생성되는 경우도 있는데 해당 wheel 파일을 install하고 다시 build를 하면 되기도 하더라구요. 아래 링크를 보면 아래처럼 설치해보라고 하는데 시도해보시는게 어떨까요. |
우선 |
다행이네요. 수고 많으셨습니다. |
안녕하세요.
현재 제 환경상 GPU 자원을 가진 시스템을 구축할 수 없어서
현재 CPU만 사용하는 환경으로 세팅하고있습니다.(AWS 사용)
installation guide를 따라 하고있는데, parallax의 tensorflow 설치에서 막혀서요.
GPU를 안쓴다면 NVIDIA Driver, CUDA, NCCL은 모두 패스하고 설치하면 되는거 아닌가요?
parrallax는 cpu_enable 브랜치로 하였고, bazel build 시에
bazel build --config=opt //tensorflow/tools/pip_package:build_pip_package
로 빌드를 시도했습니다.
다음과 같은 에러가 발생하면서 빌드가 되지 않습니다.
혹시 도움을 주실 수 있을까요.
The text was updated successfully, but these errors were encountered: