Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

RuntimeError: CUDA: Error- invalid ptx #62

Closed
Pro100rus32 opened this issue Jun 1, 2021 · 9 comments
Closed

RuntimeError: CUDA: Error- invalid ptx #62

Pro100rus32 opened this issue Jun 1, 2021 · 9 comments

Comments

@Pro100rus32
Copy link

Ну изначально вообще ничего не работало, пока не увидел #60, потом всё шло +- спокойно
image

Но в итоге я встретил опять ошибку.
image

Один вопрос буквально: Это вообще хоть кто - то тестировал?) Впервые встречаю так много ошибок. Больше похоже на заброшенный репозиторий (тогда зачем собственно публиковать статьи и хвастаться, если вы не поддерживаете репо на данный момент?) Грустненько однако...

@king-menin
Copy link
Collaborator

Неверно установили triton версию. вам надо удалить deepspeed и тритон и попробуйте следующее:

!rm -rf /tmp/DeepSpeed

!pip install triton==0.2.3

cd /tmp && git clone https://github.com/microsoft/DeepSpeed.git && cd DeepSpeed/ && git checkout ff58fa7e5a4f637a21d11daad0192683fe50ed15 && pip uninstall -y typing && pip install cpufeature && DS_BUILD_CPU_ADAM=1 DS_BUILD_SPARSE_ATTN=1 /tmp/DeepSpeed/install.sh -n && pip install typing

pip install transformers==3.5.1

@Pro100rus32
Copy link
Author

[Errno 2] No such file or directory: '/tmp && git clone https://github.com/microsoft/DeepSpeed.git && cd DeepSpeed/ && git checkout ff58fa7e5a4f637a21d11daad0192683fe50ed15 && pip uninstall -y typing && pip install cpufeature && DS_BUILD_CPU_ADAM=1 DS_BUILD_SPARSE_ATTN=1 /tmp/DeepSpeed/install.sh -n && pip install typing'
/content

@Pro100rus32
Copy link
Author

Неверно установили версию triton. вам надо удалить deepspeed и тритон и другое следующее:

!rm -rf /tmp/DeepSpeed

!pip install triton==0.2.3

cd /tmp && git clone https://github.com/microsoft/DeepSpeed.git && cd DeepSpeed/ && git checkout ff58fa7e5a4f637a21d11daad0192683fe50ed15 && pip uninstall -y typing && pip install cpufeature && DS_BUILD_CPU_ADAM=1 DS_BUILD_SPARSE_ATTN=1 /tmp/DeepSpeed/install.sh -n && pip install typing

pip install transformers==3.5.1

Я следовал строго блокноту, у меня установлены нужные версии : )

@Pro100rus32
Copy link
Author

Я попытался прописать каждую команду отдельно, но я встретил ещё несколько ошибок:
image
image

@king-menin
Copy link
Collaborator

git clone https://github.com/microsoft/DeepSpeed.git завершился успешно?

@king-menin
Copy link
Collaborator

попробуйте вышеописанные команда записать в sh файл и запустить

@AlexanderKozhevin
Copy link

@king-menin @Pro100rus32
Кому то удалось запустить блокнот?
Я дошел до этапа генерации, попробовать переустановить deepseed согласно описанию выше. Он нормально установился, но все же cuda выдает ошибку

RuntimeError: CUDA: Error- invalid ptx

Screenshot 2021-07-12 at 19 13 54

@Pro100rus32
Copy link
Author

@king-menin @Pro100rus32
Кому то удалось запустить блокнот?
Я дошел до этапа генерации, попробовать переустановить deepseed согласно описанию выше. Он нормально установился, но все же cuda выдает ошибку

RuntimeError: CUDA: Error- invalid ptx
Screenshot 2021-07-12 at 19 13 54

Нет. Этот репозиторий создан что бы просто быть, и говорить что они хорошие в своих постах на хабре. Мол выкладывают всё на гитхаб, это конечно хорошо, но только когда рядовой пользователь может это запустить, а не встретится чуть ли не с десятками ошибок которые пофиксить не в состояние. Я думаю стоит и дальше ждать, может всё таки они решат сами для начала проверить работоспособность блокнотов, и выпустить фикс.

Я уже не ожидаю решения этой проблемы, да и разбираться после нескольких ошибок - лень. Я молчу про то, что им лень через ctrl + f в коде поменять старую функцию на новую без других изменений, и исправить ошибку с новым PyTorch, чтоб не пришлось тратить время и юзать предустановленную библиотеку по дефолту а не качать несколько минут старый pytorch.

Советую лучше gpt-neo, они ещё новую версию со 175млрд вроде как выпустить собираются. И вот как раз у них - всё бесплатно, без СМС и регистрации.

@AlexanderKozhevin
Copy link

@Pro100rus32 не стоит так критично :)
как минимум gpt2 у них отлично запускается и до-тренировывается.
А тут вообще ошибка от cuda.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging a pull request may close this issue.

3 participants