Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[baseline] code2seq #8

Closed
natalymr opened this issue Jul 25, 2019 · 1 comment
Closed

[baseline] code2seq #8

natalymr opened this issue Jul 25, 2019 · 1 comment
Assignees

Comments

@natalymr
Copy link
Owner

due 25.07

@natalymr
Copy link
Owner Author

natalymr commented Jul 25, 2019

29.07

  • посмотреть, как утроены данные для задачи code captioning

    ну вообще хз, вроде как вообще данные не продоставляет, а ссылается на другой репозиторий. Устройство данных, вероятно, такое же, как для задачи предсказания имени функции

  • настроить java-extractor, чтобы подставлять вместо таргет-токенов нужные данные -сообщения комиков
    • вытащить все пути для каждой функции, для каждой функции приписывать еще имя блоба, из которого она
    • написать скрипт, который полученные данные с путями будет парcить и подставлять вместо blobName|function|Name сообщение коммита в таком же формате (каждый саб токен отделен |, каждое слово отделено |)
    • concat full log for aurora, intellij (или конкат dict-ов)
    • пересчитать гистограммы
  • из gumtree список измененных методов
  • запуск сети
    • запустить на обученной сети Аврору
    • обучить на Авроре
    • собрать данные для intellij
    • обучить на intellij + aurora
  • архитектура сети?
  • intellij - создать set(needed commits)
  • split(aurora union intellij) (не забыть сделать в разных вариантах сплит)
  • поменять в авроре, где нужно, соо комиков (если были сдвиги) <- пока забила на это

@natalymr natalymr self-assigned this Jul 25, 2019
@natalymr natalymr closed this as completed Oct 7, 2019
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant