smart pointer KernelArg #45

zeratax · 2019-12-04T12:03:40Z

es ist vielleicht cooler KernelArg mit smart pointer zu initalisieren, aber ich weiß nicht ob man implizit pointer zu smart pointern machen kann, e.g. &a wenn a ein int ist, also für die valueargs. Frag mich auch ob smart pointer cooler für jni oder schlimmer wären.

zeratax · 2019-12-04T13:54:54Z

Vielleicht so

KernelArg(std::shared_ptr host_data, bool download = false, bool copy = true, bool upload = true);

// und dann für alle basic types (ValueArg) 
KernelArg(int *host_data, bool download = false) : KernelArg{std::make_shared(host_data), download, false, false} {};
KernelArg(const int &host_data) : KernelArg{std::make_shared(host_data), false, false, false} {};

vielleicht kann man für basic types das auch templaten auch mit ner shared library, weiß nicht?

Edit:
Weiß nicht ob die defaults für non const into gut sind.
copy braucht man auch nicht, oder? eig ist nur die frage ob man runterlädt bei pods?
denke eig wenn man nicht runterladen will, sollte man const nehmen, aber kann mir vorstellen, dass man trotzdem einfach

int a{5};
KernelArg{&a};

macht für eine konstantes argument, weil der host code das als mutable braucht??

LukasSiefke · 2019-12-04T15:03:53Z

Für die JNI wärs glaube ich ganz cool
Dann braucht man die eine Wrapper-Klasse nicht

zeratax · 2019-12-05T04:02:01Z

für fundamental/basic types sollte das hier helfen:
https://en.cppreference.com/w/cpp/types/enable_if
https://en.cppreference.com/w/cpp/types/is_fundamental

aber make_shared von einem stack object klingt halt sehr falsch?
vielleicht braucht KernelArg zwei member variablen einmal für nen shared pointer und void* = nullptr, dass dann für stack objekte benutzt wird und nur benutzt wird wenn es =! nullptr ist?

Edit: eig nur fundamental types, oder auch alle pod?
https://en.cppreference.com/w/cpp/types/is_pod

zeratax · 2019-12-05T21:31:43Z

sehr nervig, dass man dann immer noch size übergeben muss, das fehlt da auch noch. eig ziemlich sicher, dass der shared pointer das speichert aber naja

zeratax · 2019-12-05T22:02:15Z

oh noch eine sache, zur zeit wird ja pro argument hochgeladen, aber man könnte auch alle auf einmal hochladen, siehe: https://docs.nvidia.com/cuda/cuda-driver-api/group__CUDA__MEM.html#group__CUDA__MEM_1g27f885b30c34cc20a663a671dbf6fc27
würde den overhead noch etwas veringern.

zeratax · 2019-12-05T22:04:02Z

oh noch etwas. pointer pointer ist eig immer ne schlechte idee zum hochladen und sollte immer geflattened werden.
also wenn der smart pointer auf nen pointer zeigt das ist schlecht.
float[][] kann man nicht zum gpu trivial hochladen.

obwohl es auch extrem umständlich ist mit shared_ptr<float**> zu arbeiten, passiert also wahrscheinlich nie.

zeratax · 2019-12-06T03:08:46Z

hier so funktionierende templates: https://wandbox.org/permlink/Ij0mH10oaCj6GrQ8

was mich hier stört ist, dass das hier schwer bis garnicht möglich ist mit vektoren auf der host seite zu arbeiten und die dann als array auf dem device zu benutzen:

std::vector<pixel> image;
image.resize(size);
KernelArgs{image.data(), size};

und den vector data zu einen smart pointer machen ist auch kein guter style, da dann vector und smart pointer den destruktor auf den selben pointer anwenden wollen.

Edit:
das hier erledigt eig gleich 2 probleme, falls man das in shared libraries benutzen darf, was ich bezweifle:
https://wandbox.org/permlink/QDd0QtKbTb9Uucxv

template<typename Iterator>
std::string KernelArg(Iterator begin, Iterator end){
    size_t size = std::distance(begin, end) * sizeof(*begin);
    return std::string {"iterator, size: "} + std::to_string(size);
}

so hier geht es auch:

std::string KernelArg(void* begin, void* end) {
    intptr_t size = reinterpret_cast<intptr_t>(end) - reinterpret_cast<intptr_t>(begin);
    return std::string {"iterator, size: "} + std::to_string(size);
}

aber dann muss man das so aufrufen:

 KernelArg(image_vector.data(), image_vector.data() + size); // kann man auch gleich void*, size
 KernelArg(&(*image_vector.begin()), &(*image_vector.end())); // ehm...

Edit Edit:
denke immer, dass man doch void* braucht auch wenn der rest hier trotzdem hilfreich ist.
vielleicht sollte man dann bei dem void* irg wie sowas machen?

template<typename T>
std::string KernelArg(T* test) {
    if(!std::is_same<typename std::remove_pointer<typename std::remove_pointer<T*>::type>::type, typename std::remove_pointer<T*>::type>::value)
        throw 1;
    return "void pointer";
}

template bool KernelArg<void>(void* test); // explizite Instanziierung für void*

float* float_ptr;
float** float_ptr_ptr;
KernelArg(float_ptr);
KernelArg(float_ptr_ptr); // wirft exception

static_assert denke ich macht keinen sinn für shared library, vielleicht assert, aber weiß nicht was einfacher für jni ist.

die range angeben gefällt mir syntaktisch aber am besten

visualJames · 2019-12-06T09:55:35Z

Die ursprüngliche Problematik ist, dass wir SIGSEGV, also Segmentationfaults bekommen und unser Programm abstürzt. Wir wollen erstmal zumindest wissen, wo und warum ein SIGSEGV aufgetreten ist. Wir könnten diese Signals, die in http://www.cplusplus.com/reference/csignal/ beschrieben sind, handeln und wie bei der checkCudaErrors Fkt, diese dann abfangen und Zeile, File und Beschreibung zurückgeben.

zeratax · 2019-12-10T13:07:14Z

An sich syntaktisch am klarsten und sichersten wäre eig ein move?

const size_t SIZE = 1024;
auto host_array = make_unique<float[]>(SIZE);

std::vector<KernelArg> args;
auto device_array = KernelArg{std::move(host_array)};
args.pushback(device_array);
args.emplace_back(KernelArg{SIZE});

kernel.launch(args);

std::unique_ptr<float*> host_array = device_array.download();

mit KernelArg header so:

void KernelArg::KernelArg(std::unique_ptr hdata, bool download = false, bool copy = true, bool upload = true);
std::unique_ptr KernelArg::download();

muss man halt sehr explizit runterladen und man kann die variable nicht mehr weiterbenutzen...

ob man für vektoren vielleicht mit std::any das safe machen könnte?

LukasSiefke · 2019-12-10T14:31:36Z

Also fürs JNI wäre ein vollständiges Kopieren noch praktischer, da das Java-Array sowieso einmal in ein neues C-Array kopiert werden muss. Dann könnte man auch die alten Variablen weiter benutzen...

zeratax · 2019-12-10T14:34:22Z

std::copy geht auch mit std::unique_ptr denke ich?
ja ich probier das vielleicht mal, schreibe glaube ich erstmal bastian an

zeratax · 2019-12-13T20:41:34Z

Hier nochmal alles als juypter notebook zusammengefasst:
https://github.com/ZerataX/notebooks/blob/master/notebooks/KernelArgs.ipynb

zeratax added the enhancement New feature or request label Dec 4, 2019

zeratax assigned zeratax, visualJames and LukasSiefke Dec 6, 2019

zeratax mentioned this issue Dec 7, 2019

upload KernelArgs at once #55

Open

zeratax added this to To do in v1.0.0 Dec 12, 2019

zeratax added the help wanted Extra attention is needed label Dec 14, 2019

zeratax moved this from To do to High Priority in v1.0.0 Dec 15, 2019

zeratax mentioned this issue Mar 28, 2020

c++20 #144

Open

7 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

smart pointer KernelArg #45

smart pointer KernelArg #45

zeratax commented Dec 4, 2019

zeratax commented Dec 4, 2019 •

edited

LukasSiefke commented Dec 4, 2019

zeratax commented Dec 5, 2019 •

edited

zeratax commented Dec 5, 2019

zeratax commented Dec 5, 2019

zeratax commented Dec 5, 2019 •

edited

zeratax commented Dec 6, 2019 •

edited

visualJames commented Dec 6, 2019

zeratax commented Dec 10, 2019 •

edited

LukasSiefke commented Dec 10, 2019

zeratax commented Dec 10, 2019

zeratax commented Dec 13, 2019

smart pointer KernelArg #45

smart pointer KernelArg #45

Comments

zeratax commented Dec 4, 2019

zeratax commented Dec 4, 2019 • edited

LukasSiefke commented Dec 4, 2019

zeratax commented Dec 5, 2019 • edited

zeratax commented Dec 5, 2019

zeratax commented Dec 5, 2019

zeratax commented Dec 5, 2019 • edited

zeratax commented Dec 6, 2019 • edited

visualJames commented Dec 6, 2019

zeratax commented Dec 10, 2019 • edited

LukasSiefke commented Dec 10, 2019

zeratax commented Dec 10, 2019

zeratax commented Dec 13, 2019

zeratax commented Dec 4, 2019 •

edited

zeratax commented Dec 5, 2019 •

edited

zeratax commented Dec 5, 2019 •

edited

zeratax commented Dec 6, 2019 •

edited

zeratax commented Dec 10, 2019 •

edited