oneMKL max and min

First set of change.
Sarbojit2019 · Nov 2, 2022 · eaf3a9b · pengtu · Nov 2, 2022 · pengtu
1 parent 3589f87
commit eaf3a9b
Show file tree

Hide file tree

Showing 5 changed files with 130 additions and 0 deletions.
diff --git a/deps/onemkl.cpp b/deps/onemkl.cpp
@@ -81,6 +81,39 @@ extern "C" int onemklZgemm(syclQueue_t device_queue, onemklTranspose transA,
     return 0;
 }
 
+extern "C" void onemklDamax(syclQueue_t device_queue, int64_t n, const double *x, int64_t incx, int64_t *result)
+{
+    //printf("Hello World\n\n");
+    printf("n %ld, incx %ld, x %p\n", n, incx, x);
+    int64_t r=0;
+    oneapi::mkl::blas::column_major::iamax(device_queue->val, n, x, incx, &r);
+}
+extern "C" void onemklSamax(syclQueue_t device_queue, int64_t n, const float  *x, int64_t incx, int64_t *result){
+    oneapi::mkl::blas::column_major::iamax(device_queue->val, n, x, incx, result);
+}
+extern "C" void onemklZamax(syclQueue_t device_queue, int64_t n, const double _Complex *x, int64_t incx, int64_t *result){
+    oneapi::mkl::blas::column_major::iamax(device_queue->val, n, reinterpret_cast<const std::complex<double> *>(x), incx, result);
+}
+extern "C" void onemklCamax(syclQueue_t device_queue, int64_t n, const float _Complex *x, int64_t incx, int64_t *result){
+    oneapi::mkl::blas::column_major::iamax(device_queue->val, n, reinterpret_cast<const std::complex<float> *>(x), incx, result);
+}
+
+extern "C" void onemklDamin(syclQueue_t device_queue, int64_t n, const double *x, int64_t incx, int64_t *result)
+{
+    //printf("Hello World\n\n");
+    //printf("n %ld, incx %ld, x %p\n", n, incx, x);
+    int64_t r=0;
+    oneapi::mkl::blas::column_major::iamin(device_queue->val, n, x, incx, &r);
+}
+extern "C" void onemklSamin(syclQueue_t device_queue, int64_t n, const float  *x, int64_t incx, int64_t *result){
+    oneapi::mkl::blas::column_major::iamin(device_queue->val, n, x, incx, result);
+}
+extern "C" void onemklZamin(syclQueue_t device_queue, int64_t n, const double _Complex *x, int64_t incx, int64_t *result){
+    oneapi::mkl::blas::column_major::iamin(device_queue->val, n, reinterpret_cast<const std::complex<double> *>(x), incx, result);
+}
+extern "C" void onemklCamin(syclQueue_t device_queue, int64_t n, const float _Complex *x, int64_t incx, int64_t *result){
+    oneapi::mkl::blas::column_major::iamin(device_queue->val, n, reinterpret_cast<const std::complex<float> *>(x), incx, result);
+}
 
 // other
 

diff --git a/deps/onemkl.h b/deps/onemkl.h
@@ -39,6 +39,16 @@ int onemklZgemm(syclQueue_t device_queue, onemklTranspose transA,
                 const double _Complex *B, int64_t ldb, double _Complex beta,
                 double _Complex *C, int64_t ldc);
 
+void onemklDamax(syclQueue_t device_queue, int64_t n, const double *x, int64_t incx, int64_t *result);
+void onemklSamax(syclQueue_t device_queue, int64_t n, const float  *x, int64_t incx, int64_t *result);
+void onemklZamax(syclQueue_t device_queue, int64_t n, const double _Complex *x, int64_t incx, int64_t *result);
+void onemklCamax(syclQueue_t device_queue, int64_t n, const float _Complex *x, int64_t incx, int64_t *result);
+
+void onemklDamin(syclQueue_t device_queue, int64_t n, const double *x, int64_t incx, int64_t *result);
+void onemklSamin(syclQueue_t device_queue, int64_t n, const float  *x, int64_t incx, int64_t *result);
+void onemklZamin(syclQueue_t device_queue, int64_t n, const double _Complex *x, int64_t incx, int64_t *result);
+void onemklCamin(syclQueue_t device_queue, int64_t n, const float _Complex *x, int64_t incx, int64_t *result);
+
 void onemklDestroy();
 #ifdef __cplusplus
 }

diff --git a/lib/mkl/libonemkl.jl b/lib/mkl/libonemkl.jl
@@ -41,3 +41,43 @@ function onemklZgemm(device_queue, transA, transB, m, n, k, alpha, A, lda, B, ld
                                     B::ZePtr{ComplexF64}, ldb::Int64, beta::ComplexF64,
                                     C::ZePtr{ComplexF64}, ldc::Int64)::Cint
 end
+
+function onemklSamax(device_queue, n, x, incx, result)
+    @ccall liboneapi_support.onemklSamax(device_queue::syclQueue_t, n::Int64,
+                             x::ZePtr{Cfloat}, incx::Int64, result::RefOrZeRef{Int64})::Cvoid
+end
+
+function onemklDamax(device_queue, n, x, incx, result)
+    @ccall liboneapi_support.onemklDamax(device_queue::syclQueue_t, n::Int64,
+                             x::ZePtr{Cdouble}, incx::Int64, result::RefOrZeRef{Int64})::Cvoid
+end
+
+function onemklCamax(device_queue, n, x, incx, result)
+    @ccall liboneapi_support.onemklCamax(device_queue::syclQueue_t, n::Int64,
+                             x::ZePtr{ComplexF32}, incx::Int64,result::RefOrZeRef{Int64})::Cvoid
+end
+
+function onemklZamax(device_queue, n, x, incx, result)
+    @ccall liboneapi_support.onemklZamax(device_queue::syclQueue_t, n::Int64,
+                             x::ZePtr{ComplexF64}, incx::Int64, result::RefOrZeRef{Int64})::Cvoid
+end
+
+function onemklSamin(device_queue, n, x, incx, result)
+    @ccall liboneapi_support.onemklSamin(device_queue::syclQueue_t, n::Int64,
+                             x::ZePtr{Cfloat}, incx::Int64, result::RefOrZeRef{Int64})::Cvoid
+end
+
+function onemklDamin(device_queue, n, x, incx, result)
+    @ccall liboneapi_support.onemklDamin(device_queue::syclQueue_t, n::Int64,
+                             x::ZePtr{Cdouble}, incx::Int64, result::RefOrZeRef{Int64})::Cvoid
+end
+
+function onemklCamin(device_queue, n, x, incx, result)
+    @ccall liboneapi_support.onemklCamin(device_queue::syclQueue_t, n::Int64,
+                             x::ZePtr{ComplexF32}, incx::Int64,result::RefOrZeRef{Int64})::Cvoid
+end
+
+function onemklZamin(device_queue, n, x, incx, result)
+    @ccall liboneapi_support.onemklZamin(device_queue::syclQueue_t, n::Int64,
+                             x::ZePtr{ComplexF64}, incx::Int64, result::RefOrZeRef{Int64})::Cvoid
+end
diff --git a/lib/mkl/wrappers.jl b/lib/mkl/wrappers.jl
@@ -19,6 +19,43 @@ end
 #
 # BLAS
 #
+# level 1
+
+## iamax
+for (fname, elty) in
+    ((:onemklDamax,:Float64),
+     (:onemklSamax,:Float32),
+     (:onemklZamax,:ComplexF64),
+     (:onemklCamax,:ComplexF32))
+    @eval begin
+        function iamax(n::Integer, x::StridedArray{$elty})
+            result = Ref{Clong}()
+            #result = StridedArray{oneArray(Int64)};
+            n = length(x)
+            queue = global_queue(context(x), device(x))
+            $fname(sycl_queue(queue), n, x, stride(x, 1), result)
+            return result[]
+        end
+    end
+end
+
+## iamin
+for (fname, elty) in
+    ((:onemklDamax,:Float64),
+     (:onemklSamax,:Float32),
+     (:onemklZamax,:ComplexF64),
+     (:onemklCamax,:ComplexF32))
+    @eval begin
+        function iamin(n::Integer, x::StridedArray{$elty})
+            result = Ref{Clong}()
+            #result = StridedArray{oneArray(Int64)};
+            n = length(x)
+            queue = global_queue(context(x), device(x))
+            $fname(sycl_queue(queue), n, x, stride(x, 1), result)
+            return result[]
+        end
+    end
+end
 
 # level 3
 

diff --git a/test/onemkl.jl b/test/onemkl.jl
@@ -0,0 +1,10 @@
+using oneAPI
+using oneAPI.oneMKL
+
+using LinearAlgebra
+
+m = 20
+
+A = oneArray(rand(Float64, m))
+#maxVal = oneMKL.iamax(m, A)
+minVal = oneMKL.iamin(m, A)